Page 2 of 2

Posted: Fri Nov 30, 2007 2:45 am
by Peterpan
Perche' ho filtrato tutti gli spazi, e i segni di interpunzione, lavorando solo sui caratteri alfabetici. Probabilmente ci si puo' lavorare su. Sono i due comandi tr che vanno modificati ad hoc.

P.S. Se mi dicevi prima che erano e-mail... :)

Posted: Mon Dec 03, 2007 7:30 am
by Mr Enrich
hai ragione scusa ; ) hai poi trovato una soluzione? io annego nella mia ignoranza

Posted: Mon Dec 03, 2007 10:48 am
by Peterpan
Mr Enrich wrote:hai ragione scusa ; ) hai poi trovato una soluzione? io annego nella mia ignoranza
Il facile esercizio viene lasciato al lettore... :lol:

No scherzo non ho raffinato il comando, ma se ne hai davvero bisogno... possiamo cercare una soluzione.

Posted: Mon Dec 03, 2007 7:41 pm
by Mr Enrich
se hai un po' di tempo da dedicarci mi dai una mano.. altrimenti fa lo stesso.. ;)

Posted: Tue Dec 04, 2007 1:28 am
by Nadabi
prova a dare un'occhiata a questa applicazione: Differencia ...da quello che ho capito confronta i dati, parole numeri tra diversi formati ..e forse anche dallo stesso testo ....

Posted: Tue Dec 04, 2007 2:09 am
by Peterpan
Eccomi qui.

Con la prova che ho fatto ha funzionato, se non dovesse funzionare mi devi dare piu' dettagli sul contenuto del tuo file:

Code: Select all

cat file_da_processare |tr A-Z a-z|tr -c [a-z'\.''\@'] '\n'|sort|uniq
Occhio agli spazi. Gli apici sono tutti singoli, quindi dove ne trovi due devi digitare due volte il carattere ' e non la doppia virgoletta "

Se vuoi mettere il risultato in un nuovo file aggiungi:

Code: Select all

cat file_da_processare |tr A-Z a-z|tr -c [a-z'\.''\@'] '\n'|sort|uniq > nuovo_file 
Ciaociao ! :smt039

Posted: Thu Dec 06, 2007 8:34 am
by Mr Enrich
grazie dell'aiuto!

in realtà alcune email continua a dividermele, però va bene così... ;)

Posted: Thu Dec 06, 2007 11:01 am
by Peterpan
Mr Enrich wrote:grazie dell'aiuto!

in realtà alcune email continua a dividermele, però va bene così... ;)
Cerca di capire perchè, ci sono segni di interpunzione o magari underscore ? se si' aggiungi dopo '\.' anche un '\_'