Page 2 of 2
Posted: Fri Nov 30, 2007 2:45 am
by Peterpan
Perche' ho filtrato tutti gli spazi, e i segni di interpunzione, lavorando solo sui caratteri alfabetici. Probabilmente ci si puo' lavorare su. Sono i due comandi tr che vanno modificati ad hoc.
P.S. Se mi dicevi prima che erano e-mail...

Posted: Mon Dec 03, 2007 7:30 am
by Mr Enrich
hai ragione scusa ; ) hai poi trovato una soluzione? io annego nella mia ignoranza
Posted: Mon Dec 03, 2007 10:48 am
by Peterpan
Mr Enrich wrote:hai ragione scusa ; ) hai poi trovato una soluzione? io annego nella mia ignoranza
Il facile esercizio viene lasciato al lettore...
No scherzo non ho raffinato il comando, ma se ne hai davvero bisogno... possiamo cercare una soluzione.
Posted: Mon Dec 03, 2007 7:41 pm
by Mr Enrich
se hai un po' di tempo da dedicarci mi dai una mano.. altrimenti fa lo stesso..

Posted: Tue Dec 04, 2007 1:28 am
by Nadabi
prova a dare un'occhiata a questa applicazione:
Differencia ...da quello che ho capito confronta i dati, parole numeri tra diversi formati ..e forse anche dallo stesso testo ....
Posted: Tue Dec 04, 2007 2:09 am
by Peterpan
Eccomi qui.
Con la prova che ho fatto ha funzionato, se non dovesse funzionare mi devi dare piu' dettagli sul contenuto del tuo file:
Code: Select all
cat file_da_processare |tr A-Z a-z|tr -c [a-z'\.''\@'] '\n'|sort|uniq
Occhio agli spazi. Gli apici sono tutti singoli, quindi dove ne trovi due devi digitare due volte il carattere ' e non la doppia virgoletta "
Se vuoi mettere il risultato in un nuovo file aggiungi:
Code: Select all
cat file_da_processare |tr A-Z a-z|tr -c [a-z'\.''\@'] '\n'|sort|uniq > nuovo_file
Ciaociao !

Posted: Thu Dec 06, 2007 8:34 am
by Mr Enrich
grazie dell'aiuto!
in realtà alcune email continua a dividermele, però va bene così...

Posted: Thu Dec 06, 2007 11:01 am
by Peterpan
Mr Enrich wrote:grazie dell'aiuto!
in realtà alcune email continua a dividermele, però va bene così...
Cerca di capire perchè, ci sono segni di interpunzione o magari underscore ? se si' aggiungi dopo '\.' anche un '\_'