Page 1 of 1

da pdf a testo

Posted: Tue Jun 19, 2007 8:12 pm
by iGiuseppe
Ciao.... mi serve un aiuto..... non ho tempo e devo portare un pdf in un documento di testo... è possibile o devo ricoiarlo a mano?


Grazie anticipatamente!

Posted: Tue Jun 19, 2007 8:15 pm
by TheCube
E' possibile con alcuni software di tipo OCR (Optical Character Recognition), come ReadIRIS e altri.

Posted: Tue Jun 19, 2007 8:19 pm
by gabod3

Re: da pdf a testo

Posted: Tue Jun 19, 2007 8:27 pm
by onumbarr
iGiuseppe wrote:devo portare un pdf in un documento di testo... è possibile o devo ricoiarlo a mano?
Se e' solo testo un copia e incolla non va bene?

Posted: Tue Jun 19, 2007 8:31 pm
by iGiuseppe
TheCube wrote:E' possibile con alcuni software di tipo OCR (Optical Character Recognition), come ReadIRIS e altri.

Grazie
gabod3 wrote:Prova anche con File Juicer: http://www.tuttologia.com/macp2p/showthread.php?t=17624
Provo subito!
Se e' solo testo un copia e incolla non va bene?
Dai pdf non si puo semplicemente copiare...

Posted: Tue Jun 19, 2007 8:39 pm
by onumbarr
iGiuseppe wrote:Dai pdf non si puo semplicemente copiare...
Oddio... a me lo copia e lo incolla!!!! Sicuro che il pdf non sia protetto?

Posted: Tue Jun 19, 2007 8:40 pm
by TheCube
iGiuseppe wrote:
Dai pdf non si puo semplicemente copiare...
Se il testo è "vero" testo si può copiare eccome... Il problema salta fuori quando il testo è "embedded" in un'immagine...

Posted: Tue Jun 19, 2007 8:52 pm
by iGiuseppe
A me non è mai capitato di trovare un testo vero in un pdf... sempre come immagine

Posted: Tue Jun 19, 2007 9:07 pm
by TheCube
iGiuseppe wrote:A me non è mai capitato di trovare un testo vero in un pdf... sempre come immagine
A me invece capita spesso.
Per fare un esempio catturato al volo dalla rete: http://download.parallels.com/v3/en/GA/ ... 0Guide.pdf

E il copia e incolla funziona perfettamente:
Parallels and Parallels logo are registered trademarks; Coherence, Compressor, SmartSelect, and Transporter are trademarks of Parallels Software International, Inc.
This product is based on a technology that is the subject matter of a number of pending patent applications.

Posted: Tue Jun 19, 2007 9:14 pm
by onumbarr
&quot wrote:
iGiuseppe wrote:A me non è mai capitato di trovare un testo vero in un pdf... sempre come immagine
Infatti, come dice TC, spesso i pdf contengono del testo piu' o meno editabile, nella maggior parte dei casi - se non si tratta di documenti protetti da una pw - basta selezionarlo e copiarlo.

I casi in cui il testo e' rappresentato come immagine, che io ricordi, sono da ricondurre alla modulistica dell apubblica amministrazione o di qualche ente, che si limita ad una scansione di una copia cartacea e salva il documento come PDF. Si potrebbe aprire una discussione sul formato PDF, che a mio parere e' una delle cose piu' intelligenti partorite dall'informatica, ma non credo sia questa la sede... ;)