PDA

Visualizza Versione Completa : cercasi applicazione per scaricare interi siti



iLupus
19-07-07, 01:59
con winzozz era teleport pro, ai tempi di winzozz 98 prima serie, immagino che ci sia qualcosa di analogo per mac, ma io non so come si chiama...

Peterpan
19-07-07, 09:20
con winzozz era teleport pro, ai tempi di winzozz 98 prima serie, immagino che ci sia qualcosa di analogo per mac, ma io non so come si chiama...

Non ne ho usate, ma cerca con termini tipo web spider o site leecher

meigel
19-07-07, 09:20
Questo è free: http://www.versiontracker.com/dyn/moreinfo/macosx/4873

...e questo è a pagamento: http://www.maxprog.com/WebDumper_it.html
;)

flashcream
19-07-07, 09:20
sposto in mac basic....

http://www.versiontracker.com/php/qs.php?mode=basic&action=search&str=off+line+viewing&srchArea=macosx%7Cmacosx-all&submit=Go

per altri versi: http://www.tuttologia.com/freeware/paparazzi.html

iLupus
19-07-07, 14:35
per altri versi: http://www.tuttologia.com/freeware/paparazzi.htmluhm, paparazzi io ce l'ho, ma non sono mai riuscito a farlo funzionare come "catturatore" di siti interi, forse non so come usarlo?

Questo è free: http://www.versiontracker.com/dyn/moreinfo/macosx/4873

...e questo è a pagamento: http://www.maxprog.com/WebDumper_it.html
WinkMi appresto a scaricarli e a provarli entrambi. Poi vi saprò dire. Nel frattempo grazie a tutti!

Nadabi
20-07-07, 01:01
c'e' anche questo :
http://lightheadsw.com/sitecrawler/


ciao

painless
20-07-07, 01:44
e questo che è donation-ware, quindi free

www.sitesucker.us/home.html

ciao

Nadabi
20-07-07, 01:50
e questo che è donation-ware, quindi free

www.sitesucker.us/home.html

ciao

e' gia' stato segnalato da flashcream ...

iLupus
03-12-07, 03:05
dunque...
tutte queste applicazioni non fungono comunque come teleport pro di winzozz. Le ho provate tutte. Si avvicina di più pagesucker, e secondo sitesucker, ma c'è differenza, parecchia direi...tutti gli altri non fungono quasi per niente. Ma neanche pagesucker e ideale...Ma per avere una applicazione decente non bisognerà mica emulare winzozz...?

mutaforme
03-12-07, 10:55
Dovresti spiegare cosa manca nei programmi segnalati dal momento che non conosciamo Teleport. Io con sitesucker non ho mai avuto problemi.

iLupus
03-12-07, 11:45
se provi, per esempio, a scaricare "www.tuttologia.com" già ti rendi conto delle mancanze, ossia: al posto di molte immagini e/o qualche menu, un bel quadratino col punto di domanda. Se succede anche a te fammi sapere...
Intanto io sono riuscito a provare in versione full site crawler, e pare che non sia male a prima vista, ma devo ancora vedere stasera. [La tariffa del mio ISP non mi permette grandi download dalla 8.00 alle 19 altrimenti finirei di provarlo subito ;) ] La maggior parte di queste applicazioni, infatti, non fanno quello che promettono, ma (quelle shareware) molto spesso hanno delle restrizioni, che una volta pagate si rivelano (aihmè) essere dei BUG PERMANENTI (te lo dico per esperienza:( ) e non credo che sia così facile (soprattutto per uno in Moldavia) ricevere un rimborso dal produttore...
Comunque in riferimento a teleport, vorrei far notare che è un soft attualmente in sviluppo anche con gli ultimi NOS (non operativ systems :) ) della microzozz, ma io l'ho provato con assoluta soddisfazione all'epoca di winzozz 98. Ho però pregato un conoscente di scaricarmi alcuni siti per vedere se (essendosi comunque evoluto il web dal 98 ) è una incompatibilità diffusa con i nuovi protocolli, ma il risultato è ottimo anche con il teleport pro di adesso, ossia non riesci a distinguere la stato online da quello offline, se lo vuoi fare dalla visualizzazione del sito; perché lo usi per la consultazione offline anche tu, vero?
PS per dare meglio l'idea di che app mi serve, vi dirò l'uso che ne faccio: non essendoci dove abito io, l'ADSL, ma un connessione broadband piuttosto cara, non mi resta che stare 2 notti alla settimana a dormire in ufficio per scaricare quello che posso scaricare e che mi serve dallo stesso (update, apps, e...siti, per l'appunto, che poi consulterò offline a casa).

0x1d
04-12-07, 00:39
non potrai mai però,scaricare le pagine in php in quanto e' un linguaggio lato server e non lo puoi vedere...

iLupus
04-12-07, 14:19
non potrai mai però,scaricare le pagine in php in quanto e' un linguaggio lato server e non lo puoi vedere...si,lo so :( acc a quando li hanno inventati...ai tempi di mac os 9 si potevano scaricare tutti i siti che si voleva, ma adesso grazie a questi .php (che grazie al cielo non sono così presenti nei tutorial di MacPeer) ci sono un sacco di problemi...propongo un vaPHPPHPa day... :D
Scherzi a parte ecco i risultati di alcuni test da me effettuati sui soft più diffusi al momento attuale. Rimane solo PageSucker per Mac OS 9 che proverò stasera. Vorrei infatti che la mia segretaria in ufficio che dispone del mio vecchio G3 senza firewire (a cuinon posso installare tiger, e PageSucker e SiteSucker non funziano con panther) mi scarichi i siti che mi servono senza la mia presenza fisica (si perché l'iBook G4 lo uso io e basta).
Le "meno peggiori" applicazioni sono Pagesucker e SiteSucker.
La prima (a pagamento ;) ) è un pochino instabile (sembra una beta) ma comunque è migliore di SiteSucker. Naturalmente per verificarne l'effettivo funzionamento bisogna SCONNETTERSI da internet, al fine di verificare se la "clonazione" più o meno approssimativa è comunque abbastanza fedele da permettere una consultazione offline più o meno completa. PageSucker è stato testato su diversi siti di "incontri" online e su "tuttologia.com" dando più che buoni risultati. Nei siti per incontri online l'unico inconveniente è la presenza delle foto SOLO sulla prima pagina di ricerca. Quelle successive PUR CONTENENDO TUTTO IL RESTO, sia la grafica che i collegamenti, e il tutto è perfettamente funzionante offline. Gli altri (sitesucker compreso) non conservano la struttura grafica e di link del sito nello stato offline. Il problema è che PageSucker si blocca su alcuni siti, e che al posto di segnalare la fine del download di un sito di nuovo si blocca. Però c'è da sottolineare che il blocco NON fa perdere i dati, e che non c'è bisogno di "forzare l'uscita" ma basta usare mela-tabs e spegnere da lì. Il blocco non avviene casualmente, ma ad un determinato punto dello sacricamento di un sito, dove sussisterebbe una presunta incompatibilità con il soft. Ciò nonostante la stragrande maggioranza delle volte, per quanto strano possa sembrare, è comunque possibile con i file già scaricati prima del blocco, una consultazione relativamente attendibile.
La differenza principale tra PgeSucker e SiteSucker è più "palpabile" con il sito tuttologia.com . Provare per credere, ma dopo il download scollegatevi dal web, mi raccomando!
Gli altri soft sono a grande distanza rispetto a questi, chi non la pensa così sconnetta il cavo o l'airport dalla rete e riverifichi ;)
C'è da sperare che PageSucker "partorisca" delle update che eliminino l'instabilità e i bug presenti.
Tra i "meno peggio" dell'altra classe [che sono quelle funzionano anche coi sistemi precedenti a Tiger, a differenza di quelle sopraelencate (PageSucker per OS 9 non è stato ancora provato)] di app di scaricamento di siti, vi è DeepVacum, che scarica almeno i siti più semplici in modo che siano leggibili anche offline, quando sono un pochino più complicati non è operativo.

iLupus
04-12-07, 15:34
ecco provato! PageSucker per Mac OS 9.2.2, gira anche sotto Classic, e ciò permette anche agli utenti di Panther che non sono muniti di dualboot con OS 9, di poter usufruire da almeno un'applicazione di ultima generazione per scaricare siti, e meno male che pare essere la migliore.
Per quanto possa sembrare strano, sotto classic pare essere più stabile.
Per questo anche sul G4 ho installato tutte e due le versioni, e al primo sito in cui quella nativa di Mac OS X si inceppa, provo con quella per classic e vedo che succede. Piccole differenze sulle impostazioni e preferenze rispetto a quella per Tiger.

iLupus
04-12-07, 20:41
non potrai mai però,scaricare le pagine in php in quanto e' un linguaggio lato server e non lo puoi vedere...beh speriamo siano in pochi ad usarle...

iLupus
06-12-07, 10:52
update: safari come browser di visualizzazione offline per PS è molto lontano dall'essere completo. Il browser che preferisce PS è (udite udite) IE. Seguito da Firefox. Questo è secondo me imputabile al fatto che detta applicazione è una applicazione di winzozz trasferita su mac, infatti tutti i bug "strani" di instabilità varia, sembrerebbero confermare la mia opinione, ossia che non è fatto per il nostro OS. Tuttavia è sicuramente la miglior applicazione PER MAC e si conferma il fatto che non è stata accordata la dovuta attenzione per lo sviluppo delle applicazioni simili per il nostro OS. Anche firefox si avvicina al risultato di IE per la consultazione offline. E' quindi consigliabile per sfruttare tutte le potenzialità del programma, procurarsi una copia di IE 5.2.3, che si può trovare nelle versioni retail di panther 10.3.0, e si può comodamente estrapolare con pacifist, visto che dal net non conosco siti da cui si può effettuare il download (io ho fatto così). Versioni successive di panther non contengono il software. Io infatti ho una 10.3.5 che mi è stata fornita in bundle con il G4 che non lo contiene. Penso che fra poco PS sia pronto per effettuare il "grande salto" in "Applicazioni: i tuoi suggerimenti, le tue opinioni"...Che ne dite?

TheCube
06-12-07, 12:33
Penso che fra poco PS sia pronto per effettuare il "grande salto" in "Applicazioni: i tuoi suggerimenti, le tue opinioni"...Che ne dite?
Dico che non mi sembra proprio il caso. Siamo nel 2007, OS 9 non è più supportato da anni e qualunque Mac venduto oggigiorno non sarebbe (facilmente) in grado di utilizzare un programma scritto (male, mi pare di capire) per OS 9.
Per cui, cui prodest?

iLupus
07-12-07, 00:56
Dico che non mi sembra proprio il caso. Siamo nel 2007, OS 9 non è più supportato da anni e qualunque Mac venduto oggigiorno non sarebbe (facilmente) in grado di utilizzare un programma scritto (male, mi pare di capire) per OS 9.
Per cui, cui prodest?No guarda che non è per OS 9, c'è una versione per Tiger (che non funziona con Panther, e che quindi è nata in tempi relativamente recenti) ed una versione per "Classic" che è graficamente e praticamente UGUALE alla versione per Tiger, probabilmente ideata per permettere a coloro che possiedono da panther in giù di farlo girare sotto classic per l'appunto...La 3.2 è sia per classic che per Tiger. Riallacciandomi al 2007, oserei dire che è assurdo che nel 2007 sia l'unica applicazione "decente" di questo genere per Mac OS X... ;) . Si può infatti tranquillamente dire che "o mangiamo sta minestra o saltiamo sta finestra"...

TheCube
07-12-07, 08:59
No guarda che non è per OS 9, c'è una versione per Tiger
Forse non hai capito: TU hai usato e usi la versione per OS 9, che ne esista una per OS X è assolutamente ininfluente.
Dato che tu volevi recensire la versione che stai usando per proporla nella sezione "Applicazioni", ti ho fatto capire che la cosa non è di alcun interesse.
Più in generale: questa è una sezione di help: se non vi sono altre domande inerenti al topic sarebbe cosa buona e giusta evitare di sproloquiare oltre.

quintalozzo
07-12-07, 11:13
beh speriamo siano in pochi ad usarle...

Ma certo. E magari speriamo anche che qualche furbacchione faccia siti "1993 style" magari con migliaia di pagine da riaggiornare manualmente ogni volta, visto che c'è qualcuno che ha "bisogno" di scaricare l'intero sito o di consultarle con Netscape 3.0 o Mosaic.
Ma per favore...:doh

Una volta usavo anche io teleport, ma decisamente NON per esigenze di lavoro:oops

Ti serve una parte di un sito? Consultala e salvala in locale.
Ti serve imparare a farlo? Studia (o paga qualcuno che lo faccia per te).

Chiedo scusa a TC :worty: per lo strascico allo "sproloquio" ma davvero non capisco che diavolo di lavoro faccia nascere la necessità di scaricarsi un intero sito (farlo fare dalla segretaria poi...).

Ma ovviamente posso sbagliarmi...

Saluti e fraternità

TheCube
07-12-07, 11:45
Chiedo scusa a TC :worty: per lo strascico allo "sproloquio" ma davvero non capisco che diavolo di lavoro faccia nascere la necessità di scaricarsi un intero sito (farlo fare dalla segretaria poi...).
Nessun problema, mio caro. Le tue perplessità sono condivise da parecchie teste... :wink:

gabod3
07-12-07, 11:49
Chiedo scusa a TC :worty: per lo strascico allo "sproloquio" ma davvero non capisco che diavolo di lavoro faccia nascere la necessità di scaricarsi un intero sito (farlo fare dalla segretaria poi...).
Se si può definire lavoro far scaricare alla segretaria diversi siti di "incontri" online... :?

iLupus
07-12-07, 13:20
Se si può definire lavoro far scaricare alla segretaria diversi siti di "incontri" online... :?
No beh, io avrei seguito il consiglio di TC, ma ora credo di avere il diritto di replica:
1)Non faccio scaricare dalla segretaria siti di incontri online, IO li ho scaricati per vedere se scaricava tutta la struttura, comprese le fotografie e il sistema di link alquanto complesso, come esperimento del programma.
2)Ho spiegato che il problema dello scaricamento "tipo teleport" e della "segretaria" per intenderci è legato al fatto che nella zona ove è situato il mio mio ufficio a Chisinau (Moldavia) c'è la copertura ADSL mentre nella mia abitazione nell'interland, sono costretto ad usare un ISP broadband molto esoso economicamente, indi per cui farsi scaricare siti INERENTI AL LAVORO dalla segretaria (la quale deve solo impostare per qualche minuto il programma) è un'ottima soluzione per evitare inutili sprechi di denaro e di tempo. Ossia: la segretaria cerca il materiale che potrebbe interessarmi, lo scarica e me lo mette su cd o sulla penna USB.
3)Il mio lavoro è basato sulla ricerca di collaborazioni con enti pubblici (Regioni, Comuni, Province, ministeri) e molte volte questi siti sono molto complessi e voluminosi ed io preferisco consultarmeli a casa.
Detto questo io, vedi firma, possiedo un G3 e un G4 e nel primo non mi è possibilie installare Tiger, e ho installato quello per classic, mentre nel G4 ho installato quella per OSX, Tiger. Avendo davanti la "pagesucker version history", sembra alquanto chiaro che la versione per MAC OS CLASSIC è stata fatta con lo scopo di permettere anche a coloro che non hanno TIGER o oltre come OS, di poter usufruire della stessa, visto che la versione per classic non è nemmeno menzionata, ma è la 3.2. Anzi per quello che capisco io (ma forse sbaglio) la versione per classic non funzionerebbe perfettamente con il boot da OS 9 per una questione di java. Vorrei aagiungere che da questi ultimi topic ho l'impressione di essere stato preso per un tonto pazzesco che addirittura non sa salvare i siti manualmente in locale (!). O che non sa gestire il proprio personale (!). Io se fossi in voi non trarrei delle conclusioni così affrettate che vi possono indurre a clamorosi errori di valutazione. Detto questo posto la pagesucker version history, per chiarezza globale.
Saluti a tutti e buone feste.

PAGESUCKER VERSION HISTORY
Version 3.2 (only for 10.4.x)
* BUG FIXES:
- Fixed a couple of bugs which affected the correct reloading of pattern matching settings when DOS style
patterns were being used.
- Fixed a bug which could cause a corrupt prefs file to be written when running on MacOS X 10.2 (Jaguar).
- In previous versions PageSucker removed multiple consecutive occurrences of slashes at the end of URLs.
This could create problems for certain Web servers, and thus multiple trailing slashes will now no longer
be removed.
- Worked around a problem with Apple's Java 1.3.1 update 1 on MacOS X, which made it impossible
or very difficult to enter proxy authentication information.
- Worked around another problem with Apple's Java 1.3.1 update 1 on MacOS X, which could cause the
control window's menus to get deactivated when the "end of download" dialog was dismissed by hitting the
"Return" key while the log window was active.

- Enhanced the log window such as to only show the last 200 lines of log output. Previously the number of
lines shown was unlimited, which could lead to memory shortages upon long downloads.

- Made sure that the log window shows newly added text on Windows machines. Previously, the log window
would remained scrolled all the way up on Windows.

- A relative URL in a redirected page will now be correctly interpreted relative to the redirected URL.
Previously it would be interpreted relative to the original URL, which could lead to incomplete downloads,
error messages or even infinite loops.

- Fixed a couple of bugs which could cause mysterious "File Not Found" messages to appear when the
"Complement Existing File" mode was used and PageSucker encountered name clashes on the site being
downloaded. Due to this bug, multiple threads could attempt to write to a given local file at the same time,
which would cause a "FileNotFoundException" message to be displayed.

- Previously, PageSucker's JavaScript interpretation would handle a single dot as a potential URL, which
would corrupt a downloaded page when a single dot was used with some other meaning inside that page.
This has been changed, so that single dots inside blocks of JavaScript are now always left alone.

- Corrected a bug which could cause problems when downloading a JavaScript include file the URL of
which does not have an extension. Such a file would incorrectly be treated like an HTML file.

- Fixed a bug which would cause certain %xx encoded characters (such as ampersands) in a URL to be
decoded, which could lead to the impossibility to correctly download certain pages.

- In previous releases, initial whitespace inside a quoted string would be moved out of the string, to
show up before the quote character. Now, inital and trailing whitespace inside quoted strings will simply
be removed.


* FEATURE ENHANCEMENTS:

- Added support for the most common cases of cascading stylesheets (CSS).

- Added two options to delete unused empty files, and/or incompletely downloaded files when a download
process is interrupted by the user.

- Enabled the "Recognize unterminated quoted strings" option in the Miscellaneous settings window by
default, as this option makes PageSucker more tolerant toward an HTML error which is very common
in today's Web pages.

- The "Parse HTML pages not in hierarchy" option in the HTML Files settings window is now also available
in the demo version of PageSucker. In previous versions, this option was reserved for registered users,
but this restriction turned out to be too severe considering the structure of many modern Web sites.