Ich habe diesen Downloader geschrieben, da mich die Lösung für Linuxuser über Wine und USD nicht zufriedenstellt (ich möchte gerne alles über die Konsole regeln können, da man nicht immer eine grafische Oberfläche zur Verfügung hat).
Zur Erkennung habe ich GOCR mit einer Captcha Datenbank benutzt.
Ich weis nicht ob das ganze unter Windows funktioniert, dieses script ist eigentlich für Linux und evtl. BSD Benutzer gedacht.
Das script wurde erfolgreich auf dem Mac gestestet, es gibt aber bis jetzt noch keine Garantie das es überall läuft!
Dies ist kein Supportthread für Linux,BSD,Mac etc.!!!
Wer probleme bei der installation der benötigten Programme hat soll sich an die entsprechenden Foren wenden oder einfach mal google benutzen.
Tip: Die logs zu lesen hilft meistens!
Was wird benötigt?
- Perl mit installiertem libwww modul (LWP), getestet mit version 5.8.8 (gentoo:libwww-perl)
für das Rapidshare.com plugin:
- jpeg bibliothek (debian/ubuntu: libjpeg-progs; gentoo:media-libs/jpeg)
- imagemagick (gentoo: media-gfx/imagemagick)
Version 0.25 - 16.06.07 - 18:00
- Check if download can be written to file
Version 0.24 - 31.05.07 - 23:00
- New Folder structure, tmp, etc, log added
- Configurationfile updated for new folders and loglevel
- loglevel added.
- Flexibel Destination for the TuxLoad Configurationfile, script first search at /home/user/.tuxload/config.pl, then /etc/tuxload/config.pl and last $path_tuxload/etc/config.pl
- Online updater can make new folders
- Failed Downloads would be save now in logs/failed.log
Version 0.23 - 29.05.07 - 21:42
- Online updater added
- new config option $update added for getting update_files
- fixed bug with listdownload
- added sub function for masking strings
- Script is now under GPL
Version 0.22 - 29.05.07 - 8:30
- list handling updated, see config
- added list for failed downloads
- returncode of default_download fixed
version 0.20 - 26.05.07 - 20:00
- ignorecase added on check_plugin
version 0.19 - 26.05.07 - 13:00
- filter updated - carriage return added - fixed a bug in some downloadlists
Version 0.18 - 26.05.07 - 10:30
- fixed some issues with filename by default download
- new option for reconnect
Version 0.17 - 25.05.07 - 14:30
- added default download, try to download all files via http where is no plugin defined
- no reconnect by default, reconnect must be set by config.pl or by argument
- path and filename to the logfile can be changed by config
Version 0.16 - 24.05.07 - 19:00
- TuxLoad redesigned to use plugins
- Configuration splitted, there are now one config file for the plugins and one for TuxLoad. The Plugins have there own configuration
- Banner Changed
Version 0.15 - 22.05.07 - 21:30
- configuration extended with $retry_max, sets the maximal retrys
- $wait_retry changed to $retry_wait in configuration
Version 0.14 - 22.05.07 - 16:20
- Logformat changed
- ".html" removed from filter
Version 0.13 - 21.05.07 - 19:22
- Argument -c added for binding onother configurationfile
- configuration extended with $config_list_handler, can now delete finished downloads from list
- usage description changed
Version 0.12 - 21.05.07 - 10:50
- fixed bug with less downloads
Version 0.10 - 20.05.07 - 16:45
- fixed listdownload
Version 0.9 - 20.05.07 - 16:07
- Configuration paged out to config.pl
- Configurationcheck at startup
- Command-line arguments are more flexible
- Argument -d added for download destination
- Progressbar updated - average Download speed added
Version 0.8 - 19.05.07 - 22:23
- Banner changed
Version 0.7 - 19.05.07 - 18:53
- added filter vor bbcode [url]
- logfile captures now more information.
Version 0.6 - 19.05.07 - 16:46
- fixed bug with namespaces in url list
Version 0.5 - 19.05.07 - 15:46
- really fixed progress display
- added filter for anonym.to and urls including rs servernumber.
- Configuration now in tuxload.pl included
Version 0.4 - 18.05.07 - 20:52
- added reconnect support for filedownload
- fixed progress display
- fixed bug in retry mode
Version 0.3 - 18.05.07 - 19:30
- display now the actual progress
Version 0.2 - 18.05.07 - 18:59
- support for download lists added
- fixed bug in logfile
Ich hatte gestern auch schon angefangen, aber war noch nicht ganz so weit wie du jetzt!
Würde dir gerne bei der Weiterentwicklung helfen, sei es selber mitschreibend oder nur beratend. Habe das Script gerade runtergeladen und nach kurzem Einlesen und Ausprobieren funktioniert es.
Ein paar Anmerkungen:
Ich brauchte noch djpeg, welches sich unter Ubuntu im Paket libjpeg-progs befindet.
Die Zeile:
Code:
if ( $html_content =~ m/(<p><p><form action=\")($URI[0]rs)(\d\d)(\.rapidshare\.com$URI[1])(\" method=\"post\">)/)
sollte durch
Code:
if ( $html_content =~ m/(<p><p><form action=\")($URI[0]rs)(\d{1,3})(\.rapidshare\.com$URI[1])(\" method=\"post\">)/)
ersetzt werden, da sie Servernummern auch 3-stellig sein können...
ich bin einfach mal davon ausgegangen, dass sie 1 bis 3-stellig sein können.
Danke für den hinweis, habs aber durch \d+ gelöst.
Desweiteren geht jetzt auch der download über eine liste, mit optionalem reconnect.
Das Programm/script zum reconnecten muss in der config angegeben werden.
bräuchte übrigens immer noch nen html code für die wartezeit. RS hat mich wohl zur zeit sehr gern^^.
Danke für den hinweis, habs aber durch /d+ gelöst.
Desweiteren geht jetzt auch der download über eine liste, mit optionalem reconnect.
Das Programm/script zum reconnecten muss in der config angegeben werden.
bräuchte übrigens immer noch nen html code für die wartezeit. RS hat mich wohl zur zeit sehr gern^^.
nicht nur dich. die wartezeit hat RS zurzeit komplett entfernt. egal wie groß die dateien sind!
Mal ne Frage: Hab ich das richtig verstanden? Läuft das nur auf Kommandozeile, oder gibts auch ne gui?
Auf jeden Fall ne super alternative zu usd+wine wenns funktioniert. Ich werds mal testen!
Kleine Schönheitskorrektur fürs Log wäre nach dem Download das Datum in der Leerzeile zu entfernen
Code:
Fri May 18 15:46:34 2007: Download finished
Fri May 18 15:46:34 2007:
Bei der Anzeige wieviel man schon runtergeladen hat, könntest du da aus der
Chunkgröße den aktuellen Downloadspeed berechnen?
Und wie genau funktioniert das mit den Chunks beim Download (was für eine Größe ist das zum Beispiel)?
Vielen Dank für die Arbeit, klappt wunderbar
Könntest du vllt noch per Default den reconnect nach jedem DL einbauen, auch wenns nur eine Datei ist (-f) ? Habs zwar bei mir schon geändert, aber ich denke das würde einigen helfen, zumal die Fehlermeldung ('Error, Maybe too much downloads?') ein bisschen missverständlich ist.
Oder man macht eine Abfrage, ob ein reconnect stattfinden soll, wenn nur eine Datei gedownloadet wird.
Soweit die (hoffentlich konstruktive) Kritik von mir...
hast du die jpeg bibliothek installiert? evtl brauchst du auch die NetPBM bibliothek und imagemagick. Wenn du die nachinstalliert hast empfiehlt es sich gocr neu zu kompilieren/installieren.
hmm hab jetzt alles drauf, aber es geht immernoch nicht.. selber fehler
welche version von gocr benutzt du? versuch mal die sources von http://anonym.to/?http://jocr.sourceforge.net/ zu kompilieren und zu installieren.
Folgendes wirklich installiert?
- jpeg bibliothek (debian/ubuntu: libjpeg-progs; gentoo:media-libs/jpeg)
- evtl. NetPBM (gentoo: media-libs/netpbm)
Ein packet wird eher schwierig, ich kann höchstens eins für linux machen. Aber selbst da müssen dann alle programme kompiliert werden, da es unterschiedliche plattformen und distributionenn gibt.