|
|
|
|
|
|
Voll im Trend? Och nö...
Registrierungsdatum: Apr 2003
Ort: Bei Deiner Mutter...
Beiträge: 669
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Zitat:
|
Zitat von RamseZ
also so wie ich das jetzt verstanden habe, hab ich nix zu befürchten mit sowas aufm space?
nich dass die bullen das nich gescheit überprüfen und dann mit ner hd vor der tür stehn... 
|
Doch, bei nem Kumel der Freund dessen Bekannten haben'se deswegen ne HD gemacht und seine Oma die gerade in der Küche stand und kochte hamse verhaftet und brutal vergewaltigt.
...man, man, man... wie sich manche immer so einscheissen und aber trotzdem cool sein wollen.
Hat nicht jemand Lust die Liste noch ein wenig mit aktuellen Hits und Movies zu erweitern?
so und nun noch nen link hier rein damit google es auch findet:
http://mitglied.lycos.de/patervinzent/Movies_Mp3/
KaZaA, download, music, warez, apps, appz, cracks, crackz, p2p, filesharing, illegal, keygen, serials, serialz, torrent, gnutella, fasttrack, hacker, leet, porno, free, gratis, stuff, eminem, metallica, harry potter, exorcism, doom, half-life, counter-strike
Geändert von BellaBong (17. 12. 2005 um 13:08 Uhr).
|
16. 12. 2005, 14:14
|
#26
|
|
▲1911▲
Registrierungsdatum: Jan 2004
Beiträge: 2.150
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
mittlerweile ist die version 1.1 von diesem script heraussen. diese behebt einige schönheitsfehler bzw. verdachtsmomente, die ein erkennen des scriptes leichter gemacht hätten.
ich empfehle jedem der dieses scirpt nutzt bzw. diese pedition unterstützt, upzudaten:
http://freshmeat.net/redir/dirindexf...faker_v1.1.zip
mfg Claymore
|
16. 12. 2005, 14:32
|
#27
|
|
Mitglied
Registrierungsdatum: Dec 2005
Beiträge: 2
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Mit "Serverkennung" mein ich unten den String. Sprich: "Apache/2.0.50 (FreeBSD) mod_ssl/2.0.50 OpenSSL/0.9.7d PHP/4.3.8 Server" - der kommt so bei google auf 1500 Sites vor. Daher muss man ihn halt anpassen. Und das Filtern dürfte irrelevant sein. Im einfachsten Fall machste einen einfachen String-Vergleich auf zwei Zeichenketten... selbst wenn Du den Vergleich komplexer machst, kommst Du pro Tag garantiert auf abertausende Seiten die Du abklappern kannst (pro Spider) - ich würde sogar behaupten, dass Du zum Download der Daten länger brauchst als zum Analysieren. Ich hab hier irgendwo ne selbstgestrickte Suchroutine in PHP rumfliegen die Artikel indiziert (in Wörter aufsplittet, Häufigkeit von Worten zählt, DB-Einträge anlegt, etc.) und selbst die schafft es, mehrere 100KB lange Texte in ner halben Sekunde zu analysieren (auf nem 2GHz Rechner) und das dürfte wesentlich komplexer sein, als die Seite als Fake zu identifizieren
|
16. 12. 2005, 14:34
|
#28
|
|
Beiträge 32024
Registrierungsdatum: Nov 2003
Ort: Da wo ich gerade bin
Beiträge: 181
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Wie jetzt ? Verstehe ich das richtig, dass dieses Tool Fake Einträge produziert, was ist dann mit der Gössenangabe Size ?
Wird Plattenspeicher dadruch vebraucht ? Oder ist es nur ein Fake und der Speicherplatz ist noch vorhanden.
Kann mal einer erklären, jemand der es schon getestet hat.
Danke
|
16. 12. 2005, 14:52
|
#29
|
|
...ist dagegen!
Registrierungsdatum: Jan 2003
Ort: Osnabrooklyn
Beiträge: 5.010
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Zitat:
|
Wird Plattenspeicher dadruch vebraucht ?
|
Steht doch im Artikel; es wird kein Speicherplatz verbraucht. Die Einträge sind fakes.
Danke für die Erklärung bzgl. der Serverkennung, Taren.
Die Sites als Fake zu enttarnen kostet trotzdem Rechenzeit und Traffic. Kannst die Endungen ja in AVI oder Ähnliches ändern, dann ist die Dateigröße auch realistisch. Serkennung änderst Du halt. Wenn das jeder anders macht, wird es relativ schwer, das automatisch zu filtern. Es soll es ja auch nicht verhindern, nur erschweren.
|
16. 12. 2005, 15:01
|
#30
|
|
Beiträge 32024
Registrierungsdatum: Nov 2003
Ort: Da wo ich gerade bin
Beiträge: 181
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Alles im Netz führt dazu, dass das Netz verlangsamt wird.
Es müsste ein Verbraucherschutzgesetz geben, was dem Verbraucher sein Recht für seine Bandbreite gibt.
Wenn Irgendwelche Firmen meinen die müssten das Netz verlangsamen, dann müssten die Provider doch dagegen klagen können oder nicht ?!?
|
16. 12. 2005, 15:32
|
#31
|
|
********
Registered User
Registrierungsdatum: Mar 2000
Beiträge: 3.882
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Auch ich bin dabei: http://members.tripod.de/chaospunker/
Wie ist das eigentlich mit robots? Müssen sich die nicht nach der robots.txt richten oder ist das nur Freundlichkeit von Google und Co?
Greetz
ASCII
|
16. 12. 2005, 15:36
|
#32
|
|
...ist dagegen!
Registrierungsdatum: Jan 2003
Ort: Osnabrooklyn
Beiträge: 5.010
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Zitat:
|
Müssen sich die nicht nach der robots.txt richten oder ist das nur Freundlichkeit von Google und Co?
|
Die müssen nicht. Machen sie teilweise auch nicht. Die dürfen alles, was andere Useragents (z.B. Browser) auch dürfen.
//edit
Taren, wenn die alle Seiten mit der Serverkennung als Fake ansehen, dann wäre das ja eine Lustige Methode um seine (richtige) Site vor den Spidern zu schützen. Fällt mir gerade noch ein
|
16. 12. 2005, 15:38
|
#33
|
|
rebuilding
Registrierungsdatum: Dec 2004
Ort: BW
Beiträge: 3.349
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Nur eine Freundlichkeit, wenn Google und co eine robots.txt finden halten sie sich drann...
meist zumindest...
edit: Greg, verdammte 10sek...
|
16. 12. 2005, 15:38
|
#34
|
|
Elementarteilchen
Registrierungsdatum: Aug 2005
Beiträge: 883
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Hm, auch wenn ich das ganze eine gute Idee finde, die gennanten Copyright Organisationen werden warscheinlich einmal drauf reinfallen, und dann die Robots einfach gewisse Datein (die, die FakeDir erzeugt) nicht mehr laden
Habt aber bitte auch mit Free-PHP-Hostern Rücksicht, da es enorm Traffic verbraucht und die Rechenlast (wurde oben schon angesprochen) doch nicht zu unterschätzen ist!
|
16. 12. 2005, 16:04
|
#35
|
|
555-Nase
Registrierungsdatum: Jan 2004
Ort: im Keller
Beiträge: 1.341
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
naja da ja sicher nicht 1000 von leuten nun das script laufen haben wird sich wohl die Rechenlast in grenzen halten. Und wie du schon sagst. Wird nicht lange dauern bis sie nicht mehr darauf reinfallen. Alles also halb so wild.
Und hier ist meiner mit counter ^^
|
16. 12. 2005, 16:22
|
#36
|
|
...ist dagegen!
Registrierungsdatum: Jan 2003
Ort: Osnabrooklyn
Beiträge: 5.010
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Zitat:
|
und dann die Robots einfach gewisse Datein (die, die FakeDir erzeugt) nicht mehr laden
|
Ist doch gut so. Dann erzeugt man erstmal richtige Namen, die dann später nichtmehr gespidert werden. Dann finden die später richtige Dateien mit den richtigen Namen nichtmehr. Und um die weiter zu verarschen ändert man halt eine Kleinigkeit am Namen. Solche Filter haben schon damals bei Napster versagt.
Das andere meinte ich ja schon. Wird aber wohl nicht so dramatisch sein, schätze ich.
|
16. 12. 2005, 16:24
|
#37
|
|
If looks could kill
Registrierungsdatum: Oct 2004
Ort: <^DA^>
Beiträge: 3.054
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
um es etwas realisticher zu machen ahbe ich das script etwas abgeändert, so das nicht mehr eine versionsnummer dabei steht wie z.b. King_Kong.1.2.0 usw. ich denke es kommt realisticher wenn der Bot King_Kong.mpeg liest oder? ^^
|
16. 12. 2005, 17:48
|
#38
|
|
Elementarteilchen
Registrierungsdatum: Aug 2005
Beiträge: 883
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
*wegeditiert*
Post überflüssig
Geändert von xxxstereoxxx (16. 12. 2005 um 23:03 Uhr).
|
16. 12. 2005, 21:34
|
#39
|
|
Mitglied
Registrierungsdatum: Dec 2005
Beiträge: 5
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
|
17. 12. 2005, 00:24
|
#40
|
|
Gast
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
newuser bitte denk auch an funpic!
ich finds echt grossartig dass die anfängern gratis unbegrenzt webspace und traffic mit php zur verfügung stellen genauso wie ich dieses script hammers genial finde aber die agbs von funpic und ohost untersagen scripts dieser art ausdrücklich und ich find man sollte da auch wirklich ein wenig rücksicht auf funpic und dessen user nehmen(das script verlangsmt schliesslich die server von funpic/ohost)
nich bös gemeint nur meine meinung
|
17. 12. 2005, 01:46
|
#41
|
|
Elementarteilchen
Registrierungsdatum: Aug 2005
Beiträge: 883
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Ich hab auch mal einen Mirror unter bombfucker.host.sk mit etwas script kiddie mäßigem design gemacht, zudem hab ich die filelist ein bisschen verlängert, bombfucker.host.sk/download/filelist.txt
|
17. 12. 2005, 13:00
|
#42
|
|
Voll im Trend? Och nö...
Registrierungsdatum: Apr 2003
Ort: Bei Deiner Mutter...
Beiträge: 669
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Man kann die filelist nicht downloaden.
|
17. 12. 2005, 13:07
|
#43
|
|
...ist dagegen!
Registrierungsdatum: Jan 2003
Ort: Osnabrooklyn
Beiträge: 5.010
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Aber hier gibt es die Liste. Das Suchmaschinenspamming kannste auch wieder weglassen, bitte.
|
17. 12. 2005, 13:14
|
#44
|
|
Voll im Trend? Och nö...
Registrierungsdatum: Apr 2003
Ort: Bei Deiner Mutter...
Beiträge: 669
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Die Liste mein ich nicht. Ich meine die Liste die ich über dir schon meinte.
...was meinst du mit Suchmaschinenspamming?
|
17. 12. 2005, 13:23
|
#45
|
|
Elementarteilchen
Registrierungsdatum: Aug 2005
Beiträge: 883
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Ich dachte das spricht vl. die Spider der RIAA und co an, aber du hast recht  Ich hab nun bei den Metatags nun bis auf Robots NOINDEX, FOLLOW alles weggetan
|
17. 12. 2005, 13:25
|
#46
|
|
Voll im Trend? Och nö...
Registrierungsdatum: Apr 2003
Ort: Bei Deiner Mutter...
Beiträge: 669
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Wieso, lass das doch drin. Ist doch gerade gut.
Man kann die Filelist.txt aber immernoch nicht downloaden.
|
17. 12. 2005, 13:29
|
#47
|
|
Elementarteilchen
Registrierungsdatum: Aug 2005
Beiträge: 883
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
*g* das liegt daran das ich mich verschrieben habe, die datei heißt nicht filelist.txt sondern filenames.txt  sorry
|
17. 12. 2005, 13:49
|
#48
|
|
Alle Zeitangaben in UTC +1. Es ist jetzt 15:46 Uhr.
|
|