|
|
|
|
|
|
gulli:News Redaktion
Registrierungsdatum: Apr 2002
Beiträge: 6.484
|
Spider der Copyrightindustrie mit Datenmüll füttern
Script generiert Apache-Fakedirs
Wer php-fähigen Wepspace hat und die Spider der einschlägigen Piraterieverfolger ein wenig ausbremsen mag, bekommt mit dem Dirindexfaker ein hübsches Tool in die Hand. Sinn der Übung: die Copyrightindustrie durchsucht unter anderem mit Spidern das Web, um Seiten mit möglicherweise unliebsamen Inhalten zu finden. Deren Inhaber werden - wenn möglich - ermittelt und - wenn möglich - angezeigt. Das automatisierte Durchforsten des Webs ergibt jedoch nur Sinn, wenn tatsächlich auch überwiegend echte Angebote gefunden werden. Fallen die Bots auf Massen von Fakematerial herein, steigt der Aufwand, echte von falschen Seiten zu sortieren, erheblich an. Und: diese Sortierung muss von Menschen gemacht werden, wenn es der Spider nicht kann.
Die Lösung: ein Script, das ohne viel Serverlast Directories erzeugt, die nach außen hin als Sammlung urheberrechtlich bedenklich scheinender Dateiangebote scheinen, tasächlich aber nur Datenmüll enthalten, dabei für einen Spider wie eine "echte" Seite erscheinen. Der DirIndexFaker setzt auf einem früheren Versuch auf, ein solches Skript zu schreiben. Der "DMCA Bot Killer" wies jedoch einige Schwächen auf, die ihn leicht maschinell erkennbar machten.
Der Dirindexfaker erzeugt Seiten, die wie Directorylistings eines Apache-Webservers aussehen
weiterlesen
|
15. 12. 2005, 16:34
|
#1
|
|
Gast
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
hätt ich space würd ichs machen
|
15. 12. 2005, 17:05
|
#2
|
|
Großmaul
Registrierungsdatum: Jan 2004
Ort: Straight in the Pit
Beiträge: 740
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Find ich klasse und werd das Script auch gleich mal auf meinen Space packen.
|
15. 12. 2005, 17:05
|
#3
|
|
Problembär
Registrierungsdatum: Apr 2002
Ort: Schweiz
Beiträge: 1.590
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Ja verdammt! Ich habs doch gewusst!! für irgendwas muss Funpic und Ohost doch zu gebrauchen sein
Berater
|
15. 12. 2005, 17:19
|
#4
|
|
rebuilding
Registrierungsdatum: Dec 2004
Ort: BW
Beiträge: 3.349
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Zitat:
|
Zitat von Berater
Für irgendwas muss Funpic und Ohost doch zu gebrauchen sein 
|
*gg* nice work
|
15. 12. 2005, 17:24
|
#5
|
|
Pädagogisch wertvoll!
Registrierungsdatum: Jun 2005
Beiträge: 1.043
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Die bremsen die Justiz, also bremst man die einfach. Aber bei ihrem Wahn kann ich mir vorstellen, dass die wegen "Vortäuschen einer Straftaat" klagen.
Anyway: Gefällt mir.
|
15. 12. 2005, 18:20
|
#6
|
|
Mitglied
Registrierungsdatum: Aug 2004
Ort: Wuppertal
Beiträge: 1.258
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Das man sowas nicht auf einem auf mit REAL DATEN angemeldeten Space mit eigener .de-Domaine & Impressum macht, das müsste doch jedem klar sein
|
15. 12. 2005, 18:30
|
#7
|
|
Pädagogisch wertvoll!
Registrierungsdatum: Jun 2005
Beiträge: 1.043
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Dann gehen die gegen den Server und verlangen die IP des Users... aber das System ist ja so alt noch nicht, mal schauen, was draus wird.
|
15. 12. 2005, 18:37
|
#8
|
|
Mitglied
Registrierungsdatum: Aug 2004
Ort: Wuppertal
Beiträge: 1.258
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Dann nutze ich ein Proxy wie TOR. Selbst JAP ist für sowas ausreichend (JAP kann nicht rückwirkend zurückverfolgen!).
Ja, es gibt keine 100%tige Anonymität, aber bei so kleinen Sachen (besonders bei Massenabmahnungen) reicht ein Proxy, um Behörden aufzuhalten - besonders bei Massenabmahnungen werden erst die Leute drangenommen wo es einfach geht und bis die alle durchhaben die kein Proxy benutzt haben, da sind zumindest die 2 Jahre Speicherungspflicht vorüber und im besten Falle ist man längst Ur-Ur-Opa oder sogar tod
|
15. 12. 2005, 18:44
|
#9
|
|
Nachfolger von Alphauser1
Registrierungsdatum: Oct 2004
Ort: Links neben dir
Beiträge: 1.460
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Aber du hast den Beitrag schon gelesen oder????
Es geht hier um Webspace besitzer
|
15. 12. 2005, 19:40
|
#10
|
|
Mitglied
Registrierungsdatum: Aug 2004
Ort: Wuppertal
Beiträge: 1.258
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Zitat:
|
Zitat von betauser2
Aber du hast den Beitrag schon gelesen oder????
Es geht hier um Webspace besitzer
|
klar hab ich den gelesen  Warum fragste? Weil du vielleicht denkst TOR ist nur zum Surfen?
Nein, JAP und TOR kann man dafür perfekt benutzen, um Webspace (mit falschen Daten) mit PHP-Unterstützung anzumelden (ja ab da ist man "Webspacebesitzer") und den Antispider-Krempel dann hochzuschieben - alles mit nem Proxy.
|
15. 12. 2005, 19:50
|
#11
|
|
Gesperrt
Registrierungsdatum: Dec 2005
Ort: im Norden.
Beiträge: 3.021
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
noop hat aber recht soweit ich weiß  ...is ne feine sache werde mich der aktion sicherlich anschliessen!
|
15. 12. 2005, 20:02
|
#12
|
|
Mitglied
Registrierungsdatum: Nov 2005
Beiträge: 68
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Fett! Werd mich aufjedenfall dran beteiligen
Postet dies doch bitte überall weiter, nur dann machts Sinn.
Macht nen Thread, auf jedem Board das ihr kennt und schickt den Link an jeden aus eurer ICQ/Mail oder sonst was Liste!
Villeicht nützts ja was
|
15. 12. 2005, 20:07
|
#13
|
|
rebuilding
Registrierungsdatum: Dec 2004
Ort: BW
Beiträge: 3.349
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Nennt mir einen grund, dass nicht zu benutzen
begehe ich damit irgendein Verbrechen?
nein, ich verwirre nur die Spider, und das ist *mir* doch pelle, mal gucken wielange funpic das mitmacht
|
15. 12. 2005, 20:38
|
#14
|
|
If looks could kill
Registrierungsdatum: Oct 2004
Ort: <^DA^>
Beiträge: 3.054
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
sooo habe mal 10 + subdomains gemacht
edit: Tip: macht mehr Filenames in die textdatei
|
15. 12. 2005, 21:08
|
#15
|
|
Elementarteilchen
Registrierungsdatum: Aug 2005
Beiträge: 883
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Ja, am besten die Titel von Glashaus auch gleich drauf, auf die Logistep so vernarrt ist :P Vielleicht auch noch eine Index Seite dazu machen, die nach einer Warez Seite wirkt, mit einem Link aufs Fake Directory!
|
15. 12. 2005, 21:29
|
#16
|
|
Mitglied
Registrierungsdatum: Apr 2002
Beiträge: 109
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
...und die Fake-Warezsite meldest Du dann bei der gulli-Toplist an. Zwei Fliegen mit einer Klappe.
|
15. 12. 2005, 21:46
|
#17
|
|
Error 404: Love not found
Registrierungsdatum: Aug 2001
Beiträge: 3.972
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Tach
Was mir aufgefallen ist,
dass ja die IP: 127.0.0.1 unten im Script steht,
man könnte ja auch die Client-IP missbrauchen
PHP-Code:
<?php echo $_SERVER['REMOTE_ADDR']?>
Sonst sieht das erstmal interesannt aus
Bis dann...
ps: es gibt doch bestimmt eine RewriteRule
damit man das vielleicht noch echter aussehen lassen könnte, oder nicht ?
Damit aus media/?download=1&file=Datei.ext nur noch media/Datei.ext wird ?
Geändert von cuhformation (16. 12. 2005 um 03:16 Uhr).
|
16. 12. 2005, 02:47
|
#18
|
|
Mitglied
Registrierungsdatum: Jun 2005
Beiträge: 1
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
THX das lieb ich an Gulli hab auch eben auf 10 spaces gepackt die ich eh ned mehr nutze  und das ist ned verboten da du ja nur eine Index anlegst mit verarsche daten das is bisher nicht verboten in DE
|
16. 12. 2005, 06:32
|
#19
|
|
...ist dagegen!
Registrierungsdatum: Jan 2003
Ort: Osnabrooklyn
Beiträge: 5.010
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Zitat:
|
Das man sowas nicht auf einem auf mit REAL DATEN angemeldeten Space mit eigener .de-Domaine & Impressum macht, das müsste doch jedem klar sein
|
Das einzige, was dagegen spricht, ist die verbrauchte Rechenleistung. Ich könnte mir vorstellen, dass es relativ aufwändig ist, 1.000 Files on-the-fly zu generieren. Hoffentlich spidern die nicht zu viele Sites (allgemein), sonst könnte das u.U. ärgerlich für Funpic & co. (und deren Nutzer) werden.
Kann mich da auch irren, hört sich aber so an.
|
16. 12. 2005, 09:35
|
#20
|
|
********
Registrierungsdatum: Jun 2000
Ort: Aachen
Beiträge: 12.253
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Zitat:
|
Zitat von b-tight06
Fett! Werd mich aufjedenfall dran beteiligen
Postet dies doch bitte überall weiter, nur dann machts Sinn.
Macht nen Thread, auf jedem Board das ihr kennt und schickt den Link an jeden aus eurer ICQ/Mail oder sonst was Liste!
Villeicht nützts ja was 
|
Mit den gesegneten Worten der heiligen Jungfrau Marias: LASS DEN SCHEISS. Dafür ist ICQ nicht da.
|
16. 12. 2005, 11:36
|
#21
|
|
Feuerfuchs
Registrierungsdatum: Sep 2004
Beiträge: 159
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
also so wie ich das jetzt verstanden habe, hab ich nix zu befürchten mit sowas aufm space?
nich dass die bullen das nich gescheit überprüfen und dann mit ner hd vor der tür stehn...
|
16. 12. 2005, 13:51
|
#22
|
|
...ist dagegen!
Registrierungsdatum: Jan 2003
Ort: Osnabrooklyn
Beiträge: 5.010
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Die bekommen doch keine Erlaubnis zur Hausdurchsuchung, nur weil Du Dateien mit irgendwelchen Namen auf Deinem Webspace hast.
|
16. 12. 2005, 13:57
|
#23
|
|
Mitglied
Registrierungsdatum: Dec 2005
Beiträge: 2
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Das Script macht nur bedingt Sinn, da es problemlos von Robots erkannt werden kann. Sei es, weil es relativ unsinnige Dateigrössen erzeugt (MP3-Files mit 500 oder 600 MB -> die mag es zwar geben, aber es ist halt relativ unwahrscheinlich), weil es statische Infos erzeugt die man abfragen kann (Server-Kennung (fragt man google nach exakt dieser Server-Kennung gibts läppische 1500 Treffer) und Verzeichnisname ist immer gleich angegeben - müsste man dann ggf. manuell anpassen - ansonsten können Robots daran schnell das Script erkennen) oder aber indem ein Robot einfach eine Seite doppelt anfordert und die zurückgelieferten Filenamen vergleicht (die sind bei dem Script immer unterschiedlich - also leicht erkennbar).
Von daher ist es eine lustige Spielerei, aber wenn man der Gegenseite auch nur minimale Intelligenz zugesteht, dann können die ihre Automatismen so anpassen, dass das Script sofort auffliegt und entsprechend ignoriert wird.
|
16. 12. 2005, 14:03
|
#24
|
|
...ist dagegen!
Registrierungsdatum: Jan 2003
Ort: Osnabrooklyn
Beiträge: 5.010
|
Re: Spider der Copyrightindustrie mit Datenmüll füttern
Es geht aber auch um die Rechenleistung/Traffic. Der erhöht sich bei den von Dir genannten Filtermethoden drastisch.
Was Du mit der Serverkennung meinst habe ich nicht verstanden!
|
16. 12. 2005, 14:11
|
#25
|
|
|