gulli:board Logo

Anzeige


  Antwort
gullinews
gulli:News Redaktion
 
Benutzerbild von gullinews
 
Registrierungsdatum: Apr 2002
Beiträge: 6.484
Spider der Copyrightindustrie mit Datenmüll füttern

Script generiert Apache-Fakedirs

Wer php-fähigen Wepspace hat und die Spider der einschlägigen Piraterieverfolger ein wenig ausbremsen mag, bekommt mit dem Dirindexfaker ein hübsches Tool in die Hand. Sinn der Übung: die Copyrightindustrie durchsucht unter anderem mit Spidern das Web, um Seiten mit möglicherweise unliebsamen Inhalten zu finden. Deren Inhaber werden - wenn möglich - ermittelt und - wenn möglich - angezeigt. Das automatisierte Durchforsten des Webs ergibt jedoch nur Sinn, wenn tatsächlich auch überwiegend echte Angebote gefunden werden. Fallen die Bots auf Massen von Fakematerial herein, steigt der Aufwand, echte von falschen Seiten zu sortieren, erheblich an. Und: diese Sortierung muss von Menschen gemacht werden, wenn es der Spider nicht kann.
Die Lösung: ein Script, das ohne viel Serverlast Directories erzeugt, die nach außen hin als Sammlung urheberrechtlich bedenklich scheinender Dateiangebote scheinen, tasächlich aber nur Datenmüll enthalten, dabei für einen Spider wie eine "echte" Seite erscheinen. Der DirIndexFaker setzt auf einem früheren Versuch auf, ein solches Skript zu schreiben. Der "DMCA Bot Killer" wies jedoch einige Schwächen auf, die ihn leicht maschinell erkennbar machten.
Der Dirindexfaker erzeugt Seiten, die wie Directorylistings eines Apache-Webservers aussehen

weiterlesen
Alt 15. 12. 2005, 16:34 gullinews is offline Mit Zitat antworten #1
deleted user
Gast
 
Beiträge: n/a
Re: Spider der Copyrightindustrie mit Datenmüll füttern

hätt ich space würd ichs machen
Alt 15. 12. 2005, 17:05 Mit Zitat antworten #2
Hardc0r3
Großmaul
 
Registrierungsdatum: Jan 2004
Ort: Straight in the Pit
Beiträge: 740
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Find ich klasse und werd das Script auch gleich mal auf meinen Space packen.
Alt 15. 12. 2005, 17:05 Hardc0r3 is offline Mit Zitat antworten #3
Berater Spender
Problembär
 
Benutzerbild von Berater
 
Registrierungsdatum: Apr 2002
Ort: Schweiz
Beiträge: 1.590
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Ja verdammt! Ich habs doch gewusst!! für irgendwas muss Funpic und Ohost doch zu gebrauchen sein

Berater
Alt 15. 12. 2005, 17:19 Berater is offline Mit Zitat antworten #4
ClemensBW Spender
rebuilding
 
Registrierungsdatum: Dec 2004
Ort: BW
Beiträge: 3.349
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Zitat:
Zitat von Berater 
Für irgendwas muss Funpic und Ohost doch zu gebrauchen sein

*gg* nice work
Alt 15. 12. 2005, 17:24 ClemensBW is offline Mit Zitat antworten #5
Bewa
Pädagogisch wertvoll!
 
Registrierungsdatum: Jun 2005
Beiträge: 1.043
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Die bremsen die Justiz, also bremst man die einfach. Aber bei ihrem Wahn kann ich mir vorstellen, dass die wegen "Vortäuschen einer Straftaat" klagen.
Anyway: Gefällt mir.
Alt 15. 12. 2005, 18:20 Bewa is offline Mit Zitat antworten #6
Noop
Mitglied
 
Registrierungsdatum: Aug 2004
Ort: Wuppertal
Beiträge: 1.258
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Das man sowas nicht auf einem auf mit REAL DATEN angemeldeten Space mit eigener .de-Domaine & Impressum macht, das müsste doch jedem klar sein
Alt 15. 12. 2005, 18:30 Noop is offline Mit Zitat antworten #7
Bewa
Pädagogisch wertvoll!
 
Registrierungsdatum: Jun 2005
Beiträge: 1.043
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Dann gehen die gegen den Server und verlangen die IP des Users... aber das System ist ja so alt noch nicht, mal schauen, was draus wird.
Alt 15. 12. 2005, 18:37 Bewa is offline Mit Zitat antworten #8
Noop
Mitglied
 
Registrierungsdatum: Aug 2004
Ort: Wuppertal
Beiträge: 1.258
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Dann nutze ich ein Proxy wie TOR. Selbst JAP ist für sowas ausreichend (JAP kann nicht rückwirkend zurückverfolgen!).
Ja, es gibt keine 100%tige Anonymität, aber bei so kleinen Sachen (besonders bei Massenabmahnungen) reicht ein Proxy, um Behörden aufzuhalten - besonders bei Massenabmahnungen werden erst die Leute drangenommen wo es einfach geht und bis die alle durchhaben die kein Proxy benutzt haben, da sind zumindest die 2 Jahre Speicherungspflicht vorüber und im besten Falle ist man längst Ur-Ur-Opa oder sogar tod
Alt 15. 12. 2005, 18:44 Noop is offline Mit Zitat antworten #9
betauser2
Nachfolger von Alphauser1
 
Benutzerbild von betauser2
 
Registrierungsdatum: Oct 2004
Ort: Links neben dir
Beiträge: 1.460
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Aber du hast den Beitrag schon gelesen oder????

Es geht hier um Webspace besitzer
Alt 15. 12. 2005, 19:40 betauser2 is offline Mit Zitat antworten #10
Noop
Mitglied
 
Registrierungsdatum: Aug 2004
Ort: Wuppertal
Beiträge: 1.258
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Zitat:
Zitat von betauser2 
Aber du hast den Beitrag schon gelesen oder????

Es geht hier um Webspace besitzer
klar hab ich den gelesen Warum fragste? Weil du vielleicht denkst TOR ist nur zum Surfen?

Nein, JAP und TOR kann man dafür perfekt benutzen, um Webspace (mit falschen Daten) mit PHP-Unterstützung anzumelden (ja ab da ist man "Webspacebesitzer") und den Antispider-Krempel dann hochzuschieben - alles mit nem Proxy.
Alt 15. 12. 2005, 19:50 Noop is offline Mit Zitat antworten #11
prezl
Gesperrt
 
Benutzerbild von prezl
 
Registrierungsdatum: Dec 2005
Ort: im Norden.
Beiträge: 3.021
Re: Spider der Copyrightindustrie mit Datenmüll füttern

noop hat aber recht soweit ich weiß ...is ne feine sache werde mich der aktion sicherlich anschliessen!
Alt 15. 12. 2005, 20:02 prezl is offline Mit Zitat antworten #12
b-tight06
Mitglied
 
Registrierungsdatum: Nov 2005
Beiträge: 68
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Fett! Werd mich aufjedenfall dran beteiligen

Postet dies doch bitte überall weiter, nur dann machts Sinn.
Macht nen Thread, auf jedem Board das ihr kennt und schickt den Link an jeden aus eurer ICQ/Mail oder sonst was Liste!

Villeicht nützts ja was
Alt 15. 12. 2005, 20:07 b-tight06 is offline Mit Zitat antworten #13
ClemensBW Spender
rebuilding
 
Registrierungsdatum: Dec 2004
Ort: BW
Beiträge: 3.349
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Nennt mir einen grund, dass nicht zu benutzen


begehe ich damit irgendein Verbrechen?
nein, ich verwirre nur die Spider, und das ist *mir* doch pelle, mal gucken wielange funpic das mitmacht
Alt 15. 12. 2005, 20:38 ClemensBW is offline Mit Zitat antworten #14
SeriousK
If looks could kill
 
Benutzerbild von SeriousK
 
Registrierungsdatum: Oct 2004
Ort: <^DA^>
Beiträge: 3.054
Re: Spider der Copyrightindustrie mit Datenmüll füttern

sooo habe mal 10 + subdomains gemacht

edit: Tip: macht mehr Filenames in die textdatei
Alt 15. 12. 2005, 21:08 SeriousK is offline Mit Zitat antworten #15
xxxstereoxxx
Elementarteilchen
 
Benutzerbild von xxxstereoxxx
 
Registrierungsdatum: Aug 2005
Beiträge: 883
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Ja, am besten die Titel von Glashaus auch gleich drauf, auf die Logistep so vernarrt ist :P Vielleicht auch noch eine Index Seite dazu machen, die nach einer Warez Seite wirkt, mit einem Link aufs Fake Directory!
Alt 15. 12. 2005, 21:29 xxxstereoxxx is offline Mit Zitat antworten #16
Kanalradde
Mitglied
 
Benutzerbild von Kanalradde
 
Registrierungsdatum: Apr 2002
Beiträge: 109
Re: Spider der Copyrightindustrie mit Datenmüll füttern

...und die Fake-Warezsite meldest Du dann bei der gulli-Toplist an. Zwei Fliegen mit einer Klappe.
Alt 15. 12. 2005, 21:46 Kanalradde is offline Mit Zitat antworten #17
cuhformation
Error 404: Love not found
 
Benutzerbild von cuhformation
 
Registrierungsdatum: Aug 2001
Beiträge: 3.972
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Tach

Was mir aufgefallen ist,
dass ja die IP: 127.0.0.1 unten im Script steht,
man könnte ja auch die Client-IP missbrauchen

PHP-Code:
<?php echo $_SERVER['REMOTE_ADDR']?>

Sonst sieht das erstmal interesannt aus

Bis dann...

ps: es gibt doch bestimmt eine RewriteRule
damit man das vielleicht noch echter aussehen lassen könnte, oder nicht ?
Damit aus media/?download=1&file=Datei.ext nur noch media/Datei.ext wird ?

Geändert von cuhformation (16. 12. 2005 um 03:16 Uhr).
Alt 16. 12. 2005, 02:47 cuhformation is offline Mit Zitat antworten #18
warpilein
Mitglied
 
Registrierungsdatum: Jun 2005
Beiträge: 1
Re: Spider der Copyrightindustrie mit Datenmüll füttern

THX das lieb ich an Gulli hab auch eben auf 10 spaces gepackt die ich eh ned mehr nutze und das ist ned verboten da du ja nur eine Index anlegst mit verarsche daten das is bisher nicht verboten in DE
Alt 16. 12. 2005, 06:32 warpilein is offline Mit Zitat antworten #19
Greg5000 Spender
...ist dagegen!
 
Benutzerbild von Greg5000
 
Registrierungsdatum: Jan 2003
Ort: Osnabrooklyn
Beiträge: 5.010
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Zitat:
Das man sowas nicht auf einem auf mit REAL DATEN angemeldeten Space mit eigener .de-Domaine & Impressum macht, das müsste doch jedem klar sein
Das einzige, was dagegen spricht, ist die verbrauchte Rechenleistung. Ich könnte mir vorstellen, dass es relativ aufwändig ist, 1.000 Files on-the-fly zu generieren. Hoffentlich spidern die nicht zu viele Sites (allgemein), sonst könnte das u.U. ärgerlich für Funpic & co. (und deren Nutzer) werden.

Kann mich da auch irren, hört sich aber so an.
Alt 16. 12. 2005, 09:35 Greg5000 is offline Mit Zitat antworten #20
nathan west
********
 
Benutzerbild von nathan west
 
Registrierungsdatum: Jun 2000
Ort: Aachen
Beiträge: 12.253
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Zitat:
Zitat von b-tight06 
Fett! Werd mich aufjedenfall dran beteiligen

Postet dies doch bitte überall weiter, nur dann machts Sinn.
Macht nen Thread, auf jedem Board das ihr kennt und schickt den Link an jeden aus eurer ICQ/Mail oder sonst was Liste!

Villeicht nützts ja was


Mit den gesegneten Worten der heiligen Jungfrau Marias: LASS DEN SCHEISS. Dafür ist ICQ nicht da.
Alt 16. 12. 2005, 11:36 nathan west is offline Mit Zitat antworten #21
RamseZ
Feuerfuchs
 
Benutzerbild von RamseZ
 
Registrierungsdatum: Sep 2004
Beiträge: 159
Re: Spider der Copyrightindustrie mit Datenmüll füttern

also so wie ich das jetzt verstanden habe, hab ich nix zu befürchten mit sowas aufm space?
nich dass die bullen das nich gescheit überprüfen und dann mit ner hd vor der tür stehn...
Alt 16. 12. 2005, 13:51 RamseZ is offline Mit Zitat antworten #22
Greg5000 Spender
...ist dagegen!
 
Benutzerbild von Greg5000
 
Registrierungsdatum: Jan 2003
Ort: Osnabrooklyn
Beiträge: 5.010
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Die bekommen doch keine Erlaubnis zur Hausdurchsuchung, nur weil Du Dateien mit irgendwelchen Namen auf Deinem Webspace hast.
Alt 16. 12. 2005, 13:57 Greg5000 is offline Mit Zitat antworten #23
Taren
Mitglied
 
Registrierungsdatum: Dec 2005
Beiträge: 2
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Das Script macht nur bedingt Sinn, da es problemlos von Robots erkannt werden kann. Sei es, weil es relativ unsinnige Dateigrössen erzeugt (MP3-Files mit 500 oder 600 MB -> die mag es zwar geben, aber es ist halt relativ unwahrscheinlich), weil es statische Infos erzeugt die man abfragen kann (Server-Kennung (fragt man google nach exakt dieser Server-Kennung gibts läppische 1500 Treffer) und Verzeichnisname ist immer gleich angegeben - müsste man dann ggf. manuell anpassen - ansonsten können Robots daran schnell das Script erkennen) oder aber indem ein Robot einfach eine Seite doppelt anfordert und die zurückgelieferten Filenamen vergleicht (die sind bei dem Script immer unterschiedlich - also leicht erkennbar).

Von daher ist es eine lustige Spielerei, aber wenn man der Gegenseite auch nur minimale Intelligenz zugesteht, dann können die ihre Automatismen so anpassen, dass das Script sofort auffliegt und entsprechend ignoriert wird.
Alt 16. 12. 2005, 14:03 Taren is offline Mit Zitat antworten #24
Greg5000 Spender
...ist dagegen!
 
Benutzerbild von Greg5000
 
Registrierungsdatum: Jan 2003
Ort: Osnabrooklyn
Beiträge: 5.010
Re: Spider der Copyrightindustrie mit Datenmüll füttern

Es geht aber auch um die Rechenleistung/Traffic. Der erhöht sich bei den von Dir genannten Filtermethoden drastisch.

Was Du mit der Serverkennung meinst habe ich nicht verstanden!
Alt 16. 12. 2005, 14:11 Greg5000 is offline Mit Zitat antworten #25
Themen-Optionen Antwort


Themen-Optionen

Gehe zu