Eine Blacklist also. Und was soll die enthalten? In welchem Format? Datenbanken für einen Bayes-Filter wird dir hier übrigens wohl keiner Anbieten, die enthalten ja durchaus auch persönliche Daten.
Normalerweise ist so ein Filter doch auch bereits mit den vordefinierten Gewichtungen und spätestens nach kurzem Training sehr leistungsstark. Warum willst du also hier angelernte Filter haben, die möglicherweise deine Ergebnisse stark verschlechtern könnten? Beispielsweise, weil der Ersteller der Liste häufig auch auf englisch kommuniziert und du dies nicht tust oder umgekehrt. Oder wenn du häufig HTML-Ham-Mails empfängst, die bei dem Ersteller vielleicht ein sehr sicheres Anzeichen für Spam sind, weil er normalerweise nur über redliche Plaintext-Mails kommuniziert.