Ich habe letzte Woche in meinem Seminar AI-Tools die Aufgabe bekommen, zusammen mit zwei anderen Seminarteilnehmern einen SPAM-Filter auf Basis von WEKA, einem Machine-Learning Toolkit zu implementieren.
Ich habe heute mal fleißig meine SPAM-eMails mittels AutoSave Extension von Thunderbird in das .eml-Format exportiert und komme auf 21 MB bei ca. 2000 Files.
Schwieriger wird es glaube ich, HAM-eMails zu finden, in denen recht unpersönliche Sachen drinnenstehen, so dass man diese auch veröffentlichen kann.
Aber ich finde das Thema sehr spannend und werde hier - denke ich - zu geeigneter Zeit mehr Informationen über SPAM und den Filter hereinstellen.
Abonnieren
Kommentare zum Post (Atom)
Keine Kommentare:
Kommentar veröffentlichen