Dienstag, 19. Dezember 2006

[Uni] SPAM-Filter für AI-Tools

Ich habe letzte Woche in meinem Seminar AI-Tools die Aufgabe bekommen, zusammen mit zwei anderen Seminarteilnehmern einen SPAM-Filter auf Basis von WEKA, einem Machine-Learning Toolkit zu implementieren.

Ich habe heute mal fleißig meine SPAM-eMails mittels AutoSave Extension von Thunderbird in das .eml-Format exportiert und komme auf 21 MB bei ca. 2000 Files.

Schwieriger wird es glaube ich, HAM-eMails zu finden, in denen recht unpersönliche Sachen drinnenstehen, so dass man diese auch veröffentlichen kann.

Aber ich finde das Thema sehr spannend und werde hier - denke ich - zu geeigneter Zeit mehr Informationen über SPAM und den Filter hereinstellen.

Keine Kommentare: