Im Master-Studiengang Data Science & Artificial Intelligence der Fachhochschule Wedel ist ein einzigartiges Tool zur robusten Erkennung von KI-generierten Texten in deutscher Sprache entstanden. Für seine Master-Thesis wurde Tom Tlok im September 2023 bereits mit dem Innovationspreis des Wedeler Hochschulbundes e.V. ausgezeichnet. Nun steht der KI-Detektor der Allgemeinheit zur Verfügung.
Künstliche Intelligenz oder ein Mensch? Wer einen Text verfasst hat, ist heute immer schwerer zu erkennen. Werke von Large Language Models (LLMs) wie ChatGPT lassen sich kaum noch von jenen unterscheiden, die von Menschen geschrieben wurden. Durch ChatGPT wurde Künstliche Intelligenz alltagstauglich, doch die einfache Zugänglichkeit birgt Risiken, zum Beispiel durch die Nutzung zur Verbreitung von Falschinformationen oder Identitätsbetrug.
Tom Tlok war die Notwendigkeit der zuverlässigen Erkennung von KI-generierten Texten bewusst. Dafür gibt es bereits englischsprachige Tools, die allerdings störungsanfällig sind. Tlok entwickelte im Rahmen seiner Master-Thesis einen robusten Detektor für Texte in deutscher Sprache. Für dessen Training und Evaluierung wurde der erste deutschsprachige Datensatz in diesem Forschungsbereich geschaffen, bestehend aus 70.000 menschlichen und 70.000 KI-generierten Texten.
„Angesichts der rasanten Entwicklung in der KI-Textgenerierung war mein Ziel bei der Entwicklung des Detektors, den transparenten und verantwortungsvollen Umgang mit generativer KI zu stärken“, begründet Tlok die Relevanz seiner Master-Thesis.
Prof. Hendrik Annuth, Studiengangsleiter Data Science & Artificial Intelligence, der Tloks Thesis im Sommersemester 2023 betreute, sagt: „Mich begeistert, dass die Arbeit über das theoretische Ergebnis hinausgeht. Viele bereits bestehende Modelle können mit einfachen Mitteln manipuliert werden, beispielsweise durch syntaktische Anpassungen wie absichtlich eingefügte Rechtschreib- und Tippfehler, was dazu führt, dass das Modell von einem menschlichen Text ausgeht. Tloks KI-Detektor ist zuverlässig und weist daher einen hohen praktischen Nutzen auf. So verbindet die Arbeit ein hohes Niveau im Bereich der Deep Learning Techniken mit dem klassischem “Handwerkszeug” der Informatik, beides sind Kompetenzgebiete der FH Wedel.
Der KI-Detektor, der durch einen modifizierten LLM-Ansatz im Rahmen von Tloks Master-Thesis entstanden ist, erkennt mit einer Zuverlässigkeit von 97,89 Prozent, ob ein deutschsprachiger Text mithilfe von Künstlicher Intelligenz erstellt wurde. Das Tool ist unter www.ki.fh-wedel.de aufrufbar.