Mit dem rasanten Fortschritt der künstlichen Intelligenz (KI) stehen traditionelle CAPTCHA-Systeme (Completely Automated Public Turing Test to Tell Computers and Humans Apart) vor einer existenziellen Bedrohung. Ursprünglich entwickelt, um menschliche Nutzer von automatisierten Bots zu unterscheiden, basieren CAPTCHAs auf Aufgaben, die für Maschinen schwer, für Menschen jedoch einfach sein sollen – etwa das Erkennen verzerrter Texte oder das Identifizieren von Objekten in Bildern. Moderne KI-Systeme, insbesondere große Sprachmodelle (LLMs) und generative Bildverarbeitungsmodelle, haben inzwischen ein Leistungsniveau erreicht, das es ihnen erlaubt, viele dieser Aufgaben mit übermenschlicher Genauigkeit zu lösen.
Um diese Entwicklung besser zu verstehen und wirksame Gegenmaßnahmen zu entwickeln, untersucht das TTZ-WUE das Thema KI-sichere CAPTCHA-Systeme im Rahmen eines Forschungsprojekts. Im Fokus steht dabei die Implementierung und Erprobung verschiedener CAPTCHA-Ansätze sowie die Evaluation ihrer Widerstandsfähigkeit gegenüber KI-gestützten Angriffen.
Typen aktueller CAPTCHA-Verfahren
Gängige CAPTCHA-Methoden lassen sich grob in drei Kategorien einteilen:
- Textbasierte CAPTCHAs (z. B. Erkennen verzerrter Zeichen)
- Bildbasierte CAPTCHAs (z. B. Auswahl bestimmter Objekte in Bildern)
- Reasoning-Based CAPTCHAs (z. B. Lösen eines kleinen 3D-Rätsels)
Wie die Namen vermuten lassen, beruhen diese Verfahren entweder auf der Erkennung von Text und Bildinhalten oder auf der Lösung kleiner kognitiver Herausforderungen. Der Reasoning-Ansatz gilt derzeit als besonders vielversprechend, da er nicht nur auf reiner Erkennung basiert, sondern auch Interpretation, Kreativität und kontextbezogenes Denken erfordert. Ergänzend können CAPTCHAs durch Elemente wie Behavior Tracking (Verhaltensanalyse beim Lösen) erweitert werden, um menschliche Nutzer noch zuverlässiger zu identifizieren.
Forschungsansatz am TTZ-WUE
Im Rahmen der Forschung wurde eine einfache Web-App mit Anmeldemaske und einem prototypischen CAPTCHA-System entwickelt. Sowohl menschliche Nutzer als auch KI-Modelle können über eine API auf die Anwendung zugreifen.
Zur Simulation KI-gestützter Angriffe wurde OpenAIs GPT-4 an die Web-App angebunden. Der gewählte CAPTCHA-Ansatz basiert auf einem reasoning-orientierten Konzept: Nutzer sollen eine kleine Skizze anfertigen – basierend auf einem zufällig ausgewählten Satz (z. B. „Eine Sonne mit genau sechs Strahlen“). Nach dem Login über einen vordefinierten Test-Account erscheint das CAPTCHA-Fenster. Dort soll der angezeigte Satz mithilfe eines Canvas-Felds als Skizze dargestellt und zur Auswertung eingereicht werden. Parallel dazu wird derselbe Prompt per API an GPT-4 gesendet, um eine Vergleichszeichnung durch die KI zu erzeugen.

Ein Python-Skript übernimmt die Auswertung der beiden Skizzen. Dabei wird geprüft, ob die Zeichnungen den Vorgaben entsprechen (z. B. genau sechs Sonnenstrahlen) und ob typische menschliche Unregelmäßigkeiten vorhanden sind (z. B. ungleichmäßige Linien oder keine perfekten Kreise). Die Ergebnisse werden in der Web-App visuell gegenübergestellt.

Ergebnisse & Ausblick
In mehreren Testreihen zeigte sich, dass GPT-4 durch immer präzisere Prompts (z. B. „Zeichne eine handgemachte Skizze einer Sonne mit sechs Strahlen, achte auf Unregelmäßigkeiten“) zunehmend in der Lage war, die Bewertungskriterien zu umgehen und das CAPTCHA zu bestehen. Dies verdeutlicht: Das Anfertigen einer Skizze allein reicht nicht mehr aus, um moderne KI-Systeme zuverlässig zu erkennen.
Ziel der weiteren Forschung ist es daher, einen erweiterten Ansatz zu entwickeln, der auf der bestehenden Reasoning-Methode aufbaut, jedoch eine höhere Robustheit gegenüber KI-Angriffen bietet – ohne dabei die Nutzerfreundlichkeit für Menschen zu beeinträchtigen.
