Lar­ge Lan­guage Models gene­rie­ren Tex­te auf Basis sta­tis­ti­scher Wahr­schein­lich­kei­ten — sie berech­nen, wel­ches Wort oder wel­che Phra­se in einem gege­be­nen Kon­text am plau­si­bels­ten folgt. Sie haben kein Kon­zept von Wahr­heit oder Fak­ti­zi­tät. Wenn ein Modell kei­ne fun­dier­te Ant­wort kennt, erfin­det es eine, die sprach­lich kohä­rent klingt.

Hal­lu­zi­na­tio­nen mani­fes­tie­ren sich auf ver­schie­de­ne Arten: erfun­de­ne Quel­len und Zita­te (das Modell nennt Bücher, Arti­kel oder Stu­di­en, die nicht exis­tie­ren), fal­sche Fak­ten (fal­sche Jah­res­zah­len, Namen, Gesetz­tes­tex­te), nicht nach­voll­zieh­ba­re Schluss­fol­ge­run­gen und im Unter­neh­mens­kon­text gefähr­lich: die Erfin­dung von Ver­trä­gen, Richt­li­ni­en oder Preis­lis­ten, die nicht existieren.

Für den Unter­neh­mens­ein­satz ist Hal­lu­zi­na­ti­on ein kri­ti­sches Pro­blem: Mit­ar­bei­ter, die sich auf hal­lu­zi­nier­te Ant­wor­ten ver­las­sen, tref­fen Ent­schei­dun­gen auf fal­scher Grund­la­ge. In regu­lier­ten Berei­chen (Medi­zin, Recht, Finan­zen) kann das gra­vie­ren­de Fol­gen haben.

RAG-basier­te Sys­te­me wie Silent AI mini­mie­ren Hal­lu­zi­na­tio­nen struk­tu­rell: Das Modell ant­wor­tet nur auf Basis von Quell­do­ku­men­ten, die beim Abruf iden­ti­fi­ziert wur­den. Wenn kei­ne rele­van­te Quel­le vor­han­den ist, signa­li­siert das Sys­tem das — anstatt eine Ant­wort zu erfin­den. Jede Ant­wort ist mit den Quell­do­ku­men­ten ver­linkt, aus denen sie abge­lei­tet wurde.

Fragen und Antworten

RAG reduziert Halluzinationen erheblich, indem das Modell an konkrete Quelldokumente gebunden wird. Vollständig ausschließen lässt sich das Phänomen nicht, da das Modell bei der Formulierung der Antwort aus den Quellen immer noch sprachlich interpoliert. Wichtig ist deshalb die Quellenangabe: Jede Silent-AI-Antwort verweist auf die Dokumente, aus denen sie abgeleitet wurde — der Nutzer kann die Basis der Antwort direkt prüfen.
Sprachlich sind Halluzinationen oft schwer zu erkennen — das ist gerade das Problem. Verlässliche Indikatoren sind: fehlende oder nicht auffindbare Quellenangaben, sehr spezifische Zahlen ohne Beleg und Antworten, die zu genau auf die Frage zugeschnitten sind. Der beste Schutz ist ein KI-System, das jede Antwort mit verifizierbaren Quellen belegt.