Was ist eigentlich…
RAG (Retrieval-Augmented Generation)
Klassische Large Language Models (LLMs) antworten ausschließlich auf Basis ihrer Trainingsdaten. Das führt zu zwei bekannten Problemen: Veraltetes Wissen (das Modell kennt nur den Stand seines Trainings) und Halluzinationen (das Modell erfindet plausibel klingende Antworten, wenn es keine fundierte Antwort kennt).
RAG löst beide Probleme strukturell: Beim Eingang einer Frage sucht das System zunächst in einem definierten Datenbestand — etwa internen Dokumenten, Wikis, Datenbanken — nach relevanten Textpassagen. Diese Passagen werden zusammen mit der eigentlichen Frage als Kontext an das Sprachmodell übergeben. Das Modell antwortet dann ausschließlich auf Basis dieser abgerufenen Inhalte, nicht auf Basis seines allgemeinen Trainingswissens.
Für Unternehmenseinsatz ist RAG aus zwei Gründen entscheidend: Erstens bleiben die Quelldaten im Unternehmen — es werden keine Unternehmensdaten an externe KI-Dienste übertragen. Zweitens kann das System nur auf Inhalte zugreifen, für die ein Nutzer Leserechte besitzt, wenn RAG mit einer Rechteverwaltung (AD/LDAP) kombiniert wird.
Silent AI basiert auf einer RAG-Architektur über interne Unternehmensdaten. Konnektoren für Microsoft 365, SharePoint, Confluence, Fileserver und weitere Quellen speisen die interne Wissensdatenbank. Die LLM-Inferenz läuft vollständig lokal auf dedizierter GPU-Hardware — kein Prompt, kein Token verlässt das Netzwerk.