KI-Appliance • lokales Inferencing • Made in Germany
Wunderschön. Höchste Performance.
Die Silent ist ein feines Stück "German Engineering". Sie basiert auf unserem erfolgreichen Performance-Storage Silent Bricks und bringt alles mit, was eine lokale KI benötigt.
Übersicht & Software • Appliance • CARE
KI-Appliance
Eine KI-Appliance ist eine dedizierte Hardware-Einheit, in der KI-Modell, Recheninfrastruktur (GPU), Datenspeicher und Software-Stack zu einem betriebsbereiten System zusammengefasst sind — als Alternative zum selbst aufgebauten KI-Server oder zur Cloud-KI.
Lokale KI-Systeme sind nicht alle gleich
hat unbestrittene Vorteile. Datenschutz, und Kostenunabhängigkeit sprechen für eigene KI-Systeme in Unternehmen und Behörden. Doch viele Lösungen bringen Nachteile und Kompromisse mit sich.
Datensouveränität
Datensouveränität beschreibt die vollständige Kontrolle einer Organisation über ihre Daten: wo sie gespeichert werden, wer darauf zugreifen kann, welchem Rechtsrahmen sie unterliegen und ob sie jederzeit ohne Abhängigkeit von einem einzelnen Anbieter verfügbar sind.
On-Premises KI
On-Premises KI bezeichnet KI-Systeme, die vollständig auf eigener Hardware im eigenen Rechenzentrum oder Serverraum betrieben werden — ohne Cloud-Anbindung, ohne Datentransfer an externe Dienste.
Zu teuer
Große Unternehmen setzen oft auf komplett eigene KI-Systeme, inklusive Custom LLM. Diese speziellen e müssen jedoch mit den Unternehmensdaten trainiert und regelmäßig nachtrainiert werden, damit sie möglichst korrekte Antworten liefern können. Dies erfordert enorme Rechenleistung in Form von High-End GPUs, die gerade unbezahlbar werden.
LLM (Large Language Model)
Ein LLM ist ein KI-Modell, das auf großen Textmengen trainiert wurde und natürlichsprachige Anfragen versteht und beantwortet — Grundlage aller modernen KI-Assistenten, von ChatGPT bis zu lokal betriebenen Open-Source-Modellen.
Zu billig
Dank Youtube lassen sich mit relativ wenig Aufwand eigene, lokale KI-Systeme zusammenstellen. Doch die Abstimmung der Komponenten erfordert viel Wissen, damit sie sich nicht gegenseitig ausbremsen. Außerdem fehlt diesen Systemen der professionelle Support und die ständige Weiterentwicklung. Und aufgrund stark gestiegener Preise für Speicher und GPUs sind Performance und Skalierung meist teuer bis unmöglich.
Zu kurz gedacht
KI entwickelt sich mit enormer Geschwindigkeit weiter. Manche Systeme sind auf bestimmte e festgelegt und können so nicht vom Fortschritt profitieren. Andere sind von Anfang an zu klein dimensioniert und nicht für Wachstum und neue Möglichkeiten ausgelegt. Beides bremst den Einsatz von KI aus und kann zu mehr Schatten-KI führen, obwohl genau das eigentlich verhindert werden soll.
LLM (Large Language Model)
Ein LLM ist ein KI-Modell, das auf großen Textmengen trainiert wurde und natürlichsprachige Anfragen versteht und beantwortet — Grundlage aller modernen KI-Assistenten, von ChatGPT bis zu lokal betriebenen Open-Source-Modellen.
Silent AI ist anders
Silent AI ist das schlüsselfertige, professionelle KI-System für Unternehmen, Behörden und Einrichtungen, die KI mit sensiblen Daten einsetzen wollen, ohne sich um langwierige Setup-Prozesse oder IT-Wartung kümmern zu müssen.
Performance
Aktuelle GPU
Silent AI Vault
CARE Wartung
Der Silent AI Vault
Silent AI speichert alle Daten lokal in einer Vektor-Datenbank, auf die das dann via RAG (Retrieval Augmented Generation) zugreift. Alle Daten liegen dabei hochverfügbar auf einem einfach zu tauschenden Storage-Baustein, der 12x NVMe-Module enthält und über Redundanz vor Datenverlust abgesichert ist.
Je Silent AI Vault stehen 12, 24, 48 oder 96 TB (brutto) zur Verfügung, die Silent verfügt über 2 Slots für SilentAI Vaults.
LLM (Large Language Model)
Ein LLM ist ein KI-Modell, das auf großen Textmengen trainiert wurde und natürlichsprachige Anfragen versteht und beantwortet — Grundlage aller modernen KI-Assistenten, von ChatGPT bis zu lokal betriebenen Open-Source-Modellen.
KI-Appliance
Eine KI-Appliance ist eine dedizierte Hardware-Einheit, in der KI-Modell, Recheninfrastruktur (GPU), Datenspeicher und Software-Stack zu einem betriebsbereiten System zusammengefasst sind — als Alternative zum selbst aufgebauten KI-Server oder zur Cloud-KI.
Technische Daten
Plattform | |
Bereitstellung | Als schlüsselfertige Appliance, On Premises |
GPU | Aktuelle Nvidia GPU, 96 BG VRAM, fanless |
Speicher für lokale Daten | |
Storage | Silent AI Vault Speichermodul mit 12x NVMe, Triple Parity |
Speicher-Slots | 2 Slots für Silent AI Vault |
Speicher-Kapazität | 12, 24, 48 oder 96 TB (brutto) je Silent AI Vault |
Netzwerk & Schnittstellen | |
Daten | Dual 10GbE (RJ45) oder 10GbE SFP+ |
Optional | Dual 25/100GbE (QSFP) |
Management | 1× 1GbE Admin 1× 1GbE IPMI |
Technische Maße | |
Leistung | Idle: ca. 170 W Typisch: ca. 636 W (1 Silent AI Vault aktiv) Maximal: 1.200 W |
Wärmeabgabe | Typisch: 2170 BTU/h Maximal: 4094 BTU/h |
Maße | 2HE × 19 Zoll × 640mm Gewicht ca. 17 kg |
KI & Integration | |
Architektur | RAG (Retrieval-Augmented Generation) |
Identity Management | AD/LDAP-Integration (vollständig) |
Nutzer-Interface | Web-UI · Chat API ab Mitte 2026 |
Authentifizierung | LDAP, SSO |
Konnektoren | MS Office, MS SharePoint, MS Outlook/Exchange, Confluence & Jira, Dozuki, Slack, Nextcloud, SMB/File Server, PDF-Upload, Web Scraper Weitere in Entwicklung / auf Anfrage API ab Mitte 2026 |
Compliance | |
Datenschutz | DSGVO-konform, kein Drittland-Transfer |
Regulatorik | NIS2-ready, EU AI Act kompatibel |
Herkunft | Deutsches Produkt · kein US CLOUD Act / FISA 702 |
Wartung | Bis zu 10 Jahre, feste Konditionen |
Die exakte Konfiguration kann je nach Verfügbarkeit und Anforderung abweichen. Die hier gemachten Angaben dienen lediglich als Referenz.
Fragen und Antworten
Das hängt stark von der konkreten Nutzung und der Konfiguration ab. Komplexe Fragestellungen mit sehr vielen Datenquellen erfordern mehr Leistung als einfache Anfragen. Im Normalfall kann Silent AI mehrere tausend Anfragen pro Stunde bearbeiten und beantworten.
In der Appliance ist ein aktuelles Nvidia-Modell verbaut. Die genaue Spezifikation richtet sich nach Verfügbarkeit und Einsatz und wird immer in Abstimmung mit dem Kunden gewählt. Da die GPU nur zum Inferencing und nicht zum Trainieren von en verwendet wird, ist die konkrete Leistung nicht so extrem entscheidend.
LLM (Large Language Model)
Ein LLM ist ein KI-Modell, das auf großen Textmengen trainiert wurde und natürlichsprachige Anfragen versteht und beantwortet — Grundlage aller modernen KI-Assistenten, von ChatGPT bis zu lokal betriebenen Open-Source-Modellen.
Die Silent basiert auf unserem Performance-Storage Silent Bricks und folgt demselben Konzept: Lokale Daten sind auf tauschbaren Speicher-Containern, den Silent AI Vaults, abgelegt. Jeder Vault hat eine Bruttokapazität von 12 oder 24 TB, für besonders anspruchsvolle Konfigurationen können aber auch Modelle bis 96 TB angeboten werden. Silent AI besitzt zwei Slots für Vaults, insgesamt stehen also bis zu 192 TB (brutto) zur Verfügung.
KI-Appliance
Eine KI-Appliance ist eine dedizierte Hardware-Einheit, in der KI-Modell, Recheninfrastruktur (GPU), Datenspeicher und Software-Stack zu einem betriebsbereiten System zusammengefasst sind — als Alternative zum selbst aufgebauten KI-Server oder zur Cloud-KI.