Artikel vom 25. Mai 2026
Isolated Recovery Environment: Aufbau einer geschützten Recovery-Zone
Das IRE-Konzept #
Eine IRE ist Zone 3 in der -Architektur:
- Zone 1: User-Workstations (hohes Angriffs-Risiko)
- Zone 2: Produktive Server (mittleres Risiko)
- Zone 3: Isolated Recovery Environment (praktisch null Risiko, durch physische/logische Isolation)
- Tier 2: Air-Gap-Backup (physisch getrennt, nicht online)
Die Idee: Wenn Ihr Production-Netzwerk kompromittiert ist, können Sie in Zone 3 Systeme wiederherstellen, ohne dass der Angreifer Zugriff hat. Die Isolation ist absolute Voraussetzung.
Technische Anforderungen einer IRE #
1. Physische oder logische Isolation #
Physisch isoliert bedeutet:
- Separate Hardware (nicht virtualisiert im gleichen Cluster wie Production)
- Keine Netzwerk-Kabel zu Production
- Physisch in einem anderen Raum oder sogar anderem Gebäude
Logisch isoliert bedeutet:
- Virtuelle Maschinen in einem separaten vSphere Cluster
- Kein Zugriff auf Production vSAN oder Storage
- Separate Netzwerk-Switches, separate VLANs
- Firewall-Regeln, die Zone 3 und Production trennen
Physische Isolation ist stärker, aber teuer. Logische Isolation ist praktikabler für viele Organisationen — solange die Implementierung strikt ist.
2. Kein Active Directory Anschluss #
Das ist kritisch: Die Recovery-Umgebung läuft nicht mit Production-AD.
Warum? Wenn der Production-AD kompromittiert ist (und bei einem Cyberangriff ist er es oft), und die Recovery-Umgebung ist an den gleichen AD angebunden, dann sind auch die wiederhergestellten Systeme sofort kompromittiert.
Statt dessen:
- Separate lokale Accounts auf Recovery-Systemen
- Oder ein separater, isolierter AD nur für Zone 3
- Keine Vertrauensrelationen zum Production-AD
3. Separate Admin-Credentials #
Zone 3 hat eigene Admin-Accounts mit eigenem Passwort-Safe.
Ein Administrator, der in Production tausend Systeme administriert, hat in Zone 3 nur Zugriff auf Systeme, die dort gerade wiederhergestellt werden. Das reduziert Risiko bei Credential-Kompromittierung.
4. Begrenzte Netzwerk-Verbindung #
Zone 3 hat minimalen Netzwerk-Zugang nach außen:
- Kein Internet: Wiederhergestellte Systeme können nicht ins Internet gehen (keine Kontakt zu Angreifer‑C&C Server)
- Kein Production-Zugriff: Zone 3 kann nicht Production-Systeme erreichen (verhindert Lateral Movement)
- Air-Gap-Backup-Zugriff: Zone 3 kann auf Air-Gap-Backups zugreifen (über geschützte Netzwerk-Kabel oder portable Medien)
- Inter-Zone-Recovery: Wenn Dateien von Production in Zone 3 geholt werden müssen, geschieht das über einen Manual-Transfer, nicht automatisch
Das ist nicht maximale Konnektivität — das ist minimales notwendiges Zugriff.
5. Verifikations-Infrastruktur #
Zone 3 muss Tools haben, um wiederhergestellte Systeme zu überprüfen:
- Antivirus / E: Scannen Sie den wiederhergestellten Server auf Malware
- Integrity Check Tools: Verifizieren Sie, dass Dateien nicht manipuliert wurden
- Application Testing: Testen Sie, dass wiederhergestellte Anwendungen funktionieren
- Data Validation: Überprüfen Sie Datenbankintegrität, File-Integrität
Die Idee: Bevor ein System Zone 3 verlässt und zurück in Production geht, wissen Sie, dass es sauber ist.
Der Recovery-Workflow mit IRE #
Szenario: Ein Ransomware-Angriff hat Ihr Production-Netzwerk kompromittiert. ERP-Server, Fileserver und Active Directory sind verschlüsselt.
Schritt 1: Erkennung & Containment
- Angriff wird erkannt (Alert im SIEM)
- Production-Netzwerk wird vom Internet getrennt
- Aber: Air-Gap-Backup ist sauber (physisch isoliert)
Schritt 2: Recovery-Vorbereitung
- Backup-Admin verbindet Air-Gap-Hardware mit Zone 3
- Recovery-Umgebung wird hochgefahren (separate Hardware, separate Credentials)
- Recovery-Software wird gestartet
Schritt 3: System-Wiederherstellung
- ERP-Server wird aus Air-Gap-Backup in Zone 3 wiederhergestellt
- RTO: ~ 2 – 4 Stunden (abhängig von Datengröße)
- Server läuft in Zone 3, nicht in Production
Schritt 4: Verifikation
- Antivirus scannt den wiederhergestellten Server
- Admin testet ERP-Funktionalität
- Datenbank-Integrität wird überprüft
- Recovery ist verifiziert, nicht nur “hoffen”
Schritt 5: Controlled Production-Migration
- Erst jetzt wird der saubere Server aus Zone 3 mit Production-Netzwerk verbunden
- Aber: Mit erhöhter Überwachung
- E und SIEM beobachten verdächtige Aktivität
Schritt 6: Parallel-Forensik
- Während Production läuft, analysiert ein separates Team den kompromittierten Fileserver (noch offline)
- Ziel: Verstehen wie der Angriff passiert ist
Das ist nicht schnell (48−72 Stunden für Recovery), aber es ist verifiziert sicher.
Häufige Fehler beim IRE-Aufbau #
Fehler 1: Zu wenig Isolation “Wir haben einen separaten vSphere Cluster für Recovery” — aber der gleiche SAN, der gleiche Admin, der gleiche Internet-Zugang. Das ist nicht IRE.
Fehler 2: Zu abhängig von AD “Unsere Recovery-VMs sind an Production-AD angebunden.” Das ist ein Sicherheitsrisiko. Separate Accounts mindestens.
Fehler 3: Zu wenig Kapazität “Unsere Zone 3 kann nur einen Server auf einmal hosten.” Das ist zu langsam. Plan für mehrere simultane Wiederherstellungen.
Fehler 4: Nicht getestet “Wir haben eine IRE aufgebaut, aber nie einen echten Recovery durchgespielt.” Das ist ein Mythos, nicht Realität. Testen Sie quartalsweise.
Häufige Fragen #
Kann eine IRE in der Cloud sein? Theoretisch ja, aber es ist schwächer. Cloud-Provider haben Zugriff auf Ihre Daten. Eine On-Premises oder Hybrid IRE ist stärker.
Wie viel kostet eine IRE? Das hängt stark ab. Eine physisch isolierte IRE mit separater Hardware: 50k-200k EUR. Eine logisch isolierte IRE im gleichen Datacenter: 20k-50k EUR.
Brauchen wir IRE für alle Systeme? Nein. Nur für kritische Systeme, die Ransomware überleben müssen. Fileserver, ERP, AD, E‑Mail: ja. Nicht-kritische Systeme: können später wiederhergestellt werden.
IT-Resilienz
IT-Resilienz ist die Fähigkeit einer IT-Infrastruktur, unter widrigen Bedingungen — von Cyberangriffen über Hardwareausfälle bis zu Naturkatastrophen — funktionsfähig zu bleiben oder die Funktionsfähigkeit in definierter Zeit wiederherzustellen, sodass kritische Geschäftsprozesse aufrechterhalten werden.
Disaster Recovery
Disaster Recovery bezeichnet die strukturierten Prozesse und technischen Maßnahmen, die sicherstellen, dass IT-Systeme nach einem schwerwiegenden Ausfall — Ransomware-Angriff, Hardwareversagen, Rechenzentrumsausfall — innerhalb definierter Zeitrahmen (RTO) mit maximalem Datenverlust (RPO) wiederhergestellt werden können.
Disaster Recovery
Disaster Recovery bezeichnet die strukturierten Prozesse und technischen Maßnahmen, die sicherstellen, dass IT-Systeme nach einem schwerwiegenden Ausfall — Ransomware-Angriff, Hardwareversagen, Rechenzentrumsausfall — innerhalb definierter Zeitrahmen (RTO) mit maximalem Datenverlust (RPO) wiederhergestellt werden können.