Support und Betrieb stehen vor einem Wandel: Künstliche Intelligenz macht aus operativen Pflichtaufgaben zunehmend strategische Hebel. Wie KI den Bereich Support & Operations (S&O) als echten Business Enabler positioniert und die Effizienz signifikant steigert, erklärt Martin Weber, director service management bei diconum. Im Interview erfahren Sie, wo KI bereits heute ihren Wert in der Praxis beweist – von der intelligenten Suche und Analyse-Assistenten bis zur vollautomatisierten Incident Response. Außerdem geht es um Datenschutzhürden bei der Cloud-KI, die Sicherheit durch SIEM-Toolkits und SRE-Prinzipien (Site Reliability Engineering), die den Übergang von reaktiven zu proaktiven, KI-gestützten Abläufen ermöglichen.
Martin Weber: KI ist der Motor für einen grundlegenden Wandel im Bereich Support & Operations. Sie versetzt uns in die Lage, Vorfälle zu antizipieren und Ausfallzeiten zu reduzieren – durch den Wechsel von reaktiver Ticketbearbeitung zu proaktivem Systemmanagement. Kontinuierliche Optimierung wird automatisiert, der manuelle Aufwand massiv reduziert. So lässt sich S&O skalieren, ohne Personal proportional aufzustocken – und als echter Business Enabler positionieren.
Neue Rollen wie AI-Operations-Analysten und Automatisierungsstrategen entstehen. KI übernimmt einfache und mittlere Tickets, Teams konzentrieren sich auf Optimierung und komplexe Fälle. Dafür braucht es Weiterbildungen auf SRE-Level. Das klassische Stufenmodell wird durch KI-gestützte SRE-Teams ersetzt. Prozessual ersetzt KI die manuelle Triage durch Ursachenanalyse und Klassifizierung. Sie wird zum Kern der Wertschöpfung – mit industriellen, KI-basierten Prozessketten. Wissensmanagement verbessert sich deutlich, relevante Informationen sind leichter abrufbar. Das senkt Lösungszeiten und steigert die Qualität. Aber auch die Zusammenarbeit profitiert: KI liefert Einblicke in operative Schwachstellen, verbessert die Abstimmung mit Entwicklungsteams und Stakeholdern. Echtzeit-Kennzahlen helfen ungemein, Serviceauswirkungen zu quantifizieren und Innovationszyklen zu verkürzen.
KI zeigt ihren Wert tatsächlich in mehreren Schlüsselbereichen, hier einmal 6 Beispiele:
Insbesondere im Support erfordert der Betrieb von KI-Systemen Zugriff auf hochsensible Daten – von Infrastrukturdetails bis zu personenbezogenen Kundendaten. Bei Cloud-basierten KI-Lösungen gibt es signifikante Datenschutzhürden. US-Anbieter unterliegen dem Cloud Act, wodurch ein Datentransfer außerhalb der EU nicht ausgeschlossen werden kann. Sicherheitsverletzungen und intransparente Datennutzung für Trainingszwecke sind reale Risiken – selbst bei strengsten Einstellungen.
Meine Empfehlung: Lokale Installationen bieten hier klare Vorteile, denn Sicherheit und Datenschutz sind vollständig kontrollierbar. Zudem lassen sich verschiedene KI-Modelle flexibel kombinieren, statt an einen Anbieter gebunden zu sein. Wir bei diconium sind Vorreiter in diesem Bereich und bieten Dienste auf Basis lokaler LLMs in hochsicheren Umgebungen oder deren Implementierung und Betrieb in der privaten Cloud unserer Kunden an.
Beim Betrieb KI-gestützter Supportsysteme müssen wir mit typischen Bedrohungen aus Software-Schwachstellen, unvollkommenen Betriebsprozessen und menschlicher Nachlässigkeit oder sogar Vorsatz rechnen. Hinzu kommen bisher unbekannte Bedrohungen. Selbst die besten Risikomanagementmaßnahmen können nicht garantieren, dass ein IT-System nicht erfolgreich angegriffen wird. Der Schlüssel zum Management der Risiken ist ein vollständiger SIEM (Security Information and Event Management)-Tool-Stack. Statische Code-Analyse-Tools decken nur einen kleinen Teil der Produktionsumgebung ab; ein SIEM-Stack hingegen überwacht die gesamte Produktionsumgebung lückenlos. Er hilft, böswillige Aktivitäten aktiv zu erkennen, sobald sie auftreten, selbst wenn Angreifer unerkannte Schwachstellen ausnutzen.
Konkret setzen wir auf Tools wie:
Diese Komponenten in Kombination mit strengen Zugriffskontrollen und Datentrennung sind unerlässlich, um die Auswirkungen eines Angriffs zu erkennen und zu minimieren. Sie bilden die Grundlage für ein hohes Maß an Vertrauen und bieten rund um die Uhr weltweite Sicherheit.
Die Mentalität, das System zu betreiben, als wäre es das eigene, ist absolut wichtig. Wenn Verfügbarkeit, Zuverlässigkeit und Sicherheit zur persönlichen Priorität werden, lassen sich Probleme an der Wurzel beheben bevor sie eskalieren. Das stärkt die Eigenverantwortung, die kontinuierliche Risikobewertung und den Abbau technischer Schulden in Sinne der Stabilität und des Vertrauens.
Für proaktiven, KI-gestützten Support kombinieren wir ITIL und DevOps: ITIL bringt Struktur und Governance, DevOps liefert Tempo durch Automatisierung. So entsteht Stabilität ohne Geschwindigkeitseinbußen – und IT wird zum echten Business-Partner.
Darüber hinaus setzen wir auf umfassende Überwachung, maschinelles Lernen und prädiktive Analysen, um Risiken früh zu erkennen und automatisiert gegenzusteuern. Wartung und Schwachstellenscans laufen automatisch und menschliche Fehler werden minimiert. SRE-Prinzipien sichern die Qualität der KI-Automatisierung: Und zwar mit spezifischen SLOs, Konfidenzschwellen, voller Transparenz und Feedback-Loops. Fehlerbudgets, Überprüfbarkeit und Bias-Tests stellen so sicher, dass Kontrolle und Vertrauen jederzeit gesichert sind.
Ein ausgereiftes S&O-Team, wie wir es im SRE-Reifegradmodell (Site Reliability Engineering) von diconium beschreiben, bewegt sich von einer reaktiven Haltung hin zu einem optimierten, strategischen Partner.
KI spielt die entscheidende Rolle beim Übergang von reaktiven zu proaktiven Abläufen: Von Stufe 2 zu 3 setzen wir umfassende Observability-Tools ein, um Probleme vorab zu erkennen. Für den Sprung von Stufe 3 zu 4 ist die Integration von KI/ML essenziell: Sie ermöglicht Anomalieerkennung, automatische Ticket-Triage und die Reduzierung korrelierter Warnmeldungen. Wir entwickeln unser Team und unsere Maßnahmen, indem wir Scorecards kontinuierlich aktualisieren, konkrete Ziele festlegen und die Automatisierung und den Einsatz von höherwertiger, prädiktiver KI konsequent ausbauen, sobald Vertrauen und Datenqualität gegeben sind. Wir priorisieren systemische Veränderungen und richten uns stets an den Erfordernissen der Geschäftsprozesse aus, um in die richtigen Verbesserungen zu investieren und Kompromisse zwischen Zuverlässigkeit und Feature-Geschwindigkeit zu managen.
KI verändert die Verteilung operativer Kompetenz grundlegend! Zentralisierte KI-Agenten reduzieren den Bedarf an Fachwissen in regionalen Teams – diese werden kleiner, aber spezialisierter und lösen komplexe Probleme gemeinsam mit der KI.
Das klassische Tier-1-Modell wird künftig vollständig durch KI abgelöst. Übergaben zwischen Schicht- und Global-Teams werden effizienter – dank KI-kuratierter Zusammenfassungen, Diagnosen und Lösungsvorschläge. Echtzeitübersetzungen und Kontextgedächtnis der KI verbessern die Zusammenarbeit weiter.
Wir sehen eine klare Verlagerung von reaktiven Operationen hin zu KI-Überwachung und System-Governance. Operative Exzellenz definiert sich zunehmend über Datenqualität, Modellleistung und Zusammenarbeit – nicht über Standort. Selbstheilende Skripte reduzieren den Bedarf an reaktiven Ops-Teams weiter. Wir von diconium setzen auf ein hybrides Support-Modell mit einem zentralisierten 24/7-Helpdesk und spezialisierten Experten on- und offshore, um die Effizienzgewinne durch den Einsatz lokaler KI-Assistenzsysteme optimal zu nutzen.