Störungsmanagement mit künstlicher Intelligenz

AIOps in der Praxis

Von Problemen im Netzwerk bekommen Anwender in Büro und Fabrik am besten erst gar nichts mit. AIOps kann helfen, früh gegen Probleme in den eigenen Anwendungen vorzugehen, schildert Klaus Kurz (Bild), Director Solutions Consulting bei New Relic.

Moderne Anwendungen gehen heute immer besser auf die Bedürfnisse der Nutzer ein. Jedoch kommt die Zuverlässigkeit der Infrastruktur durch häufig eingespielte Updates auch zuweilen an Grenzen. Dies zeigt sich dem Benutzer durch Leistungsprobleme oder im schlimmsten Fall durch den Ausfall des digitalen Services.

Für die Reaktion auf Schwierigkeiten mit der Performanz der Infrastruktur brauchen IT-Teams Tools, um Leistungsprobleme überbrücken zu können. Viele der eher cloudnativen Ansätze sind für Site Reliability Engineers (SREs) allerdings zu undurchsichtig. Gefragt sind mehr Einblicke, die als Grundlage dienen, um Prioritäten richtig setzen sowie ein Problem schnell identifizieren und beheben zu können.

KI-Werkzeug zum Fehler aufspüren

Bild: New Relic Germany GmbH

AIOps kann mithilfe von KI und maschinellen Lernen den IT-Spezialisten aufzeigen, wo es Anomalien gibt und deren Ursache identifizieren. So können Probleme aufgedeckt und behoben werden – und sie zu schwerwiegenden Beeinträchtigungen führen. Das wird auch deswegen wichtiger, weil der zu verwaltende Software- und Infrastrukturbestand stetig wächst.

AIOps spielt seine Stärke dort aus, wo große schnell wachsende Mengen an Leistungsdaten – egal ob Observability- und Engagement-Daten oder Daten von anderen Tools – im Spiel sind. Um die Teams bei der Identifizierung und Diagnose eines Problems zu unterstützen, werden Algorithmen und Tools für maschinelles Lernen auf die Daten angewandt. So sollen Prozesse nachvollziehbarer und die Verwaltung von Zwischenfällen automatisierbarer werden. Es gibt mindestens fünf Möglichkeiten, wie AIOps in der Praxis eingesetzt werden kann:

1. Zwischenfälle erkennen

KI und maschinelles Lernen beginnen, Anomalien zu verstehen und wenden dieses Wissen darauf an, Systeme und Infrastrukturen zu monitoren. Dieser Ansatz ermöglicht es, frühe Warnzeichen herauszufiltern und zu prozessieren. Teams werden schneller auf ein Problem aufmerksam, noch bevor ein Anwender etwas merkt.

2. Reduzieren des Alert-Rauschens

Die Flut von Alarmmeldungen ist eine Herausforderung für IT-Teams. Sie führt zu Abstumpfungseffekten, was bei kritischen Alerts fatal sein kann. Es kann sinnvoll sein, Alarmbenachrichtigungen mit niedriger Priorität zu unterdrücken, und solche, die miteinander in Verbindung stehen, zu gruppieren. AIOps korreliert, unterdrückt und priorisiert Vorfälle, damit sich Teams auf die Probleme konzentrieren können, die die Zuverlässigkeit des Systems am meisten gefährden.

3. Der richtige Kontext als Basis

Zwischenfälle versetzen Teams schnell in einen stressigen Krisenmodus. AIOps ist so angelegt, dass in derartigen Fällen das Geschehen automatisch abgebildet wird und so ein ganzheitliches Bild für einen Vorfall liefert. So kann eine Störung nicht nur verstanden, sondern als Reaktion darauf schnell behoben werden.

4. Aus der Vergangenheit lernen

AIOps-Tools lernen stetig dazu, es sind schließlich Machine Learning-Anwendungen. Erfahrungen aus der Vergangenheit, die aktuelle Nutzung und das Feedback von Anwendern liefern Daten, damit ähnliche Probleme kein zweites Mal auftreten. AIOps ist grundsätzlich darauf ausgerichtet, Korrelationen zu erkennen und passende Empfehlungen zur Problembehebung und -vermeidung zu liefern.

5. Integrierte Daten helfen dem Team

Daten zu Zwischenfällen aus angebundenen Quellen können in das Ereignismanagement integriert werden. Eine AIOps-Lösung nimmt diese Daten auf, reichert sie mit Kontext an und sendet Benachrichtigungen an Teams oder Responder in den eingesetzten Incident Management Tools. New Relics Observability-Plattform bietet beispielsweise eine Zweiwege-Integration mit PagerDuty und anderen gängigen Lösungen für das Incident Management an. Je mehr Daten eingehen, desto bessere Handlungsempfehlungen kann AIOps liefern.

Nicht als Block Box gedacht

Die Unterstützung durch KI und maschinelles Lernen stellt bei AIOps nur eine Handlungsempfehlung dar. Es soll für Transparenz im Stack sorgen und Optimierungspotenzial aufzeigen – bei möglichem manuellem Feedback. Die Implementierung von AIOps samt Anomalie-Detection soll mit überschaubarem Aufwand möglich sein, denn basierend auf SRE-Kernsignalen lassen sich Anomalien über Anwendungen, Services und Log-Daten zügig ausmachen.

Das könnte Sie auch Interessieren

Bild: Coscom Computer GmbH
Bild: Coscom Computer GmbH
Software-Plattform für KI und maschinelles Lernen

Software-Plattform für KI und maschinelles Lernen

Vermehrt interessieren sich Unternehmen dafür, auf Basis ihrer Fertigungsinformationen Verbesserungspotenziale in der Produktionsplanung und -steuerung zu heben. Maschinelles Lernen und künstliche Intelligenz (KI) kann aber nur dann wirtschaftlich sinnvoll eingesetzt werden, wenn alle relevanten Daten im Zugriff sind und deren Struktur zu den Anwendungen passen. Das Coscom-ECO-System soll eine Plattformökonomie als Basis für Business Intelligence (BI) bieten.

Bild: Benteler International AG
Bild: Benteler International AG
Produktionsfehler: KI findet die Nadel im Heuhaufen

Produktionsfehler: KI findet die Nadel im Heuhaufen

In der Qualitätsprüfung ist Zeit ein wichtiger Faktor: Wer Fehler rechtzeitig findet, kann sie effektiv und kostensparend beheben. Gemeinsam mit dem Fraunhofer IEM setzt der Automobilzulieferer Benteler dafür in der Warmumformung von Fahrzeugteilen auf Echtzeit-Sensordaten und Künstliche Intelligenz. Damit können Produktionsfehler schneller erkannt, behoben und zukünftig sogar vermieden werden.

Bild: ©NicoElNino/stock.adobe.com
Bild: ©NicoElNino/stock.adobe.com
Strukturierter Beratungsansatz für KI-Einsatzbereiche im Unternehmen

Strukturierter Beratungsansatz für KI-Einsatzbereiche im Unternehmen

„Künstliche Intelligenz ist eine, wenn nicht die wichtigste Zukunftstechnologie für Unternehmen.“ Diese Aussage bejahen 70 Prozent der Befragten der jüngsten Bitkom-Studie zu KI. Aber nur 10 Prozent aller Unternehmen haben KI-Technologie aktiv im Einsatz, lediglich 30 Prozent planen und diskutieren deren Anwendung. Was ist der Grund für diese große Diskrepanz?

Bild: Blue Yonder, Inc.
Bild: Blue Yonder, Inc.
Künstliche Intelligenz – mehr als eine Wissenschaft

Künstliche Intelligenz – mehr als eine Wissenschaft

Data Science ist mittlerweile ein fester Bestandteil der strategischen Planung in vielen Unternehmen. Um künftige Entwicklungen realistisch zu planen, brauchen wir Künstliche Intelligenz (KI) und Maschinelles Lernen (ML). Insbesondere im Einzelhandel vertrauen immer mehr große Player auf KI-Lösungen, die präzise Prognosen ermöglichen und zum Beispiel Bestände oder Preise optimieren. Doch viele Entscheidungsträger glauben noch nicht daran, dass KI in den Lieferketten der Zukunft eine tragende Rolle spielen wird. Der Grund hierfür liegt in einer falschen Sicht auf die Wissenschaft.

Bild: ©Stock57/stock.adobe.com
Bild: ©Stock57/stock.adobe.com
KI-Verfahren für die Produktion

KI-Verfahren für die Produktion

Mathematiker der Hochschule Darmstadt (h_da) entwickeln gemeinsam mit dem Hanauer Simulationsdienstleister und Softwareunternehmen SimPlan und dem Automationsexperten Fibro Läpple Technology neue KI-Technologien. Im Rahmen des Loewe-Projekts ‚KISPo‘ will das Konsortium eine autonome, selbstlernende Steuerungssoftware für Produktionsanlagen entwickeln, wie sie z.B. bei der Herstellung von Komponenten für Windräder oder Elektromotoren zum Einsatz kommen. Es wäre die erste KI-Software dieser Art. Damit würde eine von Industrieverbänden und Forschung lange bemängelte Technologielücke geschlossen. Das Land Hessen fördert das Projekt für zwei Jahre mit 320.000 Euro. Konsortialführerin ist die Hochschule Darmstadt.