Next: Ziel der Arbeit Up: Einführung Previous: Einführung

Einleitung und Motivation

Das Münchener Leibniz-Rechenzentrum (LRZ) der Bayerischen Akademie der Wissenschaften bietet als wissenschaftliches Rechenzentrum für die Hochschulen in München und landesweites Zentrum für technisch-wissenschaftliches Hochleistungsrechnen ein breitgefächertes Spektrum an Serviceleistungen an. Im Kompetenzzentrum für Datenkommunikationsnetze werden neueste Technologien in Pilotprojekten in Zusammenarbeit mit dem Verein Deutsches Forschungsnetz (DFN) erprobt. Zu den Aufgaben des LRZ gehören die Infrastrukturbereitstellung der Kommunikationsnetze, die Forschung auf dem Gebiet des Netz- und Systemmanagements und die Dienstleistungen, die die Infrastruktur betreffen. Über das LRZ ist der Münchener Hochschulraum einer der größten Internetnutzer in Deutschland.

Eine reibungslos funktionierende Kommunikationsinfrastruktur, wie sie im LRZ vorhanden ist, ist eine grundlegende Voraussetzung im Informationszeitalter. Es gehört zu den Leistungen eines Kommunikationsdienstleisters, eines sogenannten Dienstproviders, seinen Kunden (Dienstnutzer) ein gewisses Maß an Kommunikationsqualität zu garantieren. Diese Qualität wird in sogenannten Dienstgüteparametern festgelegt und mit den Kunden des Providers, zumindest im kommerziellen Bereich, in Dienstgütevereinbarungen (Service Level Agreements) vertraglich geregelt. Der Funktionsbereich des Netzmanagements eines Providers wird in mehrere Ebenen aufgeteilt. Im Leistungsmanagement eines Dienstanbieters werden Quality of Service (QoS)-Parameter definiert. Ein Beispiel für einen derartigen Parameter stellt die Zeit von der Fehlermeldung eines Dienstnutzers bis zur ersten Reaktion des Dienstanbieters dar. Zu einer der Aufgaben des Fehlermanagements zählt es, die Verfügbarkeit einer Kommunikationsinfrastruktur möglichst hoch zu halten. Dies kann durch ständige Überwachung und entsprechende Reaktion auf Fehler bzw. Fehlermeldungen erreicht werden.

Der Help Desk eines Kommunikationsdienstanbieters setzt sich überwiegend aus den Experten zusammen, die für die Fehlerlokalisierung und Fehlerbehebung zuständig sind. Die Experten erkennen Probleme und sind fähig, diese zu lösen. Dazu wird die Expertenriege am LRZ zur (telefonischen) Hilfestellung in einer sogenannten Hotline organisiert. Sie dient dem Benutzer als zentrale Anlaufstelle.

Die Experten benutzen zur Unterstützung der Überwachung des Netzes und der Lokalisierung der auftretenden Fehler Werkzeuge als Hilfsmittel.
Ein sogenanntes Trouble-Ticket-System (TTS) zählt dabei zu den passiven Werkzeugen in diesem Managementumfeld. Es bietet dem Help Desk die Fehlermeldungen in einem Dokumentationssystem an. Von der ersten Erfassung eines Fehlers über die gestellte Diagnose bis hin zu den Einzelschritten der Fehlerbehebung kann der Experte sich während seiner Hilfestellungsphase informieren sowie seine eigenen Schritte dokumentieren.

Am LRZ wird ein dem Trouble-Ticket-System vorgeschaltetes Werkzeug eingesetzt. Die Aufgabe des Intelligent Assistant (IA) ist es, den Vorgang der Erstellung eines Trouble-Tickets (TT) von der Fehlermeldung bis zur Fehlerlokalisierung weitgehend zu automatisieren. Dieser Assistent kann in den sogenannten First Level Support eingeordnet werden. Das ist die Hilfe, die der Benutzer zuerst erfährt und in Anspruch nehmen kann. Benutzergeführt mit Fragen, die dem Benutzer gestellt werden, oder mittels Diagnosefunktionen, die durchgeführt werden können, wird ein Fehler in einem Rechnernetz lokalisiert. Die Bedienung erfolgt dabei auf zwei Arten. Einerseits nutzt der Experte am LRZ den Assistenten und nimmt die Fehlermeldungen der Kunden telefonisch entgegen, trägt sie ein und kann zugleich Rückfragen stellen. Andererseits in der direkten Bedienung per WWW-Browser kann der Dienstnutzer benutzergeführt den Fehler eingrenzen und ein Trouble-Ticket erstellen. Derzeit ist der Intelligent Assistant für die Problembereiche Verbindung, Durchsatz und Mail realisiert.

Die Automatisierung dieser ,,Ersthilfe`` bedeutet für die am LRZ zuständigen Experten eine Entlastung hinsichtlich zeitaufwendiger Routineanfragen. Des weiteren können in der telefonischen Beratung des LRZ auch weniger routinierte Experten eingesetzt werden. In jedem Fehlerfall werden durch den Intelligent Assistant Trouble-Tickets erstellt, qualifizierte Fehlermeldungen, auf die der Experte um so schneller und präziser reagieren und damit den Fehler entsprechend beheben kann.

Eingebettet in ein Expertensystem benutzt der Intelligent Assistant derzeit eine regelbasierte Technik zur Wissensrepräsentation. Auf diese Weise wird das Vorgehen in der Fehlerlokalisierung und Diagnose bestimmt. Dazu wurden die Fragestellungen der Experten an die Benutzer im Zusammenhang mit durchzuführenden Testroutinen dokumentiert und in Entscheidungsbäumen implementiert. Die schrittweise Abarbeitungsreihenfolge der Fragen und Tests wird je nach Testverlauf und Testergebnis durch diesen Baum vorgegeben. Die Experten haben die Kosten im Sinne von Nutzen und den Informationsgehalt einer Frage oder eines Tests in der Diagnose durch ihre Wissensvorgaben in die Entscheidungsbäume eingebaut und berücksichtigt. Durch diese Vorgaben ist die Effizienz der Diagnose, vor allem die Abarbeitungsreihenfolge betreffend, weitgehend eingeschränkt.

Daher wird in diesem Expertensystem nach weiteren Möglichkeiten der Wissensrepräsentation gesucht, um den statischen und wenig ,,intelligenten`` Ablauf in der Entscheidungsphase zu verbessern.
Die Bayesschen Netze bieten hier eine Möglichkeit, Wissen in anderer Form zu repräsentieren.
Mit dem Einsatz von Wahrscheinlichkeiten kann der Grad der Überzeugung, wie es Entscheidungen unter Unsicherheit erfordern, dargestellt werden. Der Umgang mit unsicherer Information wird durch den Einsatz der Wahrscheinlichkeitstheorie ausgedrückt.
Die Abhängigkeiten einzelner Entscheidungen lassen sich, direkt oder indirekt, von Ursache und auftretenden Fehlern (Wirkung), graphisch darstellen. Der Leitgedanke ist, Schlußfolgerungen herzuleiten, ähnlich dem probabilistischen Schließen. Dieses Vorgehensmodell ist der menschlichen Entscheidungsfindung zur Lösung eines Problems sehr ähnlich.

Next: Ziel der Arbeit Up: Einführung Previous: Einführung