Fehlermanagement

Führen Sie erweiterte Fehleranalysen durch und optimieren Sie die Fehlermanagementprozesse

Das Fehlermanagement in dpCom zielt auf Probleme im physischen Netz ab. Wenn es jedoch in ein OSS oder ein Überwachungssystem integriert ist, können Sie sogar auf Fehler im aktiven Teil des Netzes zugreifen.

Die Basis für dpCom Fault Management ist das dokumentierte physische Netz zusammen mit Verbindungen, Diensten und Kunden. Dies kann mit Informationen zu geleasten Leitungen kombiniert werden, um die physischen Verbindungen End-to-End zu verfolgen.

Verwaltung geplanter Ausfälle für maximale Verfügbarkeit und Kundenservice

Neukonfigurationen, Austausch oder Aufrüsten von Komponenten und andere Wartungsarbeiten im Netz können zu Leistungsminderung für Kunden führen. dpCom verwendet Informationen zum verbundenen Netz, einschließlich Verbindungen, Diensten und Kunden, um die Auswirkungen der geplanten Änderungen zu analysieren. Diese Analyse hebt die SLA- und Risikoklassifizierung für die betroffenen Dienste hervor.

Sobald die Pläne für die Änderungen genehmigt sind, definieren Sie sie in dpCom als geplante Störungen oder Ausfälle mit geplanten Start- und Wiederherstellungszeiten. Anschließend können Sie einen Kommunikationsplan erstellen und die Medien Ihrer Wahl (E-Mail, SMS, Brief usw.) verwenden, um Informationen mit Hilfe von Vorlagen schnell an betroffene Kunden zu senden.

Nachrichten in Ihrem Kommunikationsplan können Folgendes enthalten:

  • Erste Planhinweise und Details
  • Erinnerungen an anstehende geplante Arbeiten
  • Warnungen, dass der Plan ausgeführt wird
  • Fortschritts- und Statusberichte
  • Benachrichtigungen über Änderungen am geplanten Wiederherstellungsplan
  • Hinweis zur Wiederherstellung des Dienstes

Netzbetreiber haben oft nicht alle Endkunden als Direktkunden. Sie können einem anderen Betreiber, einem ISP oder einem anderen Akteur in der Wertschöpfungskette gehören. Durch die Integration der dpCom in die OSS/BSS-, Trouble-Ticket- oder Customer-Care-Systeme dieser Dienstleister kann die Kommunikation die Wertschöpfungskette durchlaufen und alle betroffenen Parteien erreichen.

Fehlererkennung und -behebung

Fehler haben viele Aspekte einer geplanten Störung oder eines geplanten Ausfalls gemeinsam. Ein abgeschnittenes Kabel ist ein abgeschnittenes Kabel, unabhängig davon, ob es versehentlich oder im Rahmen geplanter Netzänderungen durchtrennt wurde. Der Hauptunterschied liegt in der Auslösung des Fehlers.

Insbesondere bei Fehlern im passiven Teil des Netzes müssen Sie das fehlerhafte Objekt identifizieren. Dies ist in einigen Fällen einfach, z. B. wenn Sie einen Erfahrungsbericht über versehentliche Betriebsstörungen erhalten, wie z. B. ein versehentlich abgeschnittenes Kabel. In diesem Fall kann das NOC eine schnelle erste Schätzung des tatsächlichen Kabels vornehmen und es als Fehlerquelle identifizieren. In anderen Fällen benötigen Sie jedoch etwas mehr Detektivarbeit.

Fehlerinformationen zu einer Reihe von Diensten dienen normalerweise als Eingabe für diese Detektivarbeit. Da die dpCom vollständige Informationen über den vollständigen Pfad enthält, den ein Dienst im Netz nimmt, kann die Fehleranalysefunktion des Systems diese Informationen für eine Reihe von Diensten nutzen und nach Mustern oder gemeinsamen Nennern suchen, wie z.B. „15 von 16 Diensten sind in einem bestimmten Kabel vorhanden“.

OTDR-Messungen können verwendet werden, um nach Schnitten im Glasfasernetz zu suchen, und dpCom berechnet die Position der erkannten Entfernung und zeigt sie geografisch an. Die Berechnung berücksichtigt dokumentierte Kabelschlingenlängen. Diese Informationen sind eine zuverlässige Referenz, wenn Sie bestimmen, wohin Ihre Außendienstmitarbeiter geschickt werden sollen.

Genau wie bei einem geplanten Ausfall stehen Informationen zu betroffenen Kunden und Services, einschließlich SLA-Levels und Risikoklassifizierungen, für den Fehler zur Verfügung. Dies hilft dem NOC, Prioritäten und Dringlichkeitsstufen festzulegen. Sie können diese Informationen auch anpassen, um behördlich vorgeschriebene Fehlerklassifizierungen zu implementieren, z. B. „Wenn die Anzahl der betroffenen Kunden multipliziert mit Ausfallzeiten einen bestimmten Wert überschreitet, senden Sie eine Benachrichtigung an ein öffentliches Ausfallportal.“

Vordefinierte Arbeitsablaufmuster können zur Fehlersuche und für Reparaturarbeiten verwendet werden. Diese Vorlagen können standardisiert sein oder bei Fehlern in Objekten mit höherem Risiko den Objekten selbst entnommen werden. Objektspezifische Vorlagen können beispielsweise angeben, dass als Erstes ein vorbereiteter Redundanzplan ausgeführt werden soll. Sobald weitere Informationen zum Problem vorliegen, kann der Fehler von einem Objekt zu einem anderen verschoben und der Umfang des Fehlers vergrößert oder verkleinert werden.

Der gleiche Kommunikationsplanmechanismus, der für geplante Ausfälle beschrieben wurde, kann verwendet werden, um betroffene Kunden über den Ausfall und die Wiederherstellung auf dem Laufenden zu halten.

Kundenfehlerberichte – klare und sofortige Kommunikation

dpCom bietet eine intuitive Benutzeroberfläche, die für Mitarbeiter mit Kundenkontakt einfach zu bedienen ist. Es wird hauptsächlich zum Verwalten von Fehlerberichten von Kunden verwendet. Wenn ein Fehlerbericht empfangen wird, wird er auf aktive Fehler oder Störungen überprüft. Dies ermöglicht eine sofortige Rückmeldung, wenn dpCom einen Fehler erkennt und der meldende Kunde wahrscheinlich von diesem Fehler betroffen ist. In diesen Fällen können Sie den Kunden sofort über den Fehler und die geplante Wiederherstellungszeit informieren.

Wenn kein vorhandener Fehler mit dem gemeldeten Fehler übereinstimmt, wird der Fehler abgelegt und kann zusammen mit anderen gemeldeten Fehlern für eine Fehleranalyse verwendet werden. Sobald ein entsprechender Fehler registriert wird, wird der Kunde in den Kommunikationsplan für diesen Fehler aufgenommen und erhält Aktualisierungen zum Fehler- und Wiederherstellungsstatus.

Störungs- und Ausfallstatistik

Informationen zu Fehlern und Ausfällen werden in einer Datenbank gespeichert und können in verschiedenen Berichten verwendet werden, einschließlich Berichten, die zur Einhaltung gesetzlicher Vorschriften erforderlich sind. Bei der Interaktion mit Kunden erhält das Kundendienstpersonal somit Zugriff auf die gesamte Ereignishistorie – nützliche Informationen zur Feststellung der Einhaltung der SLA-Bedingungen. Die Daten dienen auch als wertvolle Eingabe für die allgemeine Wartungsanalyse, wenn Sie Upgrade- oder Ersatzpläne für Geräte erstellen müssen, die an Fehlern beteiligt sind.

Sign up for our newsletter

Get regular news and insights straight to your mailbox.