Beschreibung description
PERFORMANCE- UND FEHLER-MANAGEMENT IN EINEM KOMMUNIKATIONSNETZPERFORMANCE AND ERROR MANAGEMENT IN A COMMUNICATION NETWORK
Die Erfindung betrifft ein Verfahren zum Performance-Management von Kommunikationsnetzwerken, insbesondere Telekommunikationsnetzwerken, die eine große Anzahl von Netzwerkelementen enthalten, gemäß dem Oberbegriff des Patentanspruchs 1.The invention relates to a method for performance management of communication networks, in particular telecommunications networks, which contain a large number of network elements, according to the preamble of patent claim 1.
Das Management von Telekommunikationsnetzwerken umfaßt eine große Anzahl von Netzwerksbetriebsprozeßen, die sich grob in drei Klassen unterteilt lassen, nämlich Aufbau des Netzwerkes, Betrieb des Netzwerkes und Erweiterung des Netzwerkes. Ein Beispiel eines derartigen Netzwerk-Managements ist in O99/20034 beschrieben.The management of telecommunications networks comprises a large number of network operating processes, which can be roughly divided into three classes, namely the construction of the network, operation of the network and expansion of the network. An example of such a network management is described in O99 / 20034.
Der Bereich des Betriebs und Unterhalt des Netzwerks betrifft die täglichen Arbeitsroutinen zum Betreiben und Unterhalten des Netzwerkes. Darunter fallen die Fehlerbehandlung inner- halb des Netzwerkes in Echtzeit, das Abarbeiten von Alarmmeldungen, Lokalisieren und Analysieren der Fehler und das Durchführen von Reparaturen.The area of operation and maintenance of the network relates to the daily work routines for operating and maintaining the network. This includes real-time error handling within the network, processing of alarm messages, locating and analyzing errors and carrying out repairs.
Ein typisches Telekommunikationsnetzwerk besteht aus einer großen Anzahl von Netzwerkelementen, einschließlich Schaltknoten, Basisstationen, Übertragungsknoten, etc.. Beispielsweise besteht in großes Netzwerk aus zehntausenden Netzwerkelementen, wobei jedes Netzwerkelement aus einer Vielzahl von Einheiten bestehen kann. Aufgrund dieser komplexen Natur ei- nes derartigen Netzwerks kommt es täglich zu einer großen Anzahl von Fehlermeldungen, wobei jeder Fehler sich in einem oder mehreren Alarmmeldungen manifestieren kann. Es ist jedoch auch möglich, daß ein Fehler sich überhaupt nicht in einem Alarm äußert .A typical telecommunications network consists of a large number of network elements, including switching nodes, base stations, transmission nodes, etc. For example, a large network consists of tens of thousands of network elements, each network element being able to consist of a multiplicity of units. Because of the complex nature of such a network, a large number of error messages occur every day, each error being manifested in one or more alarm messages. However, it is also possible that an error does not result in an alarm at all.
Um das Netzwerk zu Betreiben und zu Beobachten, ist mindestens ein Netzwerk-Managementsystem im Netzwerk angeordnet,
in dem Alarmmeldungen und andere Netzwerkinformationen gesammelt und ausgewertet werden, um das Netzwerk zu steuern und Wartungen durchzuführen.In order to operate and monitor the network, at least one network management system is arranged in the network, in which alarm messages and other network information are collected and evaluated in order to control the network and carry out maintenance.
In dem Netzwerk-Managementsystem ist ein Fault-Management angeordnet, das Fehler im Netzwerk, wie der Ausfall von Netzelementen oder die Unterbrechung von Verbindungen erkennt und analysiert, sowie geeignete Maßnahmen zur Behebung des Fehlers unternimmt .Fault management is arranged in the network management system, which detects and analyzes errors in the network, such as the failure of network elements or the interruption of connections, and takes appropriate measures to remedy the error.
Ferner weist das Netzwerk-Managementsystem üblicherweise ein Performance-Management auf, in dem Performance-Messungen zusammengeführt werden, anhand derer die Leistungsfähigkeit oder Performance des Netzwerkes und seiner Abschnitte ermit- telt werden, um den Betrieb des Netzwerks zu optimieren, die Servicequalität zu verbessern und das Netzwerk so auszulasten, daß die Kosten minimiert werden.Furthermore, the network management system usually has a performance management system in which performance measurements are brought together, on the basis of which the performance or performance of the network and its sections are determined in order to optimize the operation of the network, to improve the quality of service and utilize the network to minimize costs.
Diese Performance-Messungen von geeigneten Performance-Indi- katoren werden in vorbestimmten Netzwerkelementen oder Netzwerkknoten vorgenommen und umfassen beispielsweise die Ermittlung der Häufigkeit von Anrufversuchen, blockierten oder abgebrochenen Anrufe, fehlgeschlagenen Handover-Prozesse, Zellenverlusten bei ATM-Netzen (ATM: Asynchronous Transmis- sion Mode) , Bit-Fehlerraten, und Packetverlusten bei IP-Net- zen. Die in den Netzwerkelementen erzeugten Performance-Daten werden in den Netzwerkelementen üblicherweise zwischengespeichert und in vorbestimmten zeitlichen Intervallen von dem Performance-Management abgerufen. Dort werden diese Daten üb- licherweise in eine Performance-Datenbank abgelegt und ausgewertet. Die Zeitintervalle, in denen die Daten abgerufen bzw. übertragen werden, betragen im allgemeinen 5 bis 15 Minuten.These performance measurements of suitable performance indicators are carried out in predetermined network elements or network nodes and include, for example, the determination of the frequency of call attempts, blocked or aborted calls, failed handover processes, cell losses in ATM networks (ATM: Asynchronous Transmission Mode), bit error rates, and packet loss in IP networks. The performance data generated in the network elements are usually temporarily stored in the network elements and called up by the performance management at predetermined time intervals. There, these data are usually stored in a performance database and evaluated. The time intervals in which the data are called up or transmitted are generally 5 to 15 minutes.
Bei diesen Messungen entstehen in den entsprechenden Netzele- menten große Mengen an Performancedaten. Alle diese Daten werden gesammelt, in entsprechenden Speichermedien gespeichert und dem Performance-Managementsystem zur Analyse über-
mittelt. Bei der Analyse der Daten stellt sich dann gegebenenfalls heraus, daß aufgrund eines Ereignisses oder Fehlers im Netz sehr viele Performance-Daten nicht mehr relevant sind, da das Ereignis oder der Fehler im Netz sich auf ver- schiedenste Wegstrecken und Netzelemente auswirkt. Die Daten werden daher nach der Analyse verworfen oder noch verwertbare Daten werden zu wenigen Werten zusammengefaßt, deren Aussagekraft naturgemäß gering ist.These measurements result in large amounts of performance data in the corresponding network elements. All of this data is collected, stored in appropriate storage media and transferred to the performance management system for analysis. averages. When analyzing the data, it may then become apparent that a great deal of performance data is no longer relevant due to an event or error in the network, since the event or error in the network affects a wide variety of routes and network elements. After the analysis, the data are therefore discarded or data that can still be used are combined into a few values whose informative value is naturally low.
Da die Ermittlung und Analyse der Performance-Daten mit Aufwand und Kosten verbunden ist, ist dieser Zustand unbefriedigend.This situation is unsatisfactory because the determination and analysis of the performance data involves effort and costs.
Der Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren zum Management der Performance eines Kommunikationsnetzwerkes zu schaffen, bei dem Performance-Daten, die aufgrund eines Ereignisses im Netzwerk irrelevant sind, frühzeitig erkannt werden.The invention is therefore based on the object of providing a method for managing the performance of a communication network in which performance data which are irrelevant due to an event in the network are recognized at an early stage.
Diese Aufgabe wird durch ein Verfahren nach Anspruch 1 gelöst. Bevorzugte Ausführungsformen der Erfindung sind Gegenstand der Unteransprüche.This object is achieved by a method according to claim 1. Preferred embodiments of the invention are the subject of the dependent claims.
Bei dem erfindungsgemäßen Verfahren zum Management der Per- formance eines Kommunikationsnetzwerkes, das aus einer Vielzahl von Netzelementen besteht und ein Fault-Management sowie ein Performance-Management aufweist, werden in vorbestimmten Netzelementen Performancemessungen von Performance-Indikatoren durchgeführt und die ermittelten Performance-Daten dem Performance-Management zur Weiterverarbeitung und/oder Analyse zugeführt. Ist nun ein Fehler im Netz aufgetreten, so wird der Kontext des Netzfehlers mittels einer Topologie-Datenbank ermittelt, wobei die Topologie-Datenbank die Netzelemente, deren Verbindungen und deren Eigenschaften aufweist. Unter Kontext des Netzfehlers werden hier die von dem Netzfehler betroffenen Netzelemente verstanden. Fällt also beispielsweise in einer End-to-End-Verbindung eine Netzelement
aus, so sind dies die Netzelemente bezüglich dieser End-to- End-Verbindung . Aufgrund des ermittelten Kontextes werden die Performance-Daten der betroffenen Netzelement, die aufgrund des Netzfehlers keine verläßlichen Daten mehr liefern können, verworfen, so daß irrelevante Daten nicht ausgewertet werden müssen.In the method according to the invention for managing the performance of a communication network, which consists of a large number of network elements and has fault management and performance management, performance measurements of performance indicators are carried out in predetermined network elements and the performance data determined relates to performance -Management for further processing and / or analysis fed. If an error has now occurred in the network, the context of the network error is determined using a topology database, the topology database having the network elements, their connections and their properties. The context of the network error here means the network elements affected by the network error. For example, a network element falls in an end-to-end connection off, these are the network elements with regard to this end-to-end connection. On the basis of the context determined, the performance data of the network element concerned, which can no longer supply reliable data due to the network error, are discarded, so that irrelevant data need not be evaluated.
Die Ermittlung des Kontextes des Netzfehlers kann entweder direkt im Fault-Management vorgenommen werden, so daß in die- sem Fall das Fault-Management dem Performance-Management mitteilt, welche Netzelemente von dem Netzfehler betroffen sind, worauf das Performance-Management entsprechende Maßnahmen ergreift.The context of the network fault can either be determined directly in the fault management, so that in this case the fault management tells the performance management which network elements are affected by the network fault, and the performance management takes appropriate measures.
In einer weiteren Ausführungsform wird der Kontext des Netzfehlers in dem Performance-Management ermittelt, d.h. das Fault-Management erkennt einen Netzfehler und teilt den Netzfehler dem Performance-Management mit. Dieses ermittelt dann den Kontext unter Verwendung der Topologie-Datenbank und er- greift geeignete Maßnahmen.In a further embodiment, the context of the network fault is determined in the performance management, i.e. Fault management detects a network fault and reports the network fault to performance management. This then determines the context using the topology database and takes suitable measures.
Die aufgrund der Auswirkungen des Netzfehlers irrelevanten Performance-Daten können entweder am Ort ihrer Entstehung, nämlich dem betroffenen Netzelement selbst, oder im Perfor- mance-Management verworfen werden.The performance data that is irrelevant due to the effects of the network error can either be discarded at the point at which it originated, namely the network element itself, or in performance management.
Es ist ferner auch möglich, die betroffenen Netzelementen anzuweisen keine Performance-Messungen mehr durchzuführen, d.h. die gegebenenfalls aktivierten Messungen auszuschalten oder zu verhindern. Dies bietet sich insbesondere dann an, wenn die Behebung eines Fehlers länger dauert, wie bei einem Ausfall eines Netzelements oder wesentlicher Einheiten davon sowie bei einer Unterbrechung der Verbindung zwischen zwei Netzelementen einer End-to-End-Verbindung, beispielsweise bei dem Bruch eines Lichtleiters.
Ist der Fehler behoben, so teilt vorzugsweise das Fault-Management diesen Sachverhalt dem Performance-Management mit, wodurch das Performance-Management gegebenenfalls die betroffenen Netzelemente zur Wiederaufnahme des normalen Meßbetriebs anweist.It is also possible to instruct the network elements concerned to no longer perform performance measurements, ie to switch off or prevent any measurements that are activated. This is particularly useful if it takes longer to rectify an error, such as a network element or essential units failing, and an interruption in the connection between two network elements of an end-to-end connection, for example when a fiber-optic cable breaks. Once the error has been remedied, the fault management preferably reports this to the performance management, whereby the performance management may instruct the network elements concerned to resume normal measurement operation.
Durch die gegenseitige Information über Fehlerzusammenhänge im Netz zwischen Fault-Management und Performance-Management, d.h. den gegenseitigen Austausch von Problemsituationen, las- sen sich die großen, irrelevanten Datenmengen insbesondere am Ort ihrer Entstehung erheblich reduzieren.The mutual information about fault relationships in the network between fault management and performance management, i.e. the mutual exchange of problem situations, the large, irrelevant amounts of data can be significantly reduced, especially at the point of their creation.
Eine bevorzugte Ausführungsform der Erfindung wird nachfolgend anhand der einzigen Figur erläutert, die ein einfaches Netzwerk in schematischer Darstellung zeigt.A preferred embodiment of the invention is explained below with reference to the single figure, which shows a simple network in a schematic representation.
In der Figur ist ein Netzwerk dargestellt, das aus den Endpunkten El, E2 , E3 und E4 besteht, die über Netzelemente NEl, NE2 , NE3 und NE4 miteinander verbunden sind. Zwischen den Endpunkten El bis E4 ist jeweils eine End-to-End-Verbindung vorhanden. Die dem Netz entsprechende Topologie-Datenbank enthält die Netzelemente NEl bis NE4, deren Verbindungen, die vorhandenen End-to-End-Verbindungen sowie die Eigenschaften der Netzelemente und Verbindungen. Ein Fehler in den Netz hat je nach seinem Ort des Auftreten unterschiedliche Auswirkungen. Ist hier in dem Beispiel das zentrale Netzelement NE3 ausgefallen, so ist keine der End-to-End-Verbindungen mehr operabel und die Meßwerte sämtlicher Netzelemente NEl bis NE4 sind irrelevant. Ein Unterbrechen der Verbindung zwischen NE2 und NE3 hat Auswirkungen auf die End-to-End-Verbindung zwischen E2-E3 und E2-E4, aber keine Auswirkungen auf die restlichen Verbindungen. Daher sind nur die Performance-Daten des Netzelements NE2 irrelevant. Der Kontext des Netzfehlers ergibt sich daher aus der entsprechenden Topologie-Datenbank. Wird ein Fehler wieder behoben, so werden im allgemeinen die betroffenen Netzelemente mit der Fortsetzung des normalen Meßbetriebs angewiesen.
In the figure, a network is shown, which consists of the end points E1, E2, E3 and E4, which are connected to one another via network elements NE1, NE2, NE3 and NE4. There is an end-to-end connection between the end points E1 to E4. The topology database corresponding to the network contains the network elements NE1 to NE4, their connections, the existing end-to-end connections and the properties of the network elements and connections. An error in the network has different effects depending on where it occurs. If the central network element NE3 has failed in the example, then none of the end-to-end connections is operable anymore and the measured values of all network elements NE1 to NE4 are irrelevant. A break in the connection between NE2 and NE3 affects the end-to-end connection between E2-E3 and E2-E4, but does not affect the remaining connections. Therefore, only the performance data of the network element NE2 are irrelevant. The context of the network fault therefore results from the corresponding topology database. If an error is remedied, the network elements concerned are generally instructed to continue normal measuring operation.