Merkmalserkennungs- und Klassifikationssystem (MEKS) S. Hafner Univ.-GHS Paderborn, Abteilung Meschede Tel.: (0291) 9910-330, Fax: (0291) 9910-330 Email: Hafner@meschede.uni-paderborn.de Kurzfassung Die Computational Intelligence ist ein Fachgebiet, das die Technologie der Neuronalen Netze, der Fuzzy Logik und der Evolutionären Algorithmen verbindet. Sie gewinnt bei industriellen Anwendungen immer mehr an Bedeutung [1], [2]. In der Praxis können Neuronale Netze (NN) auf unterschiedlicheste Weise eingesetzt werden. Bei industriellen Anwendungen ist eine systematische Vorgehensweise wichtig, die frühzeitig entscheidende Faktoren für den industriellen Erfolg einer Lösung berücksichtigt. Am Beispiel von Klassifikationsaufgaben werden unterschiedliche Vorgehensweisen diskutiert. Sie führten zur Entwicklung eines Merkmalserkennungs- und Klassifikationssystem (MEKS). An unterschiedlichen Aufgaben, insbesondere in der Diagnose, wurde MEKS validiert. Es ermöglicht auch die Kombination verschiedener Technologien, wie beispielsweise die der Neuronalen Netze, der Fuzzy Systeme und der Evolutionären Algorithmen. 1 Vorgehensweise bei der Lösung von Klassifikationsaufgaben beim Einsatz konventioneller Methoden Die prinzipiellen Arbeitsschritte, die für eine Klassifikation notwendig sind, wenn konventionelle Techniken eingesetzt werden, sind in Bild 1 dargestellt [4]. Merkmalsextraktion Klassifikation Bild 1: Module eines Klassifikationssystems Zuerst werden Meßdaten mit geeigneten Sensoren aufgenommen. Danach schließt sich eine an, die eine nachfolgende Verarbeitung erleichtert und die spätere Klassifikationsleistung erhöht. Dies kann beispielsweise bei Schallsignalen eine Fourier-Transformation sein. Nach der Vorverarbeitung werden geeignete Merkmale aus den Signalen extrahiert, die mit hoher Trennschärfe eine Zuordnung der Signalmuster zu vorgegebenen n ermöglichen. Bei Schallsignalen können dies einzelne ausgewählte Werte des Leistungsdichtespektrums sein. In der eigentlichen Klassifikation wird das Muster, das durch diese Merkmale beschrieben ist, einer Entscheidungsklasse zugeordnet.
Die Merkmalsextraktion bietet mehrere Vorteile. Die Komplexität der Aufgabe wird für den Klassifikator stark reduziert, wenn nur wenige wesentliche Eingangsgrößen dem Klassifikator zugeführt werden. Zusätzlich wird auch die Implementierung des Klassifikators in Hardware einfacher. Die Gesamtkosten können gesenkt werden, wenn irrelevante Meßgrößen im Bezug zur Klassifikationsaufgabe identifiziert und die dafür notwendige Sensorik und Signalverarbeitung eingespart werden. Wenn geeignete Merkmale für die Klassifikation festgelegt sind, kann dies insgesamt zu einem übersichtlichen und kleinen Klassifikator führen und häufig auch zu besseren Klassifikationsergebnissen [4]. Oft ist es schwierig, geeignete Merkmale zu finden. Die Merkmale sind so festzulegen, daß sie für Muster einer einen möglichst kompakten Bereich im Merkmalsraum bilden und, daß für verschiedene n die eingenommenen Bereiche möglichst getrennt sind. Bei Aufgaben, die als schwierig empfunden werden, sind oft solche Merkmale nicht in offensichtlicher Form zugänglich. Häufig sind die physikalischen Zusammenhänge nicht ausreichend bekannt bzw. genügt das Erfahrungswissen für eine geeignete Merkmalsbildung nicht. Wenn die Einzelsignale zusätzlich noch stark verrauscht sind, wird die Aufgabe, Merkmale zu bilden, zu recht als schwierig eingestuft. Die Neuronalen Netze bieten sich bei diesen Aufgaben an. Sie haben den Vorteil, daß Sie auf der Basis von Beispieldaten automatisch eine Lösungsstrategie finden können. Die schwierige Aufgabe der Merkmalsextraktion kann dem Entwickler abgenommen werden. 2 Merkmalsextraktion und Klassifikation in einem einzigen Neuronalen Netz Bei Neuronalen Netzen gibt es unterschiedliche Möglichkeiten, diese zur Klassifikation einzusetzen [5], [7]. Die Möglichkeit, bei der die Merkmalsextraktion vom Neuronalen Netz übernommen wird, ist in Bild 2 dargestellt. Merkmalsextraktion und Klassifikation mit einem NN Training des NN mit Mustern Bild 2: Häufige Vorgehensweise, wenn Neuronale Netze im Klassifikationssystem eingesetzt werden. Die Sensorsignale werden nach der Vorverarbeitung ohne vorherige Merkmalsextraktion dem Neuronalen Netz für die Klassifikation zugeführt. Die Merkmalsextraktion wird mit der eigentlichen Klassifikation verbunden. Ein einziges Neuronales Netz übernimmt zwei Aufgaben gleichzeitig. Der Vorteil dieser Methode besteht darin, daß die Schwierigkeit, geeignete Merkmale zu finden, für den Entwickler entfällt. Trotz dem geringen Entwicklungsaufwand werden in der Regel insgesamt gute
Klassifikationsergebnisse erzielt. Bei der Entwicklung einer Lösung führt dann der Einsatz der Neuronalen Netze zu einem hohen Automatisierungsgrad. Der Entwickler gibt dem Neuronalen Netz alle Größen vor, die mit dem Ereignis etwas zu tun haben könnten. Es wird dem Neuronalen Netz überlassen, die in den Trainingsdaten versteckten Charakteristika, die sich für eine Klassifikation eignen, auszuwerten. Die Nachteile dieser Vorgehensweise werden häufig erst nach der Entwicklung erkannt. Sie bestehen insbesondere darin, daß es sehr schwierig ist, die gefundene Lösung zu interpretieren. Für die Klassifikation werden Charakteristika benutzt, die implizit in den Daten enthalten sind, die aber nicht direkt zugänglich sind. Warum das Netz nun eine bestimmte Klassifikationsentscheidung trifft, ist nur sehr schwer nachvollziehbar. Das zusätzliche Einbringen von Erfahrungswissen und physikalischen Kenntnissen in die vom Netz gefundene Lösung ist kaum möglich. Dies führt bei Fachleuten und Kunden häufig zu Akzeptanzproblemen. Zusätzlich sind die Kosten für die Implementierung des komplexen Neuronalen Netz-Klassifikators in Hardware höher. Wenn die Merkmalsextraktion mit der Klassifikation von einem einzigen Neuronalen Netz durchgeführt wird und gute Ergebnisse erzielt werden, hat das Neuronale Netz bestimmte Charakteristika in den Daten gefunden. Diese Merkmale sind in den Trainingsdaten enthalten, liegen allerdings nur in impliziter Form vor. Oft werden diese Merkmale auch nicht durch das Betrachten von einzelnen Trainingsmustern erkannt, u.a. weil die Trainingsdaten stark verrauscht und die in ihnen enthaltenen Charakteristika versteckt sind. Die Frage stellte sich, ob es nicht möglich wäre, direkt die Merkmalsextraktion mit Unterstützung eines Neuronalen Netzes durchzuführen und dadurch physikalisch interpretierbare Merkmale zu finden. Dies führte zur Entwicklung des Merkmalserkennungs- und Klassifikationssystems (MEKS). 3 Das Merkmalserkennungs- und Klassifikationssystem (MEKS) Bei MEKS werden u.a. Neuronale Netze eingesetzt, um aus den Meßdaten Informationen zu gewinnen und so den Entwickler bei der Bildung von geeigneten Merkmalen zu unterstützen (Bild 3). Merkmalsextraktion Klassifikation Informationen aus einem NN, das zur Datenvisualisierung trainiert wurde beispielsweise ein Fuzzy- Klassifikator Bild 3: Vorgehensweise mit MEKS beim Einsatz zweier Neuronalen Netze (NN) Die Aufgaben werden dadurch aufgeteilt. Das Neuronale Netz erfüllt nicht gleichzeitig beide Aufgaben, nämlich die Merkmalsextraktion mit der Klassifikation. Bei der mit
MEKS realisierten Methode ist die Merkmalsextraktion separat vor der Klassifikation durchzuführen. Ein Neuronales Netz unterstützt den Entwickler bei der Bildung geeigneter Merkmale. Dies reduziert die Komplexität der Aufgabe für einen Klassifikator. Dieser muß nicht mehr die Aufgabe der Merkmalsextraktion zusätzlich übernehmen, da er bereits die Merkmale als Eingangsgrößen erhält. Die Merkmalsbildung wird nicht automatisch nur vom Neuronalen Netz durchgeführt, sondern der Entwickler wird bei der Merkmalsbildung interaktiv einbezogen (Bild 5). Vom Analysenetz speziell Vom Neuronalen Netz aufbereitete speziell aufbereitete Informationen aus Informationen den Trainingsdaten Physikalische Kenntnisse Merkmale Erfahrungswissen Bild 4: Data Mining mit Unterstützung Neuronaler Netze Die in den Trainingsdaten enthaltenen Informationen werden in visueller Form von einem Neuronalen Netz dargestellt [3]. Der Entwickler bildet Merkmale, indem er die vom Neuronalen Netz speziell aufbereitete Information aus den Trainingsdaten nutzt, physikalische Kenntnisse einbringt und Erfahrungswissen berücksichtigt. Mit diesen Merkmalen kann eine anschließende Klassifikation mit unterschiedlichen Techniken durchgeführt werden. Beispielsweise können dann zur Klassifikation Fuzzy Systeme oder konventionelle Klassifikatoren eingesetzt werden. Da nur der Klassifikator implementiert wird, bietet dies also die Möglichkeit die Zielhardware entsprechend dem Kundenwunsch zu gestalten. In der industriellen Praxis kann dies für die Akzeptanz der Lösung entscheidend sein. 4 Zusammenfassung und Ausblick Die vorgeschlagene systematische Vorgehensweise beim Einsatz Neuronaler Netze führt bei Klassifikationsaufgaben zu physikalisch interpretierbaren Lösungen, die kostengünstig in Hardware umgesetzt werden können. Sie eignet sich insbesondere für die Kombination unterschiedlicher Techniken der Computational Intelligence. Werden Neuronale Netze zur Merkmalsextraktion eingesetzt, kann beispielsweise eine anschließende Klassifikation mit einem Fuzzy System durchgeführt werden [5]. Das Fuzzy System benötigt dadurch eine geringere Anzahl von Eingangsgrößen und damit auch weniger Regeln. Um relevante Fuzzy Regeln zu finden, kann beispielsweise ein evolutionärer Algorithmus eingesetzt werden [8]. Mit dieser Vorgehensweise wird der zu implementierende Klassifikator in der Komplexität erheblich reduziert und kann überschaubar und kostengünstig in Hardware umgesetzt werden. Die geringere Anzahl von Merkmalen und Regeln begünstigt die Akzeptanz beim Fachmann, da die Lösungsstrategie sehr übersichtlich dargestellt werden kann. Eine weitere Anwendung solcher Neuronalen Netze besteht im Data
Mining. Dies ist ein Prozeß bei dem nützliche Informationen und Zusammenhänge aus Daten extrahiert werden. Literatur [1] Hafner, S. (Hrsg.): Neuronale Netze in der Automatisierungstechnik. München: R. Oldenbourg Verlag. 1994. [2] Hafner, S. (Hrsg.): Industrielle Anwendung Evolutionärer Algorithmen. München: R. Oldenbourg Verlag. 1998. [3] Hafner, S.: Ein spezielles Neuronales Netz zur Merkmalsbildung für Klassifikatoren. Automatisierungstechnik (at) 47. H. 9, 1999. S. 421-428. [4] Hafner S., Baumann T., Grösch L., Henne M.: Airbagauslösealgorithmus mit Fuzzy-Logik. Deutsche Patentanmeldung 19518411.4, Internationale Patentanmeldung 1998. [5] Schürmann, J.: Pattern classification: A unified view of statistical and neural approaches. New York: Wiley 1996. [6] Hafner S., Kistner A.: Neuronale Netze zur Merkmalsbildung für Klassifikatoren. Proc. 7. Workshop: Fuzzy Control, Forschungsberichte der Fakultät für Elektrotechnik. Nr. 0397. S. 1-13. Universität Dortmund. 1997. [7 ] Rojas R.: Theorie der neuronalen Netze: Eine systematische Einführung. Berlin: Springer- Verlag. 1996. [8] Krone A., Kiendl H.: An Evolutionäry concept for Generating Relevant Fuzzy Rules from Data. Journal of Knowledge-based Intelligent engineering Systems, Vol 1, No. 4, October 1997.