Eine Publikation der Swissprofessionalmedia AG
PDF download
Ausgabe 02/2020, 07.10.2020

Das neuronale Netz ist in der Lage, eine Problemlösung zu «lernen»

Über künstliche neuronale Netzwerke wird gegenwärtig sehr viel geschrieben und aktiv geforscht. Obschon die zugrunde liegende Theorie aus den 1940er Jahren stammt, begann der grosse Aufschwung erst vor wenigen Jahren dank immer leistungsfähigeren Prozessoren. Inzwischen haben neuronale Netze auch den Weg in die Industrie gefunden.

Autor: Patrick Koller und Dr. Jürg M. Stettbacher

Innerhalb der sogenannten Künstlichen Intelligenz nimmt das maschinelle Lernen eine Schlüsselfunktion ein und löst Probleme, für welche rein algorithmische Verfahren zu komplex wären. Im Gegensatz zum klassisch programmierten Algorithmus werden beim maschinellen Lernen die Instruktionen nicht vom Programmierer in Quellcode umgesetzt, sondern es wird beispielsweise ein neuronales Netz verwendet oder entworfen, das in der Lage ist, eine Problemlösung zu «lernen». Das wird an einem einfachen Beispiel erläutert: Es soll zuerst automatisch festgestellt werden, ob ein gegebenes Bild ein Fahrzeug (PW, LKW) zeigt; wenn ja, so soll zweitens der Ort ermittelt werden, wo sich das Nummernschild des Fahrzeugs befindet; und schliesslich soll der Text auf dem Kennzeichen identifiziert werden.

Ein vortrainiertes Netz
Um die erste Teilaufgabe zu lösen, verwendet Stettbacher Signal Processing AG (SSP) ein vortrainiertes Netz. Derartige Netze, welche die Lösung verschiedener Aufgaben schon erlernt haben, und die beispielsweise auf Fotos Menschen, Haustiere oder eben Fahrzeuge erkennen können, sind frei verfügbar. Freilich ist die Qualität und die Zuverlässigkeit dieser Netze anhand von eigenen Daten (Bildern) zu prüfen. Falls nun ein Fahrzeug im Foto erkannt wurde, so gilt es, sein Nummernschild zu lokalisieren. Für diese zweite Teilaufgabe hat SSP ein eigenes Netz trainiert. Dazu musste zuerst eine grosse Menge von Fotos als Trainingsdaten aufgenommen oder gesammelt werden. Die Bilder enthalten Nummernschilder aus unterschiedlichen Perspektiven und bei diversen Lichtverhältnissen. Da die Geometrie, Farbe und Erscheinung von Fahrzeugkennzeichen verhältnismässig uniform sind, waren nur wenige hundert Bilder notwendig. Andere Fälle verlangen tausende oder mehr Datensätze. Entsprechend rechenaufwändig ist dann das Training. Es wird üblicherweise auf speziell ausgerüsteten Computern durchgeführt. Das so von SSP trainierte Netzwerk ortet und erkennt Nummernschilder zuverlässig. Schliesslich bleibt als dritter und letzter Schritt noch das Lesen des Kennzeichens: Dafür wird ein weiteres vortrainiertes Netzwerk verwendet, das Texte in Bildern identifizieren kann. Ihm wird der Bildausschnitt mit dem zuvor entzerrten Nummernschild übergeben. Die Aufgabe ist somit gelöst.

Deep Learning
Es ist immer wieder erstaunlich, was neuronale Netze leisten. Dabei sind sie im Grunde sehr übersichtlich aufgebaut. Die sogenannten Neuronen bilden Schichten, die jeweils die Inputs (z.B. Bildpixel) oder die Ausgänge der vorhergehenden Schicht neu gewichten und kombinieren. Allerdings bestehen reale Netze bisweilen aus vielen Millionen von Neuronen. Ab einer gewissen Anzahl von Schichten spricht man von Deep Learning.
SSP setzt die Technologie erfolgreich ein in Kundenprojekten im Bereich Machine Vision und Robotik. Wiederkehrende Aufgaben sind dort Detektion und Lokalisation von komplexen Objekten, die Bestimmung deren Lage und Ausrichtung im Raum sowie das Fassen und/oder exakte Platzieren der Objekte. 

Infoservice
Stettbacher Signal Processing AG
Neugutstrasse 54, 8600 Dübendorf
Tel. 043 299 57 23
dsp@stettbacher.ch, www.stettbacher.ch

 



Automatisch detektiertes Nummernschild an einem Fahrzeug bei der Stettbacher Signal Processing AG.