Neuronale Netze

Die künstlichen neuronalen Netze (KNN) sind eine Abstraktion der Informationsverarbeitung, die im Gehirn und im Nervensystem der Menschen und der Tiere verläuft. Dabei werden die physiologischen Vorgänge nicht nachgebildet, sondern nur versucht, die Architektur der massiv parallelen Informationsverarbeitung des Gehirns nachzubauen.
Die KNN bestehen aus mehreren miteinander verknüften Neuronen, die in verschienenen Schichten organisiert werden. Zwischen diesen Neuronenschichten findet eben der Informationsaustausch statt. Die Anzahl der Schichten und der Neuronen innerhalb einer Schicht kann je nach Eingabe variieren. Man unterscheidet zwischen drei verschiedenen Arten von Schichten.

Eingabeschicht
Verdeckte(n) Schicht(en)
Ausgabeschicht

Um die Funktionsweise der neuronalen Netze (NN) verstehen zu können und ein erfolgreiches Lernen durchführen zu können, muss man zuerst die Struktur eines künstlichen Neurons als Hauptbaustein der NN kennenlernen. Ein Neuron kann durch einige Basiselemente beschrieben werden.

Eingabewerte

Gewichte

Netzaktivität

Aktivierungsfunktion

Lineare Funktion

Schwellenwert- oder Treppenfunktion

Sigmoidfunktion

Ausgabe

Der prinzipelle Aufbau eines künstlichen Neurons wird wie folgt darsgestellt.

Das Lernen an sich wird zumeist als Gewichtsveränderung zwischen den einzelnen Einheiten (Neuronen) definiert. In diesem Zusammenhang hängt die Erfolgsrate des Lernprozesses vor allem von der Lernsverfahren und von der verwendeten Lernregeln ab. Diese Lernverfahren bringen ein neuronales Netz dazu, für bestimmte Eingabemuster zugehörige Ausgabemuster zu erzeugen. Dies geschieht auf drei verschiedene Wege- überwachtes, unüberwachtes und bestärkendes Lernen.
Beim überwachten Lernen hat man einen "Lehrer", der genau vorgibt, wie die Ausgabe aussehen soll. Beim bestärkenden dagegen ist ein "Kritiker", der zum Schluss "mitteilt",ob die produzierte Ausgabe korrekt oder falsch gewesen ist. Das unüberwachte Lernen hingegen erfolgt ausschließlich nur durch Eingabe der zu lernenden Muster, d.h. es wird keine Ausgabe vorgegeben.
Als Ansatz für die konkrete Problemstellung habe ich das überwachte Lernverfahren und die Backpropagation-Lernregel angewendet.

Backpropagation

Zum Lösen des OCR-Problems im Rahmen des Projekts habe ich Feedforward Netze definiert und dabei die Backpropagation-Lernregel verwendet. Die Feedforward Netze sind NN, welche keine Zyklen enthalten. Man unterscheidet singlelayer und multilayer Netze. Im Gegensatz zu den multilayer feedforward Netze haben die singlelayer NN nur Eingabe- und Ausgabeschicht
Die Backpropagation ist ein verbreitetes überwachtes Verfahren für das Einlernen von künstlichen neuronalen Netze, d.h es muss dazu ein externer Lehrer existieren, der zu jedem Zeitpunkt der Eingabe die gewünschte Ausgabe kennt.
Ich habe ein mehrschichtiges Feedforward-Netz benutzt, das die Backpropagation-Lernregel zur Modifikation der Gewichte einsetzt. Ausserdem habe ich die Sigmoid-Aktivierungsfunktion wegen ihrer günstigen Eigenschaften (z.B Differenzierbarkeit) verwendet wird. Sie ist auch im Prinzip die am häufigsten angewendete Funktion.

Der Backpropagation-Algorithmus läuft in folgenden Phasen:

Forward pass

Fehlerbestimmung

Backward pass

Der ganze Vorgang wird mehrfach wiederholt, bis der Gesamtfehler entweder klein genug ausfällt oder die zuvor festgelegte maximale Anzahl von Wiederholungen erreicht worden ist.

Abb. Schematische Darstellung der Backpropagation

Optical character recognition für chinesische Schrift

Inhalt

Neuronale Netze

Backpropagation