Architektur des neuronalen Netzes

Zum Modellieren des neuronalen Netzes habe ich das MATLAB Neural Network Toolbox benutzt. Es beinhaltet eine Vielzahl von eingebauten Funktionen zum Aufbau eines Netzes. Ich habe ein mehrschichtiges Feedward-Netz fürs Trainieren des Lernmaterials angewendet.

Hier sind die drei Ablaufphasen eines neuronalen Netzes, die durch das MATLAB Toolbox wie folgt definiert werden:

  • Initialisierung des neuronalen Netzes


  • Das newff ist die Funktion, die das Feedforward-Backpropagation-Netz definiert. Signs undtargets sind bzw. die zuvor bestimmten Eingabe- und Ausgabevektoren dieses Netzes. Die verdeckten Schichten [20 40] und die Nummer der Neuronen pro Hidden-Layer werden ebenfalls explizit eingegeben. Die optimale Anzahl der Neuronen wird mehr oder weniger durch Ausprobieren ermittelt. Die Aktivierungsfunktion in den verdeckten Schichten wird durch {’logsig’,’logsig’,’logsig’} definiert. Zusätzlich ist trainscg die Training-Funktion des neuronalen Netzes, die die Gewichtänderung ansteuert.

    trainscg: Scaled conjugate gradient backpropagation

  • Trainieren des neuronalen Netzes
  • Für das Trainieren vom neuronalen Netz wird die train Funktion aufgerufen.


    tr: trained record of various values over each epoch
    P: set of training patterns
    T: set of target outputs

    Das Trainieren erfolgt stapelweise und wird noch offline learning genannt, da die Gewichte nur nach Präsentation aller Eingabe- und Ausgabewerte modifiziert werden. Das Trainingwird dann abgebrochen, wenn die zuvor festgelegte maximale Anzahl an Wiederholungen oder der maximal zugelasse Gesamtfehler erreicht sind oder etliche Abbruchbedingungen eingetreten sind.

    Diese Trainingsparameter können je nach Netzarchitektur auch angepasst werden.



  • Testen des neuronalen Netzes
  • In der Testphase wird das neuronale Netz net mit einem verrauschten Schriftzeichen nchar überprüuft und eine Vorhersage (prediction) durch die compet Transfer-Funktion getroffen.


    Ich habe allerdings verschiedene Netze definiert,mit und ohne Rauschen trainiert und anschließend getestet, um bessere Fehlerabschätzung durchführen zu können. Außerdem habe ich die Datensätze mit Rauschen versehen, um das Verhalten des Netzes auf die so verrauschten Daten zu untersuchen.