====== Perzeptron Lernalgorithmus ======
//Im Folgenden wird der Lernalgorithmus für das **einfache Perzeptron** beschrieben. Um das Prinzip zu verstehen, werden lediglich zwei Eingangsneuronen und ein Ausgangsneuron verwendet. Mithilfe des Lernalgorithmus kann dann (z. B. in Java) gezeigt werden, dass einfache Probleme wie das UND-Problem gelernt werden können.//
===== Topologie =====
* **Eingangsneurone** $x_1$, $x_2$ und $x_3$
* Das Neuron $x_3$ hat __immer__ den Wert 1.
* **Ausgabeneuron** $y_1$ oder $o$ für **O**utput.
* **Gewichte** $w_{11}$ , $w_{21}$ und $w_{31}$
* Das Gewicht $w_{31}$ hat (in unserem Beispiel) immer den Wert $w_{31}=-0.1$ .
{{ :pnn.png?400 |}}
Die Schwelle θ wird durch ein konstantes Gewicht (in unserem Beispiel) $w_{31}=−0.1$ festgelegt. Nur die Gewichte $w_{11}$ und $w_{21}$ werden gelernt, um alle Trainingsmuster wiedergeben zu können.
Im **Perzeptron** kann anstelle der Schwelle ein Bias verwendet werden, da dieser als zusätzliches Gewicht modelliert wird, das mit einem konstanten Eingabewert von 1 multipliziert wird und dadurch die Schwelle direkt in die Gewichtsanpassung integriert.
//Der Zusammenhang zwischen Schwelle und Bias kann mathematisch gezeigt werden, was an anderer Stelle erfolgt.//
===== forward pass =====
Unter dem „forward pass“ versteht man die Berechnung der Ausgabe eines neuronalen Netzes bei gegebener Eingabe und gegebenen Gewichten. Im ersten Schritt wird die Netzeingabe $net$ berechnet. Anschließend wird darauf die Aktivierungsfunktion $f(net)$ angewandt.
** forward pass** Berechnung der Netzausgabe $f(net)$ bei gegebener Eingabe.
==== Netzeingabe $net$ ====
Allgemein gilt für die Netzeingabe des Neuron $j$:
\begin{equation} net_j = \sum w_{ij} \cdot x_i \end{equation}
Da wir nur ein Ausgabeneuron haben ist $net_j=net_1=net$ also folgt für drei Eingabeneuronen:
\begin{equation} net = \sum_{i=1}^3 w_{i1} \cdot x_i = w_{11} \cdot x_1 + w_{21} \cdot x_2+ w_{31} \cdot 1\end{equation}
Dabei wird verwendet, dass $x_3=1$ gesetzt worden ist.
==== Aktivierungsfunktion ====
Die Aktivierungsfunktion für das //Perzeptron// lautet:
\begin{equation}
f(x)=\left\{\begin{array}{ll}0 : & x < 0 \\
1 : & x\geq 0 \end{array}\right.
\end{equation}
{{ :inf:ki:schwellenwertfunktion.png? |}}
===== Trainingsmuster ($x_1$,$x_2$) → $y$ =====
Der Perzeptron-Lernalgorithmus wird auf Trainingsmuster angewendet. Ein Trainingsmuster (//engl. Training Pattern//) besteht aus der Eingabe zusammen mit der gewünschten Ausgabe, die es zu lernen gilt. Das neuronale Netz lernt die Gewichte so anzupassen, dass alle Trainingsmuster richtig wiedergegeben werden.
**Für das AND-Problem gibt es vier Trainingsmuster:**
^Input^Output t^
|$(0,0)$| 0|
|$(0,1)$| 0|
|$(1,0)$| 0|
|$(1,1)$| 1|
===== Perzeptron lernen =====
==== Vorbereitung ====
* Wähle eine Lernrate $\eta$ zwischen 0 und 1, z.B. $\eta=0.1$.
* Wähle zufällige Zahlen für die Gewichte $w_{ij}$ zwischen 0 und 1 für die Initialisierung.
==== Algorithmus ====
//Perzeptron Lernalgorithmus//
- **forward pass:** Wähle (zufällig) ein Trainingsmuster und berechne die Ausgabe $o$
- **error:** Berechne den Fehler zwischen der gewünschten Ausgabe (**t** //für Target//) und der tatsächlichen **o** mit: $t-o$.
- **hebb rule:** Berechne die Gewichtsänderung $\Delta w_{ij} = \eta\cdot (t-o)\cdot x_i$
- **update:** Ändere das Gewicht $w_{ij}$ mit: $w_{ij} = w_{ij} + \Delta w_{ij} $
- Wiederhole ab Schritt 1. für eine Anzahl an Iterationen, bis das gewünschte Ergebnis erreicht ist.
===== Test & Aufgaben =====
- Implementieren Sie den Perzeptron-Lernalgorithmus für das UND-Problem.
- Überprüfen Sie, ob das UND-Problem korrekt gelernt wurde, indem Sie für alle Inputvektoren $(x_1,x_2)$ die Ausgaben berechnen.
- Ändern Sie die Implementierung um auch das ODER-Problem zu lernen.
- Wiederholen Sie das Lernen mehrmals und untersuchen Sie die gelernten Gewichte $w_{11}$ und $w_{21}$.
- Untersuchen Sie die Abhängigkeit der Lernrate von der Anzahl der Iterationen, die benötigt werden, um das Problem zu lösen.
- Erstellen Sie hierfür einen aussagekräftigen Graphen.
- Beschäftigen Sie sich nun mit dem XOR-Problem.
- Ändern Sie den Code um auch dieses Problem zu studieren.**🕱 🕱 🕱**
Passen Sie gegebenenfalls die Lernrate oder die Anzahl der Iterationen an, damit das Problem erfolgreich gelernt werden kann.