Dies ist eine alte Version des Dokuments!
Inhaltsverzeichnis
Perzeptron Aufgaben
Aufgabe: Klassifikation von Iris setosa
Der Iris-Datensatz ist einer der bekanntesten Datensätze im Bereich maschinelles Lernen. Er enthält Messungen von drei verschiedenen Schwertlilienarten (Iris setosa, Iris versicolor, Iris virginica).
Der Datensatz wurde ursprünglich 1936 von Ronald A. Fisher veröffentlicht und ist frei verfügbar (Schwertlilien-Datensatz (Wikipedia)).
\\
Das Ziel dieser Aufgabe ist es, ein einfaches Perzeptron zu trainieren, das automatisch erkennt, ob eine gegebene Blume zur Art Iris setosa gehört oder nicht. Die Daten enthalten vier messbare Merkmale der Blüte, die als Eingabe für das neuronale Netz dienen. Die gewünschte Ausgabe ist die Art.
Die drei Iris-Arten
Gegeben
Der Datensatz enthält vier Merkmale, die für jede Blume gemessen wurden:
- Kelchblattlänge (cm)
- Kelchblattbreite (cm)
- Kronblattlänge (cm)
- Kronblattbreite (cm)
Zusätzlich soll ein weiteres Eingangsneuron mit festem Wert hinzugefügt werden, um eine implizite Schwellenwertanpassung zu ermöglichen.
Vorgehen
- Laden Sie den Datensatz und bereiten Sie die Daten für das Training vor.
- Teilen Sie den Datensatz in 80% Trainingsdaten und 20% Testdaten.
- Kodieren Sie das Problem als binäre Klassifikation:
- Setosa = 1
- Nicht-Setosa (Versicolor/Virginica) = 0
- Trainieren Sie das Modell mit dem Trainingsdatensatz.
- Bewerten Sie die Klassifikationsgenauigkeit auf dem Testdatensatz.
Verwenden Sie die Schwellenwertfunktion als Aktivierungsfunktion. Die Schwelle kann als 5. Eingabeneuron mit dem konstanten Input 1 moduliert werden.