Benutzer-Werkzeuge

Webseiten-Werkzeuge


perzeptron_aufgaben

Dies ist eine alte Version des Dokuments!


Perzeptron Aufgaben

Aufgabe: Klassifikation von Iris setosa

Der Iris-Datensatz ist einer der bekanntesten Datensätze im Bereich maschinelles Lernen. Er enthält Messungen von drei verschiedenen Schwertlilienarten (Iris setosa, Iris versicolor, Iris virginica) und wird häufig zur Demonstration von Klassifikationsverfahren verwendet.

Das Ziel dieser Aufgabe ist es, ein einfaches Perzeptron zu trainieren, das automatisch erkennt, ob eine gegebene Blume zur Art Iris setosa gehört oder nicht. Die Daten enthalten vier messbare Merkmale der Blüte, die als Eingabe für das neuronale Netz dienen.

Die drei Iris-Arten

Hier sind Beispielbilder der drei Blumenarten:

Iris setosa Iris versicolor Iris virginica
upload.wikimedia.org_wikipedia_commons_4_41_iris_setosa_2.jpg upload.wikimedia.org_wikipedia_commons_9_9f_iris_versicolor_3.jpg upload.wikimedia.org_wikipedia_commons_5_56_iris_virginica.jpg

Gegeben

Der Datensatz enthält vier Merkmale, die für jede Blume gemessen wurden:

  • Kelchblattlänge (cm)
  • Kelchblattbreite (cm)
  • Kronblattlänge (cm)
  • Kronblattbreite (cm)

Zusätzlich soll ein weiteres Eingangsneuron mit festem Wert hinzugefügt werden, um eine implizite Schwellenwertanpassung zu ermöglichen.

Vorgehen

  1. Laden Sie den Datensatz und bereiten Sie die Daten für das Training vor.
  2. Erweitern Sie den Datensatz um ein zusätzliches Eingangsneuron, das stets den Wert 1 hat (Bias-Neuron).
  3. Teilen Sie den Datensatz in 80% Trainingsdaten und 20% Testdaten.
  4. Kodieren Sie das Problem als binäre Klassifikation:
    • Setosa = 1
    • Nicht-Setosa (Versicolor/Virginica) = 0
  5. Implementieren Sie ein einfaches Perzeptron, das fünf Eingaben erhält und eine binäre Entscheidung trifft.
  6. Verwenden Sie die Schwellenwert-Aktivierungsfunktion:
    • \[ y = 1, \quad \text{falls } \sum w_i x_i \geq 0 \]
    • \[ y = 0, \quad \text{sonst} \]
  7. Trainieren Sie das Modell mit dem Trainingsdatensatz.
  8. Bewerten Sie die Klassifikationsgenauigkeit auf dem Testdatensatz.

Aufgabe: Training eines einfachen Perzeptrons zur Klassifikation von Iris setosa

Motivation

Der Iris-Datensatz ist einer der bekanntesten Datensätze im Bereich maschinelles Lernen. Er enthält Messungen von drei verschiedenen Schwertlilienarten (Iris setosa, Iris versicolor, Iris virginica).

Der Datensatz wurde ursprünglich 1936 von Ronald A. Fisher veröffentlicht und ist gemeinfrei. Er ist unter folgendem Wikipedia-Link dokumentiert: → Schwertlilien-Datensatz (Wikipedia).

Der Datensatz ist frei verfügbar und soll hier als Trainingsdatensatz für ein einfaches Perzeptron verwendet werden.

Die drei Iris-Arten

Hier sind Beispielbilder der drei Blumenarten:

Iris setosa Iris versicolor Iris virginica
upload.wikimedia.org_wikipedia_commons_4_41_iris_setosa_2.jpg upload.wikimedia.org_wikipedia_commons_9_9f_iris_versicolor_3.jpg upload.wikimedia.org_wikipedia_commons_5_56_iris_virginica.jpg

Gegeben

Der Datensatz enthält vier Merkmale, die für jede Blume gemessen wurden:

  • Kelchblattlänge (cm)
  • Kelchblattbreite (cm)
  • Kronblattlänge (cm)
  • Kronblattbreite (cm)

Zusätzlich soll ein weiteres Eingangsneuron mit festem Wert hinzugefügt werden, um eine implizite Schwellenwertanpassung zu ermöglichen.

Vorgehen

  1. Laden Sie den Datensatz und bereiten Sie die Daten für das Training vor.
  2. Erweitern Sie den Datensatz um ein zusätzliches Eingangsneuron, das stets den Wert 1 hat (Bias-Neuron).
  3. Teilen Sie den Datensatz in 80% Trainingsdaten und 20% Testdaten.
  4. Kodieren Sie das Problem als binäre Klassifikation:
    • Setosa = 1
    • Nicht-Setosa (Versicolor/Virginica) = 0
  5. Implementieren Sie ein einfaches Perzeptron, das fünf Eingaben erhält und eine binäre Entscheidung trifft.
  6. Verwenden Sie die Schwellenwert-Aktivierungsfunktion:
    • \[ y = 1, \quad \text{falls } \sum w_i x_i \geq 0 \]
    • \[ y = 0, \quad \text{sonst} \]
  7. Trainieren Sie das Modell mit dem Trainingsdatensatz.
  8. Bewerten Sie die Klassifikationsgenauigkeit auf dem Testdatensatz.
perzeptron_aufgaben.1739010438.txt.gz · Zuletzt geändert: 2025/02/08 10:27 von torsten.roehl