1.1 Ein historisches Beispiel
Ein historisches Beispiel mit echten Daten, die über 100 Jahre alt sind
Bevor wir uns damit befassen, wie ein neuronales Netz trainiert wird und dadurch selbstständig lernen kann, schauen wir uns ein bereits fertig trainiertes neuronales Netz an. Wir müssen jetzt noch nicht alles verstehen, können es aber trotzdem stellvertretend für viele andere ähnlich aufgebaute neuronale Netze zunächst erforschen. Das im Folgenden benutzte neuronale Netz ist in der Lage, zu 80 Prozent richtig vorherzusagen, wer den Untergang der berühmten Titanic 1912 überlebt hat und wer nicht. Nach einer Kollision mit einem Eisberg ging das damals als unsinkbar geltende Schiff unter, und es gab nicht genug Rettungsboote für alle Passagiere. Daher überlebten von über 2200 Menschen nur ca. 700.
Die Daten von 1300 der 2200 Passagiere aus dem Unglück vor über 100 Jahren konnten rekonstruiert und zu einem Datensatz zusammengesetzt werden, der oftmals als Einstiegsbeispiel dient und auch im Folgenden benutzt werden soll.[1] Das unten abgebildete neuronale Netz wurde bereits vollständig mit diesen Daten trainiert. Aus den gelernten Daten kann das Netz nun Vorhersagen treffen, ob ein Passagier überlebt oder nicht. Wie das exakt funktioniert, ist zunächst noch nicht wichtig und wird später erläutert. Für den jetzigen Zeitpunkt reicht es zu verstehen, dass das neuronale Netz während des Trainings lernt, wie es die Eingabedaten (das sind im Folgenden acht Zahlenwerte) am besten in die gewünschten Ausgabedaten (überlebt, nicht überlebt) umwandeln kann.
Probiere aus: Wer hat beim Untergang der Titanic überlebt?
Fülle alle acht Felder mit Werten deiner Wahl aus und klicke Berechne
. Die Eingabefelder werden in Zahlenwerte umgewandelt und in das bereits fertig trainierte neuronale Netz geschickt. Von dort aus „fließen“ die Zahlen von links nach rechts durch das neuronale Netz und sorgen dafür, dass am Ende eines der beiden so genannten Ausgabeneuronen aktiviert ist: entweder dasjenige, das für „überlebt“ steht, oder dasjenige, das für „nicht überlebt“ steht.
→
→
→
→
→
→
→
Gib probehalber einmal die Daten echter Passagiere ein, um zu schauen, ob das Netz das Überleben richtig vorhersagt:
- Mrs. Stengel, 1. Klasse, weiblich, 43 Jahre, mit Ehemann und ohne Kinder im Kabinenbereich C für 55 Pfund gebucht, in Cherbourg zugestiegen (hat überlebt)
- Mr. Lovell, 3. Klasse, männlich, 20 Jahre, allein reisend, Kabinenbereich A für 7,25 Pfund gebucht, in Southampton zugestiegen (hat nicht überlebt)
Das Netz sollte für die obigen Daten korrekt wiedergeben, ob die Personen überlebt haben oder nicht, da diese beiden Datensätze zu den 80 Prozent der insgesamt 1300 Datensätze gehören, die das Netz richtig vorhersagt. Gib nun einmal die folgenden echten Daten ein, die das Netz leider falsch vorhersagt:
- Mrs. Mack, 2. Klasse, weiblich, 57 Jahre, allein reisend im Kabinenbereich E für 10,50 Pfund gebucht, in Southampton zugestiegen (hat nicht überlebt)
- Mr. Pickard, 3. Klasse, männlich, 32 Jahre, allein reisend, Kabinenbereich E für 8,05 Pfund gebucht, in Southampton zugestiegen (hat überlebt)
Warum funktioniert das Netz nicht perfekt?
Woran liegt es, dass das Netz Fehler macht? Das liegt daran, dass das Netz keine Datenbank o. ä. ist. Es gibt auch gar keinen Speicher, in dem die Originaldaten irgendwie gespeichert und abgerufen werden können. Es gibt nicht einmal so viele Verbindungen (in denen in Form einer Zahl Informationen gespeichert werden könnten) wie Personen im Datensatz. Insgesamt hat das Netz sogar nur 118 Zahlenwerte („Parameter“), die beim Training verändert werden können und so eingestellt werden müssen, dass das Netz möglichst viele korrekte Vorhersagen trifft. Es gab aber 1300 x 8 = 10.400 Eingabedaten – und deswegen macht das Netz auch im Durchschnitt bei jeder fünften Vorhersage (20 %) einen Fehler. Es gibt jedoch genug Szenarien, in denen diese 80 % bereits wichtig sein könnten. Eine 80-prozentige Wahrscheinlichkeit, mit einem Niedrigpreis-Ticket der 3. Klasse zu sterben, ist schon durchaus aussagekräftig.
Insgesamt gibt das Netz die echte Überlebenschance auf der Titanic bei Weitem nicht perfekt, aber in der Tendenz schon ganz ordentlich wieder. Aufgrund der Knappheit der Rettungsboote wurden damals nämlich Frauen und Kinder, vor allem in der 1. und 2. Klasse, bevorzugt evakuiert. Die Passagiere der 3. Klasse hatten u. a. baulich und organisatorisch bedingt schlechteren Zugang zu den Rettungsbooten, weswegen viele von ihnen ertranken. Männer in der 2. Klasse hatten prozentual die niedrigste Überlebensquote, vermutlich weil sie Frauen und Kindern den Vortritt ließen. Diese und weitere Informationen findet man hier.[2]
Diese Seite teilen