Handbuch: 7.2.1. Neuronales Netz

Ein neuronales Netz besteht aus Knotenpunkten, die miteinander in Verbindung stehen (nicht unähnlich den durch Synapsen verbundenen Neuronen). Die Eingabedaten werden an speziellen Knotenpunkten ins Netz eingespeist und können dann im Netz weitergegeben werden. Jedesmal, wenn eine Dateninformation über eine Verbindung fährt oder einen Knotenpunkt erreicht, wird sie nach mathematischen Regeln verändert. Zu einem späteren Zeitpunkt verlässt diese Dateninformation das Netz wieder an anderen speziellen Knotenpunkten. Jede Verbindung und jeder Knotenpunkt enthält gewisse Parameter, die genau festlegen, was an dieser Stelle zu tun ist. Auf diese Weise stellt das Netz die Beziehung zwischen den Eingabedaten und den Ausgabedaten dar; es stellt also eine mathematische Funktion dar – ähnlich wie bei der Gleichung einer geraden Linie. Ein neuronales Netz ist eigentlich nicht mehr als eine Gleichung mit Parametern, die durch die Daten bestimmt werden, die das Netz darstellen soll.

Das ganze Aufheben um neuronale Netze basiert eigentlich auf der Tatsache, dass es einen mathematischen Beweis gibt (auf den wir hier nicht näher eingehen wollen), gemäß dem ein neuronales Netz in der Lage ist, einen Datensatz präzise und genau darzustellen, sofern es nur genügend Knotenpunkte enthält und solange die Daten intern konsistent sind. Das gilt selbst dann, wenn die Beziehungen innerhalb des Datensatzes höchst nichtlinear oder zeitabhängig sind.

Was meinen wir mit "intern konsistent"? Es bedeutet, dass die Datenquelle stets denselben Gesetzen gehorcht. Im Falle einer industriellen Produktion werden die Daten durch die Naturgesetze bestimmt. Weil diese sich nicht verändern, ist der Datensatz intern konsistent. Die treibenden Kräfte eines Aktienmarktes bleiben hingegen, um ein gegenteiliges Beispiel zu nennen, nicht konstant, weshalb neuronale Netze solche Datensätze nicht gut wiedergeben können.

Um es zusammenzufassen: Ein neuronales Netz ist eine komplexe mathematische Formel, die in der Lage ist, jeden intern konsistenten Datensatz präzise darzustellen. Der allgemeine Ansatz, dies zu bewerkstelligen, besteht darin, eine Formel mit Parametern zu erstellen und die Werte dieser Parameter mit Hilfe einer Rechenmethode zu bestimmen. Das nennen wir dann maschinelles Lernen.

Es kann nützlich sein, ein neuronales Netz als eine Zusammenfassung von Daten zu verstehen: Eine große Tabelle von Zahlen wird in eine Funktion umgewandelt – so als ob wir von einer wissenschaftlichen Abhandlung einen Abstrakt erstellen, also eine kurze Zusammenfassung. Beachten Sie, dass eine Zusammenfassung nicht mehr Informationen enthalten kann als der ursprüngliche Datensatz; im Gegenteil: Sie enthält weniger Informationen. Allerdings: aufgrund ihrer Kürze kann die Zusammenfassung sehr nützlich sein. Man könnte sagen, dass neuronale Netze auf diesem Weg Informationen in Wissen umwandeln, auch wenn es sich dabei um ein Wissen handelt, dass zum Zweck eines praktischen Nutzens noch gedeutet werden muss.

Die Zusammenfassung von Daten ist zwar schön, aber für konkrete Anwendungen noch nicht ausreichend. Um praktisch nutzbar zu sein, benötigen wir die interpolierenden und extrapolierenden Qualitäten eines Modells. Nehmen wir einmal an, ein Datensatz enthält Messungen für die unabhängige Variable x, deren Wert x=1 und x=2 sein können; dann hat das Modell eine interpolative Qualität, sofern der Ausgangswert dieses Modells, der zwischen diesen beiden Werten liegt, vernünftig ist; d.h., dass er etwa dem entspricht, was als Messung herausgekommen wäre, wenn wir den Wert tatsächlich gemessen hätten, z.B. bei x=1,5. Das ist freilich nur möglich, wenn die ursprünglichen Daten mit genügend hoher Auflösung erhoben wurden, um alle diese Effekte abzudecken. Das Modell hat eine extrapolative Qualität, wenn der Ausgangswert dieses Modells für die unabhängige Variable außerhalb der beobachteten Spanne liegt und dennoch vernünftig ist, z.B. in diesem Fall bei x=2,5. Verhält sich ein Modell vernünftig sowohl in Bezug auf Interpolation wie auch auf Extrapolation, so sprechen wir davon, dass das Modell gut verallgemeinern kann.

Ein neuronales Netz wird im Allgemeinen wie ein Black-Box-Modell eingesetzt. Das heißt, man versteht es nicht als eine Funktion zum Verständnis für menschliche Ingenieure, sondern eher als ein Berechnungswerkzeug, mit dessen Hilfe man sich viele Experimente ersparen oder auf die Bestimmung von Werten durch direkte Beobachtung verzichten kann. Es ist diese Anwendung, welche die beiden oben genannten Aspekte erfordert: Wir benötigen eine Funktion zur Berechnung, und diese ist nur dann nützlich, wenn sie vernünftige Ausgangswerte für die unabhängigen Variablen produziert, die nicht gemessen werden sollen. Es wird das Ergebnis eines virtuellen Experimentes berechnet, das in Wirklichkeit nicht praktisch durchgeführt wird, bei dem wir aber sicher sein können, dass das berechnete Ergebnis mit dem übereinstimmt, was wir beobachten würden, hätten wir das Experiment tatsächlich durchgeführt.

Zurück Inhalt PDF Export Weiter