Handbuch: 7.2. Maschinelles Lernen
Maschinelles Lernen ist – in seiner grundlegenden Definition – ein Weg, empirische Daten so effizient darzustellen, dass sie reproduziert, verallgemeinert, und wiedererkannt werden können oder dass darin ein Muster erkennbar wird. Das Ziel des maschinellen Lernens ist es also, Daten in Form von Gleichungen zusammenzufassen.
Ein sehr einfaches Beispiel für maschinelles Lernen wäre es, eine Reihe von Punkten auf einer geraden Linie darzustellen. Die Gerade ist ein Modell für Daten, die wir gemessen haben. Wir benutzen eine einfache Gleichung, um diese Gerade darzustellen: y, die senkrechten Achse, ist gleich m, die Neigung der Geraden, multipliziert mit x, der horizontalen Achse, plus der Konstanten b>, dem Schnittpunkt der Geraden mit der senkrechten Achse. Somit stellt y = mx + b eine Zusammenfassung der Daten dar und beinhaltet zwei Parameter, nämlich m und b. Weil die Messungen für beide, x und y ungenau sind, haben auch die Modell-Parameter m und b ihre Unsicherheiten. Das erlaubt es dem Modell, mit dem ungenauen Charakter der dem wirklichen Leben entnommenen Datensätze umzugehen.
Die Werte von m und b aus einem speziellen Satz empirischer Daten herauszufinden ist, wie gesagt, ein einfaches Beispiel für maschinelles Lernen. Tausende von Datenpunkten werden auf zwei Parameter einer Gleichung reduziert.
Die Methode, aus den Daten die Parameter eines Modells zu errechnen, nennen wir Algorithmus. Zusätzlich zum Algorithmus, der nötig ist, um aus den Daten die Parameter eines Modells zu berechnen, benötigt das maschinelle Lernen noch einen zweiten Algorithmus, um die Parameter zu aktualisieren, sobald neue Daten verfügbar gemacht werden. Das ist zwar – je nach Modell – nicht immer möglich, stellt aber einen großen Vorzug dar, weil das anfängliche Lernen in der Regel sehr zeitaufwändig ist.
Die Art und Weise, wie eine Maschine lernt, ist nicht dieselbe, wie Menschen lernen, darum ist es im Falle von neuronalen Netzen nützlich, sich einer Analogie zu bedienen.
Das Gehirn ist im Wesentlichen ein Netz von Neuronen, die durch Synapsen verbunden sind. Jedes Neuron und jede Synapse sind – für sich genommen – recht einfache Objekte, aber innerhalb eines Netzes können sie einige erstaunlich komplexe Aktionen durchführen. Nehmen Sie als Beispiel die Fähigkeit, dem Gesicht einer Person einen Namen zuzuordnen und dies mit Erinnerungen an diese Person zu verknüpfen. All das passiert unbewusst in Sekundenschnelle.
Weil der Mensch bei seiner Geburt nicht von vornherein alle Leute kennt, denen er im Laufe seines Lebens begegnen wird, wird das Gehirn darauf trainiert, Erfahrungen zu sammeln und daraus zu lernen, um dann dieses Wissen jederzeit schnell abrufen zu können.
So ähnlich funktioniert also auch ein künstliches neuronales Netz. Man fängt mit einem prototypischen neuronalen Netz an und setzt es dann gewissen Erfahrungen aus. Je mehr das Netz solchen Erfahrungen ausgesetzt wird, umso besser wird es in der Lage sein, diese Erfahrungen korrekt darzustellen und sie auch in Zukunft abzurufen.
Das Erlernen einer geraden Linie, wie wir es oben besprochen haben, ist nur ein einfaches Beispiel für maschinelles Lernen. Neuronale Netze sind jedoch in der Lage, auch extrem komplizierte Datensätze darzustellen.