Wie funktioniert Künstliche Intelligenz einfach erklärt? Was sind die Unterschiede zum menschlichen Gehirn?

Der grundlegende Aufbau einer KI ist an das menschliche (bzw. tierische) Gehirn angelehnt bzw. die Bilderkennung an den Aufbau unseres Sehnervs. Auch im Bereich von Sprach-, Musik- und simulierter Geruchserkennung funktionieren die KIs am besten, welche in ihrem Aufbau den auditorischen und olfaktorischen Systemen des Gehirns ähneln. Sie bestehen aus neuronalen Netzen mit künstlichen Neuronen, die vereinfachte digitale Modelle der biologischen Vorbilder (unser Gehirn besteht aus 100 Milliarden Neuronen, die über mehr als 100 Billionen Synapsen vernetzt sind) darstellen.

Im Gehirn spiegelt die Stärke der Verbindung zwischen Neuronen gelernte Assoziationen wider. Auch künstliche neuronale Netzen trainieren und lernen über die Stärke der Verbindungen der künstlichen Neuronen. Allerdings deutlich vereinfacht, denn menschliche Nervenzellen können Informationen deutlich komplexer und tiefer verarbeiten als ihre digitalen Versionen.

Bei beiden System durchläuft die Informationsverarbeitung mehrere Schichten. Bei der Bildbearbeitung zum Beispiel starten die erste Schicht bzw. das menschliche Auge mit der Erkennung grundsätzlicher Merkmale eines Bilds wie Kanten, Konturen, Farben und Formen. Jede weitere Schicht arbeitet mit verfeinerten und immer komplexeren Merkmalen in Form von Filtern bis am Ende (im Gehirn im inferotemporalen Kortex) ein detailliertes, vollständiges Bild erstellt wird. Im Rahmen eines Trainings einer KI startet der Computer mit zufälligen Anfangswerten für die Stärke der Verbindungen sowie der Filter und passt diese so lange an, bis das gewünschte Ergebnis erreicht wird.

Dafür nutzt die KI zusätzlich eine Fehlerrückführung in Form von Feedbackschleifen. Das heißt, dass sie immer wieder das erreichte Ergebnis mit dem eigentlich Ziel abgleicht und entsprechende Abweichung zurück von der Ausgabe- an die Eingabeschicht meldet. Je nach Differenz ändern sich die Verbindungsstärken zwischen den künstlichen Neuronen.

Interessanterweise kennt das menschliche Gehirn keine solche Feedbackschleifen. Unsere Neuronen sind nicht in der Lage, Informationen in die rückwärtige Richtung zu transportieren. Zudem können biologische Zellen nur auf Signale ihrer direkten Kontakte zugreifen, während sich die Fehlerrückführung einer KI über das ganze System erstrecken kann.
Das Gehirn hingegen arbeitet vermutlich mit dem sogenannten „Predictive Coding“. Das bedeutet, dass das Gehirn ständig Vorhersagen trifft. Dabei sagt jede Schicht die Ausgabe der vorgelagerten Schicht voraus, was aber langsam etwas zu weit an dieser Stelle führt 🙂

Noch einen Schritt weiter gehen die vor kurzem auf den Markt gekommenen KIs wie z.B. Chat GPT-3 (von der Firma OpenAI in Partnerschaft mit Microsoft und Elon Musk). Dieses System lernt anhand von gestellten Aufgaben (Few-Shot-Learning) und nicht anhand von unglaublichen Datenmengen (Machine-Learning). Wie oben bereits erwähnt benötigt der Mensch häufig nur einen kurzen Satz oder ein Beispiel, um zu verstehen worum es geht (One-Shot-Learning). Und das ist das Neue und Faszinierende an GPT-3, es wird nicht mehr anhand von Daten, sondern mit Beispiellösungen auf eine bestimmte Aufgabe hin trainiert. Das System sucht dann jeweils Teile seines Wissens heraus, um eine Aufgabe zu lösen und ist damit deutlich „intelligenter“ als die bisherigen KIs, welche nicht über ein Auswendiglernen hinaus kommen.

Das Ergebnis klingt dann in der Tat so, als würde Chat-GPT uns tatsächlich verstehen. Das tut es jedoch nicht, es berechnet immer nur das wahrscheinlichste nächste Wort und setzt so seine Antworten Wort für Wort zusammen. Diese Texte sind dann allerdings komplett neu generiert. Daher spricht man dabei auch von „generativer KI“.
Dies hat z.B. den Vorteil für alle Schüler und Studenten ;-), dass die Ergebnisse keine aus Webseiten kopierte Textfragmente sind bei denen man durch die Suche nach genau diesen Textfragmenten die originale Quelle finden könnte. Es ist also sehr schwer zu identifizieren, ob der Text tatsächlich von dem Schüler oder ein KI formuliert wurde.

Ähnlich funktionieren auch die KI-Bildgeneratoren Midjourney & Co. Sie bauen keine Bilder aus kopierten Bildbestandteilen zusammen, sondern generieren völlig neue Bilder.

Das führt u.a. auch zu einer sehr komplexen Frage zu dem Thema Copyright.