Der Lebenszyklus eines KI-Modells
Ein Large Language Model (LLM) durchläuft zwei Hauptphasen:- Die Trainingsphase
- Das Modell wird auf großen Datensätzen trainiert
- Die Nutzungsphase
- Das Modell kann verwendet werden, um eine Antwort zu generieren
- Das Modell kann nicht mehr lernen

Training eines LLM
Während des Trainings verarbeitet das Modell große Mengen an Textdaten mit einer Technik namens “Next Token Prediction”. Das Modell lernt statistische Beziehungen zwischen Wörtern und Konzepten, indem es wiederholt vorhersagt, welches Wort als nächstes in einer Sequenz kommen sollte.
Verwendung eines LLM
Während der Nutzungsphase (auch als Inferenz bekannt) generiert das Modell Antworten, indem es aus den Wahrscheinlichkeitsverteilungen sampelt, die es während des Trainings gelernt hat. Wenn du nachKünstlicher Intelligenz
fragst, weist das Modell verwandten Begriffen wie Machine Learning
eine viel höhere Wahrscheinlichkeit zu als unverwandten Begriffen wie Bananenkuchen
.

Hi
vom Nutzer das Modell wahrscheinlich mit einem Gruß antworten. Es antwortet mit Hallo
.
Dann generiert es das nächste wahrscheinlichste Wort basierend auf Hi
und Hallo
. Dieser Prozess wird wiederholt, bis das Modell entscheidet, dass die Anfrage ausreichend beantwortet wurde.
Beeinflussung der Ausgabe einer Antwort
Wie bereits erwähnt, können die Modelle nach der Bereitstellung und nach Abschluss des Trainings nicht mehr lernen. Wie erinnern sie sich an vorherige Nachrichten oder integrieren neue Informationen? Die Antwort liegt im Context Window.