Starten Sie Ihre KI-Reise mit Deutschlands modernster KI-Beratung

Experience-driven Lifelong Learning (ELL) 2025: Wie selbst-evolvierende Agenten durch Erfahrung lernen 🚀

Von Oliver Welling
KINEWS24.de - Experience-driven Lifelong Learning

Experience-driven Lifelong Learning: Die Entwicklung Künstlicher Intelligenz schreitet rasant voran, doch die meisten heutigen Systeme haben eine grundlegende Schwäche: Sie sind für statische, isolierte Aufgaben optimiert. Sie meistern Brettspiele, erkennen Bilder oder übersetzen Sprachen, aber ihr Lernprozess endet mit dem Training. Die reale Welt ist jedoch dynamisch, unvorhersehbar und erfordert ständige Anpassung. Genau hier setzt ein bahnbrechendes neues Konzept an: Experience-driven Lifelong Learning (ELL), ein Framework für die Entwicklung von selbst-evolvierenden Agenten, die kontinuierlich aus realen Interaktionen lernen und wachsen.

Dieser Ansatz, vorgestellt in einer Forschungsarbeit von Wissenschaftlern der East China Normal University und des Shanghai AI Laboratory, markiert einen Paradigmenwechsel. Statt KI-Systeme mit festen Datensätzen zu füttern, sollen sie sich wie Menschen durch eigene, selbstmotivierte Erfahrungen weiterentwickeln. Das Ziel ist nicht mehr nur die Lösung einer vordefinierten Aufgabe, sondern die Schaffung offener, anpassungsfähiger Intelligenzen, die langfristige Erinnerungen aufbauen, Fähigkeiten auf neue Herausforderungen übertragen und strategisch planen können. Um diese Fähigkeiten zu messen, wurde zudem der

StuLife Benchmark entwickelt – eine komplexe Simulation, die KI-Agenten vor die Herausforderungen eines gesamten Hochschulstudiums stellt. 2025 ist das Jahr der KI-Agenten – und quasi ALLE Anbieter sind bemüht heute schon die Claims abzustecken. Jüngstes Beispiel: Z.ai aus China bietet hier spannende – und vor allem kostenfreie – Use-Cases.

Das musst Du wissen – Experience-driven Lifelong Learning in Kürze

  • Neuer Lernansatz: Beim Experience-driven Lifelong Learning (ELL) geht es darum, dass KI-Agenten nicht mehr nur auf Basis statischer Datensätze trainiert werden, sondern durch kontinuierliche, selbstmotivierte Interaktion mit einer dynamischen Umgebung lernen und wachsen.
  • Vier Kernprinzipien: Das Framework basiert auf vier Säulen: Experience Exploration (aktives Erkunden), Long-term Memory (dauerhaftes Wissensgedächtnis), Skill Learning (Fähigkeiten aus Mustern abstrahieren) und Knowledge Internalization (Wissen wird zur zweiten Natur).
  • Der ultimative Test: Der StuLife Benchmark simuliert ein komplettes Studentenleben – von der Kurswahl über Prüfungen bis hin zu sozialen Aktivitäten –, um die Fähigkeiten von selbst-evolvierenden Agenten in einer komplexen, vernetzten Welt umfassend zu bewerten.
  • Aktuelle Grenzen überwinden: Heutige große Sprachmodelle (LLMs) sind von Natur aus zustandslos und haben kein Langzeitgedächtnis, was ihre Fähigkeit zu proaktivem, langfristigem Handeln stark einschränkt. ELL und StuLife decken diese Schwächen gezielt auf.

Vom statischen Task zum dynamischen Lernen: Warum wir einen neuen KI-Ansatz brauchen

Heutige Machine-Learning-Systeme sind beeindruckend. Sie erzielen übermenschliche Leistungen in klar definierten Bereichen. Doch sie operieren unter starken Annahmen: Die Trainingsdaten sind statisch, das Ziel ist fest vorgegeben und die Umgebung, in der sie agieren, bleibt unverändert. Die Realität sieht anders aus. Das Leben ist keine Serie voneinander unabhängiger Aufgaben mit klaren Anweisungen. Es erfordert ständige Anpassung, das Lernen aus vergangenen Erlebnissen und die Fähigkeit, mit einer unsicheren Zukunft umzugehen.

Experience-driven Lifelong Learning (ELL) 2025

Bisherige Ansätze des kontinuierlichen Lernens (Continual Learning) haben sich zwar bemüht, das sogenannte „katastrophale Vergessen“ zu mildern – also das Überschreiben von altem Wissen, wenn Neues gelernt wird. Doch auch sie operieren oft unter laborähnlichen Bedingungen mit vordefinierten Task-Grenzen und statischen Datenströmen. Sie konzentrieren sich mehr auf den Erhalt von Wissen als auf dessen proaktive Aneignung. Dies limitiert die Entwicklung wirklich autonomer, sich selbst verbessernder Agenten, die in der echten Welt bestehen können. Der entscheidende Schritt, den Alan Turing schon forderte – „Was wir wollen, ist eine Maschine, die aus Erfahrung lernen kann“ – stand bislang aus.

Das ELL-Framework: Die vier Säulen des erfahrungsbasierten Lernens

Das Experience-driven Lifelong Learning (ELL) Framework wurde entwickelt, um diese Lücke zu schließen. Es ist ein kontinuierlicher Lernzyklus, in dem ein Agent durch direkte Interaktion mit seiner Umgebung evolviert. Dieser Prozess stützt sich auf vier fundamentale Prinzipien:

Experience Exploration: Die Welt proaktiv entdecken

Der Agent lernt nicht passiv, sondern durch andauernde, selbstmotivierte Interaktion. Er muss komplexe, langfristige Aufgaben, die sich über Stunden erstrecken können, eigenständig in Teilschritte zerlegen und ausführen. Durch dieses anhaltende Engagement generiert er reichhaltige Erfahrungsdaten – eine Art persönliches Tagebuch seiner Handlungen und deren Konsequenzen. Dieses Vorgehen ermöglicht es ihm, Strategien schrittweise zu verfeinern und sein Verhalten an dynamisches Feedback anzupassen, ähnlich dem menschlichen Lernprozess durch Versuch und Irrtum.

Experience-driven Lifelong Learning (ELL) 2025

Long-term Memory: Ein Gedächtnis für die Ewigkeit

Die gesammelten Erfahrungen werden nicht einfach nur abgelegt. Sie werden systematisch verarbeitet und in einem persistenten, strukturierten Gedächtnis konsolidiert. Dieses Gedächtnis ist keine passive Datenbank, sondern eine aktive Ressource. Es speichert rohe Beobachtungen, wichtige Ereignisse, erlernte Fakten und sogar selbstreflektierte Einsichten. So kann der Agent über lange Zeiträume auf früheres Wissen zugreifen, kontextbezogen schlussfolgern und fundierte Entscheidungen für die Zukunft treffen. Das Gedächtnis wird unterteilt in verschiedene Wissensarten:

  • Trajectory Memory: Rohe oder zusammengefasste Interaktionsverläufe.
  • Declarative Knowledge: Faktenwissen (das „Was“), wie z. B. Konzepte oder Überzeugungen.
  • Structural Knowledge: Wissen über Beziehungen zwischen Objekten und Konzepten, oft als Wissensgraph dargestellt.

Skill Learning: Von Mustern zu wiederverwendbaren Fähigkeiten

Ein entscheidender Schritt ist die Abstraktion. Der Agent analysiert seine Erfahrungen und extrahiert wiederkehrende Muster, die er zu wiederverwendbaren Fähigkeiten (Skills) verdichtet. Solche Skills können Entscheidungsregeln, Lösungsheuristiken oder funktionale Module sein. Diese Fähigkeiten werden nicht nur einmal gelernt, sondern durch Anwendung in neuen Aufgaben aktiv validiert und verfeinert. Der Agent verwaltet sein Skill-Repertoire dynamisch: Er fügt neue hinzu, verbessert bestehende, kombiniert sie oder verwirft veraltete – ein sich selbst optimierendes System entsteht. Auch hier gibt es verschiedene Formen:

  • Procedural Knowledge: Handlungswissen (das „Wie“), also Strategien zur Erledigung von Aufgaben.
  • Meta-Knowledge: Wissen über das eigene Wissen, was dem Agenten hilft, seinen Lernprozess zu steuern.
  • Heuristic Knowledge: Faustregeln und erfahrungsbasierte Abkürzungen für komplexe Entscheidungen.

Knowledge Internalization: Wenn Wissen zur zweiten Natur wird

Der letzte Schritt geht über das reine Speichern und Abrufen hinaus. Explizites und diskretes Wissen wird in implizites und intuitives Verständnis umgewandelt. Häufig genutzte Regeln und Muster werden so tief in den Kernprozess des Agenten destilliert, dass er nicht mehr bewusst darüber nachdenken oder Schritt-für-Schritt-Anleitungen abrufen muss. Dieser Übergang von bewusster Anwendung zu automatischer Ausführung spiegelt den kognitiven Wandel vom Anfänger zum Experten wider, bei dem erlerntes Verhalten zur „zweiten Natur“ wird.

StuLife: Das ultimative Testgelände für selbst-evolvierende Agenten

Ein theoretisches Framework ist nur so gut wie seine praktische Überprüfbarkeit. Deshalb wurde StuLife entwickelt – ein umfassender Benchmark, der die gesamte College-Erfahrung eines Studenten simuliert, von der Einschreibung bis zum persönlichen Wachstum. StuLife ist nicht nur eine weitere Sammlung von Aufgaben, sondern eine dynamische, vernetzte Welt, die speziell darauf ausgelegt ist, die Kernkompetenzen des lebenslangen Lernens zu bewerten.

Experience-driven Lifelong Learning (ELL) 2025

Die drei Paradigmenwechsel: Von passiv zu proaktiv

StuLife wurde um drei zentrale Veränderungen im Denken über KI-Evaluation herum konzipiert:

  1. From Imitation to Learning (Von der Nachahmung zum Lernen): Agenten sollen nicht einfach nur vergangene Aktionen nachahmen. Sie müssen aus ihren Interaktionen verallgemeinerbare Fähigkeiten ableiten, wie z.B. die Navigation auf dem Campus, die Terminplanung oder die Kursregistrierung.
  2. From Context to Memory (Vom Kontext zum Gedächtnis): Die Aufgaben in StuLife sind zeitlich und logisch eng miteinander verknüpft. Eine frühe Entscheidung, wie die Wahl eines bestimmten Kurses, hat direkte Auswirkungen auf spätere Möglichkeiten. Schlüsselvariablen wie verfügbare Ressourcen oder die Beziehung zu einem Berater entwickeln sich basierend auf den Aktionen des Agenten. Dies erfordert ein robustes Langzeitgedächtnis, um flüchtigen Kontext in dauerhaftes, nutzbares Wissen zu verwandeln.
  3. From Passive to Proactive (Von passiv zu proaktiv): Von den Agenten wird erwartet, dass sie über reaktives Verhalten hinauswachsen. Sie müssen ein Zeitgefühl entwickeln, proaktiv Termine verwalten, persönliche Ziele setzen und sich an veränderte Bedingungen anpassen – kurz gesagt, Initiative zeigen.

Ein virtuelles Studentenleben: Die Szenarien in StuLife

Der Benchmark umfasst insgesamt 1.284 Aufgabeninstanzen, die in 10 miteinander verbundene Szenarien und drei Kernphasen unterteilt sind:

  • In-Class Tasks: Hier geht es um das strukturierte akademische Lernen. Die Agenten müssen Vorlesungen zu korrekten Zeiten an den richtigen Orten besuchen, akademische Richtlinien verinnerlichen und fachspezifische Fragen beantworten.
  • Daily Campus Tasks: Diese Phase erfasst die vielfältigen, selbstgesteuerten Aktivitäten des Studentenlebens. Dazu gehören die Erkundung des Campus, die komplexe Erstsemester-Kurswahl unter Nutzung begrenzter „Priority Cards“, die strategische Planung für zukünftige Semester, die Kontaktaufnahme mit akademischen Beratern und das Engagement in Studentenclubs.
  • Examination Tasks: Am Ende stehen Zwischen- und Abschlussprüfungen, die das über Wochen und Monate angesammelte Wissen testen. Sie bewerten die Fähigkeit des Agenten, Informationen über lange Zeiträume zu behalten, zu synthetisieren und unter Druck abzurufen.

Die harte Realität: Aktuelle LLMs im StuLife-Test

Die Forscher haben aktuelle, hochmoderne Sprachmodelle (LLMs) wie GPT-5 und Gemini 2.5 Pro auf den StuLife-Benchmark losgelassen. Die Ergebnisse sind ernüchternd: Unter den Standardeinstellungen war die Leistung aller Modelle außergewöhnlich schlecht. Der beste Agent erreichte einen „StuGPA“ (eine ganzheitliche Bewertung) von gerade einmal 17,76 von 100 Punkten.

Der Grund liegt in einer fundamentalen Architekturschwäche: Heutige LLMs sind zustandslos und besitzen kein natives Langzeitgedächtnis. Dies führt zu zwei kritischen Fehlern:

  1. Fehlende proaktive Initiative: Selbst wenn der Agent die Information erhält, dass es 8:00 Uhr ist und um 8:00 Uhr eine Vorlesung ansteht, ergreift er oft nicht die Initiative, dorthin zu gehen. Er denkt nicht einmal daran, in seinen Kalender zu schauen.
  2. Kein Langzeitgedächtnis: Die Modelle sind unfähig, sich an Informationen aus weit zurückliegenden Interaktionen zu erinnern und diese zu nutzen. Dies verhindert den Aufbau eines kohärenten, kumulativen Wissens über die Zeit.

Die Experimente zeigen zwar, dass größere Modelle tendenziell besser abschneiden, aber selbst die leistungsfähigsten LLMs scheitern an den grundlegenden Herausforderungen der proaktiven, langfristigen Handlungsfähigkeit, die StuLife aufzeigt.

Mehr als nur bessere Modelle: Die entscheidende Rolle des Kontext-Engineerings

Die Studie liefert jedoch auch einen entscheidenden Hoffnungsschimmer. Die Leistung der Agenten kann drastisch verbessert werden – und das nicht nur durch größere und bessere Modelle. Eine mindestens ebenso wichtige Rolle spielt das

Kontext-Engineering: die strategische Gestaltung des Prompts, der das Gedächtnis, die Aufgabenhistorie und die Handlungsanweisungen für den Agenten strukturiert.

Durch gut designte System-Prompts, die den Agenten zu proaktivem Verhalten, zur Gedächtnisnutzung und zur Anwendung von Skills anleiten, konnten die Erfolgsraten signifikant gesteigert werden. Dies deutet darauf hin, dass der Weg zu allgemeiner künstlicher Intelligenz (AGI) ebenso sehr davon abhängt,

wie wir das kognitive Framework eines Agenten strukturieren, wie von den rohen Fähigkeiten des zugrundeliegenden Modells. Die Optimierung der Art und Weise, wie wir Modelle anleiten, könnte ein Schlüsselfaktor für den Fortschritt sein.

KINEWS24.de - Experience-driven Lifelong Learning
KINEWS24.de – Experience-driven Lifelong Learning

Fazit Experience-driven Lifelong Learning: Eine neue Ära für lernende Maschinen

Das Experience-driven Lifelong Learning (ELL) Framework und der StuLife Benchmark stellen einen entscheidenden Schritt in der KI-Forschung dar. Sie verlagern den Fokus von der Lösung isolierter Aufgaben hin zur Entwicklung von selbst-evolvierenden Agenten, die nachhaltig und autonom aus ihren Erfahrungen lernen. Die ernüchternde Leistung aktueller LLMs im StuLife-Test zeigt unmissverständlich die noch bestehenden Hürden auf dem Weg zu wahrhaft intelligenter, proaktiver KI: das Fehlen eines robusten Langzeitgedächtnisses und die mangelnde Eigeninitiative.

Gleichzeitig zeigt die Forschung aber auch einen klaren Weg nach vorn. Der Schlüssel liegt nicht allein in der Skalierung der Modelle, sondern in der intelligenten Gestaltung ihrer kognitiven Architektur durch fortschrittliches Kontext-Engineering. Indem wir KI-Systemen beibringen, nicht nur aus Daten, sondern aus dem Leben selbst zu lernen, schaffen wir die Grundlage für eine Zukunft, in der Maschinen – ähnlich wie Menschen – mit jeder neuen Erfahrung weiser werden.

Quellen

#KI #AI #ArtificialIntelligence #KuenstlicheIntelligenz #LifelongLearning #SelfEvolvingAgents #StuLife #ContextEngineering, Experience-driven Lifelong Learning

Ähnliche Beiträge

Business

OpenAI + Anthropic Kooperation: Brisante KI-Sicherheitstests enthüllt

Die OpenAI Anthropic Kooperation liefert tiefe Einblicke in die KI-Sicherheit. Entdecke die überraschenden Unterschiede bei Halluzinationen und Jailbreaking-Tests der Top-Modelle.

AI-Agents Science

💡 Agentic AI 2025: Die Taxonomie zu LLM-Agenten & Reasoning Frameworks – endlich Ordnung für

Agentic AI & LLM-Agenten einfach erklärt. Dieser Guide enthüllt die neue Taxonomie für Reasoning Frameworks und zeigt, wie autonome KI.

Folge uns

Beliebte Artikel

About Author

Maßgeschneiderte KI-Lösungen für Ihr Unternehmen

TechNow ist Ihr strategischer Partner für den erfolgreichen Einsatz von Künstlicher Intelligenz.

Beraten lassen

HOT CATEGORIES

de_DEGerman