AI-Agents

AI-Agents – 2025 Science Papers Daily

KINEWS24.de - AI-Agents - 2025 Science Papers, Daily

KINEWS24.de - AI-Agents - 2025 Science Papers, Daily

Willkommen zu unserem täglich aktualisierten Überblick über die neuesten wissenschaftlichen Veröffentlichungen zum Thema „AI-Agents“!

In diesem Artikel sammeln und präsentieren wir jeden Tag die spannendsten und relevantesten Papers rund um Multi-Agentensysteme, agentenbasierte KI-Ansätze und alle anderen Spielarten intelligenter Software-Agenten. Das Besondere: Die aktuellsten Funde setzen wir stets ganz nach oben, sodass du ohne Umwege siehst, welche Forschungsergebnisse gerade frisch publiziert wurden. Weiter unten findest du dann die Zusammenfassungen aus den Vortagen – ideal, um deinen Wissensstand chronologisch aufzufrischen oder nachzulesen, was sich in den letzten Tagen alles getan hat.

AI-Agents – 2025 Science Papers Daily: Warum lohnt es sich, hier täglich reinzuschauen?

  • Kompakte Zusammenfassungen: Statt Dutzende oder gar Hunderte arXiv-Uploads, Konferenzbeiträge oder Journals zu durchforsten, bekommst du hier eine konzentrierte Übersicht.
  • Zeitgewinn durch Kuratierung: Mit nur wenigen Absätzen pro neuem Paper erfährst du sofort, ob es für dein Forschungsvorhaben, dein Projekt oder dein persönliches Interesse relevant ist.
  • Trends und Innovationen erkennen: Agentenbasierte KI-Systeme sind einer der dynamischsten Bereiche der aktuellen Forschung, sei es bei generativen Agenten, kollaborativer Robotik, Multi-Agenten-Verhandlungen oder LLM-basierten Anwendungen. Hier entdeckst du früh, was sich abzeichnet.
  • Lückenlose Aktualität: Wir schauen täglich nach frischen Veröffentlichungen, damit du keine spannenden Themen verpasst.
  • Wachsendes Archiv: Dank dieser fortlaufenden Dokumentation entsteht im Laufe der Zeit ein umfangreicher Fundus, in dem du stöbern kannst – perfekt für einen späteren Deep Dive oder um ältere, aber immer noch interessante Arbeiten nachzuschlagen.

Wir möchten dir mit diesem Service eine Anlaufstelle bieten, an der du dich verlässlich über neueste Forschungsimpulse informieren kannst – ohne von der Flut der Paper regelrecht überrollt zu werden. Ob du bereits in dem Gebiet forscht, dich mit Kolleg*innen austauschen willst oder einfach nur ein Auge auf die technologischen Trends werfen möchtest: Unsere Zusammenfassungen sollen dir helfen, auf dem Laufenden zu bleiben und dich inspirieren, in tiefergehende Lektüre einzusteigen.

Viel Freude beim Durchstöbern!

Die Liste unten wird täglich erweitert – bleib also am Ball, wenn du nichts verpassen willst. Neue Einträge findest du stets ganz oben. So kannst du jederzeit schnell erkennen, was die Community heute oder gestern diskutiert hat und gleichzeitig tiefer nach unten scrollen, um das große Ganze zu sehen.

Liste der arXiv-Veröffentlichungen zu KI-Agenten (06.Januar 2025)

  1. SDPO: Segment-Level Direct Preference Optimization for Social Agents
    Link:https://arxiv.org/abs/2501.01821
    • Dieses Paper stellt eine neue Methode vor, die Präferenzoptimierung segmentweise angeht, um das Verhalten sozialer KI-Agenten anzupassen.
    • Dabei berücksichtigt sie die individuellen Präferenzen in verschiedenen Handlungskontexten.
    • Ziel ist, Agenten zu entwickeln, die flexibler und anpassungsfähiger auf Interaktionen reagieren.
  2. Proposing Hierarchical Goal-Conditioned Policy Planning in Multi-Goal Reinforcement Learning
    Link:https://arxiv.org/abs/2501.01727
    • Dieses Paper führt ein hierarchisches Verfahren ein, das Agenten unterstützt, mehrere Ziele im Reinforcement Learning parallel anzugehen.
    • Es kombiniert eine Planungs- mit einer Lernkomponente, um hochkomplexe Aufgaben zu meistern.
    • Damit sollen KI-Agenten effizienter und koordinierter auf unterschiedliche Ziele hin trainiert werden.
  3. AgentRefine: Enhancing Agent Generalization through Refinement Tuning
    Link:https://arxiv.org/abs/2501.01702
    • Diese Arbeit beschreibt ein Verfahren namens “Refinement Tuning”, das die Generalisierungsfähigkeit von KI-Agenten verbessern soll.
    • Der Ansatz baut auf bereits trainierten Agenten auf und verfeinert deren Strategien in neuen Umgebungen.
    • Dadurch können Agenten robuster und anpassungsfähiger auf variierende Aufgabenstellungen reagieren.
  4. BLAST: A Stealthy Backdoor Leverage Attack against Cooperative Multi-Agent Deep Reinforcement Learning based Systems
    Link:https://arxiv.org/abs/2501.01593
    • Dieses Paper analysiert eine Backdoor-Angriffsstrategie in kooperativen Multi-Agenten-Systemen für Deep Reinforcement Learning.
    • Es zeigt auf, wie bösartige Modifikationen unbemerkt eingestreut werden können, um das Gesamtsystem zu manipulieren.
    • Die Studie verdeutlicht damit Schwachstellen und liefert zugleich Hinweise zum Schutz vor solchen Angriffen.
  5. QuArch: A Question-Answering Dataset for AI Agents in Computer Architecture
    Link:https://arxiv.org/abs/2501.01892
    • Dieses Werk stellt ein neues Datenset namens “QuArch” vor, das KI-Agenten beim Verständnis von Computerarchitektur unterstützen soll.
    • Es beinhaltet Fragen und Antworten zu technischen Details und Konzepten aus der Hardware-Architektur.
    • Ziel ist es, KI-Agenten zu befähigen, komplexe Sachverhalte in der Computerarchitektur korrekt zu interpretieren und zu beantworten.
  6. Multi-Agent Conversational Online Learning for Adaptive LLM Response Identification
    Link:https://arxiv.org/abs/2501.01849
    • In dieser Arbeit wird ein Mehr-Agenten-Ansatz vorgestellt, der laufend von Nutzerinteraktionen lernt, um bessere Antworten großer Sprachmodelle zu identifizieren.
    • Dabei kommunizieren die Agenten untereinander, um Kontexte und Nutzerrückmeldungen gemeinsam auszuwerten.
    • So sollen KI-Systeme anpassungsfähiger und nutzerzentrierter reagieren können.
  7. MoColl: Agent-Based Specific and General Model Collaboration for Image Captioning
    Link:https://arxiv.org/abs/2501.01834
    • Dieses Paper schlägt einen agentenbasierten Ansatz vor, bei dem verschiedene Modelle für das Bildunterschreiben (Image Captioning) zusammenarbeiten.
    • Ein spezieller Agent kümmert sich um fein abgestimmte, kontextbezogene Beschreibungen, während ein allgemeiner Agent universell einsetzbare Bildunterschriften generiert.
    • Durch ihre Zusammenarbeit wird eine höhere Qualität und Vielfalt der generierten Bildbeschreibungen erzielt.
  8. Goal Recognition using Actor-Critic Optimization
    Link:https://arxiv.org/abs/2501.01463
    • Das Paper behandelt ein Verfahren, um mithilfe von Actor-Critic-Methoden die Ziele eines beobachteten Agenten schnell zu erkennen.
    • Dabei werden unvollständige oder teilweise Beobachtungen ausgewertet, um Rückschlüsse auf das wahrscheinliche Ziel des Agenten zu ziehen.
    • Dieses Vorgehen erleichtert unter anderem die Anpassung kooperativer oder kompetitiver Strategien gegenüber anderen KI-Agenten.

Liste der arXiv-Veröffentlichungen zu KI-Agenten (03. Januar 2025):

  1. Titel:Aviary: training language agents on challenging scientific tasks
    • Link: https://arxiv.org/abs/2412.21154
    • Beschreibung:
      • Dieses Paper präsentiert Aviary, eine Plattform, die speziell darauf ausgerichtet ist, Sprachagenten in anspruchsvollen wissenschaftlichen Bereichen zu trainieren.
      • Aviary nutzt eine Kombination aus neuen Trainingsmethoden und einer speziell kuratierten Aufgabenvielfalt, um die Fähigkeiten der Agenten zu verbessern.
      • Die Experimente zeigen, dass mit Aviary trainierte Sprachagenten eine signifikant bessere Leistung in komplexen wissenschaftlichen Aufgaben erzielen als andere Ansätze.
  2. Titel:UnrealZoo: Enriching Photo-realistic Virtual Worlds for Embodied AI
    • Link: https://arxiv.org/abs/2412.20977
    • Beschreibung:
      • UnrealZoo ist eine neue Plattform, die es ermöglicht, hochrealistische virtuelle Umgebungen für das Training von Embodied AI-Agenten zu erstellen.
      • Die Plattform bietet eine Vielfalt an Umgebungen, die von einfachen Szenarien bis hin zu komplexen, lebensnahen Settings reichen.
      • Durch die Nutzung fotorealistischer Umgebungen sollen die Agenten besser auf reale Aufgaben vorbereitet werden.
  3. Titel:Planning, Living and Judging: A Multi-agent LLM-based Framework for Cyclical Urban Planning
    • Link: https://arxiv.org/abs/2412.20505
    • Beschreibung:
      • Dieses Paper stellt ein Multi-Agenten-Framework vor, das auf Large Language Models (LLMs) basiert und für die zyklische Stadtplanung konzipiert wurde.
      • Das Framework integriert Planungs-, Lebens- und Bewertungsaspekte, um einen iterativen Planungsprozess zu ermöglichen.
      • Die Ergebnisse deuten darauf hin, dass LLMs in einem Multiagenten-System effektiv zur Lösung von Herausforderungen in der Stadtplanung genutzt werden können.
  4. Titel:High-fidelity social learning via shared episodic memories enhances collaborative foraging through mnemonic convergence
    • Link: https://arxiv.org/abs/2412.20271
    • Beschreibung:
      • Diese Studie untersucht, wie sich das Teilen episodischer Erinnerungen auf das soziale Lernen und die kollaborative Futtersuche von KI-Agenten auswirkt.
      • Durch den Austausch von Gedächtnisinhalten können Agenten ihre Zusammenarbeit verbessern und effizienter zusammenarbeiten.
      • Die Forschungsergebnisse legen nahe, dass eine gemeinsame Erinnerungsbasis die mnemotechnische Konvergenz fördert und somit das kollaborative Lernen optimiert.
  5. Titel:BaiJia: A Large Scale Role-Playing Agent Corpus of Chinese Historical Charcaters
    • Link: https://arxiv.org/abs/2412.20024
    • Beschreibung:
      • BaiJia ist ein umfangreiches Korpus, das für das Training und die Evaluation von Rollenspiel-KI-Agenten mit chinesischen historischen Figuren entwickelt wurde.
      • Das Korpus umfasst detaillierte Beschreibungen und Dialoge, die es den Agenten ermöglichen, glaubwürdige historische Persönlichkeiten darzustellen.
      • Diese Ressource soll die Forschung im Bereich der personalisierten und kulturell sensiblen KI-Interaktion fördern.
  6. Titel:Exploring and Controlling Diversity in LLM-Agent Conversation
    • Link: https://arxiv.org/abs/2412.21102
    • Beschreibung:
      • Diese Arbeit untersucht Methoden zur Messung und Steuerung der inhaltlichen Vielfalt in Gesprächen, die von LLM-basierten Agenten geführt werden.
      • Es werden verschiedene Ansätze vorgestellt, um die Diversität von Konversationen zu erhöhen oder zu reduzieren, je nach Anwendungsfall.
      • Die Ergebnisse deuten darauf hin, dass eine gezielte Steuerung der Diversität die Qualität und Relevanz von Agenten-Konversationen verbessern kann.
  7. Titel:Plancraft: an evaluation dataset for planning with LLM agents
    • Link: https://arxiv.org/abs/2412.21033
    • Beschreibung:
      • Plancraft ist ein neuer Datensatz, der speziell für die Bewertung der Planungsfähigkeiten von LLM-basierten Agenten entwickelt wurde.
      • Der Datensatz enthält eine Reihe komplexer Aufgaben, die von den Agenten erfordern, detaillierte Handlungsabläufe zu entwerfen.
      • Plancraft soll als Standard-Benchmark für die Forschung im Bereich des Planens mit LLMs dienen.
  8. Titel:Game Theory and Multi-Agent Reinforcement Learning: From Nash Equilibria to Evolutionary Dynamics
    • Link: https://arxiv.org/abs/2412.20519
    • Beschreibung:
      • Dieses Paper bietet einen Überblick über die Grundlagen der Spieltheorie und deren Anwendung auf Multi-Agenten Reinforcement Learning.
      • Es werden verschiedene Methoden und Algorithmen vorgestellt, die von Nash-Gleichgewichten bis zur evolutionären Dynamik reichen.
      • Die Arbeit bietet sowohl theoretische als auch praktische Einblicke in die Gestaltung kooperativer und kompetitiver Multi-Agenten-Systeme.
  9. Titel:Multi-Scenario Reasoning: Unlocking Cognitive Autonomy in Humanoid Robots for Multimodal Understanding
    • Link: https://arxiv.org/abs/2412.20429
    • Beschreibung:
      • Dieses Paper untersucht, wie humanoide Roboter durch Multi-Modal-Reasoning eine höhere kognitive Autonomie erreichen können.
      • Der Fokus liegt auf der Fähigkeit der Roboter, über verschiedene Szenarien hinweg zu schlussfolgern und zu verstehen.
      • Es wird ein Ansatz vorgestellt, der es Robotern ermöglicht, multimodale Eingaben zu integrieren und flexible Entscheidungen zu treffen.
  10. Titel:Safe Multiagent Coordination via Entropic Exploration
    • Link: https://arxiv.org/abs/2412.20361
    • Beschreibung:
      • Dieses Paper präsentiert einen Ansatz, um die sichere Koordination von Multi-Agenten-Systemen durch die Nutzung von Entropie-basierter Exploration zu verbessern.
      • Es wird gezeigt, dass die kontrollierte Zufallsexploration das Risiko unkoordinierter Aktionen minimieren und gleichzeitig die Zusammenarbeit fördern kann.
      • Die Arbeit bietet eine vielversprechende Methode, um sichere und effiziente Multi-Agenten-Systeme zu entwickeln.
  11. Titel:TradingAgents: Multi-Agents LLM Financial Trading Framework
    • Link: https://arxiv.org/abs/2412.20138
    • Beschreibung:
      • Dieses Paper stellt TradingAgents vor, ein Framework, das LLMs nutzt, um Multi-Agenten-Systeme für den Finanzhandel zu entwickeln.
      • Das Framework ermöglicht es, verschiedene Handelsstrategien zu testen und ihre Leistung in simulierten Marktszenarien zu bewerten.
      • Durch die Verwendung mehrerer Agenten kann eine robustere und vielseitigere Handelsstrategie erreicht werden.
  12. Titel:M-MAD: Multidimensional Multi-Agent Debate Framework for Fine-grained Machine Translation Evaluation
    • Link: https://arxiv.org/abs/2412.20127
    • Beschreibung:
      • M-MAD ist ein Multi-Agenten-Framework, das auf Debatten basiert und zur präzisen Evaluierung maschineller Übersetzungen entwickelt wurde.
      • Es verwendet mehrere Agenten, die verschiedene Aspekte einer Übersetzung diskutieren und bewerten, um eine umfassendere Analyse zu ermöglichen.
      • Dieser Ansatz ermöglicht eine differenziertere Bewertung als herkömmliche Metriken.
  13. Titel:OneKE: A Dockerized Schema-Guided LLM Agent-based Knowledge Extraction System
    • Link: https://arxiv.org/abs/2412.20005
    • Beschreibung:
      • OneKE ist ein dockerisiertes System, das schemageführte LLM-Agenten verwendet, um Wissen aus Dokumenten zu extrahieren.
      • Das System ist flexibel und ermöglicht eine einfache Integration in verschiedene Arbeitsabläufe durch den Einsatz von Docker-Containern.
      • OneKE ist ein Beispiel dafür, wie LLM-basierte Agenten für automatisierte Wissensextraktion genutzt werden können.
  14. Titel:Can Large Language Models Adapt to Other Agents In-Context?
    • Link: https://arxiv.org/abs/2412.19726
    • Beschreibung:
      • Diese Forschung untersucht, ob Large Language Models (LLMs) ihre Verhaltensweisen während einer Interaktion mit anderen Agenten anpassen können.
      • Es wird analysiert, wie LLMs in-context lernen und ihre Strategien auf Grundlage der Interaktionspartner optimieren.
      • Die Ergebnisse geben Aufschluss über die Flexibilität und Anpassungsfähigkeit von LLMs in Multi-Agenten-Umgebungen.
  15. Titel:OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis
    • Link: https://arxiv.org/abs/2412.19723
    • Beschreibung:
      • OS-Genesis ist ein System, welches automatisch Trajektorien für GUI-Agenten mittels Reverse Task Synthesis erstellen kann.
      • Der Ansatz kehrt den Prozess der Task-Ausführung um, indem es von einem gewünschten Ergebnis ausgehend eine Reihe von Schritten ableitet.
      • Dieses System zielt darauf ab, die Erstellung und Analyse von GUI-Agenten zu vereinfachen.
  16. Titel:Hindsight Planner: A Closed-Loop Few-Shot Planner for Embodied Instruction Following
    • Link: https://arxiv.org/abs/2412.19562
    • Beschreibung:
      • Dieser Artikel stellt einen Planner vor, der nur wenige Beispiele benötigt und aus Erfahrung lernt, um Anweisungen in einer Umgebung zu befolgen.
      • Der Planner nutzt ein Hindsight-Konzept, um aus Fehlern zu lernen und den Planungsprozess anzupassen.
      • Das System zeigt, wie Agenten in dynamischen Umgebungen mit wenigen Beispielen komplexe Aufgaben erfolgreich bewältigen können.
  17. Titel:Hierarchical Multi-agent Meta-Reinforcement Learning for Cross-channel Bidding
    • Link: https://arxiv.org/abs/2412.19064
    • Beschreibung:
      • Hier wird ein hierarchischer Multi-Agenten-Ansatz vorgestellt, der Meta-Reinforcement Learning (Meta-RL) verwendet, um Bietstrategien über verschiedene Kanäle zu optimieren.
      • Die Hierarchie ermöglicht es, dass Agenten auf verschiedenen Ebenen agieren und somit komplexere Entscheidungen treffen können.
      • Die Experimente zeigen, dass dieser Ansatz die Effizienz und Rentabilität von Bietprozessen verbessern kann.
  18. Titel:TravelAgent: Generative Agents in the Built Environment
    • Link: https://arxiv.org/abs/2412.18985
    • Beschreibung:
      • TravelAgent ist ein System, das generative KI-Agenten nutzt, um das Verhalten von Menschen in einer bebauten Umgebung zu simulieren.
      • Die Agenten sind in der Lage, selbstständig Entscheidungen zu treffen und Interaktionen mit der Umgebung zu simulieren, die auf realen Mustern basieren.
      • Dies ermöglicht ein besseres Verständnis von räumlichen Interaktionen und kann in der Stadtplanung verwendet werden.
  19. Titel:GAI: Generative Agents for Innovation
    • Link: https://arxiv.org/abs/2412.18899
    • Beschreibung:
      • Dieses Paper untersucht die Rolle von generativen Agenten bei der Förderung von Innovationen.
      • Es wird ein Framework vorgestellt, das verschiedene Agenten mit unterschiedlichen Rollen für die generative Ideenfindung und Problemlösung kombiniert.
      • Die Forschung zeigt das Potenzial generativer Agenten, die Entwicklung von neuen Lösungen in verschiedenen Bereichen zu beschleunigen.
  20. Titel:Agents on the Bench: Large Language Model Based Multi Agent Framework for Trustworthy Digital Justice
    • Link: https://arxiv.org/abs/2412.18697
    • Beschreibung:
      • Nutzt ein Multi-Agenten-System mit LLMs, um bestimmte Aspekte der digitalen Justiz transparent und vertrauenswürdig abzubilden.
      • Die Arbeit zielt darauf ab, die Transparenz und das Vertrauen in die digitale Justiz zu stärken.
      • Die Arbeit adressiert wichtige ethische und praktische Aspekte im Kontext von KI und Rechtsprechung.
  21. Titel:Multi-Agent Norm Perception and Induction in Distributed Healthcare
    • Link: https://arxiv.org/abs/2412.18454
    • Beschreibung:
      • Diese Arbeit untersucht die Normwahrnehmung und -induktion durch Multi-Agenten-Systeme im verteilten Gesundheitswesen.
      • Es wird analysiert, wie Agenten gemeinsame Verhaltensregeln erlernen und befolgen können, um eine effektive Zusammenarbeit zu gewährleisten.
      • Diese Forschung bietet Einblicke in die Schaffung sicherer und effizienter Multi-Agenten-Systeme in komplexen Umgebungen.
  22. Titel:Explainable Multi-Modal Data Exploration in Natural Language via LLM Agent
    • Link: https://arxiv.org/abs/2412.18428
    • Beschreibung:
      • Hier wird ein LLM-Agent zur multimodalen Datenexploration durch natürliche Sprache vorgestellt.
      • Das System ermöglicht es, verschiedene Datenmodalitäten zu durchsuchen, abzufragen und besser zu verstehen.
      • Die Arbeit verbessert die Zugänglichkeit zu komplexen Datensätzen.
  23. Titel:GUI Testing Arena: A Unified Benchmark for Advancing Autonomous GUI Testing Agent
    • Link: https://arxiv.org/abs/2412.18426
    • Beschreibung:
      • Stellt einen Benchmark bereit, um automatisierte Test-Agenten für grafische User-Interfaces (GUI) zu entwickeln und zu testen.
      • Die Benchmark zielt darauf ab, die Entwicklung effizienterer und effektiverer Testmethoden zu fördern.
      • Die Arbeit bietet einen umfassenden Testrahmen mit klaren Kriterien zur Bewertung der Testfähigkeiten.
  24. Titel:MineStudio: A Streamlined Package for Minecraft AI Agent Development
    • Link: https://arxiv.org/abs/2412.18293
    • Beschreibung:
      • Bietet eine vereinfachte Entwicklungsumgebung, um KI-Agenten in Minecraft zu erstellen und zu evaluieren.
      • Das Paket stellt eine Reihe von Tools und Ressourcen bereit, die den Entwicklungsprozess erleichtern.
      • MineStudio soll die Anwendung von KI in Spielen durch benutzerfreundliche Tools ermöglichen.
  25. Titel:AutoDroid-V2: Boosting SLM-based GUI Agents via Code Generation
    • Link: https://arxiv.org/abs/2412.18111
    • Beschreibung:
      • Zeigt, wie man GUI-Agenten durch Code-Generierung verbessert, unter Nutzung eines „SLM“-Ansatzes (vermutlich specialized LLM).
      • Der Fokus liegt auf der Effizienz von SLMs für GUI-bezogene Aufgaben.
      • Durch die Kombination von SLMs mit Codegenerierung sollen GUI-Agenten effektiver und robuster gemacht werden.
  26. Titel:Dynamic Multi-Agent Orchestration and Retrieval for Multi-Source Question-Answer Systems using Large Language Models
    • Link: https://arxiv.org/abs/2412.17964
    • Beschreibung:
      • Dieses Paper beschreibt den Einsatz von LLMs für die dynamische Multi-Agenten-Orchestrierung in Q&A-Systemen, die verschiedene Datenquellen nutzen.
      • Die Agenten arbeiten zusammen, um Aufgaben koordiniert zu bearbeiten und Informationen aus verschiedenen Quellen abzurufen.
      • Die Arbeit zeigt, dass die Leistung und Effizienz solcher Systeme durch die Zusammenarbeit gesteigert wird.
  27. Titel:Contrato360 2.0: A Document and Database-Driven Question-Answer System using Large Language Models and Agents
    • Link: https://arxiv.org/abs/2412.17942
    • Beschreibung:
      • Beschreibt ein QA-System, bei dem LLMs und mehrere Agenten Dokumente und Datenbanken gemeinsam nutzen, um Fragen zu beantworten.
      • Das System ist darauf ausgerichtet, komplexe Fragen aus heterogenen Datenquellen zu beantworten.
    • Diese Arbeit demonstriert, wie leistungsfähige Q&A-Systeme durch die Kombination von LLM- und Agenten-Technologien realisiert werden können.
  28. Titel:Decentralized Intelligence in GameFi: Embodied AI Agents and the Convergence of DeFi and Virtual Ecosystems
    • Link: https://arxiv.org/abs/2412.18601
    • Beschreibung:
      • Diskutiert „Embodied AI Agents“ für GameFi-Ökosysteme, bei denen DeFi und virtuelle Umgebungen verschmelzen.
      • Es wird untersucht, wie KI-Agenten autonome Entscheidungen treffen und zu einer dezentralisierten Intelligenz beitragen können.
    • Die Forschung untersucht die Möglichkeiten und Herausforderungen in diesem neuen Feld.
  29. Titel:A Paragraph is All It Takes: Rich Robot Behaviors from Interacting, Trusted LLMs
    • Link: https://arxiv.org/abs/2412.18588
    • Beschreibung:
      • Diese Studie zeigt, dass Roboter mithilfe von Interaktionen mit vertrauenswürdigen LLMs komplexe Verhaltensweisen erlernen können.
      • Es genügt eine kurze textuelle Anweisung, damit LLMs Roboter effektiv lenken und koordinieren können.
        *Die Ergebnisse zeigen eine verbesserte Flexibilität und Anpassungsfähigkeit der Roboter in dynamischen Umgebungen.
  30. Titel:Multi-Modal Grounded Planning and Efficient Replanning For Learning Embodied Agents with A Few Examples
    Link:https://arxiv.org/abs/2412.17288
    Beschreibung:
    * Die Forschung in diesem Paper konzentriert sich auf multimodale, geerdete Planung und effiziente Neuplanung für das Lernen von Embodied Agents mit wenigen Beispielen.
    • Die Methode integriert visuelle und sprachliche Informationen, um die Planungsfähigkeit der Agenten zu verbessern.
    • Die Arbeit zeigt, dass Agents mit dieser Methode effizient und flexibel in verschiedenen Szenarien planen und agieren können.
  31. Titel:A3: Android Agent Arena for Mobile GUI Agents
    • Link: https://arxiv.org/abs/2501.01149
    • Beschreibung:
      • Ein Toolkit und Framework, das Agenten für Android-GUIs trainiert und testet, um automatisierte Bedienung und Interaktion auf mobilen Apps zu ermöglichen.
      • Die Plattform dient als standardisierte Umgebung für die Forschung in diesem Bereich.
      • Es ermöglicht die Entwicklung effizienterer und robusterer Agenten für mobile Geräte.
  32. Titel:Beyond Text: Implementing Multimodal Large Language Model-Powered Multi-Agent Systems Using a No-Code Platform
    Link:https://arxiv.org/abs/2501.00750
    Beschreibung:
    * Beschreibt den Einsatz von Multi-Agenten-Systemen (gestützt durch multimodale LLMs) über eine No-Code-Lösung.
    • Ermöglicht die Automatisierung komplexer multimodaler Aufgaben ohne tiefgehende Programmierkenntnisse.
      * Die Forschung zielt auf eine breitere Anwendung von LLMs in Multi-Agenten-Systemen ab.
  33. Titel:PIMAEX: Multi-Agent Exploration through Peer Incentivization
    Link:https://arxiv.org/abs/2501.01266
    • Beschreibung:
      • Ein Multi-Agenten-Rahmenwerk, in dem Agenten sich gegenseitig motivieren, Explorationsaufgaben auszuführen.
      • Durch die peer-basierte Motivation sollen bessere Ergebnisse erzielt und eine effektivere Exploration erreicht werden.
        * Die Studie leistet einen wichtigen Beitrag zum Multi-Agenten-Lernen.
  34. Titel:Harnessing Multi-Agent LLMs for Complex Engineering Problem-Solving: A Framework for Senior Design Projects
    • Link: https://arxiv.org/abs/2501.01205
    • Beschreibung:
      • Stellt einen Multi-Agenten-Ansatz (basierend auf LLMs) vor, um hochkomplexe technische Aufgaben und Projektarbeit im akademischen Umfeld zu unterstützen.
      • Ziel ist es, durch die Nutzung von LLMs die Zusammenarbeit bei komplexen Ingenieursprojekten zu verbessern.
      • Die Studie demonstriert die Anwendbarkeit von LLMs in praktischen Szenarien.
  35. Titel:Large Language Model Based Multi-Agent System Augmented Complex Event Processing Pipeline for Internet of Multimedia Things
    • Link:https://arxiv.org/abs/2501.00891
      • Beschreibung:
        • Dieses Paper beschreibt eine Multi-Agenten-Lösung mit LLMs für die Verarbeitung komplexer Ereignisse in IoT-Umgebungen.
        • Die Agenten kooperieren dabei, um relevante Ereignisse zu identifizieren und zu analysieren.
      • Diese Forschung leistet einen Beitrag zur intelligenten Verarbeitung von Daten aus dem Internet der Dinge.
  36. Titel:AI Agent for Education: von Neumann Multi-Agent System Framework
    • Link: https://arxiv.org/abs/2501.00083
      Beschreibung:
    • Ein Multi-Agenten-System-Framework, das speziell für den Bildungsbereich entwickelt wurde und den Ansatz eines „von-Neumann-Systems“ verfolgt.
    • Ziel ist es, durch KI-Agenten Lehre und Lernen zu personalisieren und zu unterstützen.
    • Das System bietet einen vielseitigen Rahmen für die Entwicklung von KI-gestützten Lernsystemen.

Liste der arXiv-Veröffentlichungen zu KI-Agenten (02. Januar 2025):

  1. Titel:Aviary: training language agents on challenging scientific tasks
    • Link: https://arxiv.org/abs/2412.21154
    • Beschreibung:
      • Dieses Paper präsentiert Aviary, eine Plattform, die speziell darauf ausgerichtet ist, Sprachagenten in anspruchsvollen wissenschaftlichen Bereichen zu trainieren.
      • Aviary nutzt eine Kombination aus neuen Trainingsmethoden und einer speziell kuratierten Aufgabenvielfalt, um die Fähigkeiten der Agenten zu verbessern.
      • Die Experimente zeigen, dass mit Aviary trainierte Sprachagenten eine signifikant bessere Leistung in komplexen wissenschaftlichen Aufgaben erzielen als andere Ansätze.
  2. Titel:UnrealZoo: Enriching Photo-realistic Virtual Worlds for Embodied AI
    • Link: https://arxiv.org/abs/2412.20977
    • Beschreibung:
      • UnrealZoo ist eine neue Plattform, die es ermöglicht, hochrealistische virtuelle Umgebungen für das Training von Embodied AI-Agenten zu erstellen.
      • Die Plattform bietet eine Vielfalt an Umgebungen, die von einfachen Szenarien bis hin zu komplexen, lebensnahen Settings reichen.
      • Durch die Nutzung fotorealistischer Umgebungen sollen die Agenten besser auf reale Aufgaben vorbereitet werden.
  3. Titel:Planning, Living and Judging: A Multi-agent LLM-based Framework for Cyclical Urban Planning
    • Link: https://arxiv.org/abs/2412.20505
    • Beschreibung:
      • Dieses Paper stellt ein Multi-Agenten-Framework vor, das auf Large Language Models (LLMs) basiert und für die zyklische Stadtplanung konzipiert wurde.
      • Das Framework integriert Planungs-, Lebens- und Bewertungsaspekte, um einen iterativen Planungsprozess zu ermöglichen.
      • Die Ergebnisse deuten darauf hin, dass LLMs in einem Multiagenten-System effektiv zur Lösung von Herausforderungen in der Stadtplanung genutzt werden können.
  4. Titel:High-fidelity social learning via shared episodic memories enhances collaborative foraging through mnemonic convergence
    • Link: https://arxiv.org/abs/2412.20271
    • Beschreibung:
      • Diese Studie untersucht, wie sich das Teilen episodischer Erinnerungen auf das soziale Lernen und die kollaborative Futtersuche von KI-Agenten auswirkt.
      • Durch den Austausch von Gedächtnisinhalten können Agenten ihre Zusammenarbeit verbessern und effizienter zusammenarbeiten.
      • Die Forschungsergebnisse legen nahe, dass eine gemeinsame Erinnerungsbasis die mnemotechnische Konvergenz fördert und somit das kollaborative Lernen optimiert.
  5. Titel:BaiJia: A Large Scale Role-Playing Agent Corpus of Chinese Historical Charcaters
    • Link: https://arxiv.org/abs/2412.20024
    • Beschreibung:
      • BaiJia ist ein umfangreiches Korpus, das für das Training und die Evaluation von Rollenspiel-KI-Agenten mit chinesischen historischen Figuren entwickelt wurde.
      • Das Korpus umfasst detaillierte Beschreibungen und Dialoge, die es den Agenten ermöglichen, glaubwürdige historische Persönlichkeiten darzustellen.
      • Diese Ressource soll die Forschung im Bereich der personalisierten und kulturell sensiblen KI-Interaktion fördern.
  6. Titel:Exploring and Controlling Diversity in LLM-Agent Conversation
    • Link: https://arxiv.org/abs/2412.21102
    • Beschreibung:
      * Diese Arbeit untersucht Methoden zur Messung und Steuerung der inhaltlichen Vielfalt in Gesprächen, die von LLM-basierten Agenten geführt werden.
      * Es werden verschiedene Ansätze vorgestellt, um die Diversität von Konversationen zu erhöhen oder zu reduzieren, je nach Anwendungsfall.
      * Die Ergebnisse deuten darauf hin, dass eine gezielte Steuerung der Diversität die Qualität und Relevanz von Agenten-Konversationen verbessern kann.
  7. Titel:Plancraft: an evaluation dataset for planning with LLM agents
    • Link: https://arxiv.org/abs/2412.21033
    • Beschreibung:
      * Plancraft ist ein neuer Datensatz, der speziell für die Bewertung der Planungsfähigkeiten von LLM-basierten Agenten entwickelt wurde.
      • Der Datensatz enthält eine Reihe komplexer Aufgaben, die von den Agenten erfordern, detaillierte Handlungsabläufe zu entwerfen.
        * Plancraft soll als Standard-Benchmark für die Forschung im Bereich des Planens mit LLMs dienen.
  8. Titel:Game Theory and Multi-Agent Reinforcement Learning: From Nash Equilibria to Evolutionary Dynamics
    • Link: https://arxiv.org/abs/2412.20519
    • Beschreibung:
      • Dieses Paper bietet einen Überblick über die Grundlagen der Spieltheorie und deren Anwendung auf Multi-Agenten Reinforcement Learning.
      • Es werden verschiedene Methoden und Algorithmen vorgestellt, die von Nash-Gleichgewichten bis zur evolutionären Dynamik reichen.
        * Die Arbeit bietet sowohl theoretische als auch praktische Einblicke in die Gestaltung kooperativer und kompetitiver Multi-Agenten-Systeme.
  9. Titel:Multi-Scenario Reasoning: Unlocking Cognitive Autonomy in Humanoid Robots for Multimodal Understanding
    • Link: https://arxiv.org/abs/2412.20429
    • Beschreibung:
      • Dieses Paper untersucht, wie humanoide Roboter durch Multi-Modal-Reasoning eine höhere kognitive Autonomie erreichen können.
      • Der Fokus liegt auf der Fähigkeit der Roboter, über verschiedene Szenarien hinweg zu schlussfolgern und zu verstehen.
      • Es wird ein Ansatz vorgestellt, der es Robotern ermöglicht, multimodale Eingaben zu integrieren und flexible Entscheidungen zu treffen.
  10. Titel:Safe Multiagent Coordination via Entropic Exploration
    • Link: https://arxiv.org/abs/2412.20361
    • Beschreibung:
      • Dieses Paper präsentiert einen Ansatz, um die sichere Koordination von Multi-Agenten-Systemen durch die Nutzung von Entropie-basierter Exploration zu verbessern.
      • Es wird gezeigt, dass die kontrollierte Zufallsexploration das Risiko unkoordinierter Aktionen minimieren und gleichzeitig die Zusammenarbeit fördern kann.
      • Die Arbeit bietet eine vielversprechende Methode, um sichere und effiziente Multi-Agenten-Systeme zu entwickeln.
  11. Titel:TradingAgents: Multi-Agents LLM Financial Trading Framework
    • Link: https://arxiv.org/abs/2412.20138
    • Beschreibung:
      • Dieses Paper stellt TradingAgents vor, ein Framework, das LLMs nutzt, um Multi-Agenten-Systeme für den Finanzhandel zu entwickeln.
      • Das Framework ermöglicht es, verschiedene Handelsstrategien zu testen und ihre Leistung in simulierten Marktszenarien zu bewerten.
      • Durch die Verwendung mehrerer Agenten kann eine robustere und vielseitigere Handelsstrategie erreicht werden.
  12. Titel:M-MAD: Multidimensional Multi-Agent Debate Framework for Fine-grained Machine Translation Evaluation
    • Link: https://arxiv.org/abs/2412.20127
    • Beschreibung:
      • M-MAD ist ein Multi-Agenten-Framework, das auf Debatten basiert und zur präzisen Evaluierung maschineller Übersetzungen entwickelt wurde.
      • Es verwendet mehrere Agenten, die verschiedene Aspekte einer Übersetzung diskutieren und bewerten, um eine umfassendere Analyse zu ermöglichen.
      • Dieser Ansatz ermöglicht eine differenziertere Bewertung als herkömmliche Metriken.
  13. Titel:OneKE: A Dockerized Schema-Guided LLM Agent-based Knowledge Extraction System
    • Link: https://arxiv.org/abs/2412.20005
    • Beschreibung:
      * OneKE ist ein dockerisiertes System, das schemageführte LLM-Agenten verwendet, um Wissen aus Dokumenten zu extrahieren.
      * Das System ist flexibel und ermöglicht eine einfache Integration in verschiedene Arbeitsabläufe durch den Einsatz von Docker-Containern.
      * OneKE ist ein Beispiel dafür, wie LLM-basierte Agenten für automatisierte Wissensextraktion genutzt werden können.
  14. Titel:Can Large Language Models Adapt to Other Agents In-Context?
    • Link: https://arxiv.org/abs/2412.19726
    • Beschreibung:
      * Diese Forschung untersucht, ob Large Language Models (LLMs) ihre Verhaltensweisen während einer Interaktion mit anderen Agenten anpassen können.
      * Es wird analysiert, wie LLMs in-context lernen und ihre Strategien auf Grundlage der Interaktionspartner optimieren.
      * Die Ergebnisse geben Aufschluss über die Flexibilität und Anpassungsfähigkeit von LLMs in Multi-Agenten-Umgebungen.
  15. Titel:OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis
    • Link: https://arxiv.org/abs/2412.19723
    • Beschreibung:
      • OS-Genesis ist ein System, welches automatisch Trajektorien für GUI-Agenten mittels Reverse Task Synthesis erstellen kann.
      • Der Ansatz kehrt den Prozess der Task-Ausführung um, indem es von einem gewünschten Ergebnis ausgehend eine Reihe von Schritten ableitet.
      • Dieses System zielt darauf ab, die Erstellung und Analyse von GUI-Agenten zu vereinfachen.
  16. Titel:Hindsight Planner: A Closed-Loop Few-Shot Planner for Embodied Instruction Following
    • Link: https://arxiv.org/abs/2412.19562
    • Beschreibung:
      • Dieser Artikel stellt einen Planner vor, der nur wenige Beispiele benötigt und aus Erfahrung lernt, um Anweisungen in einer Umgebung zu befolgen.
      • Der Planner nutzt ein Hindsight-Konzept, um aus Fehlern zu lernen und den Planungsprozess anzupassen.
      • Das System zeigt, wie Agenten in dynamischen Umgebungen mit wenigen Beispielen komplexe Aufgaben erfolgreich bewältigen können.
  17. Titel:Hierarchical Multi-agent Meta-Reinforcement Learning for Cross-channel Bidding
    • Link: https://arxiv.org/abs/2412.19064
    • Beschreibung:
      • Hier wird ein hierarchischer Multi-Agenten-Ansatz vorgestellt, der Meta-Reinforcement Learning (Meta-RL) verwendet, um Bietstrategien über verschiedene Kanäle zu optimieren.
      • Die Hierarchie ermöglicht es, dass Agenten auf verschiedenen Ebenen agieren und somit komplexere Entscheidungen treffen können.
        * Die Experimente zeigen, dass dieser Ansatz die Effizienz und Rentabilität von Bietprozessen verbessern kann.
  18. Titel:TravelAgent: Generative Agents in the Built Environment
    • Link:https://arxiv.org/abs/2412.18985
      • Beschreibung:
        • TravelAgent ist ein System, das generative KI-Agenten nutzt, um das Verhalten von Menschen in einer bebauten Umgebung zu simulieren.
        • Die Agenten sind in der Lage, selbstständig Entscheidungen zu treffen und Interaktionen mit der Umgebung zu simulieren, die auf realen Mustern basieren.
      • Dies ermöglicht ein besseres Verständnis von räumlichen Interaktionen und kann in der Stadtplanung verwendet werden.
  19. Titel:GAI: Generative Agents for Innovation
    Link:https://arxiv.org/abs/2412.18899
    • Beschreibung:
      • Dieses Paper untersucht die Rolle von generativen Agenten bei der Förderung von Innovationen.
      • Es wird ein Framework vorgestellt, das verschiedene Agenten mit unterschiedlichen Rollen für die generative Ideenfindung und Problemlösung kombiniert.
      • Die Forschung zeigt das Potenzial generativer Agenten, die Entwicklung von neuen Lösungen in verschiedenen Bereichen zu beschleunigen.
  20. Titel:Agents on the Bench: Large Language Model Based Multi Agent Framework for Trustworthy Digital Justice
    • Link: https://arxiv.org/abs/2412.18697
    • Beschreibung:
      • Dieses Paper präsentiert ein Multi-Agenten-Framework, basierend auf LLMs, das für Anwendungen im Bereich der digitalen Justiz entwickelt wurde.
      • Das Framework soll die Transparenz und das Vertrauen in die digitale Justiz stärken.
      • Die Arbeit adressiert wichtige ethische und praktische Aspekte im Kontext von KI und Rechtsprechung.
  21. Titel:Multi-Agent Norm Perception and Induction in Distributed Healthcare
    • Link: https://arxiv.org/abs/2412.18454
    • Beschreibung:
      • Dieses Paper untersucht die Wahrnehmung und Induktion von Normen in Multi-Agenten-Systemen, die im verteilten Gesundheitswesen eingesetzt werden.
      • Es wird analysiert, wie Agenten gemeinsame Verhaltensregeln erlernen und befolgen können, um eine effektive Zusammenarbeit zu gewährleisten.
      • Diese Forschung bietet Einblicke in die Schaffung sicherer und effizienter Multi-Agenten-Systeme in komplexen Umgebungen.
  22. Titel:Explainable Multi-Modal Data Exploration in Natural Language via LLM Agent
    Link:https://arxiv.org/abs/2412.18428
    • Beschreibung:
      • Hier wird ein Ansatz vorgestellt, wie LLMs genutzt werden können, um multimodale Daten in natürlicher Sprache zu explorieren.
      • Ein LLM-Agent dient dabei als Schnittstelle, über die Benutzer Fragen stellen und Ergebnisse interpretieren können.
      • Dieser Ansatz soll die Zugänglichkeit von komplexen multimodalen Datensätzen verbessern.
  23. Titel:GUI Testing Arena: A Unified Benchmark for Advancing Autonomous GUI Testing Agent
    • Link: https://arxiv.org/abs/2412.18426
    • Beschreibung:
      • Dieses Paper präsentiert eine vereinheitlichte Benchmark für die Entwicklung und Evaluierung von autonomen GUI-Testagenten.
      • Die Benchmark soll die Entwicklung effizienterer und effektiverer Testmethoden in GUI-basierten Systemen fördern.
      • Die Arbeit bietet einen umfassenden Testrahmen mit klaren Kriterien zur Bewertung der Testfähigkeiten.
  24. Titel:MineStudio: A Streamlined Package for Minecraft AI Agent Development
    • Link: https://arxiv.org/abs/2412.18293
    • Beschreibung:
      • MineStudio ist ein Paket, das den Entwicklungsprozess von KI-Agenten in Minecraft vereinfacht und optimiert.
      • Das Paket bietet eine Reihe von Werkzeugen und Ressourcen, die es Entwicklern erleichtern, Agenten zu erstellen, zu trainieren und zu testen.
      • MineStudio zielt darauf ab, die Hürden für den Einsatz von KI in Spielen zu senken.
  25. Titel:AutoDroid-V2: Boosting SLM-based GUI Agents via Code Generation
    • Link: https://arxiv.org/abs/2412.18116
    • Beschreibung:
      • AutoDroid-V2 ist eine Methode, um die Leistung von GUI-Agenten durch Codegenerierung zu verbessern.
      • Der Fokus liegt auf der Effizienz von speziell trainierten Sprachmodellen (SLMs) für GUI-bezogene Aufgaben.
      • Durch die Kombination von SLMs mit Codegenerierung sollen GUI-Agenten effektiver und robuster gemacht werden.
  26. Titel:Dynamic Multi-Agent Orchestration and Retrieval for Multi-Source Question-Answer Systems using Large Language Models
    • Link: https://arxiv.org/abs/2412.17964
    • Beschreibung:
      • Dieses Paper beschreibt einen Ansatz zur dynamischen Orchestrierung mehrerer KI-Agenten mit LLMs in Frage-Antwort-Systemen, die auf verschiedene Datenquellen zugreifen.
      • Das Framework ermöglicht es, dass die Agenten ihre Aufgaben koordiniert ausführen und aus verschiedenen Quellen benötigte Informationen beziehen.
      • Die Studie untersucht die verbesserte Genauigkeit und Effizienz dieser Systeme im Vergleich zu anderen Ansätzen.
  27. Titel:Contrato360 2.0: A Document and Database-Driven Question-Answer System using Large Language Models and Agents
    • Link: https://arxiv.org/abs/2412.17942
    • Beschreibung:
      • Contrato360 2.0 ist ein Frage-Antwort-System, welches LLMs und Agenten nutzt, um Dokumente und Datenbanken gemeinsam zu analysieren.
      • Das System ist darauf ausgerichtet, komplexe Fragen aus heterogenen Datenquellen zu beantworten.
      • Diese Forschung zeigt, wie verschiedene LLM- und Agenten-Technologien kombiniert werden können, um leistungsfähige Q&A-Systeme zu entwickeln.
  28. Titel:Decentralized Intelligence in GameFi: Embodied AI Agents and the Convergence of DeFi and Virtual Ecosystems
    • Link: https://arxiv.org/abs/2412.18601
    • Beschreibung:
      • Das Paper analysiert den Einsatz von „Embodied AI Agents“ in GameFi-Systemen, wo DeFi (Dezentrale Finanzen) und virtuelle Ökosysteme interagieren.
      • Es wird untersucht, wie KI-Agenten autonome Entscheidungen treffen und zu einer dezentralisierten Intelligenz beitragen können.
      • Die Forschung untersucht die Möglichkeiten und Herausforderungen in diesem neuen Feld.
  29. Titel:A Paragraph is All It Takes: Rich Robot Behaviors from Interacting, Trusted LLMs
    • Link: https://arxiv.org/abs/2412.18588
    • Beschreibung:
      • Diese Studie zeigt, dass Roboter mithilfe von Interaktionen mit vertrauenswürdigen LLMs komplexe Verhaltensweisen erlernen können.
      • Es genügt eine kurze textuelle Anweisung, damit LLMs Roboter effektiv lenken und koordinieren können.
      • Die Ergebnisse zeigen eine verbesserte Flexibilität und Anpassungsfähigkeit der Roboter in dynamischen Umgebungen.
  30. Titel:Multi-Modal Grounded Planning and Efficient Replanning For Learning Embodied Agents with A Few Examples
    Link:https://arxiv.org/abs/2412.17288
    Beschreibung:
    • Dieses Paper präsentiert eine Methode für multimodale, geerdete Planung, die es Embodied Agents ermöglicht, mit wenigen Beispielen zu lernen.
      * Die Methode integriert visuelle und sprachliche Informationen, um die Planungsfähigkeit der Agenten zu verbessern.
    • Die Arbeit zeigt, dass Agents mit dieser Methode effizient und flexibel in verschiedenen Szenarien planen und agieren können.

Exit mobile version