Tägliche KI-Agenten und AI-Agents Forschung

Tägliche KI-Agenten und AI-Agents Forschung: Bleiben Sie mit unseren 2025 Science Papers Up-to-Date!: Herzlich willkommen zu Ihrem täglichen, hochaktuellen Überblick über die neuesten wissenschaftlichen Veröffentlichungen im Bereich KI-Agenten und AI-Agents! Wir präsentieren Ihnen hier die spannendsten 2025 Forschungsergebnisse zu intelligenten Software-Agenten, Multi-Agentensystemen, agentenbasierter KI und allen verwandten Themen. Unser Fokus liegt darauf, Ihnen die neuesten Entwicklungen in der Welt der autonomen Systeme und des Reinforcement Learning schnell und effizient zugänglich zu machen.

KI-Agenten und AI-Agents – 2025 Science Papers Daily: Ihr täglicher Vorteil

Bei uns finden Sie nicht einfach eine Liste von Veröffentlichungen. Wir kuratieren und verdichten für Sie die relevantesten Papers, damit Sie keine Zeit mit der Durchsicht unzähliger arXiv-Uploads, Konferenzbeiträge und Journal-Publikationen verschwenden. Die aktuellsten wissenschaftlichen Fortschritte in der KI-Forschung stellen wir stets ganz oben auf der Seite, sodass Sie auf einen Blick sehen, welche neuen Erkenntnisse gerade veröffentlicht wurden. Weiter unten finden Sie dann die Zusammenfassungen der vorangegangenen Tage – ideal, um Ihren Wissensstand chronologisch aufzufrischen und die Entwicklungen der letzten Tage nachzuvollziehen.

Kompakte Zusammenfassungen: Keine Informationsflut! Anstatt sich durch Hunderte von Papers zu kämpfen, erhalten Sie bei uns eine präzise Übersicht über die neuesten Entwicklungen im Bereich der KI-Agenten.
Zeitgewinn durch Kuratierung: Mit wenigen Absätzen pro Paper erfassen Sie schnell die Relevanz für Ihre Forschung, Ihr Projekt oder Ihr persönliches Interesse an agentenbasierten Systemen.
Trends und Innovationen erkennen: Die agentenbasierte KI-Forschung ist ein hochdynamischer Bereich mit rasanten Fortschritten, insbesondere in den Bereichen generative Agenten, kollaborative Robotik, Multi-Agenten-Verhandlungen, Vision-Language-Modelle und LLM-basierte Anwendungen. Hier entdecken Sie frühzeitig die neuesten Trends in Multi-Agentensystemen und deren bahnbrechende Anwendungen.
Lückenlose Aktualität: Tägliche Updates zu KI-Papers! Wir durchforsten täglich die neuesten Veröffentlichungen, um sicherzustellen, dass Sie keine bahnbrechenden Entdeckungen und arXiv KI-Agenten Papers verpassen.
Wachsendes Archiv: Mit der Zeit entsteht hier ein umfassendes Archiv, das Sie für tiefergehende Recherchen und zum Nachschlagen älterer, aber relevanter Arbeiten nutzen können. Ideal für einen Deep Dive in die KI-Agenten Forschung oder um ältere, aber immer noch interessante Arbeiten nachzuschlagen.

Ihre Anlaufstelle für KI-Agenten Forschung

Wir möchten Ihnen mit diesem Service eine verlässliche Anlaufstelle bieten, an der Sie sich über die neuesten Forschungsergebnisse im Bereich der KI-Agenten informieren können, ohne von der schieren Menge an Publikationen überwältigt zu werden. Ob Sie in diesem Gebiet forschen, sich mit Kolleg*innen austauschen oder einfach nur die technologischen Entwicklungen verfolgen wollen: Unsere Zusammenfassungen sollen Ihnen helfen, auf dem Laufenden zu bleiben und Ihre eigene KI-Agenten Forschung zu inspirieren.

Top 5 Forschungsergebnisse zu KI-Agenten im Januar 2025

…werden Anfang Februar 2025 veröffentlicht.

Die Liste unten wird täglich aktualisiert, wobei die neuesten Einträge immer ganz oben stehen. So können Sie schnell erkennen, was die Community gerade diskutiert, und gleichzeitig tiefer scrollen, um einen umfassenden Überblick über die Entwicklung im Bereich der KI-Agenten und AI-Agents zu erhalten. Bleiben Sie am Ball, wenn Sie keine wichtigen Entwicklungen verpassen wollen!

Zusammenfassung der AI-Agents – 2025 Science Papers Daily der tägliche Blick auf die Forschung zu KI-Agenten

Wöchentlich erstellen wir eine Zusammenfassung, um Trends besser zu verstehen. Diese Zusammenfassungen gibt es im Folgenden:

Woche 1

2025 – Woche 1 – Zusammenfassung aller ArXiv Veröffentlichungen zum Thema KI-Agenten

Woche 2

2025 – Woche 2 – KI-Agenten – Zusammenfassung aller ArXiv-Veröffentlichungen und bahnbrechenden Forschungen

Woche 3

2025 – Woche 3 – KI-Agenten – Zusammenfassung aller ArXiv-Veröffentlichungen und bahnbrechenden Forschungen Überblick Woche 3 (20.1. – 24.1.2025)

Woche 4

2025 – Woche 4 – KI-Agenten – Zusammenfassung aller ArXiv-Veröffentlichungen und Forschungen im Überblick Woche 4 (27.1. – 31.1.2025)

Woche 5

KI-Agenten Forschung 2025 Woche 5: Von Bewusstsein bis zum Klassenzimmer – Ein Blick auf die neuesten Durchbrüche!

Woche 6

2025 – Woche 6 – KI-Agenten – Zusammenfassung aller ArXiv-Veröffentlichungen und Forschungen im Überblick Woche 6 (10.2. – 14.2.2025)

Woche 7

2025 – Woche 7 – KI-Agenten – Zusammenfassung aller ArXiv-Veröffentlichungen und bahnbrechenden Forschungen

Woche 8

Liste der arXiv-Veröffentlichungen vom 7. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks

1. ToolFuzz — Automated Agent Tool Testing

Beschreibung:
- ToolFuzz ist ein Framework zur automatisierten Testung von Tools, die von KI-Agenten verwendet werden.
- Es zielt darauf ab, die Robustheit und Effizienz einzelner Agenten zu verbessern, indem deren Werkzeugnutzung systematisch geprüft wird.
- Relevanz: Fokus auf die Optimierung einzelner KI-Agenten.
Autoren: Ivan Milev, Mislav Balunović, Maximilian Baader, Martin Vechev
Link: arXiv:2503.04479
Subjects: Artificial Intelligence (cs.AI); Software Engineering (cs.SE)

2. From Idea to CAD: A Language Model-Driven Multi-Agent System for Collaborative Design

Beschreibung:
- Dieses Paper beschreibt ein Multi-Agenten-System, das durch Sprachmodelle gesteuert wird, um kollaboratives Design (z. B. CAD-Modelle) zu ermöglichen.
- Agenten arbeiten zusammen, um Ideen in technische Designs umzusetzen.
- Relevanz: Expliziter Einsatz eines Multi-Agenten-Frameworks für Designaufgaben.
Autoren: Felix Ocker, Stefan Menzel, Ahmed Sadik, Thiago Rios
Link: arXiv:2503.04417
Subjects: Artificial Intelligence (cs.AI); Multiagent Systems (cs.MA)

3. AgentSafe: Safeguarding Large Language Model-based Multi-agent Systems via Hierarchical Data Management

Beschreibung:
- AgentSafe ist ein Framework zum Schutz von Multi-Agenten-Systemen, die auf großen Sprachmodellen basieren, durch hierarchisches Datenmanagement.
- Es adressiert Sicherheits- und Datenschutzaspekte in der Zusammenarbeit mehrerer Agenten.
- Relevanz: Multi-Agenten-System mit Fokus auf Sicherheit.
Autoren: Junyuan Mao, Fanci Meng, Yifan Duan, Miao Yu, Xiaojun Jia, Junfeng Fang, Yuxuan Liang, Kun Wang, Qingsong Wen
Link: arXiv:2503.04392
Subjects: Artificial Intelligence (cs.AI)

4. Guidelines for Applying RL and MARL in Cybersecurity Applications

Beschreibung:
- Dieses Paper bietet Richtlinien für die Anwendung von Reinforcement Learning (RL) und Multi-Agent Reinforcement Learning (MARL) in Cybersicherheitsanwendungen.
- Es behandelt sowohl einzelne als auch Multi-Agenten-Ansätze für Sicherheitsprobleme.
- Relevanz: Kombination von Einzel- und Multi-Agenten-RL in einem praktischen Kontext.
Autoren: Vasilios Mavroudis, Gregory Palmer, Sara Farmer, Kez Smithson Whitehead, David Foster, Adam Price, Ian Miles, Alberto Caron, Stephen Pasteris
Link: arXiv:2503.04262
Subjects: Artificial Intelligence (cs.AI)

5. Learning to Negotiate via Voluntary Commitment

Beschreibung:
- Diese Arbeit untersucht, wie Agenten durch freiwillige Verpflichtungen Verhandlungen lernen können, unter Nutzung von RL und Multi-Agenten-Interaktionen.
- Sie kombiniert Spieltheorie mit Multi-Agenten-Systemen.
- Relevanz: Multi-Agenten-Framework für Verhandlungsaufgaben.
Autoren: Shuhui Zhu, Baoxiang Wang, Sriram Ganapathi Subramanian, Pascal Poupart
Link: arXiv:2503.03866
Subjects: Artificial Intelligence (cs.AI); Computer Science and Game Theory (cs.GT); Machine Learning (cs.LG); Multiagent Systems (cs.MA)

6. Predicting Team Performance from Communications in Simulated Search-and-Rescue

Beschreibung:
- Das Paper analysiert, wie Teamleistung in simulierten Such- und Rettungsszenarien aus Kommunikation vorhergesagt werden kann.
- Es impliziert Multi-Agenten-Systeme, da Teams aus mehreren Akteuren bestehen, die zusammenarbeiten.
- Relevanz: Indirekter Fokus auf Multi-Agenten-Koordination.
Autoren: Ali Jalal-Kamali, Nikolos Gurney, David Pynadath
Link: arXiv:2503.03791
Subjects: Artificial Intelligence (cs.AI)

7. Multi-Agent Inverse Q-Learning from Demonstrations

Beschreibung:
- Diese Arbeit entwickelt ein Multi-Agenten-Inverse-Q-Learning-Verfahren, das aus Demonstrationen lernt.
- Es wird in Robotik-Anwendungen eingesetzt, um die Zusammenarbeit mehrerer Agenten zu optimieren.
- Relevanz: Explizites Multi-Agenten-Framework mit Lernansatz.
Autoren: Nathaniel Haynam, Adam Khoja, Dhruv Kumar, Vivek Myers, Erdem Bıyık
Link: arXiv:2503.04679
Subjects: Multiagent Systems (cs.MA); Artificial Intelligence (cs.AI); Machine Learning (cs.LG); Robotics (cs.RO)

8. RiskAgent: Autonomous Medical AI Copilot for Generalist Risk Prediction

Beschreibung:
- RiskAgent ist ein autonomer medizinischer KI-Copilot für allgemeine Risikovorhersagen, der auch Multi-Agenten-Aspekte integriert.
- Es nutzt mehrere Agenten für verschiedene Aufgaben in der Risikoanalyse.
- Relevanz: Kombination von autonomem Agenten mit Multi-Agenten-Elementen.
Autoren: Fenglin Liu, Jinge Wu, Hongjian Zhou, Xiao Gu, Soheila Molaei, Anshul Thakur, Lei Clifton, Honghan Wu, David A. Clifton
Link: arXiv:2503.03802
Subjects: Machine Learning (cs.LG); Artificial Intelligence (cs.AI); Multiagent Systems (cs.MA)

9. Multi-Agent Systems Powered by Large Language Models: Applications in Swarm Intelligence

Beschreibung:
- Dieses Paper untersucht Multi-Agenten-Systeme, die durch große Sprachmodelle angetrieben werden, mit Anwendungen in Schwarmintelligenz.
- Es zeigt, wie LLMs die Koordination und Intelligenz von Agentengruppen verbessern.
- Relevanz: Direkter Fokus auf Multi-Agenten-Systeme mit LLMs.
Autoren: Cristian Jimenez-Romero, Alper Yegenoglu, Christian Blum
Link: arXiv:2503.03800
Subjects: Multiagent Systems (cs.MA); Artificial Intelligence (cs.AI); Computation and Language (cs.CL); Machine Learning (cs.LG)

10. Human Implicit Preference-Based Policy Fine-tuning for Multi-Agent Reinforcement Learning in USV Swarm

Beschreibung:
- Diese Arbeit beschreibt die Feinabstimmung von Multi-Agenten-RL-Richtlinien basierend auf impliziten menschlichen Präferenzen in einem USV-Schwarm (Unmanned Surface Vehicles).
- Sie optimiert die Zusammenarbeit mehrerer Agenten in Robotik-Szenarien.
- Relevanz: Multi-Agenten-RL mit praktischer Anwendung.
Autoren: Hyeonjun Kim, Kanghoon Lee, Junho Park, Jiachen Li, Jinkyoo Park
Link: arXiv:2503.03796
Subjects: Multiagent Systems (cs.MA); Artificial Intelligence (cs.AI); Machine Learning (cs.LG); Robotics (cs.RO)

11. Accelerating Focal Search in Multi-Agent Path Finding with Tighter Lower Bounds

Beschreibung:
- Das Paper verbessert die fokussierte Suche in Multi-Agenten-Pfadfindung durch strengere untere Schranken.
- Es zielt auf effizientere Koordination in Multi-Agenten-Systemen ab, insbesondere in Robotik.
- Relevanz: Multi-Agenten-System für Pfadfindung.
Autoren: Yimin Tang, Zhenghong Yu, Jiaoyang Li, Sven Koenig
Link: arXiv:2503.03779
Subjects: Multiagent Systems (cs.MA); Artificial Intelligence (cs.AI); Robotics (cs.RO)

Liste der arXiv-Veröffentlichungen vom 6. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks

1. CHOP: Mobile Operating Assistant with Constrained High-frequency Optimized Subtask Planning

Beschreibung:
- CHOP ist ein mobiler Betriebsassistent, der optimierte Teilaufgabenplanung mit hoher Frequenz unter Einschränkungen nutzt.
- Fokus liegt auf einem einzelnen KI-Agenten, der effizient auf mobilen Geräten operiert.
- Relevanz: Entwicklung eines spezialisierten KI-Agenten für mobile Anwendungen.
Autoren: Yuqi Zhou, Shuai Wang, Sunhao Dai, Qinglin Jia, Zhaocheng Du, Zhenhua Dong, Jun Xu
Link: arXiv:2503.03743
Subjects: Artificial Intelligence (cs.AI)

2. Parallelized Planning-Acting for Efficient LLM-based Multi-Agent Systems

Beschreibung:
- Diese Arbeit schlägt ein paralleles Planungs- und Handlungssystem für effiziente Multi-Agenten-Systeme basierend auf LLMs vor.
- Ziel ist es, die Koordination und Effizienz von Multi-Agenten durch parallele Verarbeitung zu verbessern.
- Relevanz: Expliziter Fokus auf Multi-Agenten-Systeme mit LLM-Unterstützung.
Autoren: Yaoru Li, Shunyu Liu, Tongya Zheng, Mingli Song
Link: arXiv:2503.03505
Subjects: Artificial Intelligence (cs.AI)

3. Unified Mind Model: Reimagining Autonomous Agents in the LLM Era

Beschreibung:
- Das Paper stellt ein einheitliches Mind-Modell vor, das autonome Agenten im Kontext von LLMs neu konzipiert.
- Es untersucht, wie einzelne Agenten durch einheitliche kognitive Modelle verbessert werden können.
- Relevanz: Fokus auf autonome KI-Agenten mit potenzieller Erweiterung auf Multi-Agenten-Kontexte.
Autoren: Pengbo Hu, Xiang Ying
Link: arXiv:2503.03459
Subjects: Artificial Intelligence (cs.AI); Computation and Language (cs.CL)

4. COSINT-Agent: A Knowledge-Driven Multimodal Agent for Chinese Open Source Intelligence

Beschreibung:
- COSINT-Agent ist ein wissensgesteuerter, multimodaler KI-Agent für Open-Source-Intelligence in chinesischer Sprache.
- Er integriert verschiedene Datenquellen, um eigenständig Erkenntnisse zu gewinnen.
- Relevanz: Entwicklung eines spezialisierten einzelnen KI-Agenten.
Autoren: Wentao Li, Congcong Wang, Xiaoxiao Cui, Zhi Liu, Wei Guo, Lizhen Cui
Link: arXiv:2503.03215
Subjects: Artificial Intelligence (cs.AI)

5. LiteWebAgent: The Open-Source Suite for VLM-Based Web-Agent Applications

Beschreibung:
- LiteWebAgent ist eine Open-Source-Suite für VLM-basierte Web-Agenten-Anwendungen.
- Es adressiert sowohl einzelne Agenten als auch Multi-Agenten-Systeme für Web-Interaktionen.
- Relevanz: Kombination von Einzelagenten und Multi-Agenten-Ansätzen.
Autoren: Danqing Zhang, Balaji Rama, Jingyi Ni, Shiying He, Fu Zhao, Kunyu Chen, Arnold Chen, Junyu Cao
Link: arXiv:2503.02950
Subjects: Artificial Intelligence (cs.AI); Computation and Language (cs.CL); Multiagent Systems (cs.MA)

6. Multi-Agent DRL for Queue-Aware Task Offloading in Hierarchical MEC-Enabled Air-Ground Networks

Beschreibung:
- Diese Arbeit nutzt Multi-Agenten-Deep Reinforcement Learning (DRL) für warteschlangenbewusstes Task-Offloading in hierarchischen MEC-Netzwerken.
- Ziel ist die Optimierung der Zusammenarbeit zwischen Agenten in Luft-Boden-Netzwerken.
- Relevanz: Explizite Anwendung eines Multi-Agenten-Frameworks.
Autoren: Muhammet Hevesli, Abegaz Mohammed Seid, Aiman Erbad, Mohamed Abdallah
Link: arXiv:2503.03391
Subjects: Machine Learning (cs.LG); Artificial Intelligence (cs.AI)

7. RAILGUN: A Unified Convolutional Policy for Multi-Agent Path Finding Across Different Environments and Tasks

Beschreibung:
- RAILGUN entwickelt eine einheitliche konvolutionale Policy für Multi-Agenten-Pfadfindung in verschiedenen Umgebungen und Aufgaben.
- Es optimiert die Koordination zwischen Agenten für Robotik-Anwendungen.
- Relevanz: Multi-Agenten-System für Pfadfindung mit praktischer Anwendung.
Autoren: Yimin Tang, Xiao Xiong, Jingyi Xi, Jiaoyang Li, Erdem Bıyık, Sven Koenig
Link: arXiv:2503.02992
Subjects: Robotics (cs.RO); Artificial Intelligence (cs.AI)

8. Reliable and Efficient Multi-Agent Coordination via Graph Neural Network Variational Autoencoders

Beschreibung:
- Diese Arbeit schlägt eine Methode zur zuverlässigen und effizienten Multi-Agenten-Koordination mit Graph Neural Networks und variationalen Autoencodern vor.
- Anwendung in Robotik mit Fokus auf robuste Zusammenarbeit.
- Relevanz: Multi-Agenten-System mit fortschrittlichen ML-Techniken.
Autoren: Yue Meng, Nathalie Majcherczyk, Wenliang Liu, Scott Kiesel, Chuchu Fan, Federico Pecora
Link: arXiv:2503.02954
Subjects: Robotics (cs.RO); Artificial Intelligence (cs.AI); Machine Learning (cs.LG); Multiagent Systems (cs.MA)

9. Towards Robust Multi-UAV Collaboration: MARL with Noise-Resilient Communication and Attention Mechanisms

Beschreibung:
- Das Paper untersucht robuste Multi-UAV-Kollaboration mit Multi-Agent Reinforcement Learning (MARL), rauschresistenter Kommunikation und Aufmerksamkeitsmechanismen.
- Ziel ist die Verbesserung der Zusammenarbeit zwischen mehreren unbemannten Luftfahrzeugen.
- Relevanz: Multi-Agenten-System mit Fokus auf Kommunikation und Koordination.
Autoren: Zilin Zhao, Chishui Chen, Haotian Shi, Jiale Chen, Xuanlin Yue, Zhejian Yang, Yang Liu
Link: arXiv:2503.02913
Subjects: Multiagent Systems (cs.MA); Artificial Intelligence (cs.AI); Robotics (cs.RO)

10. Interactive Debugging and Steering of Multi-Agent AI Systems

Beschreibung:
- Diese Arbeit behandelt interaktives Debugging und Steuern von Multi-Agenten-KI-Systemen.
- Sie bietet Methoden zur Verbesserung der Mensch-AI-Interaktion in Multi-Agenten-Kontexten.
- Relevanz: Fokus auf Multi-Agenten-Systeme mit praktischen Anwendungen.
Autoren: Will Epperson, Gagan Bansal, Victor Dibia, Adam Fourney, Jack Gerrits, Erkang Zhu, Saleema Amershi
Link: arXiv:2503.02068
Subjects: Multiagent Systems (cs.MA); Artificial Intelligence (cs.AI); Human-Computer Interaction (cs.HC)

Liste der arXiv-Veröffentlichungen vom 5. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks

1. AutoEval: A Practical Framework for Autonomous Evaluation of Mobile Agents

Beschreibung:
- Dieses Paper stellt AutoEval vor, ein praktisches Framework zur autonomen Bewertung von mobilen KI-Agenten.
- Es fokussiert sich auf die Bewertung von Agenten in realen Szenarien, z. B. auf mobilen Geräten, und bietet eine Methode zur Analyse ihrer Leistungsfähigkeit.
- Relevanz: Direkter Fokus auf autonome KI-Agenten.
Autoren: Jiahui Sun, Zhichao Hua, Yubin Xia
Link: arXiv:2503.02403
Subjects: Artificial Intelligence (cs.AI)

2. AppAgentX: Evolving GUI Agents as Proficient Smartphone Users

Beschreibung:
- AppAgentX ist ein Framework zur Entwicklung von GUI-basierten KI-Agenten, die wie kompetente Smartphone-Nutzer agieren können.
- Es nutzt evolutionäre Methoden, um Agenten zu trainieren, die Benutzeroberflächen effektiv navigieren.
- Relevanz: Entwicklung und Optimierung einzelner KI-Agenten mit praktischer Anwendung.
Autoren: Wenjia Jiang, Yangyang Zhuang, Chenxi Song, Xu Yang, Chi Zhang
Link: arXiv:2503.02268
Subjects: Artificial Intelligence (cs.AI)

3. PersonaX: A Recommendation Agent Oriented User Modeling Framework for Long Behavior Sequence

Beschreibung:
- PersonaX ist ein Framework für Empfehlungsagenten, das Nutzermodelle basierend auf langen Verhaltenssequenzen erstellt.
- Es zielt darauf ab, personalisierte Empfehlungen durch agentenbasierte Modellierung zu verbessern.
- Relevanz: Einsatz eines spezialisierten KI-Agenten für Empfehlungssysteme.
Autoren: Yunxiao Shi, Wujiang Xu, Zeqi Zhang, Xing Zi, Qiang Wu, Min Xu
Link: arXiv:2503.02398
Subjects: Information Retrieval (cs.IR); Artificial Intelligence (cs.AI)

4. LTL Verification of Memoryful Neural Agents

Beschreibung:
- Diese Arbeit untersucht die Verifikation von gedächtnisfähigen neuronalen Agenten mit Linear Temporal Logic (LTL).
- Sie adressiert sowohl einzelne Agenten als auch Multi-Agenten-Systeme und bietet eine formale Methode zur Sicherstellung korrekten Verhaltens.
- Relevanz: Verbindung von KI-Agenten mit Multi-Agenten-Systemen und formaler Verifikation.
Autoren: Mehran Hosseini, Alessio Lomuscio, Nicola Paoletti
Link: arXiv:2503.02512
Subjects: Logic in Computer Science (cs.LO); Artificial Intelligence (cs.AI); Machine Learning (cs.LG); Multiagent Systems (cs.MA); Symbolic Computation (cs.SC)

5. MultiAgentBench: Evaluating the Collaboration and Competition of LLM agents

Beschreibung:
- MultiAgentBench ist ein Benchmark zur Bewertung der Zusammenarbeit und des Wettbewerbs von LLM-basierten Agenten.
- Es testet die Fähigkeit von Multi-Agenten-Systemen, komplexe Aufgaben kooperativ oder kompetitiv zu lösen.
- Relevanz: Expliziter Fokus auf Multi-Agenten-Interaktionen mit LLMs.
Autoren: Kunlun Zhu, Hongyi Du, Zhaochen Hong, Xiaocheng Yang, Shuyi Guo, Zhe Wang, Zhenhailong Wang, Cheng Qian, Xiangru Tang, Heng Ji, Jiaxuan You
Link: arXiv:2503.01935
Subjects: Multiagent Systems (cs.MA); Artificial Intelligence (cs.AI); Computation and Language (cs.CL); Computers and Society (cs.CY)

6. UDora: A Unified Red Teaming Framework against LLM Agents by Dynamically Hijacking Their Own Reasoning

Beschreibung:
- UDora ist ein Framework zum Testen der Robustheit von LLM-Agenten durch dynamisches Eingreifen in ihre Reasoning-Prozesse.
- Es simuliert Angriffe auf einzelne Agenten, um Schwächen in deren Entscheidungsfindung aufzudecken.
- Relevanz: Sicherheitsaspekte von KI-Agenten mit potenzieller Erweiterung auf Multi-Agenten-Systeme.
Autoren: Jiawei Zhang, Shuang Yang, Bo Li
Link: arXiv:2503.01908
Subjects: Cryptography and Security (cs.CR); Artificial Intelligence (cs.AI); Machine Learning (cs.LG)

7. Towards Enterprise-Ready Computer Using Generalist Agent

Beschreibung:
- Diese Arbeit untersucht die Nutzung eines generalistischen KI-Agenten für unternehmensfähige Computersysteme.
- Sie adressiert auch Multi-Agenten-Aspekte, indem sie die Koordination zwischen Agenten in verteilten Systemen betrachtet.
- Relevanz: Generalistische Agenten mit Multi-Agenten-Kontext.
Autoren: Sami Marreed, Alon Oved, Avi Yaeli, Segev Shlomov, Ido Levy, Aviad Sela, Asaf Adi, Nir Mashkif
Link: arXiv:2503.01861
Subjects: Distributed, Parallel, and Cluster Computing (cs.DC); Artificial Intelligence (cs.AI); Multiagent Systems (cs.MA)

Liste der arXiv-Veröffentlichungen vom 4. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks

1. SrSv: Integrating Sequential Rollouts with Sequential Value Estimation for Multi-agent Reinforcement Learning

Beschreibung:
- Dieses Paper stellt SrSv vor, ein Framework, das sequentielle Rollouts mit sequentieller Wertschätzung für Multi-Agenten-Verstärkendes Lernen (Reinforcement Learning, RL) integriert.
- Es zielt darauf ab, die Effizienz und Leistung in Multi-Agenten-Szenarien zu verbessern, indem es langfristige Abhängigkeiten berücksichtigt.
- Anwendungsbereich: Multi-Agenten-Systeme mit Schwerpunkt auf kooperativem Verhalten.
Autoren: Xu Wan, Chao Yang, Cheng Yang, Jie Song, Mingyang Sun
Link: arXiv:2503.01458
Subjects: Artificial Intelligence (cs.AI); Machine Learning (cs.LG); Multiagent Systems (cs.MA)

2. Multi-Agent Reinforcement Learning with Long-Term Performance Objectives for Service Workforce Optimization

Beschreibung:
- Diese Arbeit untersucht Multi-Agenten-Verstärkendes Lernen mit langfristigen Leistungszielen zur Optimierung von Service-Arbeitskräften.
- Sie schlägt ein System vor, in dem Agenten kooperativ arbeiten, um Ressourcenallokation und Arbeitsplanung zu verbessern.
- Ergebnisse zeigen eine verbesserte Effizienz in dynamischen Umgebungen.
Autoren: Kareem Eissa, Rayal Prasad, Sarith Mohan, Ankur Kapoor, Dorin Comaniciu, Vivek Singh
Link: arXiv:2503.01069
Subjects: Artificial Intelligence (cs.AI); Multiagent Systems (cs.MA)

3. Human-AI Collaboration: Trade-offs Between Performance and Preferences

Beschreibung:
- Das Paper untersucht die Zusammenarbeit zwischen Mensch und KI als Multi-Agenten-System, wobei die Trade-offs zwischen Leistung und menschlichen Präferenzen analysiert werden.
- Es wird ein Framework vorgeschlagen, um die Interaktion zwischen menschlichen und KI-Agenten zu optimieren.
- Relevanz für Multi-Agenten-Kontexte durch die Betrachtung kooperativer Dynamiken.
Autoren: Lukas William Mayer, Sheer Karny, Jackie Ayoub, Miao Song, Danyang Tian, Ehsan Moradi-Pari, Mark Steyvers
Link: arXiv:2503.00248
Subjects: Artificial Intelligence (cs.AI); Human-Computer Interaction (cs.HC); Multiagent Systems (cs.MA)

4. Agentic AI Needs a Systems Theory

Beschreibung:
- Diese Arbeit argumentiert für die Notwendigkeit einer Systemtheorie für agentische KI, insbesondere in Multi-Agenten-Kontexten.
- Sie untersucht, wie agentische KI-Systeme (selbstständig handelnde Agenten) besser modelliert und koordiniert werden können.
- Theoretischer Ansatz mit praktischen Implikationen für Multi-Agenten-Frameworks.
Autoren: Erik Miehling, Karthikeyan Natesan Ramamurthy, Kush R. Varshney, Matthew Riemer, Djallel Bouneffouf, John T. Richards, Amit Dhurandhar, Elizabeth M. Daly, Michael Hind, Prasanna Sattigeri, Dennis Wei, Ambrish Rawat, Jasmina Gajcin, Werner Geyer
Link: arXiv:2503.00237
Subjects: Artificial Intelligence (cs.AI)

5. Persuade Me if You Can: A Framework for Evaluating Persuasion Effectiveness and Susceptibility Among Large Language Models

Beschreibung:
- Dieses Paper entwickelt ein Framework zur Bewertung der Überzeugungsfähigkeit und Anfälligkeit von LLMs in Multi-Agenten-Interaktionen.
- Es simuliert Szenarien, in denen KI-Agenten versuchen, sich gegenseitig zu überzeugen, und bewertet deren Effektivität.
- Relevanz für Multi-Agenten-Systeme durch den Fokus auf Interaktion und Kooperation.
Autoren: Nimet Beyza Bozdag, Shuhaib Mehri, Gokhan Tur, Dilek Hakkani-Tür
Link: arXiv:2503.01829
Subjects: Computation and Language (cs.CL); Artificial Intelligence (cs.AI); Machine Learning (cs.LG); Multiagent Systems (cs.MA)

6. PodAgent: A Comprehensive Framework for Podcast Generation

Beschreibung:
- PodAgent ist ein umfassendes Framework zur Podcast-Generierung, das Multi-Agenten-KI nutzt.
- Es integriert verschiedene Agenten für Aufgaben wie Skripterstellung, Sprachsynthese und Bearbeitung.
- Demonstriert die Anwendung von Multi-Agenten-Systemen in kreativen Kontexten.
Autoren: Yujia Xiao, Lei He, Haohan Guo, Fenglong Xie, Tan Lee
Link: arXiv:2503.00455
Subjects: Sound (cs.SD); Artificial Intelligence (cs.AI); Multiagent Systems (cs.MA); Multimedia (cs.MM); Audio and Speech Processing (eess.AS)

7. LLMDR: LLM-Driven Deadlock Detection and Resolution in Multi-Agent Pathfinding

Beschreibung:
- Diese Arbeit nutzt Large Language Models (LLMs), um Deadlocks in Multi-Agenten-Pfadfindung zu erkennen und zu lösen.
- Sie schlägt einen Ansatz vor, bei dem KI-Agenten kooperativ Konflikte in dynamischen Umgebungen lösen.
- Praktische Anwendung in Multi-Agenten-Systemen wie Robotik oder Verkehrsmanagement.
Autoren: Seungbae Seo, Junghwan Kim, Minjeong Shin, Bongwon Suh
Link: arXiv:2503.00717
Subjects: Multiagent Systems (cs.MA); Artificial Intelligence (cs.AI)

8. Nucleolus Credit Assignment for Effective Coalitions in Multi-agent Reinforcement Learning

Beschreibung:
- Das Paper führt eine Methode zur Kreditvergabe basierend auf dem Nucleolus-Konzept für effektive Koalitionen im Multi-Agenten-Verstärkenden Lernen ein.
- Es zielt darauf ab, die Zusammenarbeit zwischen Agenten zu verbessern, indem Beiträge fair zugewiesen werden.
- Relevanz für kooperative Multi-Agenten-Systeme.
Autoren: Yugu Li, Zehong Cao, Jianglin Qiao, Siyi Hu
Link: arXiv:2503.00372
Subjects: Multiagent Systems (cs.MA); Artificial Intelligence (cs.AI)

9. Factorized Deep Q-Network for Cooperative Multi-Agent Reinforcement Learning in Victim Tagging

Beschreibung:
- Diese Arbeit schlägt ein faktorisiertes Deep-Q-Network für kooperatives Multi-Agenten-Verstärkendes Lernen im Kontext von Opfermarkierung vor.
- Ziel ist es, die Koordination zwischen Agenten in komplexen Szenarien wie Katastrophenhilfe zu optimieren.
- Praktische Anwendung mit Fokus auf Zusammenarbeit.
Autoren: Maria Ana Cardei, Afsaneh Doryab
Link: arXiv:2503.00684
Subjects: Multiagent Systems (cs.MA); Artificial Intelligence (cs.AI); Machine Learning (cs.LG); Robotics (cs.RO)

10. BixBench: A Comprehensive Benchmark for LLM-based Agents in Computational Biology

Beschreibung:
- BixBench ist ein Benchmark zur Bewertung von LLM-basierten Agenten in der Computational Biology.
- Es testet die Fähigkeit von KI-Agenten, biologische Probleme autonom zu lösen, und könnte auf Multi-Agenten-Szenarien erweitert werden.
- Fokus auf agentische Fähigkeiten in spezialisierten Domänen.
Autoren: Ludovico Mitchener, Jon M Laurent, Benjamin Tenmann, Siddharth Narayanan, Geemi P Wellawatte, Andrew White, Lorenzo Sani, Samuel G Rodriques
Link: arXiv:2503.00096
Subjects: Quantitative Methods (q-bio.QM); Artificial Intelligence (cs.AI)

Liste der arXiv-Veröffentlichungen vom 3. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks

1. ARIES: Autonomous Reasoning with LLMs on Interactive Thought Graph Environments

Beschreibung:
- Das Paper stellt ARIES vor, ein Framework, das autonome Reasoning-Fähigkeiten von Large Language Models (LLMs) in interaktiven Denkgraph-Umgebungen untersucht.
- Es nutzt strukturierte Graphen, um komplexe Problemlösungen zu ermöglichen, und zeigt, wie LLMs als eigenständige Agenten agieren können.
- Die Arbeit demonstriert die Anwendung anhand praktischer Beispiele und bewertet die Leistung in dynamischen Szenarien.
Link: arXiv:2502.21208

2. ProAI: Proactive Multi-Agent Conversational AI with Structured Knowledge Base for Psychiatric Diagnosis

Beschreibung:
- ProAI ist ein proaktives Multi-Agenten-System, das auf konversationeller KI basiert und eine strukturierte Wissensbasis für psychiatrische Diagnosen nutzt.
- Das System integriert mehrere KI-Agenten, die kooperativ arbeiten, um präzise Diagnosen zu stellen und Patienteninteraktionen zu verbessern.
- Es wird die Wirksamkeit anhand von Fallstudien gezeigt, wobei der Fokus auf Verantwortlichkeit und Genauigkeit liegt.
Link: arXiv:2502.20689

3. Among Them: A game-based framework for assessing persuasion capabilities of LLMs

Beschreibung:
- Dieses Paper beschreibt ein spielbasiertes Framework zur Bewertung der Überzeugungsfähigkeiten von LLMs als Agenten in Multi-Agenten-Interaktionen.
- Es simuliert Szenarien, in denen LLMs miteinander konkurrieren oder kooperieren, um persuasive Strategien zu testen.
- Die Ergebnisse bieten Einblicke in die sozialen Fähigkeiten von KI-Agenten und deren Potenzial in realistischen Anwendungen.
Link: arXiv:2502.20426

Liste der arXiv-Veröffentlichungen vom 28. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Multi-Agent Verification: Scaling Test-Time Compute with Multiple Verifiers
- Proposes a multi-agent approach to verification tasks.
- Utilizes multiple verifiers to scale test-time compute efficiently.
- Aims to improve the accuracy and reliability of verification processes.
  Link
EAIRA: Establishing a Methodology for Evaluating AI Models as Scientific Research Assistants
- Develops a comprehensive methodology for assessing AI models.
- Focuses on AI’s role as assistants in scientific research.
- Establishes benchmarks and standards for evaluating AI’s effectiveness in research settings.
  Link
Evaluating Human Trust in LLM-Based Planners: A Preliminary Study
- Investigates how humans trust large language model (LLM)-based planners.
- Conducts a preliminary study to understand trust dynamics.
- Provides insights into improving human-AI collaboration in planning tasks.
  Link
AI Will Always Love You: Studying Implicit Biases in Romantic AI Companions
- Examines implicit biases in AI designed as romantic companions.
- Analyzes how these biases affect user interactions and perceptions.
- Discusses the ethical implications and potential mitigation strategies.
  Link
Optimus-2: Multimodal Minecraft Agent with Goal-Observation-Action Conditioned Policy
- Introduces Optimus-2, an advanced multimodal agent for Minecraft.
- Employs a policy conditioned on goals, observations, and actions.
- Demonstrates enhanced performance and adaptability in complex environments.
  Link
Developmental Support Approach to AI’s Autonomous Growth: Toward the Realization of a Mutually Beneficial Stage Through Experiential Learning
- Proposes a developmental support framework for AI’s autonomous growth.
- Emphasizes experiential learning to achieve mutual benefits.
- Explores the potential for AI to evolve in a human-aligned manner.
  Link
Agentic Mixture-of-Workflows for Multi-Modal Chemical Search
- Presents an agentic approach combining multiple workflows.
- Focuses on multi-modal chemical search applications.
- Enhances search efficiency and accuracy in chemical databases.
  Link
Program Synthesis Dialog Agents for Interactive Decision-Making
- Develops dialog agents specialized in program synthesis.
- Facilitates interactive decision-making between humans and AI.
- Aims to streamline and improve the coding process through dialogue.
  Link
Sim-to-Real Reinforcement Learning for Vision-Based Dexterous Manipulation on Humanoids
- Explores reinforcement learning for dexterous manipulation tasks.
- Bridges the sim-to-real gap for vision-based control on humanoids.
- Demonstrates practical applications in robotic manipulation.
  Link
Physics-Driven Data Generation for Contact-Rich Manipulation via Trajectory Optimization
- Introduces a method for generating data using physics-driven simulations.
- Focuses on contact-rich manipulation tasks.
- Utilizes trajectory optimization to enhance data quality and relevance.
  Link
Deep Reinforcement Learning based Autonomous Decision-Making for Cooperative UAVs: A Search and Rescue Real World Application
- Applies deep reinforcement learning to cooperative UAVs.
- Focuses on autonomous decision-making in search and rescue scenarios.
- Demonstrates real-world applicability and effectiveness.
  Link
M^3Builder: A Multi-Agent System for Automated Machine Learning in Medical Imaging
- Presents M^3Builder, a multi-agent system for automated machine learning.
- Tailored for applications in medical imaging.
- Streamlines the process of model development and deployment.
  Link
Collab-Overcooked: Benchmarking and Evaluating Large Language Models as Collaborative Agents
- Introduces Collab-Overcooked, a benchmark for evaluating LLMs.
- Assesses LLMs‘ capabilities as collaborative agents.
- Provides insights into improving multi-agent collaboration.
  Link
Exponential Topology-enabled Scalable Communication in Multi-agent Reinforcement Learning
- Proposes a communication framework for multi-agent reinforcement learning.
- Utilizes exponential topology to enable scalable interactions.
- Enhances coordination and performance in large-scale multi-agent systems.
  Link

Liste der arXiv-Veröffentlichungen vom 27. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

TheoremExplainAgent: Towards Multimodal Explanations for LLM Theorem Understanding

Beschreibung:
- Entwickelt einen KI-Agenten, der multimodale Erklärungen für das Verständnis mathematischer Theoreme durch große Sprachmodelle liefert.
- Nutzt eine Kombination aus Text, Bildern und Sprache, um komplexe Konzepte verständlich zu machen.
- Zeigt Anwendungen in der Bildung und Forschung zur Verbesserung der Interpretierbarkeit von KI.
Link: https://arxiv.org/abs/2502.19400

Multi-Agent Security Tax: Trading Off Security and Collaboration Capabilities in Multi-Agent Systems

Beschreibung:
- Untersucht die Balance zwischen Sicherheitsmaßnahmen und Kooperationsfähigkeit in Multi-Agenten-Systemen.
- Schlägt ein Modell vor, das Sicherheitskosten quantifiziert und die Zusammenarbeit der Agenten optimiert.
- Präsentiert Ergebnisse, die für die Entwicklung sicherer und effizienter Multi-Agenten-Frameworks relevant sind.
Link: https://arxiv.org/abs/2502.19145

A Temporal Planning Framework for Multi-Agent Systems via LLM-Aided Knowledge Base Management

Beschreibung:
- Stellt ein zeitliches Planungsframework für Multi-Agenten-Systeme vor, das große Sprachmodelle zur Verwaltung von Wissensdatenbanken nutzt.
- Ermöglicht Agenten, dynamische Umgebungen zu koordinieren und zeitabhängige Aufgaben zu lösen.
- Demonstriert die Anwendbarkeit in Robotik und komplexen Entscheidungsszenarien.
Link: https://arxiv.org/abs/2502.19135

Nexus: A Lightweight and Scalable Multi-Agent Framework for Complex Tasks Automation

Beschreibung:
- Präsentiert Nexus, ein leichtgewichtiges und skalierbares Multi-Agenten-Framework zur Automatisierung komplexer Aufgaben.
- Betont die Flexibilität und Effizienz bei der Verteilung von Aufgaben unter mehreren Agenten.
- Zeigt praktische Einsatzmöglichkeiten in Softwareentwicklung und Systemadministration.
Link: https://arxiv.org/abs/2502.19091

Multi-LLM Collaborative Search for Complex Problem Solving

Beschreibung:
- Entwickelt ein Multi-Agenten-System, bei dem mehrere große Sprachmodelle kollaborativ komplexe Probleme lösen.
- Beschreibt, wie Agenten Informationen suchen, teilen und kombinieren, um präzise Lösungen zu finden.
- Liefert Ergebnisse, die die Effektivität dieses Ansatzes im Vergleich zu Einzelmodellen zeigen.
Link: https://arxiv.org/abs/2502.18873

REALM-Bench: A Real-World Planning Benchmark for LLMs and Multi-Agent Systems

Beschreibung:
- Stellt REALM-Bench vor, einen Benchmark zur Bewertung von Planungsfähigkeiten großer Sprachmodelle und Multi-Agenten-Systemen in realen Szenarien.
- Testet die Fähigkeit der Agenten, realistische und komplexe Planungsaufgaben zu bewältigen.
- Bietet eine Grundlage für die Weiterentwicklung von KI-Planungstechnologien.
Link: https://arxiv.org/abs/2502.18836

Data-Efficient Multi-Agent Spatial Planning with LLMs

Beschreibung:
- Schlägt ein dateneffizientes Multi-Agenten-System für räumliche Planung vor, unterstützt durch große Sprachmodelle.
- Ermöglicht Agenten, mit minimalen Daten effektiv in physischen Umgebungen zu navigieren und zu planen.
- Präsentiert Ergebnisse aus Simulationen, die die Praxistauglichkeit bestätigen.
Link: https://arxiv.org/abs/2502.18822

Independent Mobility GPT (IDM-GPT): A Self-Supervised Multi-Agent Large Language Model Framework for Customized Traffic Mobility Analysis Using Machine Learning Models

Beschreibung:
- Entwickelt IDM-GPT, ein Multi-Agenten-Framework zur Analyse von Verkehrsmobilität mit selbstüberwachtem Lernen.
- Integriert maschinelles Lernen, um personalisierte Mobilitätslösungen für verschiedene Agenten zu erstellen.
- Zeigt Anwendungen in der Verkehrsplanung und Optimierung von Mobilitätsströmen.
Link: https://arxiv.org/abs/2502.18652

Liste der arXiv-Veröffentlichungen vom 26. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

MAPoRL: Multi-Agent Post-Co-Training for Collaborative Large Language Models with Reinforcement Learning
- Beschreibung:
  - Das Paper stellt MAPoRL vor, eine Methode zur Verbesserung kollaborativer großer Sprachmodelle durch Multi-Agenten-Post-Training mit Verstärkendem Lernen.
  - Es untersucht, wie Agenten gemeinsam trainiert werden können, um ihre Leistung bei kooperativen Aufgaben zu steigern.
  - Die Ergebnisse zeigen eine erhöhte Effizienz und Genauigkeit im Vergleich zu Einzelagenten-Ansätzen.
- Link: arXiv:2502.18439
ChatMotion: A Multimodal Multi-Agent for Human Motion Analysis
- Beschreibung:
  - ChatMotion ist ein Multi-Agenten-System, das multimodale Daten nutzt, um menschliche Bewegungen zu analysieren.
  - Es kombiniert verschiedene KI-Agenten, die jeweils auf spezifische Aspekte der Bewegungsanalyse spezialisiert sind, wie z. B. visuelle oder sensorische Daten.
  - Die Arbeit hebt die Anwendung in Bereichen wie Sport und Rehabilitation hervor.
- Link: arXiv:2502.18180
ToMCAT: Theory-of-Mind for Cooperative Agents in Teams via Multiagent Diffusion Policies
- Beschreibung:
  - ToMCAT integriert Theory-of-Mind-Konzepte in Multi-Agenten-Systeme, um die Kooperation in Teams zu verbessern.
  - Es verwendet diffusionsbasierte Richtlinien, um die Entscheidungsfindung von Agenten in dynamischen Umgebungen zu optimieren.
  - Die Methode zeigt eine verbesserte Teamleistung durch besseres Verständnis der Absichten anderer Agenten.
- Link: arXiv:2502.18438
Socratic: Enhancing Human Teamwork via AI-enabled Coaching
- Beschreibung:
  - Socratic ist ein KI-gestütztes Multi-Agenten-System, das menschliche Teams durch Coaching unterstützt.
  - Es analysiert Teamdynamiken und bietet Echtzeit-Feedback, um die Zusammenarbeit zu fördern.
  - Die Arbeit demonstriert die Anwendung in realen Szenarien und zeigt Verbesserungen in der Teamleistung.
- Link: arXiv:2502.17643
MRBTP: Efficient Multi-Robot Behavior Tree Planning and Collaboration
- Beschreibung:
  - MRBTP entwickelt eine effiziente Planungsmethode für Multi-Roboter-Systeme basierend auf Verhaltensbäumen.
  - Es optimiert die Zusammenarbeit mehrerer Roboteragenten in komplexen Aufgabenstellungen.
  - Die Ergebnisse zeigen eine Reduktion der Planungszeit und eine verbesserte Koordination.
- Link: arXiv:2502.18072
CAML: Collaborative Auxiliary Modality Learning for Multi-Agent Systems
- Beschreibung:
  - CAML schlägt ein Lernparadigma vor, das Multi-Agenten-Systeme durch kollaborative Nutzung zusätzlicher Modalitäten verbessert.
  - Es ermöglicht Agenten, Informationen aus verschiedenen Quellen zu integrieren, um bessere Entscheidungen zu treffen.
  - Die Methode wird anhand von Simulationen validiert, die eine erhöhte Robustheit zeigen.
- Link: arXiv:2502.17821
RAG-Enhanced Collaborative LLM Agents for Drug Discovery
- Beschreibung:
  - Dieses Paper beschreibt kollaborative LLM-Agenten, die mit Retrieval-Augmented Generation (RAG) für die Arzneimittelforschung verbessert werden.
  - Mehrere Agenten arbeiten zusammen, um Wissen aus Datenbanken zu nutzen und Hypothesen zu generieren.
  - Die Ergebnisse deuten auf eine beschleunigte Entdeckung neuer Medikamente hin.
- Link: arXiv:2502.17506
Smart and Efficient IoT-Based Irrigation System Design: Utilizing a Hybrid Agent-Based and System Dynamics Approach
- Beschreibung:
  - Diese Arbeit präsentiert ein intelligentes Bewässerungssystem, das auf einem hybriden Multi-Agenten-Ansatz basiert.
  - Agenten modellieren individuelle Komponenten des Systems, während Systemdynamiken die Gesamtinteraktionen abbilden.
  - Die Lösung zeigt eine effizientere Wassernutzung in IoT-Anwendungen.
- Link: arXiv:2502.18298

Liste der arXiv-Veröffentlichungen vom 25. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

1. A Multi-LLM-Agent-Based Framework for Economic and Public Policy Analysis

Beschreibung:
- Das Paper entwickelt ein System, das mehrere Large Language Models (LLMs) als kollaborative Agenten einsetzt, um wirtschaftliche und politische Analysen durchzuführen.
- Es zeigt, wie diese Agenten Daten analysieren, Hypothesen testen und politische Szenarien simulieren können.
- Die Ergebnisse werden anhand realer Fallstudien validiert, die die praktische Anwendbarkeit demonstrieren.
Link: arXiv:2502.16879

2. Toward Dependency Dynamics in Multi-Agent Reinforcement Learning for Traffic Signal Control

Beschreibung:
- Diese Arbeit untersucht ein Multi-Agenten-Reinforcement-Learning-Modell zur Optimierung von Verkehrssignalen unter Berücksichtigung dynamischer Abhängigkeiten zwischen Agenten.
- Sie zeigt, wie koordinierte Entscheidungen den Verkehrsfluss verbessern und Staus reduzieren können.
- Experimentelle Evaluationen vergleichen den Ansatz mit traditionellen Methoden und belegen eine höhere Effizienz.
Link: arXiv:2502.16608

3. Does Your AI Agent Get You? A Personalizable Framework for Approximating Human Models from Argumentation-based Dialogue Traces

Beschreibung:
- Das Paper schlägt einen anpassbaren KI-Agenten vor, der menschliche Verhaltensmodelle aus Dialogspuren ableitet, um personalisierte Interaktionen zu ermöglichen.
- Es nutzt argumentationsbasierte Ansätze, um Präferenzen und Entscheidungsprozesse zu modellieren.
- Die Methode wird anhand von Beispieldaten getestet und bietet Einblicke in verbesserte Mensch-Maschine-Kooperation.
Link: arXiv:2502.16376

4. MobileSteward: Integrating Multiple App-Oriented Agents with Self-Evolution to Automate Cross-App Instructions

Beschreibung:
- MobileSteward ist ein Multi-Agenten-System, das app-spezifische Agenten integriert, um plattformübergreifende Aufgaben zu automatisieren.
- Es verwendet Selbstentwicklungstechniken, um die Agentenleistung kontinuierlich zu verbessern und komplexe Workflows zu bewältigen.
- Die Arbeit zeigt praktische Anwendungen, wie z. B. die Automatisierung von Smartphone-Aufgaben, mit hoher Erfolgsquote.
Link: arXiv:2502.16796

5. Curie: Toward Rigorous and Automated Scientific Experimentation with AI Agents

Beschreibung:
- Curie ist ein Framework, das KI-Agenten einsetzt, um wissenschaftliche Experimente automatisiert und systematisch durchzuführen.
- Es kombiniert maschinelles Lernen mit agentenbasierten Strategien, um Hypothesen zu testen und Daten effizient zu analysieren.
- Die Validierung erfolgt in verschiedenen wissenschaftlichen Bereichen, was die Vielseitigkeit des Ansatzes zeigt.
Link: arXiv:2502.16069

6. PlanGEN: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories for Complex Problem Solving

Beschreibung:
- PlanGEN nutzt mehrere Agenten, um Planungs- und Reasoning-Prozesse für komplexe Probleme zu generieren und zu optimieren.
- Es zeigt, wie kollaborative Agenten schrittweise Lösungspfade entwickeln und anpassen können.
- Die Arbeit demonstriert die Überlegenheit des Ansatzes in Szenarien mit hoher Komplexität, wie z. B. Logistikproblemen.
Link: arXiv:2502.16111

7. PMAT: Optimizing Action Generation Order in Multi-Agent Reinforcement Learning

Beschreibung:
- PMAT optimiert die Reihenfolge der Aktionen in Multi-Agenten-Reinforcement-Learning-Systemen, um die Koordination zu verbessern.
- Es untersucht, wie die zeitliche Abfolge von Entscheidungen die Gesamtleistung in dynamischen Umgebungen beeinflusst.
- Simulationen zeigen eine signifikante Verbesserung gegenüber Standard-Reinforcement-Learning-Ansätzen.
Link: arXiv:2502.16496

8. Together We Rise: Optimizing Real-Time Multi-Robot Task Allocation using Coordinated Heterogeneous Plays

Beschreibung:
- Diese Arbeit entwickelt ein Multi-Agenten-Framework für die Echtzeit-Aufgabenverteilung bei Robotern mit unterschiedlichen Fähigkeiten.
- Es nutzt koordinierte Strategien, um die Zusammenarbeit zu maximieren und Aufgaben effizient zu lösen.
- Die Methode wird in realen Szenarien getestet und zeigt eine höhere Flexibilität und Leistung.
Link: arXiv:2502.16079

9. Multi-Agent Autonomous Driving Systems with Large Language Models: A Survey of Recent Advances

Beschreibung:
- Das Paper bietet eine Übersicht über Multi-Agenten-Systeme im autonomen Fahren, die Large Language Models integrieren.
- Es beleuchtet, wie LLMs die Kommunikation und Entscheidungsfindung zwischen Fahrzeugen verbessern können.
- Zudem werden aktuelle Herausforderungen und zukünftige Forschungsperspektiven diskutiert.
Link: arXiv:2502.16804

10. The Hidden Strength of Disagreement: Unraveling the Consensus-Diversity Tradeoff in Adaptive Multi-Agent Systems

Beschreibung:
- Diese Studie analysiert die Rolle von Meinungsverschiedenheiten in Multi-Agenten-Systemen und deren Einfluss auf Konsens und Diversität.
- Sie zeigt, dass kontrollierte Divergenz die Anpassungsfähigkeit und Robustheit des Systems steigern kann.
- Simulationen untermauern die These, dass ein Gleichgewicht zwischen Einigkeit und Vielfalt die beste Leistung erzielt.
Link: arXiv:2502.16565

11. Discovery and Deployment of Emergent Robot Swarm Behaviors via Representation Learning and Real2Sim2Real Transfer

Beschreibung:
- Diese Arbeit untersucht die Entdeckung und Anwendung von Schwarmverhalten bei Robotern durch Multi-Agenten-Systeme.
- Sie nutzt Repräsentationslernen und Real2Sim2Real-Transfer, um emergente Verhaltensweisen zu identifizieren und zu übertragen.
- Die Ergebnisse zeigen erfolgreiche Anwendungen in realen Roboterschwärmen mit hoher Skalierbarkeit.
Link: arXiv:2502.15937

12. Reproducibility Study of Cooperation, Competition, and Maliciousness: LLM-Stakeholders Interactive Negotiation

Beschreibung:
- Das Paper untersucht die Reproduzierbarkeit von Kooperation, Wettbewerb und Böswilligkeit in einem Multi-Agenten-System mit LLMs.
- Es simuliert Verhandlungen zwischen Agenten, die verschiedene Stakeholder repräsentieren, und analysiert deren Interaktionen.
- Die Ergebnisse bieten Einblicke in die Dynamik von Multi-Agenten-Verhandlungen und deren Stabilität.
Link: arXiv:2502.16242

13. Level-Navi Agent: A Framework and Benchmark for Chinese Web Search Agents

Beschreibung:
- Dieses Paper stellt einen KI-Agenten-Rahmen für chinesische Websuchen vor, der als Benchmark dient.
- Es zeigt, wie Agenten komplexe Suchanfragen effizient bearbeiten und relevante Ergebnisse liefern können.
- Der Ansatz wird mit anderen Suchsystemen verglichen und zeigt überlegene Leistung bei sprachspezifischen Aufgaben.
Link: arXiv:2502.15690

14. Toward Agentic AI: Generative Information Retrieval Inspired Intelligent Communications and Networking

Beschreibung:
- Die Arbeit schlägt ein agentenbasiertes KI-System vor, das generative Informationsretrieval für intelligente Kommunikation nutzt.
- Es untersucht, wie Agenten Netzwerke optimieren und Daten effizient abrufen können, inspiriert von Multi-Agenten-Ansätzen.
- Die Ergebnisse deuten auf Potenzial für verbesserte 6G-Netzwerke hin.
Link: arXiv:2502.16866

15. Space-O-RAN: Enabling Intelligent, Open, and Interoperable Non Terrestrial Networks in 6G

Beschreibung:
- Dieses Paper beschreibt ein Multi-Agenten-System für intelligente, offene und interoperable nicht-terrestrische Netzwerke in 6G.
- Es zeigt, wie Agenten zusammenarbeiten, um Netzwerkressourcen zu verwalten und Kommunikation zu optimieren.
- Der Ansatz wird als zukunftssicher für satellitengestützte Netzwerke präsentiert.
Link: arXiv:2502.15936

Liste der arXiv-Veröffentlichungen vom 24. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

1. AutoToM: Automated Bayesian Inverse Planning and Model Discovery for Open-ended Theory of Mind

Beschreibung:
- Das Paper stellt AutoToM vor, ein automatisiertes System zur Rückschlussplanung und Modellentdeckung für eine offene Theorie des Geistes (Theory of Mind) mit Bayesianischen Methoden.
- Es nutzt KI-Agenten, um menschliches Verhalten zu modellieren und deren mentale Zustände zu verstehen, mit einem Fokus auf skalierbare und flexible Ansätze.
- Die Ergebnisse zeigen Anwendungen in sozialer Kognition und Mensch-Maschine-Interaktion.
Link: arXiv:2502.15676

2. Superintelligent Agents Pose Catastrophic Risks: Can Scientist AI Offer a Safer Path?

Beschreibung:
- Diese Arbeit untersucht die Risiken superintelligenter KI-Agenten und deren potenzielle katastrophale Auswirkungen auf die Menschheit.
- Es wird ein Konzept für „Scientist AI“ vorgeschlagen, ein sichererer KI-Agententyp, der wissenschaftliche Entdeckungen fördert, ohne uncontrollierte Autonomie.
- Die Autoren diskutieren ethische und technische Herausforderungen sowie mögliche Lösungsansätze.
Link: arXiv:2502.15657

3. Measuring AI agent autonomy: Towards a scalable approach with code inspection

Beschreibung:
- Das Paper entwickelt eine skalierbare Methode zur Messung der Autonomie von KI-Agenten durch Code-Inspektion.
- Es zielt darauf ab, die Entscheidungsfindung und Handlungsfähigkeit von Agenten in verschiedenen Kontexten zu quantifizieren.
- Die vorgeschlagene Technik wird anhand praktischer Beispiele validiert und bietet Einblicke in die Entwicklung sicherer KI-Systeme.
Link: arXiv:2502.15212

4. TAG: A Decentralized Framework for Multi-Agent Hierarchical Reinforcement Learning

Beschreibung:
- TAG ist ein dezentrales Framework für hierarchisches Reinforcement Learning in Multi-Agenten-Systemen.
- Es ermöglicht die Koordination mehrerer Agenten durch eine strukturierte Aufgabenverteilung und verbessert die Effizienz in komplexen Umgebungen.
- Die Arbeit zeigt experimentelle Ergebnisse, die die Skalierbarkeit und Robustheit des Ansatzes belegen.
Link: arXiv:2502.15425

5. Multi-Agent Architecture in Distributed Environment Control Systems: vision, challenges, and opportunities

Beschreibung:
- Diese Studie skizziert eine Multi-Agenten-Architektur für verteilte Umgebungskontrollsysteme und beleuchtet deren Vision sowie Herausforderungen.
- Sie hebt die Rolle von autonomen Agenten bei der Optimierung von Ressourcen und der Anpassung an dynamische Bedingungen hervor.
- Zudem werden zukünftige Möglichkeiten für die Integration in reale Anwendungen diskutiert.
Link: arXiv:2502.15663

6. EgoSpeak: Learning When to Speak for Egocentric Conversational Agents in the Wild

Beschreibung:
- EgoSpeak ist ein Modell für egocentrische konversationelle Agenten, das entscheidet, wann sie in natürlichen Umgebungen sprechen sollen.
- Es kombiniert visuelle und sprachliche Daten, um situationsgerechte Interaktionen zu ermöglichen, und nutzt maschinelles Lernen für verbesserte Anpassungsfähigkeit.
- Die Ergebnisse zeigen eine gesteigerte Benutzerfreundlichkeit und Kontextsensibilität im Vergleich zu herkömmlichen Ansätzen.
Link: arXiv:2502.14892

Liste der arXiv-Veröffentlichungen vom 21. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Die Methode bietet Einblicke in die Gestaltung sicherer und effizienter Interaktionen.

Optimizing Model Selection for Compound AI Systems
Link: arXiv:2502.14815

Beschreibung:

Dieses Paper untersucht die Modellselektion für zusammengesetzte KI-Systeme mit Multi-Agenten-Architekturen.

Es schlägt optimierte Ansätze vor, um die Zusammenarbeit zwischen Agenten zu verbessern und die Gesamtleistung zu steigern.

Experimentelle Ergebnisse zeigen eine erhöhte Effizienz in komplexen KI-Anwendungen.

Building reliable sim driving agents by scaling self-play
Link: arXiv:2502.14706

Beschreibung:

Die Arbeit entwickelt zuverlässige Fahragenten für Simulationen durch skaliertes Selbstspiel in einem Multi-Agenten-Setup.

Agenten lernen durch gegenseitige Interaktionen, um robuste Fahrstrategien in dynamischen Umgebungen zu entwickeln.

Die Methode zeigt eine verbesserte Anpassungsfähigkeit und Sicherheit in simulierten Szenarien.

Plan-over-Graph: Towards Parallelable LLM Agent Schedule
Link: arXiv:2502.14563

Beschreibung:

Plan-over-Graph ist ein Framework für parallele LLM-Agenten-Planung in Multi-Agenten-Systemen.

Es nutzt Graphstrukturen, um Agentenpläne zu koordinieren und parallele Ausführung zu ermöglichen.

Tests zeigen eine erhöhte Effizienz und Skalierbarkeit bei der Aufgabenverteilung.

FlowAgent: Achieving Compliance and Flexibility for Workflow Agents
Link: arXiv:2502.14345

Beschreibung:

FlowAgent ist ein Multi-Agenten-Framework, das Konformität und Flexibilität in Workflow-Agenten integriert.

Agenten passen sich dynamisch an Arbeitsabläufe an, während sie regulatorische Anforderungen einhalten.

Die Methode verbessert die Workflow-Automatisierung in komplexen Umgebungen.

Causal Mean Field Multi-Agent Reinforcement Learning
Link: arXiv:2502.14200

Beschreibung:

Dieses Paper stellt ein kausales Mean-Field-Modell für Multi-Agenten-Verstärkungslernen vor.

Es modelliert kausale Beziehungen zwischen Agenten, um koordinierte Entscheidungen in großen Systemen zu optimieren.

Ergebnisse zeigen eine verbesserte Skalierbarkeit und Leistung in verteilten Szenarien.

Multi-Agent Coordination across Diverse Applications: A Survey
Link: arXiv:2502.14743

Beschreibung:

Diese Übersicht analysiert Multi-Agenten-Koordination in verschiedenen Anwendungen wie Robotik und Spielen.

Sie identifiziert zentrale Herausforderungen und Techniken zur Verbesserung der Zusammenarbeit zwischen Agenten.

Die Arbeit bietet Einblicke in aktuelle Trends und zukünftige Forschungsrichtungen.

Ranking Joint Policies in Dynamic Games using Evolutionary Dynamics
Link: arXiv:2502.14724

Beschreibung:

Das Paper nutzt evolutionäre Dynamiken, um gemeinsame Policies in dynamischen Multi-Agenten-Spielen zu bewerten.

Agenten entwickeln Strategien kollaborativ, wobei ihre Leistung anhand von Rangfolgen optimiert wird.

Simulationen zeigen eine erhöhte Effektivität in komplexen Spielszenarien.

Multi-Agent Risks from Advanced AI
Link: arXiv:2502.14143

Beschreibung:

Die Arbeit untersucht Risiken von fortgeschrittenen KI-Systemen in Multi-Agenten-Kontexten.

Sie analysiert potenzielle Konflikte und Sicherheitsprobleme, die aus der Interaktion autonomer Agenten entstehen.

Vorschläge zur Risikominderung werden anhand theoretischer Modelle diskutiert.

Human-Artificial Interaction in the Age of Agentic AI: A System-Theoretical Approach
Link: arXiv:2502.14000

Beschreibung:

Dieses Paper entwickelt einen systemtheoretischen Ansatz für Mensch-KI-Interaktionen mit agentischer KI.

Multi-Agenten-Systeme werden modelliert, um die Dynamik zwischen menschlichen und künstlichen Akteuren zu verstehen.

Liste der arXiv-Veröffentlichungen vom 20. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Simulationen zeigen eine verbesserte Verkehrsflusssteuerung durch kooperative Agenten.

Causes and Strategies in Multiagent Systems
Link: arXiv:2502.13701

Beschreibung:

Das Paper untersucht Ursachen und Strategien in Multi-Agenten-Systemen, um deren Entscheidungsprozesse zu verbessern.

Es analysiert, wie Agenten durch kausale Zusammenhänge und koordinierte Strategien komplexe Aufgaben lösen können.

Die Ergebnisse werden anhand theoretischer Modelle und praktischer Beispiele validiert.

Vision-Based Generic Potential Function for Policy Alignment in Multi-Agent Reinforcement Learning
Link: arXiv:2502.13430

Beschreibung:

Dieses Paper schlägt eine visionsbasierte generische Potentialfunktion vor, um Richtlinien in Multi-Agenten-Verstärkungslernen abzustimmen.

Die Methode nutzt visuelle Informationen, um die Koordination zwischen Agenten zu optimieren und Konflikte zu minimieren.

Experimente zeigen eine erhöhte Effizienz und Stabilität in dynamischen Umgebungen.

Integration of Agentic AI with 6G Networks for Mission-Critical Applications: Use-case and Challenges
Link: arXiv:2502.13476

Beschreibung:

Die Arbeit untersucht die Integration von agentischer KI mit 6G-Netzwerken für missionskritische Anwendungen wie Katastrophenmanagement.

Sie beschreibt einen Use-Case, bei dem autonome Agenten in Echtzeit Entscheidungen treffen, und identifiziert technische Herausforderungen wie Latenz und Skalierbarkeit.

Lösungsvorschläge umfassen adaptive Algorithmen und robuste Kommunikationsprotokolle.

Autellix: An Efficient Serving Engine for LLM Agents as General Programs
Link: arXiv:2502.13965

Beschreibung:

Autellix ist ein effizientes Serving-Framework, das LLM-Agenten als allgemeine Programme unterstützt, um komplexe Aufgaben zu bewältigen.

Es optimiert die Ressourcennutzung und Reaktionszeit durch parallele Verarbeitung und dynamische Lastverteilung.

Die Evaluation zeigt eine deutliche Verbesserung der Leistung im Vergleich zu herkömmlichen Ansätzen.

Decentralized Planning Using Probabilistic Hyperproperties
Link: arXiv:2502.13621

Beschreibung:

Das Paper stellt eine Methode für dezentrale Planung in Multi-Agenten-Systemen vor, die probabilistische Hyperproperties nutzt.

Agenten koordinieren sich autonom unter Unsicherheit, indem sie Wahrscheinlichkeitsmodelle für Zustände und Aktionen verwenden.

Die Methode wird anhand eines Szenarios getestet und zeigt verbesserte Robustheit und Flexibilität.

Learning Symbolic Task Decompositions for Multi-Agent Teams
Link: arXiv:2502.13376

Beschreibung:

Diese Arbeit entwickelt ein Lernverfahren zur symbolischen Aufgabenzerlegung für Multi-Agenten-Teams.

Es ermöglicht Agenten, komplexe Aufgaben in kleinere, koordinierte Teilaufgaben zu zerlegen, um die Effizienz zu steigern.

Ergebnisse demonstrieren eine höhere Erfolgsquote bei der Ausführung kollaborativer Aufgaben.

Conditional Max-Sum for Asynchronous Multiagent Decision Making
Link: arXiv:2502.13194

Beschreibung:

Das Paper präsentiert eine erweiterte Max-Sum-Methode für asynchrone Entscheidungsfindung in Multi-Agenten-Systemen.

Sie berücksichtigt bedingte Abhängigkeiten zwischen Agenten, um Konflikte zu lösen und Entscheidungen zu optimieren.

Die Methode zeigt in Simulationen eine bessere Skalierbarkeit und Genauigkeit.

HedgeAgents: A Balanced-aware Multi-agent Financial Trading System
Link: arXiv:2502.13165

Beschreibung:

HedgeAgents ist ein Multi-Agenten-System für den Finanzhandel, das auf ausgewogener Risikoverteilung basiert.

Agenten arbeiten zusammen, um Marktunsicherheiten zu managen und Handelsstrategien dynamisch anzupassen.

Tests zeigen eine verbesserte Stabilität und Rentabilität im Vergleich zu einzelnen Agenten.

Multi-Agent Actor-Critic Generative AI for Query Resolution and Analysis
Link: arXiv:2502.13164

Beschreibung:

Diese Arbeit stellt eine generative KI vor, die den Actor-Critic-Ansatz für Multi-Agenten-Abfragebearbeitung nutzt.

Agenten analysieren und lösen komplexe Anfragen kollaborativ, indem sie generative Modelle mit Verstärkungslernen kombinieren.

Die Methode zeigt hohe Genauigkeit und Effizienz bei der Verarbeitung von Anfragedaten.

Understanding Dynamic Diffusion Process of LLM-based Agents under Information Asymmetry
Link: arXiv:2502.13160

Beschreibung:

Das Paper untersucht den Diffusionsprozess von LLM-basierten Agenten unter Informationsasymmetrie in Multi-Agenten-Systemen.

Es modelliert, wie Agenten Wissen austauschen und Entscheidungen treffen, wenn Informationen ungleich verteilt sind.

Ergebnisse zeigen Einflüsse auf Kooperation und Effizienz in dynamischen Szenarien.

Communication Strategy on Macro-and-Micro Traffic State in Cooperative Deep Reinforcement Learning for Regional Traffic Signal Control
Link: arXiv:2502.13248

Beschreibung:

Die Arbeit entwickelt eine Kommunikationsstrategie für Multi-Agenten-Systeme zur Steuerung regionaler Verkehrssignale.

Sie nutzt tiefes Verstärkungslernen, um makro- und mikroskopische Verkehrszustände zu koordinieren und Staus zu reduzieren.

Liste der arXiv-Veröffentlichungen vom 19. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Die Methode zeigt Verbesserungen in der Informationsverarbeitung und Benutzerinteraktion.

Agentic Deep Graph Reasoning Yields Self-Organizing Knowledge Networks
Link: arXiv:2502.13025

Beschreibung:

Dieses Paper präsentiert eine agentische Methode für tiefes Graph-Reasoning, die selbstorganisierende Wissensnetzwerke erzeugt.

Ein Multi-Agenten-System nutzt Graphstrukturen, um Wissen dynamisch zu organisieren und komplexe Probleme zu lösen.

Die Ergebnisse zeigen eine verbesserte Anpassungsfähigkeit und Effizienz in Wissensrepräsentationen.

You need to MIMIC to get FAME: Solving Meeting Transcript Scarcity with a Multi-Agent Conversations
Link: arXiv:2502.13001

Beschreibung:

Das Paper schlägt ein Multi-Agenten-System vor, um die Knappheit von Besprechungsprotokollen durch simulierte Konversationen zu lösen.

Agenten imitieren menschliche Interaktionen, um realistische Transkripte zu generieren, die für Training genutzt werden können.

Die Methode zeigt eine hohe Genauigkeit und praktische Anwendbarkeit in datenarmen Szenarien.

Integrating Expert Knowledge into Logical Programs via LLMs
Link: arXiv:2502.12275

Beschreibung:

Diese Arbeit integriert Expertenwissen in logische Programme mithilfe von Multi-Agenten-Systemen und LLMs.

Agenten arbeiten kollaborativ, um Experteninformationen in strukturierte logische Regeln zu übersetzen.

Tests demonstrieren eine verbesserte Reasoning-Fähigkeit und Domänenadaption.

Magma: A Foundation Model for Multimodal AI Agents
Link: arXiv:2502.13130

Beschreibung:

Magma ist ein Grundmodell für multimodale KI-Agenten, das Multi-Agenten-Kooperation in verschiedenen Modalitäten ermöglicht.

Es kombiniert visuelle, sprachliche und sensorische Daten, um robuste Entscheidungen in komplexen Umgebungen zu treffen.

Die Evaluation zeigt eine überlegene Leistung in Aufgaben mit hoher Multimodalität.

Continuous Learning Conversational AI: A Personalized Agent Framework via A2C Reinforcement Learning
Link: arXiv:2502.12876

Beschreibung:

Das Paper entwickelt ein personalisiertes Agenten-Framework für konversationelle KI mit kontinuierlichem Lernen via A2C-Verstärkungslernen.

Der Agent passt sich dynamisch an Benutzerpräferenzen an und optimiert Interaktionen in Echtzeit.

Ergebnisse zeigen eine gesteigerte Benutzerzufriedenheit und Anpassungsfähigkeit.

Towards more Contextual Agents: An extractor-Generator Optimization Framework
Link: arXiv:2502.12926

Beschreibung:

Diese Arbeit stellt ein Optimierungs-Framework für kontextbezogene Agenten vor, basierend auf Extraktor-Generator-Modellen.

Agenten extrahieren relevante Kontextinformationen und generieren daraufhin präzise Antworten oder Aktionen.

Die Methode verbessert die Kontextverarbeitung und Effizienz in Multi-Agenten-Systemen.

Investigating and Extending Homans‘ Social Exchange Theory with Large Language Model based Agents
Link: arXiv:2502.12450

Beschreibung:

Das Paper untersucht und erweitert Homans‘ soziale Austauschtheorie mit LLM-basierten Multi-Agenten-Systemen.

Agenten simulieren soziale Interaktionen, um Austauschdynamiken und Kooperationsmuster zu analysieren.

Die Studie zeigt neue Einsichten in soziale Netzwerke und Agentenverhalten.

CityEQA: A Hierarchical LLM Agent on Embodied Question Answering Benchmark in City Space
Link: arXiv:2502.12532

Beschreibung:

CityEQA ist ein hierarchischer LLM-Agent für verkörpertes Fragenbeantworten in urbanen Räumen.

Der Agent nutzt Multi-Agenten-Koordination, um Fragen in komplexen städtischen Umgebungen zu beantworten.

Benchmarks zeigen eine hohe Genauigkeit und Robustheit in realen Szenarien.

LM Agents for Coordinating Multi-User Information Gathering
Link: arXiv:2502.12328

Beschreibung:

Dieses Paper entwickelt Sprachmodell-Agenten zur Koordination von Informationssammlung bei mehreren Benutzern.

Multi-Agenten-Systeme organisieren und priorisieren Datenanfragen kollaborativ, um Effizienz zu maximieren.

Liste der arXiv-Veröffentlichungen vom 18. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Experimentelle Ergebnisse unterstreichen das Potenzial für autonome Werkzeugentwicklung.

Scaling Autonomous Agents via Automatic Reward Modeling And Planning
Link: arXiv:2502.12130

Beschreibung:

Dieses Paper schlägt ein Framework vor, um autonome Agenten durch automatisches Belohnungsmodellieren und Planen zu skalieren.

Es nutzt Reinforcement Learning und Planungsstrategien, um Agenten in komplexen Umgebungen effizienter zu machen.

Experimentelle Ergebnisse zeigen eine verbesserte Anpassungsfähigkeit und Leistung in realen Szenarien.

Leveraging Dual Process Theory in Language Agent Framework for Real-time Simultaneous Human-AI Collaboration
Link: arXiv:2502.11882

Beschreibung:

Die Arbeit integriert die Dual-Prozess-Theorie in ein Sprachagenten-Framework für die Echtzeit-Kollaboration zwischen Mensch und KI.

Sie kombiniert schnelle intuitive und langsame analytische Prozesse, um die Entscheidungsfindung von Agenten zu verbessern.

Tests demonstrieren eine höhere Effizienz und Genauigkeit in interaktiven Multi-Agenten-Systemen.

Table-Critic: A Multi-Agent Framework for Collaborative Criticism and Refinement in Table Reasoning
Link: arXiv:2502.11799

Beschreibung:

Table-Critic ist ein Multi-Agenten-Framework, das kollaborative Kritik und Verfeinerung für tabellenbasiertes Reasoning ermöglicht.

Agenten arbeiten zusammen, um Tabellendaten zu analysieren, Fehler zu identifizieren und Lösungen zu optimieren.

Die Methode zeigt eine verbesserte Genauigkeit bei der Verarbeitung strukturierter Daten.

Competing LLM Agents in a Non-Cooperative Game of Opinion Polarisation
Link: arXiv:2502.11649

Beschreibung:

Das Paper untersucht konkurrierende LLM-Agenten in einem nicht-kooperativen Spiel zur Meinungspolarisierung.

Agenten versuchen, ihre Standpunkte durch strategische Interaktionen zu verstärken, ohne gemeinsame Ziele zu verfolgen.

Simulationen zeigen Dynamiken der Polarisierung und deren Einfluss auf soziale Netzwerke.

Explorer: Scaling Exploration-driven Web Trajectory Synthesis for Multimodal Web Agents
Link: arXiv:2502.11357

Beschreibung:

Explorer ist ein Framework zur Skalierung von Web-Trajektorien-Synthese für multimodale Web-Agenten durch explorationsgetriebene Ansätze.

Es nutzt Multi-Agenten-Systeme, um Web-Interaktionen zu simulieren und adaptive Navigationsstrategien zu entwickeln.

Ergebnisse zeigen eine erhöhte Effizienz bei der Erkundung komplexer Webumgebungen.

Talk Structurally, Act Hierarchically: A Collaborative Framework for LLM Multi-Agent Systems
Link: arXiv:2502.11098

Beschreibung:

Dieses Paper präsentiert ein kollaboratives Framework für Multi-Agenten-Systeme mit LLMs, das strukturiertes Reden und hierarchisches Handeln kombiniert.

Agenten kommunizieren strukturiert und führen Aktionen in einer koordinierten Hierarchie aus, um komplexe Aufgaben zu lösen.

Die Methode verbessert die Koordination und Effektivität in verteilten Systemen.

Agentic LLM Framework for Adaptive Decision Discourse
Link: arXiv:2502.10978

Beschreibung:

Das Framework entwickelt agentische LLMs für adaptiven Entscheidungsdiskurs in dynamischen Umgebungen.

Es ermöglicht Agenten, Entscheidungen durch Diskussion und Anpassung an neue Informationen zu optimieren.

Anwendungen zeigen eine erhöhte Flexibilität und Robustheit bei Entscheidungsprozessen.

SCALE: Towards Collaborative Content Analysis in Social Science with Large Language Model Agents and Human Intervention
Link: arXiv:2502.10937

Beschreibung:

SCALE ist ein Ansatz für kollaborative Inhaltsanalyse in den Sozialwissenschaften mit LLM-Agenten und menschlicher Intervention.

Multi-Agenten-Systeme analysieren Daten kooperativ, während Menschen die Ergebnisse verfeinern und validieren.

Die Methode steigert die Genauigkeit und Interpretierbarkeit sozialwissenschaftlicher Analysen.

D-CIPHER: Dynamic Collaborative Intelligent Agents with Planning and Heterogeneous Execution for Enhanced Reasoning in Offensive Security
Link: arXiv:2502.10931

Beschreibung:

D-CIPHER ist ein Multi-Agenten-System für offensive Sicherheit mit dynamischer Planung und heterogener Ausführung.

Agenten arbeiten kollaborativ, um Sicherheitslücken zu identifizieren und Angriffsstrategien zu optimieren.

Die Ergebnisse zeigen eine erhöhte Effizienz bei der Erkennung und Nutzung von Schwachstellen.

CoPEFT: Fast Adaptation Framework for Multi-Agent Collaborative Perception with Parameter-Efficient Fine-Tuning
Link: arXiv:2502.10705

Beschreibung:

CoPEFT ist ein Framework zur schnellen Anpassung von Multi-Agenten-Kollaborationswahrnehmung durch parameter-effizientes Fine-Tuning.

Es ermöglicht Agenten, ihre Wahrnehmungsfähigkeiten in dynamischen Umgebungen effizient zu synchronisieren und zu verbessern.

Experimente zeigen eine reduzierte Anpassungszeit und gesteigerte Leistung in kollaborativen Szenarien.

HARBOR: Exploring Persona Dynamics in Multi-Agent Competition
Link: arXiv:2502.12149

Beschreibung:

HARBOR untersucht Personadynamiken in Multi-Agenten-Wettbewerben und deren Einfluss auf Entscheidungen.

Agenten mit unterschiedlichen Persönlichkeiten konkurrieren, wobei ihre Interaktionen analysiert werden.

Die Studie zeigt, wie Persona-Variationen die Strategieentwicklung und Koordination beeinflussen.

Generative Multi-Agent Collaboration in Embodied AI: A Systematic Review
Link: arXiv:2502.11518

Beschreibung:

Diese systematische Übersicht analysiert generative Multi-Agenten-Kollaboration in verkörperter KI.

Sie beleuchtet Ansätze, bei denen Agenten kooperativ Inhalte generieren und Aufgaben in physischen Umgebungen lösen.

Die Arbeit identifiziert Herausforderungen und zukünftige Richtungen für die Forschung.

LLM Agents Making Agent Tools
Link: arXiv:2502.11705

Beschreibung:

Das Paper erforscht, wie LLM-Agenten Werkzeuge für andere Agenten in Multi-Agenten-Systemen erstellen können.

Es zeigt, wie selbstentwickelte Tools die Zusammenarbeit und Effizienz zwischen Agenten steigern.

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 17.2.2025

Cooperative Multi-Agent Planning with Adaptive Skill Synthesis
Link: arXiv:2502.10148
- Beschreibung:
  - Das Paper stellt ein neues Framework für kooperative Multi-Agenten-Planung vor, das adaptive Fertigkeitssynthese nutzt, um komplexe Aufgaben effizient zu lösen.
  - Es integriert Lernmechanismen, die es Agenten ermöglichen, ihre Fähigkeiten dynamisch an die Anforderungen der Umgebung anzupassen.
  - Experimentelle Ergebnisse zeigen eine verbesserte Koordination und Leistung im Vergleich zu traditionellen Ansätzen.
STMA: A Spatio-Temporal Memory Agent for Long-Horizon Embodied Task Planning
Link: arXiv:2502.10177
- Beschreibung:
  - STMA ist ein KI-Agent, der raumzeitliche Erinnerungen nutzt, um langfristige verkörperte Aufgabenplanung zu ermöglichen.
  - Das Modell kombiniert räumliche und zeitliche Kontextinformationen, um robuste Entscheidungen in dynamischen Umgebungen zu treffen.
  - Es zeigt überlegene Leistung bei Aufgaben, die eine erweiterte Planungshorizont erfordern, wie z. B. Navigation und Manipulation.
The Ann Arbor Architecture for Agent-Oriented Programming
Link: arXiv:2502.09903
- Beschreibung:
  - Dieses Paper beschreibt eine neue Architektur für agentenorientierte Programmierung, die auf Flexibilität und Skalierbarkeit abzielt.
  - Sie bietet eine strukturierte Methode zur Entwicklung autonomer Agenten mit Fokus auf Interaktion und Entscheidungsfindung.
  - Die Architektur wird anhand von Fallstudien validiert, die ihre Anwendbarkeit in realen Szenarien demonstrieren.
A Scoresheet for Explainable AI
Link: arXiv:2502.09861
- Beschreibung:
  - Das Paper entwickelt ein Bewertungssystem für erklärbare KI, das Multi-Agenten-Systeme einschließt, um Transparenz und Verständnis zu fördern.
  - Es schlägt vor, Agentenentscheidungen systematisch zu bewerten, basierend auf Klarheit, Nachvollziehbarkeit und Nützlichkeit der Erklärungen.
  - Die Methode wird anhand praktischer Beispiele getestet und zeigt Verbesserungen in der Mensch-Agenten-Interaktion.
Evaluating and Improving Graph-based Explanation Methods for Multi-Agent Coordination
Link: arXiv:2502.09889
- Beschreibung:
  - Die Arbeit untersucht graphbasierte Erklärungsmethoden zur Verbesserung der Koordination in Multi-Agenten-Systemen.
  - Sie identifiziert Schwächen bestehender Ansätze und schlägt Optimierungen vor, die die Interpretierbarkeit von Agenteninteraktionen erhöhen.
  - Experimente zeigen, dass die verbesserten Methoden die Effizienz und Zuverlässigkeit der Koordination steigern.
A Multiagent Path Search Algorithm for Large-Scale Coalition Structure Generation
Link: arXiv:2502.10226
- Beschreibung:
  - Dieses Paper präsentiert einen Multi-Agenten-Pfadsuchalgorithmus zur Generierung großskaliger Koalitionsstrukturen in Spielen.
  - Der Ansatz nutzt verteilte Suche, um die Rechenkomplexität zu reduzieren und optimale Koalitionen effizient zu finden.
  - Ergebnisse zeigen eine deutliche Verbesserung der Skalierbarkeit gegenüber früheren Methoden.

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 14.2.2025

KIMAs: A Configurable Knowledge Integrated Multi-Agent System
- Beschreibung:
  - Dieses Paper stellt ein anpassbares Framework vor, das Wissen in die Interaktion mehrerer Agenten integriert.
  - Es fokussiert auf die Konfiguration und Integration von Wissenskomponenten in Multi-Agenten-Systeme.
  - Die vorgestellten Ansätze verbessern die Effizienz und Anpassungsfähigkeit von KI-Agenten.
- Link: arXiv:2502.09596
EmbodiedBench: Comprehensive Benchmarking Multi-modal Large Language Models for Vision-Driven Embodied Agents
- Beschreibung:
  - Das Paper präsentiert einen Benchmark zur Evaluierung multimodaler LLMs in vision-getriebenen Agentensystemen.
  - Es verknüpft visuelle und sprachbasierte Komponenten, um das Verhalten eingebetteter Agenten zu bewerten.
  - Die Ergebnisse liefern Einblicke in die Leistungsfähigkeit von KI-Agenten in realen Szenarien.
- Link: arXiv:2502.09560
Mind the Gaps: Logical English, Prolog, and Multi-agent Systems for Autonomous Vehicles
- Beschreibung:
  - Das Paper kombiniert logische Sprachen mit Multi-Agenten-Ansätzen zur Verbesserung der Steuerung autonomer Fahrzeuge.
  - Es wird ein Framework vorgestellt, das natürliche Sprache und logische Programmierung integriert.
  - Der Fokus liegt auf der Reduktion von Systemlücken und der Erhöhung der Zuverlässigkeit in autonomen Systemen.
- Link: arXiv:2502.09216
Can a Single Model Master Both Multi-turn Conversations and Tool Use? CALM: A Unified Conversational Agentic Language Model
- Beschreibung:
  - Das Paper untersucht, wie ein einzelnes Modell sowohl Mehrfachgespräche als auch den Einsatz von Tools bewältigen kann.
  - CALM demonstriert eine einheitliche Sprachmodellarchitektur mit agentischen Eigenschaften.
  - Die Ergebnisse zeigen Potenziale und Herausforderungen beim Aufbau von vielseitig agierenden KI-Agenten.
- Link: arXiv:2502.08820
TRIFFID: Autonomous Robotic Aid For Increasing First Responders Efficiency
- Beschreibung:
  - Das Paper stellt TRIFFID vor, einen autonomen robotischen Helfer zur Unterstützung von Ersthelfern.
  - Es beschreibt die Integration von KI in Roboter, um Einsatzkräfte in Notfallsituationen zu unterstützen.
  - Die vorgestellte Lösung verbessert die Reaktionsgeschwindigkeit und Effizienz im Katastrophenmanagement.
- Link: arXiv:2502.09379
Language Agents as Digital Representatives in Collective Decision-Making
- Beschreibung:
  - Das Paper untersucht den Einsatz von Sprachagenten als digitale Repräsentanten in kollektiven Entscheidungsprozessen.
  - Es werden Modelle vorgestellt, die menschliche Entscheidungsfindung simulieren und unterstützen.
  - Die Ergebnisse zeigen, wie KI-Agenten zu faireren und effizienteren Gruppenentscheidungen beitragen können.
- Link: arXiv:2502.09369
Architecture for Simulating Behavior Mode Changes in Norm-Aware Autonomous Agents
- Beschreibung:
  - Dieses Paper präsentiert eine Architektur zur Simulation von Verhaltensänderungen in normbewussten autonomen Agenten.
  - Es kombiniert logische Modellierung mit Verhaltenssimulation, um adaptive Reaktionen zu ermöglichen.
  - Der Ansatz zielt darauf ab, die Anpassungsfähigkeit und Sicherheit von KI-Agenten zu verbessern.
- Link: arXiv:2502.09215
AIDE: Agentically Improve Visual Language Model with Domain Experts
- Beschreibung:
  - Das Paper stellt AIDE vor, ein Framework, das visuelle Sprachmodelle mithilfe von Expertenfeedback agentenartig verbessert.
  - Es kombiniert maschinelles Lernen mit interaktiver Anpassung durch Domänenexperten.
  - Der Ansatz zielt darauf ab, die Genauigkeit und Anwendbarkeit von KI-Agenten in visuellen Aufgaben zu erhöhen.
- Link: arXiv:2502.09051
Few is More: Task-Efficient Skill-Discovery for Multi-Task Offline Multi-Agent Reinforcement Learning
- Beschreibung:
  - Dieses Paper befasst sich mit der effizienten Entdeckung von Fähigkeiten in Multi-Agenten-Systemen mittels Offline Reinforcement Learning.
  - Es zeigt, wie wenige Beispiele ausreichen, um robuste Fähigkeiten in komplexen Umgebungen zu erlernen.
  - Der vorgestellte Ansatz verbessert die Leistungsfähigkeit und Skalierbarkeit von Multi-Agenten-Frameworks.
- Link: arXiv:2502.08985
SkyRover: A Modular Simulator for Cross-Domain Pathfinding
- Beschreibung:
  - Das Paper präsentiert SkyRover, einen modularen Simulator zur Erprobung von Pathfinding-Strategien in verschiedenen Domänen.
  - Es wird ein Framework vorgestellt, das Multi-Agenten-Interaktionen in simulierten Umgebungen ermöglicht.
  - Die Ergebnisse liefern wertvolle Einblicke in die Anwendung von KI-Agenten in komplexen, realweltlichen Szenarien.
- Link: arXiv:2502.08969
RTBAS: Defending LLM Agents Against Prompt Injection and Privacy Leakage
- Beschreibung:
  - Das Paper thematisiert Sicherheitsaspekte von LLM-Agenten und deren Schutz vor Prompt Injection.
  - Es werden Abwehrmechanismen vorgestellt, die die Integrität und Privatsphäre der Agenten gewährleisten.
  - Die Ergebnisse demonstrieren wirksame Strategien zur Absicherung von KI-Agenten in kritischen Anwendungen.
- Link: arXiv:2502.08966
PathFinder: A Multi-Modal Multi-Agent System for Medical Diagnostic Decision-Making Applied to Histopathology
- Beschreibung:
  - Dieses Paper stellt ein multi-modales Multi-Agenten-System für die medizinische Diagnostik in der Histopathologie vor.
  - Es kombiniert verschiedene Datenmodalitäten, um fundierte diagnostische Entscheidungen zu unterstützen.
  - Der vorgestellte Ansatz verbessert die Genauigkeit und Effizienz medizinischer Entscheidungsprozesse.
- Link: arXiv:2502.08916
AgentSociety: Large-Scale Simulation of LLM-Driven Generative Agents Advances Understanding of Human Behaviors and Society
- Beschreibung:
  - Das Paper präsentiert AgentSociety, ein großskaliges Simulationsframework für generative LLM-Agenten.
  - Es untersucht, wie KI-Agenten menschliches Verhalten und gesellschaftliche Dynamiken modellieren können.
  - Die Ergebnisse bieten neue Einblicke in das Zusammenspiel von KI-Agenten und sozialen Systemen.
- Link: arXiv:2502.08690
Centrally Coordinated Multi-Agent Reinforcement Learning for Power Grid Topology Control
- Beschreibung:
  - Dieses Paper untersucht den Einsatz von zentral koordinierter Multi-Agenten-Reinforcement-Learning zur Steuerung von Stromnetz-Topologien.
  - Es wird ein Framework vorgestellt, das eine effektive Zusammenarbeit von Agenten zur Optimierung von Netzstrukturen ermöglicht.
  - Der Ansatz zielt darauf ab, die Stabilität und Effizienz von Energieverteilungssystemen zu verbessern.
- Link: arXiv:2502.08681

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 13.2.2025

The Danger of Overthinking: Examining the Reasoning-Action Dilemma in Agentic Tasks
- Untersucht das Spannungsverhältnis zwischen ausgedehntem Denkprozess und unmittelbarem Handeln in agentischen Aufgaben.
- Analysiert, wie übermäßiges Nachdenken zu ineffizienten Entscheidungen bei KI-Agenten führen kann.
- Liefert Einsichten zur optimalen Balance zwischen kognitiver Verarbeitung und schneller Aktion.
  Link zum Paper
WorldGUI: Dynamic Testing for Comprehensive Desktop GUI Automation
- Entwickelt einen dynamischen Testansatz zur automatisierten Überprüfung von Desktop-GUIs.
- Nutzt multiagent-basierte Simulationen, um Benutzerinteraktionen realistisch nachzubilden.
- Demonstriert die Effizienz des Frameworks bei der Fehlererkennung und -behebung.
  Link zum Paper
Enhancing kidney transplantation through multi-agent kidney exchange programs: A comprehensive review and optimization models
- Bietet einen umfassenden Überblick über multiagent-basierte Nierentauschprogramme.
- Bewertet Optimierungsmodelle zur Verbesserung von Transplantationsergebnissen.
- Diskutiert Herausforderungen und Lösungsansätze bei der Koordination von Agenten im Gesundheitswesen.
  Link zum Paper
Learning in Markets with Heterogeneous Agents: Dynamics and Survival of Bayesian vs. No-Regret Learners
- Analysiert das Verhalten heterogener Agenten in marktbasierten Lernumgebungen.
- Vergleicht Bayesian-Lernverfahren mit No-Regret-Strategien hinsichtlich ihrer Überlebensfähigkeit.
- Liefert theoretische und empirische Einsichten in dynamische Interaktionen von KI-Agenten in Märkten.
  Link zum Paper
Commercial LLM Agents Are Already Vulnerable to Simple Yet Dangerous Attacks
- Zeigt auf, dass kommerzielle LLM-Agenten bereits für einfache, aber gefährliche Angriffe anfällig sind.
- Analysiert Sicherheitslücken in der Architektur und Interaktionsweise dieser Agenten.
- Fordert robustere Sicherheitsmaßnahmen zur Absicherung von KI-Agenten.
  Link zum Paper
Human-Centric Foundation Models: Perception, Generation and Agentic Modeling
- Erforscht die Kombination von Wahrnehmung und Generationsfähigkeiten in agentischer Modellierung.
- Stellt Ansätze zur Entwicklung menschzentrierter KI-Agenten vor.
- Diskutiert Herausforderungen und Potenziale bei der Integration agentischer Eigenschaften in Foundation Models.
  Link zum Paper
Towards Principled Multi-Agent Task Agnostic Exploration
- Stellt ein Framework zur erkundungsbasierten Aufgabenbewältigung in Multi-Agenten-Systemen vor.
- Entwickelt methodische Grundlagen, die unabhängig von spezifischen Aufgaben anwendbar sind.
- Hebt den Beitrag zur verbesserten Kollaboration und Exploration in agentischen Netzwerken hervor.
  Link zum Paper
Hierarchical Multi-Agent Framework for Carbon-Efficient Liquid-Cooled Data Center Clusters
- Präsentiert ein hierarchisches Multi-Agenten-Framework zur Optimierung von Rechenzentren.
- Fokussiert auf die Steigerung der Energieeffizienz und Reduktion von CO₂-Emissionen.
- Verbindet agentenbasierte Steuerungsstrategien mit praktischen Anwendungen in der Infrastruktur.
  Link zum Paper
TRISHUL: Towards Region Identification and Screen Hierarchy Understanding for Large VLM based GUI Agents
- Entwickelt einen Ansatz zur Identifikation von Bildschirmregionen für GUI-Agenten.
- Nutzt Vision-Language Modelle, um die Hierarchie und Struktur von Benutzeroberflächen zu erfassen.
- Verbessert die Interaktion und Automatisierung von GUI-basierten Agentensystemen.
  Link zum Paper
VSC-RL: Advancing Autonomous Vision-Language Agents with Variational Subgoal-Conditioned Reinforcement Learning
- Stellt einen neuartigen Ansatz zur Verbesserung autonomer Vision-Language Agenten vor.
- Nutzt variational subgoal-conditioned Reinforcement Learning zur zielgerichteten Steuerung.
- Demonstriert Leistungssteigerungen in komplexen, multimodalen Umgebungen.
  Link zum Paper
CP-Guard+: A New Paradigm for Malicious Agent Detection and Defense in Collaborative Perception
- Entwickelt ein Konzept zur Erkennung bösartiger Agenten in kollaborativen Perzeptionssystemen.
- Integriert fortschrittliche Sicherheitsmechanismen in KI-gestützte Wahrnehmungsnetzwerke.
- Bietet eine robuste Verteidigungsstrategie zur Sicherung von Multi-Agenten-Umgebungen.
  Link zum Paper
Do AI assistants help students write formal specifications? A study with ChatGPT and the B-Method
- Untersucht den Einsatz von KI-Assistenten bei der Erstellung formaler Spezifikationen.
- Vergleicht die Unterstützung durch ChatGPT mit traditionellen Methoden.
- Analysiert den Einfluss von KI-Unterstützung auf die Qualität technischer Dokumentationen.
  Link zum Paper

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 12.2.2025

MAGELLAN: Metacognitive predictions of learning progress guide autotelic LLM agents in large goal spaces

Das Paper präsentiert ein Framework, in dem LLM-Agenten ihre Lernfortschritte metakognitiv vorhersagen.
Diese Vorhersagen steuern die autonome Zielverfolgung in komplexen Umgebungen.
Erste Experimente deuten auf eine signifikante Verbesserung der Zielerreichung hin.
Link zum Paper

Approximating Human Strategic Reasoning with LLM-Enhanced Recursive Reasoners Leveraging Multi-agent Hypergames

Das Paper untersucht, wie LLMs strategisches menschliches Denken in einem rekursiven Multi-Agenten-Framework simulieren können.
Mittels hypergame-basierter Ansätze werden komplexe Interaktionen zwischen Agenten modelliert.
Erste Ergebnisse zeigen, dass die Modelle in der Lage sind, strategische Entscheidungen effektiv nachzuvollziehen.
Link zum Paper

KABB: Knowledge-Aware Bayesian Bandits for Dynamic Expert Coordination in Multi-Agent Systems

Hier wird ein wissensbasierter Ansatz vorgestellt, der Bayes’sche Banditen zur Koordination von Experten in Multi-Agenten-Systemen nutzt.
Das Modell aggregiert dynamisch Expertenwissen, um verbesserte Entscheidungen zu treffen.
Experimente belegen die Effizienz des Ansatzes in dynamischen Umgebungen.
Link zum Paper

Interactive Data Harmonization with LLM Agents

Das Paper stellt ein interaktives Framework vor, in dem LLM-Agenten zur Harmonisierung heterogener Daten eingesetzt werden.
Die Agenten kommunizieren miteinander, um konsistente Datenrepräsentationen zu erzeugen.
Erste Ergebnisse zeigen, dass das System große und unterschiedliche Datensätze effektiv vereinheitlicht.
Link zum Paper

Autonomous Deep Agent

In diesem Paper wird ein autonomer Deep Agent vorgestellt, der eigenständig Entscheidungen in komplexen Szenarien trifft.
Die Kombination aus tiefen Lernverfahren und autonomer Steuerung ermöglicht eine flexible Anpassung an neue Aufgaben.
Erste Tests deuten auf eine hohe Effizienz und Robustheit des Systems hin.
Link zum Paper

Position: Episodic Memory is the Missing Piece for Long-Term LLM Agents

Das Paper argumentiert, dass episodisches Gedächtnis ein entscheidender Faktor für die Leistungsfähigkeit langfristiger LLM-Agenten ist.
Es wird ein theoretischer Rahmen präsentiert, der den Einsatz von Gedächtnismodulen in Agenten erläutert.
Erste Experimente zeigen, dass Agenten mit episodischem Gedächtnis Aufgaben effizienter bewältigen.
Link zum Paper

Distributed Value Decomposition Networks with Networked Agents

Hier wird ein verteiltes Netzwerkmodell vorgestellt, das die Zusammenarbeit von vernetzten Agenten unterstützt.
Das Modell zerlegt komplexe Entscheidungsprozesse in Teilwerte, die von einzelnen Agenten berechnet werden.
Die Ergebnisse belegen eine verbesserte Performance in kollaborativen Multi-Agenten-Szenarien.
Link zum Paper

Fairness in Multi-Agent AI: A Unified Framework for Ethical and Equitable Autonomous Systems

Das Paper entwickelt ein Rahmenwerk, das Fairness und ethische Prinzipien in Multi-Agenten-Systemen sicherstellt.
Es werden Mechanismen zur gerechten Entscheidungsfindung und Ressourcenverteilung zwischen Agenten vorgestellt.
Erste Experimente deuten darauf hin, dass das Framework diskriminierungsfreie Interaktionen in autonomen Systemen fördert.
Link zum Paper

Don’t Just Demo, Teach Me the Principles: A Principle-Based Multi-Agent Prompting Strategy for Text Classification

In diesem Paper wird eine prinzipienbasierte Prompting-Strategie für den Einsatz von Multi-Agenten im Textklassifikationsbereich vorgestellt.
Der Ansatz vermittelt nicht nur Beispiele, sondern auch zugrunde liegende Prinzipien, um die Modelle zu verbessern.
Ergebnisse zeigen eine gesteigerte Genauigkeit und Robustheit in Textklassifikationsaufgaben.
Link zum Paper

SyncMind: Measuring Agent Out-of-Sync Recovery in Collaborative Software Engineering

Das Paper untersucht, wie Agenten in kollaborativen Softwareentwicklungsprozessen aus dem Takt geraten und sich wieder synchronisieren.
Es wird ein Messframework entwickelt, das Ausfallzeiten und Synchronisationsprobleme quantifiziert.
Erste Tests zeigen, dass die Analyse der Agent-Synchronisation zu optimierten Kollaborationsstrategien führen kann.
Link zum Paper

Who is Helping Whom? Analyzing Inter-dependencies to Evaluate Cooperation in Human-AI Teaming

Dieses Paper analysiert die Interdependenzen zwischen menschlichen und KI-Agenten in kooperativen Teams.
Es wird ein Modell vorgestellt, das die Zusammenarbeit und gegenseitige Unterstützung zwischen den Beteiligten quantifiziert.
Die Ergebnisse liefern wertvolle Einsichten zur Verbesserung der Mensch-KI-Kooperation.
Link zum Paper

Multi-Agent Simulator Drives Language Models for Legal Intensive Interaction

Das Paper präsentiert einen Multi-Agenten-Simulator, der Sprachmodelle in rechtlich intensiven Interaktionen unterstützt.
Der Simulator ermöglicht die Simulation komplexer rechtlicher Szenarien durch koordinierte Agenteninteraktionen.
Erste Ergebnisse deuten darauf hin, dass solche Systeme die Effizienz und Genauigkeit von Rechtsanwendungen steigern können.
Link zum Paper

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 11.2.2025

Training Language Models for Social Deduction with Multi-Agent Reinforcement Learning

Das Paper beschreibt den Einsatz von Multi-Agent Reinforcement Learning zur Schulung von Sprachmodellen im Bereich sozialer Deduktion.
Es beleuchtet die Herausforderungen bei der Koordination zwischen mehreren Agenten.
Die Studie zeigt, wie interaktive Lernmechanismen die deduktiven Fähigkeiten der Modelle verbessern können.
Link zum Paper

MetaChain: A Fully-Automated and Zero-Code Framework for LLM Agents

Hier wird ein Framework vorgestellt, das die automatische Kaskadierung und den Betrieb von LLM‑basierten Agenten ohne Programmierung ermöglicht.
Das System integriert verschiedene Module, um komplexe Aufgaben agentengesteuert zu lösen.
Die vorgestellten Ergebnisse demonstrieren eine effiziente und skalierbare Implementierung von KI-Agenten.
Link zum Paper

Barriers and Pathways to Human-AI Alignment: A Game-Theoretic Approach

Das Paper nutzt spieltheoretische Konzepte, um die Herausforderungen der Human-AI-Alignment zu analysieren.
Es werden Barrieren identifiziert, die einer effektiven Zusammenarbeit zwischen Mensch und KI im Wege stehen.
Gleichzeitig werden Lösungsansätze vorgestellt, die auf Multiagent-Systemen basieren.
Link zum Paper

Amorphous Fortress Online: Collaboratively Designing Open-Ended Multi-Agent AI and Game Environments

Die Autoren präsentieren einen kollaborativen Ansatz zur Gestaltung offener, multiagentiger Spielumgebungen.
Es wird gezeigt, wie flexible KI-Agenten in dynamischen und interaktiven Umgebungen agieren können.
Das Paper diskutiert zudem Herausforderungen und Lösungsstrategien im gemeinsamen Designprozess.
Link zum Paper

LLM-Powered Decentralized Generative Agents with Adaptive Hierarchical Knowledge Graph for Cooperative Planning

Dieses Werk stellt generative Agenten vor, die auf großen Sprachmodellen basieren und dezentral kooperieren.
Mittels adaptiver, hierarchischer Wissensgraphen wird eine effiziente gemeinsame Planung ermöglicht.
Die Ergebnisse unterstreichen das Potenzial von LLMs, kooperative Entscheidungsprozesse zu unterstützen.
Link zum Paper

The Odyssey of the Fittest: Can Agents Survive and Still Be Good?

In diesem Paper wird untersucht, ob KI-Agenten in evolutionären Umgebungen überleben und gleichzeitig moralisch bzw. kooperativ agieren können.
Es werden Simulationsszenarien präsentiert, in denen Agenten unter Wettbewerbsbedingungen getestet werden.
Die Studie liefert Einblicke in die Balance zwischen Überlebensfähigkeit und ethischem Verhalten.
Link zum Paper

Agentic AI Systems Applied to tasks in Financial Services: Modeling and model risk management crews

Das Paper fokussiert auf den Einsatz agentischer KI-Systeme im Finanzsektor.
Es werden Methoden zur Modellierung und zum Risikomanagement solcher Systeme erläutert.
Die Ergebnisse unterstreichen den Mehrwert von KI-Agenten in komplexen Finanzanwendungen.
Link zum Paper

ITBench: Evaluating AI Agents across Diverse Real-World IT Automation Tasks

Hier wird ein Benchmark vorgestellt, der die Leistungsfähigkeit von KI-Agenten in IT-Automatisierungsaufgaben bewertet.
Das Paper vergleicht verschiedene Agentenansätze in realistischen Einsatzszenarien.
Es werden Metriken und Evaluationsmethoden zur objektiven Leistungsbewertung entwickelt.
Link zum Paper

Towards Internet-Scale Training For Agents

Dieses Paper untersucht Methoden, um das Training von KI-Agenten auf internetskalierter Ebene zu realisieren.
Es werden Herausforderungen der Daten- und Recheninfrastruktur im großskaligen Setting adressiert.
Die vorgestellten Ansätze ermöglichen eine signifikante Skalierung der Agententrainingsprozesse.
Link zum Paper

Hephaestus: Improving Fundamental Agent Capabilities of Large Language Models through Continual Pre-Training

Das Paper zielt darauf ab, die Kernfähigkeiten von LLM-basierten Agenten mittels kontinuierlicher Vortrainingsstrategien zu verbessern.
Es werden Techniken vorgestellt, die die Anpassungsfähigkeit und Robustheit der Agenten steigern.
Die Experimente belegen eine nachhaltige Leistungssteigerung in agentenspezifischen Aufgaben.
Link zum Paper

KARMA: Leveraging Multi-Agent LLMs for Automated Knowledge Graph Enrichment

Die Autoren präsentieren einen Ansatz, der mehrere LLM-Agenten zur automatisierten Anreicherung von Wissensgraphen einsetzt.
Das System koordiniert Agenten, um strukturierte Informationen effizient zu extrahieren.
Die Ergebnisse zeigen eine signifikante Verbesserung der Wissensgraphqualität.
Link zum Paper

SIGMA: Sheaf-Informed Geometric Multi-Agent Pathfinding

Dieses Paper stellt einen neuartigen geometriebasierten Ansatz zur Pfadfindung in Multi-Agent-Systemen vor.
Durch die Verwendung sheaf-informierter Methoden wird die Koordination zwischen Agenten optimiert.
Die vorgestellten Experimente belegen eine verbesserte Effizienz und Robustheit im Pfadfindungsproblem.
Link zum Paper

CSR-Bench: Benchmarking LLM Agents in Deployment of Computer Science Research Repositories

Das Paper führt einen Benchmark ein, der den Einsatz von LLM-Agenten in der Verwaltung von Forschungsrepositories evaluiert.
Es werden spezifische Metriken zur Bewertung der Agentenleistung in realen IT-Infrastrukturen entwickelt.
Die Studie liefert praxisnahe Erkenntnisse zur Optimierung von Agenteneinsätzen im wissenschaftlichen Kontext.
Link zum Paper

Comprehensive Framework for Evaluating Conversational AI Chatbots

Hier wird ein umfassendes Evaluationsframework für Conversational Agents (Chatbots) präsentiert.
Das Paper definiert präzise Metriken zur Beurteilung der Dialogqualität und Interaktionsfähigkeit.
Die Ergebnisse unterstützen die Weiterentwicklung von Chatbots im Hinblick auf Benutzerzufriedenheit und Funktionalität.
Link zum Paper

Cyri: A Conversational AI-based Assistant for Supporting the Human User in Detecting and Responding to Phishing Attacks

Das Paper beschreibt einen KI-basierten Assistenten, der mittels Konversation den Benutzer bei der Erkennung von Phishing-Angriffen unterstützt.
Es wird ein hybrider Ansatz vorgestellt, der natürliche Sprachverarbeitung und sicherheitstechnische Analysen kombiniert.
Die Studie demonstriert, wie Agenten dazu beitragen können, Cyberbedrohungen effektiver abzuwehren.
Link zum Paper

„Let the AI conspiracy begin…“ Language Model coordination is just one inference-intervention away

In diesem Paper wird untersucht, wie Sprachmodelle durch gezielte Interventionen koordinierte Verhaltensmuster entwickeln können.
Es wird das Potenzial von emergenten Koordinationsstrategien in Multi-Agent-Umgebungen aufgezeigt.
Die Ergebnisse werfen zugleich Fragen zur Steuerbarkeit und Sicherheit solcher koordinierten Systeme auf.
Link zum Paper

MTPChat: A Multimodal Time-Aware Persona Dataset for Conversational Agents

Das Paper stellt ein neuartiges, multimodales Datenset vor, das speziell zur Entwicklung und Evaluation von Chatbot-Personas dient.
Es berücksichtigt zeitliche Aspekte, um dynamische Verhaltensmuster in Agentendialogen zu modellieren.
Die Nutzung des Datensets verbessert das Verständnis und die Personalisierung von Conversational Agents.
Link zum Paper

Acquisition through My Eyes and Steps: A Joint Predictive Agent Model in Egocentric Worlds

Hier wird ein prädiktives Agentenmodell vorgestellt, das Egocentric-Visionsdaten zur Umgebungsanalyse nutzt.
Das Modell kombiniert visuelle und Bewegungseingaben, um zukünftige Ereignisse in dynamischen Szenarien vorherzusagen.
Die Ansätze zielen darauf ab, Agenten zu befähigen, ihre Umgebung autonom zu interpretieren und zu navigieren.
Link zum Paper

CODESIM: Multi-Agent Code Generation and Problem Solving through Simulation-Driven Planning and Debugging

Das Paper präsentiert einen simulationsbasierten Ansatz, bei dem mehrere Agenten gemeinsam Code generieren und Probleme lösen.
Durch die Integration von Planung und Debugging wird eine kollaborative Problemlösung ermöglicht.
Die Ergebnisse zeigen, dass multiagentige Strategien die Effizienz im Softwareentwicklungsprozess steigern können.
Link zum Paper

On Memory Construction and Retrieval for Personalized Conversational Agents

In diesem Werk wird untersucht, wie Erinnerungsmechanismen personalisierter Chatbots aufgebaut und abgerufen werden können.
Es werden Methoden zur Speicherung und dynamischen Aktualisierung von Nutzerinformationen vorgestellt.
Die Studie demonstriert, wie verbesserte Gedächtnisstrukturen zu konsistenteren und individuelleren Agenten führen.
Link zum Paper

Low-Rank Agent-Specific Adaptation (LoRASA) for Multi-Agent Policy Learning

Das Paper stellt eine Methode vor, um durch Low-Rank-Anpassungen agentenspezifische Politiken in Multi-Agent-Systemen zu optimieren.
Es wird gezeigt, wie die Reduktion von Parametern die Effizienz und Generalisierungsfähigkeit verbessert.
Die vorgestellten Techniken fördern eine präzisere Abstimmung von Verhaltensstrategien in kollaborativen Szenarien.
Link zum Paper

Towards Learning Scalable Agile Dynamic Motion Planning for Robosoccer Teams with Policy Optimization

Dieses Paper untersucht dynamische Bewegungsplanungsstrategien für Robosoccer-Teams im Multi-Agent-Setting.
Mittels Policy Optimization wird ein skalierbarer Ansatz zur schnellen Anpassung an wechselnde Spielsituationen entwickelt.
Die Ergebnisse demonstrieren eine verbesserte Agilität und Koordination in teamorientierten Robotersystemen.
Link zum Paper

Riemannian Manifold Learning for Stackelberg Games with Neural Flow Representations

Das Paper wendet manifold-basierte Lernmethoden an, um Stackelberg-Spiele in Multi-Agent-Szenarien zu modellieren.
Es werden neuronale Flussdarstellungen genutzt, um die Dynamik zwischen Führungs- und Folgeverhalten zu erfassen.
Die Studie liefert theoretische und praktische Einblicke in die Optimierung von Interaktionsstrategien in spieltheoretischen Settings.
Link zum Paper

Robotouille: An Asynchronous Planning Benchmark for LLM Agents

In diesem Beitrag wird ein asynchroner Planungsbenchmark speziell für LLM-basierte Agenten im Robotik-Kontext eingeführt.
Das Paper bietet standardisierte Evaluationsmetriken zur Messung der Planungs- und Reaktionsfähigkeit von Agenten.
Die vorgestellten Ergebnisse ermöglichen einen objektiven Vergleich verschiedener agentengesteuerter Systeme.
Link zum Paper

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 10.2.2025

SiriuS: Self-improving Multi-agent Systems via Bootstrapped Reasoning

Das Paper stellt ein Framework vor, das Multi-Agenten befähigt, sich selbst zu verbessern.
Mittels bootstrapped Reasoning wird eine dynamische Koordination zwischen den Agenten ermöglicht.
Experimentelle Ergebnisse zeigen signifikante Leistungssteigerungen in komplexen Umgebungen.
Link: https://arxiv.org/abs/2502.04780

Learning Strategic Language Agents in the Werewolf Game with Iterative Latent Space Policy Optimization

In diesem Paper wird ein Ansatz zur Ausbildung strategischer Sprachagenten im Werewolf-Spiel präsentiert.
Durch iterative Optimierung im latenten Raum werden Entscheidungsprozesse in einer sozialen Deduktionsumgebung verfeinert.
Die Resultate belegen, dass die Agenten effektive Kommunikations- und Taktikstrategien entwickeln.
Link: https://arxiv.org/abs/2502.04686

Agentic Reasoning: Reasoning LLMs with Tools for the Deep Research

Das Paper führt einen innovativen Ansatz ein, um große Sprachmodelle (LLMs) in agentenähnliche Systeme zu transformieren.
Externe Tools werden integriert, um die reasoning-Fähigkeiten der Modelle gezielt zu erweitern.
Dadurch wird gezeigt, wie ein agentisches Verhalten tiefere Forschungsergebnisse fördern kann.
Link: https://arxiv.org/abs/2502.04644

TAR2: Temporal-Agent Reward Redistribution for Optimal Policy Preservation in Multi-Agent Reinforcement Learning

Dieses Paper präsentiert eine Methode zur Umverteilung von Belohnungen in Multi-Agenten-Reinforcement-Learning-Umgebungen.
Durch eine temporale Anpassung werden optimale Politiken in dynamischen Szenarien erhalten.
Die experimentellen Ergebnisse belegen eine signifikante Verbesserung der Lernstabilität.
Link: https://arxiv.org/abs/2502.04864

S2-MAD: Breaking the Token Barrier to Enhance Multi-Agent Debate Efficiency

Das Paper adressiert die Herausforderung der Token-Beschränkungen in Multi-Agenten-Debatten.
Es werden neuartige Strategien vorgestellt, um den Informationsaustausch zwischen Agenten zu optimieren.
Die vorgestellten Methoden führen zu einer höheren Effizienz und verbesserter Debattenleistung.
Link: https://arxiv.org/abs/2502.04790

Every Software as an Agent: Blueprint and Case Study

Hier wird ein Paradigmenwechsel vorgeschlagen, bei dem Softwarekomponenten als autonome Agenten betrachtet werden.
Das Paper liefert einen detaillierten Blueprint sowie eine Fallstudie zur praktischen Umsetzung dieses Konzepts.
Die Ergebnisse demonstrieren, dass agentenbasierte Softwarearchitekturen die Modularität und Skalierbarkeit erheblich verbessern können.
Link: https://arxiv.org/abs/2502.04747

Division-of-Thoughts: Harnessing Hybrid Language Model Synergy for Efficient On-Device Agents

Das Paper präsentiert ein Framework, das hybride Sprachmodelle zur Steigerung der Effizienz von On-Device-Agenten kombiniert.
Durch die Synergie verschiedener Modelle wird eine ressourcenschonende Ausführung in mobilen Geräten ermöglicht.
Empirische Ergebnisse zeigen, dass dieser Ansatz die Leistungsfähigkeit und Reaktionsgeschwindigkeit der Agenten verbessert.
Link: https://arxiv.org/abs/2502.04392

Position: Scaling LLM Agents Requires Asymptotic Analysis with LLM Primitives

In diesem Paper wird untersucht, wie sich LLM-basierte Agenten skalieren lassen, wobei asymptotische Analysen im Fokus stehen.
Es wird argumentiert, dass grundlegende LLM-Primitiven eine zentrale Rolle bei der Optimierung von Agenten spielen.
Die gewonnenen Erkenntnisse liefern wertvolle Einblicke in die Herausforderungen und Möglichkeiten beim Aufbau skalierbarer KI-Agenten.
Link: https://arxiv.org/abs/2502.04358

Position: Emergent Machina Sapiens Urge Rethinking Multi-Agent Paradigms

Das Paper fordert ein Umdenken in der Gestaltung von Multi-Agenten-Systemen angesichts emergenter Verhaltensmuster.
Es wird diskutiert, wie neue Erkenntnisse über „Machina Sapiens“ innovative Multi-Agent-Paradigmen inspirieren können.
Die vorgeschlagenen Ansätze eröffnen neue Perspektiven zur Entwicklung effizienterer und flexiblerer Agentensysteme.
Link: https://arxiv.org/abs/2502.04388

MEETING DELEGATE: Benchmarking LLMs on Attending Meetings on Our Behalf

Dieses Paper evaluiert, wie LLMs als Agenten eingesetzt werden können, um Meetings im Auftrag von Nutzern zu übernehmen.
Es wird ein Benchmarking-Framework vorgestellt, das die Leistung von LLM-basierten Meeting-Delegates misst.
Die Ergebnisse zeigen, dass LLMs in der Lage sind, relevante Informationen effizient zu extrahieren und zusammenzufassen.
Link: https://arxiv.org/abs/2502.04376

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 7.2.2025

Free Energy Risk Metrics for Systemically Safe AI: Gatekeeping Multi-Agent Study
Link: https://arxiv.org/abs/2502.04249
- Das Paper entwickelt Risikomessmetriken auf Basis von freien Energiekonzepten, um systemische Sicherheit in KI-Systemen zu bewerten.
- Es fokussiert sich auf Multi-Agenten-Studien, wobei Gatekeeping-Mechanismen im Zentrum der Analyse stehen.
- Die Autoren kombinieren theoretische Ansätze mit experimenteller Validierung, um die Effektivität des vorgeschlagenen Sicherheitsmodells zu demonstrieren.
Enhancing Online Learning Efficiency Through Heterogeneous Resource Integration with a Multi-Agent RAG System
Link: https://arxiv.org/abs/2502.03948
- In diesem Paper wird ein Multi-Agenten-System vorgestellt, das heterogene Ressourcen integriert, um die Effizienz des Online-Lernens zu verbessern.
- Es werden Strategien zur optimalen Ressourcennutzung und zur Integration unterschiedlicher Datenquellen erläutert.
- Die experimentellen Ergebnisse belegen, dass der Ansatz zu einer signifikanten Steigerung der Lernleistung führt.
Ancient Greek Technology: An Immersive Learning Use Case Described Using a Co-Intelligent Custom ChatGPT Assistant
Link: https://arxiv.org/abs/2502.04110
- Das Paper beschreibt einen innovativen Anwendungsfall, bei dem ein maßgeschneiderter ChatGPT-Assistent zur immersiven Wissensvermittlung eingesetzt wird.
- Es kombiniert historische Inhalte mit modernen KI-Methoden, um eine interaktive Lernumgebung zu schaffen.
- Die Autoren zeigen, wie ein ko-intelligenter Assistent das Lernen durch kontextuelle Interaktion und personalisierte Unterstützung bereichern kann.
VTutor: An Open-Source SDK for Generative AI-Powered Animated Pedagogical Agents with Multi-Media Output
Link: https://arxiv.org/abs/2502.04103
- Dieses Paper stellt VTutor vor, ein Open-Source-SDK zur Erstellung von animierten, pädagogischen Agenten, die von generativer KI unterstützt werden.
- Der Ansatz integriert verschiedene Medienformate, um interaktive Lernanwendungen zu ermöglichen.
- Die vorgestellten Ergebnisse demonstrieren das Potenzial des Systems zur Verbesserung der Bildungslandschaft durch innovative KI-gestützte Ansätze.
LLMs to Support a Domain Specific Knowledge Assistant
Link: https://arxiv.org/abs/2502.04095
- Das Paper untersucht den Einsatz großer Sprachmodelle (LLMs) zur Unterstützung domänenspezifischer Wissensassistenten.
- Es werden Methoden vorgestellt, um die Interaktion zwischen Nutzern und KI-Agenten in spezialisierten Anwendungsfeldern zu optimieren.
- Die Ergebnisse unterstreichen die Effektivität der Modelle bei der Bereitstellung präziser und kontextbezogener Fachinformationen.
Large Language Models for Multi-Robot Systems: A Survey
Link: https://arxiv.org/abs/2502.03814
- Dieses Survey-Paper bietet einen umfassenden Überblick über den Einsatz großer Sprachmodelle in Multi-Roboter-Systemen.
- Es beleuchtet die Herausforderungen und Chancen bei der Integration von LLMs in autonome Robotik-Agenten.
- Die Autoren identifizieren aktuelle Ansätze und skizzieren zukünftige Forschungsrichtungen zur Verbesserung der Systemleistung in Multi-Agenten-Settings.
Elucidation of the Concept of Consciousness from the Theory of Non-Human Communication Agents
Link: https://arxiv.org/abs/2502.03508
- In diesem Paper wird das Konzept des Bewusstseins anhand der Theorie nicht-menschlicher Kommunikationsagenten untersucht.
- Es werden theoretische Modelle und Erklärungsansätze vorgestellt, die Kommunikationsverhalten und Selbstwahrnehmung beleuchten.
- Die Arbeit liefert neue Perspektiven auf das Zusammenspiel von KI und Bewusstseinsforschung und eröffnet Ansätze für weiterführende Untersuchungen.

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 6.2.2025

SymAgent: A Neural-Symbolic Self-Learning Agent Framework for Complex Reasoning over Knowledge Graphs

• Das Paper stellt einen neuartigen KI-Agenten vor, der neuronale und symbolische Ansätze integriert.
• Es demonstriert, wie dieser Agent komplexe Schlussfolgerungen über Wissensgraphen ziehen kann.
• Die Ergebnisse belegen eine verbesserte Fähigkeit in wissensbasierten Aufgaben.
Link zum Paper

2. FedMobileAgent: Training Mobile Agents Using Decentralized Self-Sourced Data from Diverse Users

• Dieses Paper präsentiert einen Ansatz zum Training mobiler KI-Agenten unter Nutzung dezentral gesammelter Daten.
• Es wird gezeigt, wie diverse Datenquellen zur Steigerung der Agentenleistung beitragen können.
• Die Methode demonstriert Robustheit und Anpassungsfähigkeit in heterogenen Umgebungen.
Link zum Paper

3. Fully Autonomous AI Agents Should Not be Developed

• Das Paper diskutiert die ethischen und sicherheitstechnischen Risiken autonomer KI-Agenten.
• Es argumentiert, dass vollständig autonome Agenten unerwünschte Konsequenzen mit sich bringen können.
• Zudem werden Empfehlungen zur Beschränkung der Autonomie von KI-Agenten gegeben.
Link zum Paper

4. ReachAgent: Enhancing Mobile Agent via Page Reaching and Operation

• Dieses Paper stellt „ReachAgent“ vor, einen Ansatz zur Verbesserung der Funktionalität mobiler Agenten durch gezieltes Seiten-Erreichen.
• Es kombiniert Techniken der Informationsbeschaffung und operative Optimierung.
• Die Resultate deuten auf eine signifikante Steigerung der Effizienz mobiler Agenten hin.
Link zum Paper

5. OceanChat: The Effect of Virtual Conversational AI Agents on Sustainable Attitude and Behavior Change

• Das Paper untersucht den Einfluss virtueller Gesprächs-KI-Agenten auf nachhaltige Einstellungs- und Verhaltensänderungen.
• Es analysiert, wie interaktive Agenten Einstellungen und Verhalten in sozialen Kontexten beeinflussen können.
• Die empirische Studie liefert Belege für die Wirksamkeit von KI-gestützter Kommunikation im Bereich Nachhaltigkeit.
Link zum Paper

6. Wolfpack Adversarial Attack for Robust Multi-Agent Reinforcement Learning

• Dieses Paper behandelt adversariale Angriffe in Szenarien des Multi-Agent Reinforcement Learning.
• Es wird ein neuartiger Angriff namens „Wolfpack“ zur Überprüfung der Robustheit von Agenten vorgestellt.
• Die Ergebnisse zeigen, dass der Angriff die Sicherheit und Zuverlässigkeit von Multi-Agent Systemen signifikant herausfordert.
Link zum Paper

7. Classroom Simulacra: Building Contextual Student Generative Agents in Online Education for Learning Behavioral Simulation

• Das Paper beschreibt die Entwicklung generativer Agenten zur Simulation von studentischem Verhalten in Online-Lernumgebungen.
• Es wird ein Framework präsentiert, das realistische Interaktionen und Verhaltensmuster nachbildet.
• Die Studie zeigt, wie solche Agenten zur Verbesserung von Bildungssimulationen beitragen können.
Link zum Paper

8. PatchPilot: A Stable and Cost-Efficient Agentic Patching Framework

• Dieses Paper führt „PatchPilot“ ein, einen Framework-Ansatz zur agentischen Verwaltung von Software-Patches.
• Der Fokus liegt auf Stabilität und Kosteneffizienz bei der Anwendung von Systemupdates.
• Die Ergebnisse demonstrieren, dass der agentische Ansatz signifikante Vorteile in der Fehlerbehebung und Wartung bietet.
Link zum Paper

9. MedRAX: Medical Reasoning Agent for Chest X-ray

• Das Paper präsentiert „MedRAX“, einen medizinischen KI-Agenten zur Analyse von Brust-Röntgenaufnahmen.
• Es integriert maschinelles Lernen und logische Schlussfolgerungen zur Unterstützung der Diagnostik.
• Die Resultate weisen auf eine hohe Genauigkeit und praktische Anwendbarkeit in der Radiologie hin.
Link zum Paper

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 5.2.2025

A Minimax Approach to Ad Hoc Teamwork
Beschreibung:
- Das Paper präsentiert einen Minimax-Ansatz zur Koordination in ad-hoc Teams.
- Es werden strategische Entscheidungsmodelle für variable Agentenzusammenstellungen entwickelt.
- Theoretische Analysen und experimentelle Ergebnisse belegen die Vorteile der vorgeschlagenen Methode.
  Link zum Paper: https://arxiv.org/abs/2502.02377
CH-MARL: Constrained Hierarchical Multiagent Reinforcement Learning for Sustainable Maritime Logistics
Beschreibung:
- In diesem Beitrag wird ein hierarchischer Multiagenten-RL-Ansatz speziell für maritime Logistik vorgestellt.
- Es kommen Einschränkungen zur Gewährleistung nachhaltiger Abläufe zum Einsatz.
- Die Methodik verbessert die Planung und Koordination in komplexen Logistiksystemen.
  Link zum Paper: https://arxiv.org/abs/2502.02060
An Agentic AI Workflow for Detecting Cognitive Concerns in Real-world Data
Beschreibung:
- Das Paper stellt einen agentischen Workflow vor, der KI zur Erkennung kognitiver Auffälligkeiten einsetzt.
- Es werden datengetriebene Analysen mit domänenspezifischem Expertenwissen kombiniert.
- Erste Anwendungsergebnisse an realen Datensätzen zeigen die Effektivität der Herangehensweise.
  Link zum Paper: https://arxiv.org/abs/2502.01789
QLASS: Boosting Language Agent Inference via Q-Guided Stepwise Search
Beschreibung:
- Das Paper führt einen Q-gesteuerten, schrittweisen Suchansatz zur Verbesserung der Inferenz von Sprachagenten ein.
- Die Methode optimiert Entscheidungsfindungen in sprachbasierten KI-Agenten.
- Experimentelle Vergleiche belegen eine Steigerung der Genauigkeit und Effizienz gegenüber Basismodellen.
  Link zum Paper: https://arxiv.org/abs/2502.02584
Decision Theoretic Foundations for Conformal Prediction: Optimal Uncertainty Quantification for Risk-Averse Agents
Beschreibung:
- Hier wird ein entscheidungstheoretischer Rahmen für die Unsicherheitsquantifizierung in KI-Agenten entwickelt.
- Das Paper adaptiert konforme Vorhersagemethoden, um risikoscheuen Agenten robuste Entscheidungen zu ermöglichen.
- Theoretische Garantien und empirische Tests unterstreichen den Nutzen des Ansatzes.
  Link zum Paper: https://arxiv.org/abs/2502.02561
Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies
Beschreibung:
- Der Beitrag untersucht, wie durch optimierte Prompts und Netzwerkstrukturen Multiagentensysteme verbessert werden können.
- Es werden Designprinzipien vorgestellt, die die Leistungsfähigkeit von KI-Agenten steigern.
- Empirische Studien zeigen signifikante Verbesserungen in der Agenteninteraktion und -koordination.
  Link zum Paper: https://arxiv.org/abs/2502.02533
Can You Move These Over There? An LLM-based VR Mover for Supporting Object Manipulation
Beschreibung:
- Dieses Paper präsentiert einen virtuellen Assistenten, der mithilfe großer Sprachmodelle Objekte in VR-Umgebungen bewegt.
- Es werden Interaktionsmechanismen zwischen LLMs und virtuellen Realitäten erforscht.
- Die Evaluierung zeigt, dass die Methode die Benutzerinteraktion in simulationsbasierten Anwendungen verbessert.
  Link zum Paper: https://arxiv.org/abs/2502.02368
AdaptBot: Combining LLM with Knowledge Graphs and Human Input for Generic-to-Specific Task Decomposition and Knowledge Refinement
Beschreibung:
- AdaptBot kombiniert große Sprachmodelle, Wissensgraphen und menschliches Feedback zur Aufgabenzerlegung.
- Der Agent wird von einer generischen Problemlösung zu spezialisierten, präzisen Arbeitsabläufen geführt.
- Die vorgestellte Methode verbessert die Effizienz und Genauigkeit in komplexen Task-Management-Szenarien.
  Link zum Paper: https://arxiv.org/abs/2502.02067
DHP: Discrete Hierarchical Planning for Hierarchical Reinforcement Learning Agents
Beschreibung:
- In diesem Paper wird ein diskreter, hierarchischer Planungsansatz für Reinforcement-Learning-Agenten entwickelt.
- Die Methode ermöglicht es Agenten, Entscheidungen auf mehreren Ebenen zu treffen.
- Experimente belegen, dass die hierarchische Planung zu einer signifikanten Leistungssteigerung in komplexen Aufgaben führt.
  Link zum Paper: https://arxiv.org/abs/2502.01956
VolleyBots: A Testbed for Multi-Drone Volleyball Game Combining Motion Control and Strategic Play
Beschreibung:
- Das Paper stellt VolleyBots vor, eine Plattform zur Erprobung von Multi-Drohnen-Spielen.
- Es werden sowohl Bewegungssteuerung als auch strategische Entscheidungsfindung in den Agenten integriert.
- Die Testumgebung dient als Experimentierfeld für die Koordination und Interaktion mehrerer autonomer Drohnen.
  Link zum Paper: https://arxiv.org/abs/2502.01932
Wake-Informed 3D Path Planning for Autonomous Underwater Vehicles Using A* and Neural Network Approximations
Beschreibung:
- Der Beitrag präsentiert einen neuartigen Ansatz zur 3D-Routenplanung für autonome Unterwasserfahrzeuge.
- Es wird A*-Suche mit neuronalen Netzwerken kombiniert, um Umgebungsinformationen effektiv zu nutzen.
- Die Methode verbessert die Navigation autonomer Agenten in komplexen, dynamischen Unterwasserumgebungen.
  Link zum Paper: https://arxiv.org/abs/2502.01918
Agentic Bug Reproduction for Effective Automated Program Repair at Google
Beschreibung:
- Dieses Paper beschreibt einen agentischen Ansatz zur Reproduktion und Analyse von Softwarefehlern.
- Mithilfe von KI wird das Verhalten von Bugs simuliert, um automatisierte Reparaturen zu unterstützen.
- Erste Ergebnisse deuten auf eine deutliche Effizienzsteigerung im automatisierten Programmreparaturprozess hin.
  Link zum Paper: https://arxiv.org/abs/2502.01821
Flow-based Domain Randomization for Learning and Sequencing Robotic Skills
Beschreibung:
- Das Paper stellt eine flow-basierte Methode zur Domänenrandomisierung vor, um robotische Fertigkeiten zu erlernen.
- Es wird untersucht, wie Roboter durch zufallsbasierte Variationen besser generalisieren können.
- Die vorgestellte Technik verbessert das Sequenzieren und die Ausführung komplexer Bewegungsabläufe in Robotern.
  Link zum Paper: https://arxiv.org/abs/2502.01800
Position: Towards a Responsible LLM-empowered Multi-Agent Systems
Beschreibung:
- In diesem Beitrag wird die Integration von großen Sprachmodellen in Multiagentensysteme thematisiert.
- Es werden ethische und verantwortungsbewusste Aspekte im Design und Einsatz solcher Systeme beleuchtet.
- Theoretische Überlegungen und experimentelle Resultate bieten Ansätze für einen sicheren und effektiven Einsatz.
  Link zum Paper: https://arxiv.org/abs/2502.01714
Agent-Based Uncertainty Awareness Improves Automated Radiology Report Labeling with an Open-Source Large Language Model
Beschreibung:
- Das Paper präsentiert einen agentenbasierten Ansatz zur Unsicherheitsabschätzung bei der automatisierten Radiologiebericht-Erstellung.
- Durch die Kombination offener Sprachmodelle mit Unsicherheitsbewertung wird die Genauigkeit der Labeling-Prozesse gesteigert.
- Erste Tests zeigen, dass die Methode insbesondere in sicherheitskritischen medizinischen Anwendungen Vorteile bietet.
  Link zum Paper: https://arxiv.org/abs/2502.01691

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 4.2.2025

2025-02-04, die sich explizit mit KI-Agenten bzw. multiagenten Systemen beschäftigen:

TReMu: Towards Neuro‑Symbolic Temporal Reasoning for LLM‑Agents with Memory in Multi‑Session Dialogues
- • Das Paper präsentiert einen Ansatz, der neuro‑symbolische Methoden mit zeitlicher Argumentation kombiniert.
- • Im Fokus stehen LLM‑Agenten mit Gedächtnis, die mehrstufige Dialoge effizient verarbeiten.
- • Ziel ist es, das Verständnis und die Interaktion in komplexen Dialogsystemen zu verbessern.
  Link zum Paper
Sea‑cret Agents: Maritime Abduction for Region Generation to Expose Dark Vessel Trajectories
- • Hier wird ein KI‑Agentenansatz vorgestellt, der maritime Regionen analysiert.
- • Mithilfe abduktiven Schließens werden verborgene Schiffsbewegungen aufgedeckt.
- • So soll durch regionenspezifische Analyse die Transparenz dunkler Schiffsrouten erhöht werden.
  Link zum Paper
Develop AI Agents for System Engineering in Factorio
- • Das Paper beschreibt die Entwicklung autonomer KI‑Agenten zur Optimierung systemtechnischer Prozesse in Factorio.
- • Es wird gezeigt, wie Agenten komplexe industrielle Abläufe steuern können.
- • Der Fokus liegt auf praktischen Implementierungen zur Leistungsverbesserung in simulationsbasierten Umgebungen.
  Link zum Paper
RTBAgent: A LLM‑based Agent System for Real‑Time Bidding
- • In diesem Beitrag wird ein Agentensystem vorgestellt, das auf großen Sprachmodellen basiert und Echtzeit-Bidding optimiert.
- • Der Ansatz verbessert die Entscheidungsfindung in zeitkritischen Auktionsprozessen.
- • Die Ergebnisse zeigen, wie KI‑Agenten wirtschaftliche Transaktionen effizient unterstützen können.
  Link zum Paper
Perspectives for Direct Interpretability in Multi‑Agent Deep Reinforcement Learning
- • Das Paper untersucht Ansätze zur besseren Nachvollziehbarkeit von Entscheidungen in multiagenten Deep‑Reinforcement‑Learning-Systemen.
- • Es werden Methoden vorgestellt, die Transparenz in der Zusammenarbeit von Agenten fördern.
- • Damit sollen komplexe Entscheidungsprozesse in kooperativen Umgebungen verständlicher gemacht werden.
  Link zum Paper
ALU: Agentic LLM Unlearning
- • Hier wird ein Verfahren entwickelt, das es LLM‑Agenten ermöglicht, unerwünschtes Wissen selektiv zu „vergessen“.
- • Der Ansatz unterstützt die kontinuierliche Anpassung der Agenten, ohne ihre Leistungsfähigkeit zu beeinträchtigen.
- • Damit wird eine verbesserte Modellintegrität bei der Anpassung an neue Aufgaben angestrebt.
  Link zum Paper
A Differentiated Reward Method for Reinforcement Learning based Multi‑Vehicle Cooperative Decision‑Making Algorithms
- • Dieses Paper stellt einen differenzierten Belohnungsansatz für kooperative Entscheidungsfindung in Fahrzeugnetzwerken vor.
- • Durch Reinforcement Learning werden mehrere autonome Agenten in der Verkehrssteuerung koordiniert.
- • Ziel ist es, die Zusammenarbeit und Effizienz in solchen multiagenten Systemen zu optimieren.
  Link zum Paper
A Dynamic and High‑Precision Method for Scenario‑Based HRA Synthetic Data Collection in Multi‑Agent Collaborative Environments Driven by LLMs
- • Das Paper präsentiert eine Methode zur synthetischen Datenerzeugung in kollaborativen, multiagenten Umgebungen.
- • Dabei werden LLM‑Agenten eingesetzt, um realistische Szenarien für sicherheitsrelevante Anwendungen zu simulieren.
- • Dies ermöglicht eine präzise Modellierung von Mensch‑Computer‑Interaktionen in komplexen Settings.
  Link zum Paper
The AI Agent Index
- • In diesem Beitrag wird ein umfassender Index bestehender KI‑Agenten und ihrer Einsatzgebiete präsentiert.
- • Es erfolgt eine Katalogisierung und Bewertung verschiedener Agentensysteme.
- • Der Index dient als Referenz für die Weiterentwicklung und Vergleichbarkeit von Agenten im KI‑Bereich.
  Link zum Paper
Reinforcement Learning for Long‑Horizon Interactive LLM Agents
- • Das Paper untersucht den Einsatz von Reinforcement Learning zur Steuerung interaktiver LLM‑Agenten über längere Zeiträume.
- • Es werden Strategien entwickelt, um die Leistungsfähigkeit der Agenten bei Langzeitaufgaben zu steigern.
- • Die Ergebnisse belegen eine verbesserte Effizienz in der Handhabung komplexer Interaktionsszenarien.
  Link zum Paper
Simulating Rumor Spreading in Social Networks using LLM Agents
- • Hier wird ein Modell vorgestellt, das mithilfe von LLM‑Agenten die Ausbreitung von Gerüchten in sozialen Netzwerken simuliert.
- • Es werden agentenbasierte Ansätze mit sozialnetzwerkanalytischen Methoden kombiniert.
- • Ziel ist es, Kommunikationsmuster und deren Auswirkungen in digitalen Netzwerken besser zu verstehen.
  Link zum Paper
Eliciting Language Model Behaviors with Investigator Agents
- • Das Paper beschreibt den Einsatz spezieller „Investigator‑Agenten“, um das Verhalten großer Sprachmodelle systematisch zu erforschen.
- • Es werden Methoden entwickelt, die das Verhaltensspektrum der LLMs gezielt hervorheben.
- • So sollen tiefergehende Einblicke in die internen Entscheidungsprozesse der Modelle gewonnen werden.
  Link zum Paper
Provable Ordering and Continuity in Vision‑Language Pretraining for Generalizable Embodied Agents
- • In diesem Beitrag wird der Zusammenhang zwischen Vision‑Language‑Vortraining und der kontinuierlichen Lernfähigkeit von eingebetteten Agenten analysiert.
- • Es werden theoretische Garantien für eine geordnete und stabile Repräsentation erbracht.
- • Der Ansatz zielt darauf ab, die Generalisierungsfähigkeit von Agenten in multimodalen Aufgaben zu verbessern.
  Link zum Paper
Advanced Architectures Integrated with Agentic AI for Next‑Generation Wireless Networks
- • Dieses Paper fokussiert sich auf die Integration agentischer KI in moderne drahtlose Netzwerke.
- • Es werden fortschrittliche Architekturen vorgestellt, die autonomes Handeln und dynamische Entscheidungsfindung ermöglichen.
- • Der Beitrag adressiert zentrale Herausforderungen bei der Skalierung und Implementierung solcher Systeme.
  Link zum Paper
ChartCitor: Multi‑Agent Framework for Fine‑Grained Chart Visual Attribution
- • Das Paper stellt ein Multi‑Agent System vor, das sich auf die detaillierte Analyse und Interpretation von Diagrammen spezialisiert.
- • Mehrere Agenten arbeiten zusammen, um visuelle Elemente von Charts präzise zu attribuieren.
- • Dadurch wird die automatisierte Datenvisualisierung und -interpretation deutlich verbessert.
  Link zum Paper
PlotGen: Multi‑Agent LLM‑based Scientific Data Visualization via Multimodal Feedback
- • Hier wird ein multiagentenbasierter Ansatz für die wissenschaftliche Datenvisualisierung präsentiert.
- • LLM‑Agenten interagieren mit multimodalen Daten, um aussagekräftige Visualisierungen zu erzeugen.
- • Der Ansatz verbessert sowohl die Präzision als auch die interpretative Qualität der Diagramme.
  Link zum Paper
ML‑Dev‑Bench: Comparative Analysis of AI Agents on ML development workflows
- • Das Paper analysiert den Einsatz von KI‑Agenten in Entwicklungsworkflows für maschinelles Lernen.
- • Es werden verschiedene Agenten hinsichtlich ihrer Effizienz und Beitrag zur Workflow-Optimierung verglichen.
- • Ziel ist es, Best Practices für den produktiven Einsatz von Agenten in der ML‑Entwicklung abzuleiten.
  Link zum Paper
AgentBreeder: Mitigating the AI Safety Impact of Multi‑Agent Scaffolds
- • In diesem Beitrag wird ein Ansatz zur Reduktion sicherheitsrelevanter Risiken in Multi‑Agent Systemen entwickelt.
- • Es werden Mechanismen vorgestellt, die negative Effekte von Agentenskalen auf die KI‑Sicherheit abmildern.
- • Der Fokus liegt auf praxisnahen Strategien zur Verbesserung der Robustheit von Agenten.
  Link zum Paper
Looking into the Future of Health‑Care Services: Can Life‑Like Agents Change the Future of Health‑Care Services?
- • Das Paper untersucht, wie lebensnahe KI‑Agenten das Gesundheitswesen revolutionieren könnten.
- • Es wird analysiert, inwieweit autonome Agenten in der Patientenbetreuung und Diagnostik eingesetzt werden können.
- • Dabei werden sowohl potenzielle Vorteile als auch Herausforderungen bei der Implementierung beleuchtet.
  Link zum Paper
MarketSenseAI 2.0: Enhancing Stock Analysis through LLM Agents
- • Hier wird ein KI‑Agentensystem vorgestellt, das die Aktienanalyse mithilfe großer Sprachmodelle verbessert.
- • Es werden innovative Ansätze zur Integration von LLM‑Agenten in finanzielle Entscheidungsprozesse präsentiert.
- • Der Beitrag demonstriert, wie präzise und zeitnahe Marktanalysen durch KI‑Agenten ermöglicht werden können.
  Link zum Paper
OrcaLoca: An LLM Agent Framework for Software Issue Localization
- • Dieses Paper präsentiert ein Framework, in dem LLM‑Agenten zur Lokalisierung von Softwarefehlern eingesetzt werden.
- • Es wird ein mehrstufiger Prozess beschrieben, der Entwicklern bei der präzisen Fehlerdiagnose hilft.
- • Der Ansatz steigert die Effizienz in der Softwarewartung und -optimierung deutlich.
  Link zum Paper
The Composite Task Challenge for Cooperative Multi‑Agent Reinforcement Learning
- • Das Paper formuliert eine komplexe Aufgabenstellung zur Kooperation mehrerer Agenten im Reinforcement Learning.
- • Es werden Herausforderungen und Lösungsansätze für kooperative Lernumgebungen diskutiert.
- • Benchmarking-Ergebnisse belegen die Effektivität des multiagenten Ansatzes bei der Aufgabenbewältigung.
  Link zum Paper
Musical Agent Systems: MACAT and MACataRT
- • In diesem Beitrag wird der Einsatz von KI‑Agenten im musikalischen Kontext untersucht.
- • Zwei Frameworks werden vorgestellt, die Agenten für kreative Aufgaben in der Musikproduktion nutzen.
- • Ziel ist es, die Interaktion zwischen Mensch und Maschine in kreativen Prozessen zu fördern.
  Link zum Paper
A Study about Distribution and Acceptance of Conversational Agents for Mental Health in Germany: Keep the Human in the Loop?
- • Das Paper untersucht die Verbreitung und Akzeptanz von Konversationsagenten im Bereich der psychischen Gesundheit in Deutschland.
- • Es werden sowohl technische Aspekte als auch gesellschaftliche Rahmenbedingungen des Agenteneinsatzes analysiert.
- • Der Beitrag betont die Bedeutung menschlicher Intervention zur Unterstützung von KI‑Systemen in sensiblen Anwendungen.
  Link zum Paper

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 3.2.2025

1. Titel: An Empirical Game-Theoretic Analysis of Autonomous Cyber-Defence Agents
Beschreibung:

Dieses Paper untersucht den Einsatz von autonomen Cyber-Verteidigungsagenten mit Hilfe einer empirischen spieltheoretischen Analyse.

Es werden verschiedene Strategien und Verhaltensweisen dieser Agenten in Cyber-Sicherheitsszenarien analysiert.
Das Ziel ist es, ein besseres Verständnis für die Dynamik und Effektivität von KI-gestützten Verteidigungssystemen zu entwickeln.
Link: http://arxiv.org/abs/2501.19206

2. Titel: Language Games as the Pathway to Artificial Superhuman Intelligence
Beschreibung:

Dieses Positionspapier argumentiert, dass Sprachspiele einen robusten Mechanismus für die Erreichung übermenschlicher Intelligenz in großen Sprachmodellen darstellen.
Es wird die Idee untersucht, dass die Fähigkeit, komplexe Sprachspiele zu meistern, ein Schlüssel zur Entwicklung fortschrittlicher KI sein könnte.
Das Papier diskutiert die Implikationen für zukünftige Forschungsrichtungen im Bereich der künstlichen Intelligenz.
Link: http://arxiv.org/abs/2501.18924

3. Titel: Enabling Autonomic Microservice Management through Self-Learning Agents
Beschreibung:

Dieses Paper untersucht die Anwendung von selbstlernenden Agenten zur autonomen Verwaltung von Microservice-Architekturen.
Es wird ein Ansatz vorgestellt, bei dem KI-Agenten eingesetzt werden, um die Leistung und Zuverlässigkeit von Microservices zu optimieren.
Das Ziel ist die Automatisierung komplexer Verwaltungsaufgaben in verteilten Systemen durch intelligente Agententechnologie.
Link: http://arxiv.org/abs/2501.19057

4. Titel: Layered Chain-of-Thought Prompting for Multi-Agent LLM Systems: A Comprehensive Approach to Explainable Large Language Models
Beschreibung:

Dieses Paper präsentiert einen umfassenden Ansatz namens Layered Chain-of-Thought Prompting für Multi-Agenten-Systeme, die auf großen Sprachmodellen (LLMs) basieren.
Es wird untersucht, wie diese Methode die Erklärbarkeit von LLMs in Multi-Agenten-Kontexten verbessern kann.
Das Paper zielt darauf ab, die Transparenz und das Verständnis komplexer Interaktionen in KI-Systemen zu fördern.
Link: http://arxiv.org/abs/2501.18645

5. Titel: MINDSTORES: Memory-Informed Neural Decision Synthesis for Task-Oriented Reinforcement in Embodied Systems
Beschreibung:

Dieses Paper präsentiert MINDSTORES, ein System für speicherinformierte neuronale Entscheidungssynthese.
Es zielt darauf ab, die aufgabenorientierte Verstärkung in verkörperten Systemen zu verbessern, indem es Gedächtnismechanismen integriert.
Das Paper untersucht, wie Gedächtnis die Entscheidungsfindung von Agenten in komplexen Umgebungen beeinflussen kann.
Link: http://arxiv.org/abs/2501.19318

6. Titel: SETS: Leveraging Self-Verification and Self-Correction for Improved Test-Time Scaling
Beschreibung:

Dieses Paper untersucht die Verwendung von Selbstverifikation und Selbstkorrektur in KI-Systemen.
Es stellt SETS vor, einen Ansatz zur Verbesserung der Testzeit-Skalierung durch interne Validierungsmechanismen.
Das Paper demonstriert, wie Agenten ihre eigenen Entscheidungen überprüfen und korrigieren können, um die Leistung zu steigern.
Link: http://arxiv.org/abs/2501.19306

7. Titel: Synthetic User Behavior Sequence Generation with Large Language Models for Smart Homes
Beschreibung:

Dieses Paper untersucht die Generierung synthetischer Nutzerverhaltenssequenzen für Smart-Home-Umgebungen mithilfe von Large Language Models.
Es wird erforscht, wie LLMs genutzt werden können, um realistische Nutzerinteraktionen für die Simulation und das Testen von Smart-Home-Systemen zu erzeugen.
Das Ziel ist es, virtuelle Nutzeragenten zu schaffen, um das Verhalten und die Leistung von Smart Homes umfassender zu bewerten.
Link: http://arxiv.org/abs/2501.19298

8. Titel: SHARPIE: A Modular Framework for Reinforcement Learning and Human-AI Interaction Experiments
Beschreibung:

Dieses Paper stellt SHARPIE vor, ein modulares Framework für Reinforcement Learning und Human-AI-Interaktions-Experimente.
Es bietet Werkzeuge und eine Plattform zur Erforschung der Interaktion zwischen Menschen und KI-Agenten in RL-Umgebungen.
Das Framework zielt darauf ab, die Entwicklung und Evaluierung von Agenten zu erleichtern, die effektiv mit Menschen zusammenarbeiten können.
Link: http://arxiv.org/abs/2501.19245

9. Titel: Imitation Game for Adversarial Disillusion with Multimodal Generative Chain-of-Thought Role-Play
Beschreibung:

Dieses Paper untersucht ein Imitationsspiel für Adversarial Disillusion unter Verwendung von multimodalen generativen Chain-of-Thought-Rollenspielen.
Es erforscht, wie Agenten in Rollenspielen eingesetzt werden können, um adversarialle Angriffe zu simulieren und Abwehrmechanismen zu testen.
Das Paper zielt darauf ab, die Robustheit von KI-Systemen gegenüber Täuschungsversuchen durch agentenbasierte Simulationen zu verbessern.
Link: http://arxiv.org/abs/2501.19143

10. Titel: Bridging the Reasoning Gap: Small LLMs Can Plan with Generalised Strategies
Beschreibung:

Dieses Paper untersucht die Planungsfähigkeiten von kleinen Large Language Models (LLMs).
Es zeigt, dass auch kleinere LLMs in der Lage sind, mit generalisierten Strategien zu planen und somit über reine Mustererkennung hinauszugehen.
Das Paper demonstriert das Potenzial von LLMs als Planungsagenten in verschiedenen Domänen.
Link: http://arxiv.org/abs/2501.18817

11. Titel: LLM-Generated Heuristics for AI Planning: Do We Even Need Domain-Independence Anymore?
Beschreibung:

Dieses Paper untersucht die Verwendung von LLM-generierten Heuristiken für KI-Planungsprobleme.
Es wird die Frage aufgeworfen, ob domänenunabhängige Planungsansätze angesichts der Leistungsfähigkeit von LLMs noch notwendig sind.
Das Paper evaluiert die Effektivität von LLMs bei der Generierung von Heuristiken für Planungsagenten.
Link: http://arxiv.org/abs/2501.18784

12. Titel: Simulation Streams: A Programming Paradigm for Controlling Large Language Models and Building Complex Systems with Generative AI
Beschreibung:

Dieses Paper stellt Simulation Streams vor, ein Programmierparadigma zur Steuerung von Large Language Models und zum Aufbau komplexer Systeme mit generativer KI.
Es bietet einen Ansatz zur Orchestrierung von LLMs in komplexen Anwendungen, die agentenartige Verhaltensweisen und Interaktionen erfordern.
Das Paradigma zielt darauf ab, die Entwicklung und den Einsatz von Agenten-Systemen mit LLMs zu vereinfachen.
Link: http://arxiv.org/abs/2501.18668

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 31.1.2025

Gravity-Bench-v1: A Benchmark on Gravitational Physics Discovery for Agents
https://arxiv.org/abs/2501.18411

Das Paper stellt einen Benchmark vor, der KI-Agenten bei der Entdeckung gravitationsphysikalischer Gesetzmäßigkeiten unterstützt.
Es werden experimentelle Ergebnisse sowie technische Details des Setups und der Evaluationsmethodik präsentiert.
Die Resultate belegen, dass Agenten komplexe physikalische Zusammenhänge in simulierten Umgebungen effektiv erfassen können.

Leveraging LLM Agents for Automated Optimization Modeling for SASP Problems: A Graph-RAG based Approach
https://arxiv.org/abs/2501.18320

In diesem Paper wird der Einsatz von LLM-Agenten zur automatisierten Modellierung von Optimierungsproblemen im Rahmen von SASP aufgezeigt.
Ein innovativer Graph-RAG-basierter Ansatz wird vorgestellt, der die Integration von Sprachmodellen mit Optimierungsalgorithmen ermöglicht.
Die vorgestellten Ergebnisse demonstrieren eine gesteigerte Effizienz und Genauigkeit bei der Lösung komplexer Optimierungsaufgaben.

Model-Free RL Agents Demonstrate System 1-Like Intentionality
https://arxiv.org/abs/2501.18299

Das Paper untersucht modellfreie Reinforcement-Learning-Agenten und vergleicht deren Verhalten mit intuitiven, schnellen Entscheidungsprozessen (System 1).
Es werden experimentelle Studien präsentiert, die belegen, dass diese Agenten spontane und effektive Entscheidungen treffen.
Die gewonnenen Erkenntnisse liefern wichtige Hinweise zur Gestaltung von Agenten, die menschenähnliche Entscheidungsstrategien adaptieren.

Economic Rationality under Specialization: Evidence of Decision Bias in AI Agents
https://arxiv.org/abs/2501.18190

In diesem Paper wird untersucht, wie Spezialisierung die wirtschaftliche Rationalität von KI-Agenten beeinflusst.
Empirische Analysen zeigen, dass spezialisierte Agenten systematische Entscheidungsverzerrungen aufweisen.
Die Resultate bieten wertvolle Implikationen für das Design und die Optimierung von KI-Agenten im wirtschaftlichen Kontext.

Free Agent in Agent-Based Mixture-of-Experts Generative AI Framework
https://arxiv.org/abs/2501.17903

Das Paper präsentiert einen neuartigen Ansatz, bei dem ein freier Agent in einem agentenbasierten Mixture-of-Experts Framework für generative KI integriert wird.
Es wird erläutert, wie dieser Agent zur Verbesserung der Expertenmischung und der generativen Leistungsfähigkeit beiträgt.
Experimentelle Ergebnisse unterstreichen das Potenzial des Ansatzes für vielfältige Anwendungen im Bereich der künstlichen Intelligenz.

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 30.1.2025

2025-01-30

Inferring Implicit Goals Across Differing Task Models
- Dieses Paper untersucht, wie KI-Agenten die versteckten Ziele hinter verschiedenen Aufgabenmodellen erkennen können.
- Die Autoren präsentieren einen Ansatz, der es Agenten ermöglicht, über verschiedene Aufgabenmodelle hinweg gemeinsame Ziele zu inferieren.
- Ziel ist es, die Flexibilität und das Verständnis von KI-Agenten bei der Bewältigung vielfältiger und impliziter Aufgabenstellungen zu verbessern.
- Link zum Paper auf arXiv.org
Integrating Reinforcement Learning and AI Agents for Adaptive Robotic Interaction and Assistance in Dementia Care
- Das Paper erforscht die Integration von Reinforcement Learning mit KI-Agenten für Roboter, die in der Demenzpflege unterstützen.
- Es wird gezeigt, wie Roboter durch RL-basierte Agenten adaptiv auf die Bedürfnisse von Demenzpatienten reagieren können.
- Ziel ist es, personalisierte und effektive Roboterinteraktion in der Betreuung zu ermöglichen.
- Link zum Paper auf arXiv.org
Actions Speak Louder than Words: Agent Decisions Reveal Implicit Biases in Language Models
- Diese Arbeit untersucht, wie sich implizite Voreingenommenheiten von Sprachmodellen in den Entscheidungen von Agenten manifestieren.
- Durch die Analyse von Agentenverhalten werden versteckte Vorurteile in Sprachmodellen aufgedeckt.
- Die Forschung trägt dazu bei, KI-Systeme fairer und unvoreingenommener zu gestalten.
- Link zum Paper auf arXiv.org
A Dual-Agent Adversarial Framework for Robust Generalization in Deep Reinforcement Learning
- Das Paper stellt einen Dual-Agent-Ansatz vor, um die Generalisierung von Deep-Reinforcement-Learning-Modellen zu verbessern.
- Durch einen adversarialen Prozess zwischen zwei Agenten wird die Robustheit der Modelle gesteigert.
- Das Ziel ist, die Leistung von RL-Agenten in verschiedenen Umgebungen zu verbessern.
- Link zum Paper auf arXiv.org
QualityFlow: An Agentic Workflow for Program Synthesis Controlled by LLM Quality Checks
- Dieses Paper beschreibt ein agentenbasiertes Workflow-System für die Programmsynthese, das von LLMs kontrolliert wird.
- Der Ansatz nutzt KI-Agenten um die Qualität der generierten Programme zu gewährleisten.
- Es soll die Zuverlässigkeit und Effizienz der automatischen Programmgenerierung verbessern.
- Link zum Paper auf arXiv.org
Dialogue Systems for Emotional Support via Value Reinforcement
- In diesem Paper wird ein Dialogsystem für emotionale Unterstützung vorgestellt, das auf Wert-Reinforcement basiert.
- Das System lernt, durch Interaktionen, die bestmögliche emotionale Unterstützung für den Nutzer zu leisten.
- Das Hauptziel ist die Entwicklung von KI-basierten Systemen, die einfühlsame und hilfreiche Dialoge führen können.
- Link zum Paper auf arXiv.org
Solving Urban Network Security Games: Learning Platform, Benchmark, and Challenge for AI Research
- Das Paper präsentiert eine Lernplattform für Sicherheitsspiele in urbanen Netzwerken, die als Benchmark für KI-Forschung dient.
- Es entwickelt und validiert einen Benchmark, der es ermöglicht, KI-Agenten in komplexen Sicherheitsherausforderungen zu testen.
- Der Fokus liegt auf der Verbesserung der Sicherheit städtischer Infrastrukturen durch fortgeschrittene KI-Methoden.
- Link zum Paper auf arXiv.org
From Natural Language to Extensive-Form Game Representations
- Diese Arbeit untersucht die automatische Umwandlung von natürlicher Sprache in Darstellungen von Spielen in extensiver Form.
- Der Ansatz zielt darauf ab, KI-Agenten zu ermöglichen, strategische Entscheidungen in komplexen Spielsituationen basierend auf verbalen Anweisungen zu treffen.
- Es wird ein neues Paradigma für KI-basierte strategische Planung und Entscheidungsfindung vorgestellt.
- Link zum Paper auf arXiv.org
Planning with Vision-Language Models and a Use Case in Robot-Assisted Teaching
- Das Paper untersucht die Nutzung von Vision-Language-Modellen zur Planungsfindung in der Robotik, insbesondere im Einsatz für das robotische Unterrichten.
- Es zeigt, wie Roboter mit VLM-basierter Planung komplexe Aufgaben verstehen und ausführen können.
- Die Forschung zielt darauf ab, Roboter interaktiver und adaptiver im Bildungsbereich zu machen.
- Link zum Paper auf arXiv.org
General Scene Adaptation for Vision-and-Language Navigation
- Das Paper stellt eine Methode zur Adaption von Vision- und Language Navigation an unterschiedliche Szenarien vor.
- Der Ansatz soll die Robustheit von Navigationssystemen in verschiedenartigen Umgebungen erhöhen.
- Das Ziel ist, dass KI-Agenten mit VLN-Systemen in neuen Umgebungen besser zurecht kommen.
- Link zum Paper auf arXiv.org
Anomaly Detection in Cooperative Vehicle Perception Systems under Imperfect Communication
- Dieses Paper befasst sich mit der Anomalieerkennung in kooperativen Fahrzeugwahrnehmungssystemen bei unvollständiger Kommunikation.
- Die Studie untersucht die Robustheit von KI-Agenten in autonomen Fahrzeugsystemen bei gestörter Datenübertragung.
- Es werden Methoden entwickelt, um Anomalien auch unter widrigen Kommunikationsbedingungen zu erkennen.
- Link zum Paper auf arXiv.org
Algorithmic Segmentation and Behavioral Profiling for Ransomware Detection Using Temporal-Correlation Graphs
* Das Paper entwickelt Algorithmen für die Segmentierung und Verhaltensprofilierung zur Ransomware-Erkennung.
* Es nutzt zeitliche Korrelationsgraphen, um verdächtige Aktivitäten zu identifizieren.
* Ziel ist, fortschrittliche KI-basierte Mechanismen zur Verbesserung der Cyber-Sicherheit einzusetzen.
* Link zum Paper auf arXiv.org
Intensional Inheritance Between Concepts: An Information-Theoretic Interpretation
- Dieses Paper untersucht die intensionale Vererbung zwischen Konzepten mithilfe einer informationstheoretischen Interpretation.
- Es wird ein Ansatz präsentiert, um Beziehungen zwischen Konzepten mithilfe von Informationsmetriken zu erfassen.
- Das Ziel ist eine verbesserte Repräsentation und Organisation von Wissen in KI-Systemen.
- Link zum Paper auf arXiv.org

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 29.1.2025

Revisit Mixture Models for Multi-Agent Simulation: Experimental Study within a Unified Framework
https://arxiv.org/abs/2501.17015
- Dieses Paper untersucht Mischungsmodelle für die Multi-Agenten-Simulation in einem einheitlichen Rahmen.
- Es werden experimentelle Studien durchgeführt, um die Leistungsfähigkeit verschiedener Mischungsmodellansätze in Multi-Agenten-Umgebungen zu bewerten.
- Der Fokus liegt auf dem Vergleich und der Analyse von Mischungsmodellen, um ein besseres Verständnis für deren Anwendung in komplexen Multi-Agenten-Systemen zu entwickeln.
Agential AI for Integrated Continual Learning, Deliberative Behavior, and Comprehensible Models
https://arxiv.org/abs/2501.16922
- Das Paper thematisiert Agential AI und deren Integration mit kontinuierlichem Lernen, deliberativem Verhalten und verständlichen Modellen.
- Es wird ein Ansatz für KI-Agenten vorgestellt, die in der Lage sind, kontinuierlich zu lernen und gleichzeitig überlegt zu handeln.
- Ziel ist es, KI-Agenten zu entwickeln, die nicht nur effektiv lernen und handeln, sondern deren Entscheidungen auch nachvollziehbar sind.
MACI: Multi-Agent Collaborative Intelligence for Robust Reasoning and Temporal Planning
https://arxiv.org/abs/2501.16689
- MACI steht für Multi-Agent Collaborative Intelligence und befasst sich mit robuster Argumentation und zeitlicher Planung in Multi-Agenten-Systemen.
- Das Paper präsentiert ein Framework für kollaborative Intelligenz, das es Agenten ermöglicht, gemeinsam zu argumentieren und Pläne zu entwickeln.
- Der Fokus liegt auf der Entwicklung von Systemen, die auch in komplexen und dynamischen Umgebungen zuverlässig funktionieren.
CowPilot: A Framework for Autonomous and Human-Agent Collaborative Web Navigation
https://arxiv.org/abs/2501.16609
- CowPilot ist ein Framework für autonome und kollaborative Webnavigation durch Mensch-Agenten-Teams.
- Es ermöglicht die Entwicklung von Systemen, in denen KI-Agenten und menschliche Nutzer gemeinsam im Web navigieren und Aufgaben erledigen können.
- Das Framework zielt darauf ab, die Effizienz und Effektivität der Webnavigation durch die Kombination von menschlicher Expertise und autonomer Agentenintelligenz zu verbessern.
Learning Mean Field Control on Sparse Graphs
https://arxiv.org/abs/2501.17079
- Dieses Paper untersucht das Lernen von Mean Field Control auf spärlichen Graphen.
- Es wird ein Ansatz entwickelt, um die Steuerung großer Multi-Agenten-Systeme zu optimieren, die durch spärliche Interaktionsgraphen charakterisiert sind.
- Die Arbeit konzentriert sich auf die Anwendung von Mean Field Control in Szenarien, in denen Agenten nur mit einer begrenzten Anzahl anderer Agenten interagieren.
RDMM: Fine-Tuned LLM Models for On-Device Robotic Decision Making with Enhanced Contextual Awareness in Specific Domains
https://arxiv.org/abs/2501.16899
- RDMM (Robotic Decision Making Model) nutzt feinabgestimmte LLM-Modelle für die Entscheidungsfindung in Robotern direkt auf dem Gerät.
- Der Fokus liegt auf verbesserter Kontextsensitivität in spezifischen Anwendungsbereichen, um präzisere und situationsgerechtere Roboteraktionen zu ermöglichen.
- Das Paper untersucht, wie Large Language Models effizient in Robotersysteme integriert werden können, um deren Autonomie und Anpassungsfähigkeit zu steigern.
Generalized Mission Planning for Heterogeneous Multi-Robot Teams via LLM-constructed Hierarchical Trees
https://arxiv.org/abs/2501.16539
- Dieses Paper befasst sich mit der generalisierten Einsatzplanung für heterogene Multi-Roboter-Teams mithilfe von LLM-konstruierten hierarchischen Bäumen.
- Es wird ein Ansatz vorgestellt, bei dem Large Language Models genutzt werden, um komplexe Missionspläne für Teams aus unterschiedlichen Robotertypen zu erstellen.
- Ziel ist es, die Planung von Multi-Roboter-Missionen flexibler und anpassungsfähiger an verschiedene Aufgaben und Umgebungen zu gestalten.
Sample-Efficient Behavior Cloning Using General Domain Knowledge
https://arxiv.org/abs/2501.16546
– Dieses Paper beschäftigt sich mit dem Problem der Proben-effizienten Verhaltensklonierung unter Nutzung allgemeinen Domänenwissens.
– Es wird untersucht, wie man von wenigen Demonstrationen eines Verhaltens lernen kann, indem man externes Wissen einbezieht, das über die spezifische Aufgabe hinausgeht.
– Der Fokus liegt auf der Entwicklung von Methoden, die es KI-Agenten ermöglichen, schneller und effizienter von menschlichen oder simulierten Beispielen zu lernen.
Governing the Agent-to-Agent Economy of Trust via Progressive Decentralization
https://arxiv.org/abs/2501.16607
- Das Paper thematisiert die Steuerung einer Agent-zu-Agent-Ökonomie des Vertrauens durch progressive Dezentralisierung.
- Es wird untersucht, wie man Vertrauensmechanismen in Systemen verteilter KI-Agenten gestalten kann, insbesondere in wirtschaftlichen Kontexten.
- Der Fokus liegt auf der Anwendung von Dezentralisierung, um Fairness, Transparenz und Robustheit in Multi-Agenten-Systemen zu fördern.
How Strategic Agents Respond: Comparing Analytical Models with LLM-Generated Responses in Strategic Classification
https://arxiv.org/abs/2501.16355
– Dieses Paper untersucht das Antwortverhalten strategischer Agenten in Szenarien der strategischen Klassifizierung.
– Es werden analytische Modelle mit Reaktionen verglichen, die von Large Language Models (LLMs) generiert wurden, um das strategische Denken von KI-Agenten zu analysieren.
– Der Fokus liegt auf dem Verständnis und der Modellierung, wie KI-Agenten in kompetitiven oder strategischen Situationen Entscheidungen treffen.

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 28.1.2025

1. Titel: AI Agents for Computer Use: A Review of Instruction-based Computer Control, GUI Automation, and Operator Assistants
Link: http://arxiv.org/abs/2501.16150
Beschreibung:

Dieses Paper gibt einen umfassenden Überblick über KI-Agenten, die für die Interaktion mit Computern entwickelt wurden.
Es werden verschiedene Methoden wie instruktionsbasierte Steuerung, GUI-Automatisierung und Assistenzsysteme für Computerbedienung untersucht.
Die Übersichtsarbeit analysiert den aktuellen Stand der Forschung und identifiziert zukünftige Herausforderungen und Forschungsrichtungen im Bereich der KI-Agenten für Computernutzer.

2. Titel: From Informal to Formal — Incorporating and Evaluating LLMs on Natural Language Requirements to Verifiable Formal Proofs
Link: http://arxiv.org/abs/2501.16207
Beschreibung:

Dieses Paper untersucht den Einsatz von Large Language Models (LLMs) als Agenten, um informelle natürlichsprachliche Anforderungen in formale, verifizierbare Beweise umzuwandeln.
Es demonstriert, wie LLMs genutzt werden können, um den Prozess der formalen Verifikation zu automatisieren und zugänglicher zu machen.
Die Arbeit evaluiert die Leistungsfähigkeit von LLMs in dieser Rolle und zeigt das Potenzial für die Integration von LLMs in formale Methoden der Softwareentwicklung, insbesondere im Kontext von intelligenten Agenten, die Software entwickeln oder verifizieren.

3. Titel: AI Agents for Computer Use: A Review of Instruction-based Computer Control, GUI Automation, and Operator Assistants
Link: http://arxiv.org/abs/2501.16150
Beschreibung:

Dieses Paper bietet eine Übersicht über KI-Agenten für die Computerbedienung, fokussiert auf instruktionsbasierte Steuerung, GUI-Automatisierung und Operator-Assistenz.
Es analysiert bestehende Ansätze und diskutiert deren Stärken und Schwächen im Hinblick auf Benutzerfreundlichkeit und Effektivität.
Die Review gibt einen Ausblick auf zukünftige Entwicklungen und Potentiale von KI-Agenten, die den Umgang mit Computern intuitiver und effizienter gestalten sollen.

4. Titel: Flexible Blood Glucose Control: Offline Reinforcement Learning from Human Feedback
Link: http://arxiv.org/abs/2501.15972
Beschreibung:

Dieses Paper untersucht den Einsatz von Offline-Reinforcement Learning, um KI-Agenten für die flexible Blutzuckerkontrolle zu trainieren.
Der Agent lernt aus menschlichem Feedback, um personalisierte und adaptive Strategien zur Blutzuckereinstellung zu entwickeln.
Die Forschung zielt darauf ab, autonome Systeme für die Diabetesbehandlung zu schaffen, die sich an individuelle Patientenbedürfnisse anpassen können und somit als medizinische KI-Agenten agieren könnten.

5. Titel: Harnessing Diverse Perspectives: A Multi-Agent Framework for Enhanced Error Detection in Knowledge Graphs
Link: http://arxiv.org/abs/2501.15791
Beschreibung:

Dieses Paper präsentiert ein Multi-Agenten-Framework, um die Fehlererkennung in Wissensgraphen durch die Nutzung unterschiedlicher Agentenperspektiven zu verbessern.
Verschiedene Agenten mit diversen Ansätzen arbeiten zusammen, um Fehler in Wissensgraphen effektiver zu identifizieren und zu beheben.
Die Evaluierung des Frameworks zeigt eine signifikante Steigerung der Genauigkeit und Robustheit der Fehlererkennung in Wissensgraphen durch die kollaborative Natur des Multi-Agenten-Systems.

6. Titel: LLM-powered Multi-agent Framework for Goal-oriented Learning in Intelligent Tutoring System
Link: http://arxiv.org/abs/2501.15749
Beschreibung:

Dieses Paper stellt ein Multi-Agenten-Framework vor, das auf Large Language Models (LLMs) aufbaut und für zielorientiertes Lernen in Intelligenten Tutorsystemen (ITS) konzipiert ist.
Das Framework nutzt die Fähigkeiten von LLMs, um verschiedene Rollen und Perspektiven in einem Lernprozess abzubilden, die durch kooperierende Agenten realisiert werden.
Die Arbeit untersucht, wie ein solches LLM-basiertes Multi-Agenten-System die Interaktivität, Personalisierung und Effektivität von ITS verbessern kann, indem es ein dynamisches und adaptives Lernumfeld schafft.

7. Titel: Expert-Free Online Transfer Learning in Multi-Agent Reinforcement Learning
Link: http://arxiv.org/abs/2501.15495
Beschreibung:

Diese Arbeit adressiert das Problem des Transferlernens in Multi-Agenten-Reinforcement-Learning (MARL) ohne die Notwendigkeit von Experten-Demonstrationen oder -Anleitungen.
Es wird ein neuartiger Ansatz präsentiert, der es Agenten ermöglicht, online Wissen und Fähigkeiten zwischen verschiedenen Aufgaben zu übertragen, ohne auf externe Experten angewiesen zu sein.
Die Forschung konzentriert sich auf die Entwicklung autonomer MARL-Systeme, die sich selbstständig an neue Umgebungen und Aufgaben anpassen und ihr Wissen kontinuierlich erweitern können, was für robuste KI-Agenten entscheidend ist.

8. Titel: Feedback-Aware Monte Carlo Tree Search for Efficient Information Seeking in Goal-Oriented Conversations
Link: http://arxiv.org/abs/2501.15056
Beschreibung:

Dieses Paper untersucht die Integration von Feedback in die Monte Carlo Tree Search (MCTS) Methode, um die Informationssuche in zielorientierten Konversationen zu optimieren.
Es wird ein Agent vorgeschlagen, der durch Feedback aus der Interaktion mit Benutzern lernt, seine Suchstrategie zu verbessern und relevantere Informationen zu liefern.
Die Arbeit demonstriert, wie Feedback-Aware MCTS die Effizienz und Qualität der Informationssuche in dialogorientierten KI-Agenten steigern kann, was besonders für Chatbots und virtuelle Assistenten relevant ist.

9. Titel: Contextual Knowledge Sharing in Multi-Agent Reinforcement Learning with Decentralized Communication and Coordination
Link: http://arxiv.org/abs/2501.15695
Beschreibung:

Dieses Paper befasst sich mit dem Problem des kontextsensitiven Wissensaustauschs in Multi-Agenten-Reinforcement-Learning (MARL) Systemen mit dezentraler Kommunikation.
Es wird ein Ansatz entwickelt, der es Agenten ermöglicht, basierend auf dem aktuellen Kontext relevante Informationen miteinander auszutauschen und ihre Aktionen zu koordinieren.
Die Forschung zeigt, dass kontextbezogener Wissensaustausch die Lernleistung, Koordination und Robustheit von MARL-Systemen in komplexen und dynamischen Umgebungen erheblich verbessern kann.

10. Titel: UNIDOOR: A Universal Framework for Action-Level Backdoor Attacks in Deep Reinforcement Learning
Link: http://arxiv.org/abs/2501.15529
Beschreibung:

Dieses Paper präsentiert UNIDOOR, ein universelles Framework für Backdoor-Angriffe auf Aktionslevel in Deep Reinforcement Learning (DRL) Agenten.
Es untersucht die Sicherheitsrisiken von DRL-Agenten und demonstriert, wie durch subtile Manipulationen im Trainingsprozess Backdoors in das Verhalten von Agenten eingebaut werden können.
Die Arbeit unterstreicht die Notwendigkeit, robuste Sicherheitsmechanismen für KI-Agenten zu entwickeln, insbesondere in sicherheitskritischen Anwendungen, in denen das Verhalten von Agenten manipuliert werden könnte.

11. Titel: Towards Conscious Service Robots
Link: http://arxiv.org/abs/2501.15145
Beschreibung:

Dieses Paper diskutiert die Entwicklung von Servicerobotern, die Merkmale von Bewusstsein aufweisen könnten, und die damit verbundenen ethischen und technischen Herausforderungen.
Es untersucht verschiedene Aspekte von Bewusstsein in Bezug auf Roboter und KI-Agenten, einschließlich Selbstwahrnehmung, Intentionalität und emotionaler Intelligenz.
Die Arbeit wirft grundlegende Fragen zur Zukunft der Robotik und der Möglichkeit wirklich intelligenter und möglicherweise bewusster KI-Agenten auf, die mit Menschen in komplexen sozialen Umgebungen interagieren können.

12. Titel: Research on the Application of Spark Streaming Real-Time Data Analysis System and large language model Intelligent Agents
Link: http://arxiv.org/abs/2501.14734
Beschreibung:

Dieses Paper untersucht die Anwendung intelligenter Agenten, basierend auf Large Language Models (LLMs), in Kombination mit Spark Streaming für Echtzeit-Datenanalyse.
Es wird analysiert, wie LLM-basierte Agenten verwendet werden können, um komplexe Datenverarbeitungsaufgaben in Echtzeit zu automatisieren und intelligenter zu gestalten.
Die Arbeit zeigt das Potential dieser Kombination für effiziente und flexible Echtzeit-Datenanalysesysteme, die in verschiedenen Anwendungsbereichen eingesetzt werden können, in denen schnelle und intelligente Entscheidungen auf Basis von Datenströmen erforderlich sind.

13. Titel: LLM as HPC Expert: Extending RAG Architecture for HPC Data
Link: http://arxiv.org/abs/2501.14733
Beschreibung:

Dieses Paper untersucht den Einsatz von Large Language Models (LLMs) als „Experten“ im Bereich High-Performance Computing (HPC), insbesondere durch Erweiterung der Retrieval-Augmented Generation (RAG) Architektur.
Es wird erforscht, wie LLMs als intelligente Agenten fungieren können, um HPC-Benutzer bei komplexen Aufgaben zu unterstützen, z.B. bei der Datenanalyse, Code-Optimierung und Systemkonfiguration.
Die Arbeit demonstriert, dass LLMs, ausgestattet mit relevantem HPC-Wissen, als wertvolle Assistenzsysteme für HPC-Experten dienen und die Effizienz der HPC-Nutzung verbessern können.

14. Titel: A transformer-based deep q learning approach for dynamic load balancing in software-defined networks
Link: http://arxiv.org/abs/2501.12829
Beschreibung:

Dieses Paper präsentiert einen neuen Ansatz für dynamisches Load Balancing in Software-Defined Networks (SDN) mithilfe eines Transformer-basierten Deep-Q-Learning (DQL) Agenten.
Der DQL-Agent lernt, optimale Load-Balancing-Strategien in SDN-Umgebungen zu entwickeln, indem er das Netzwerkverhalten beobachtet und auf Veränderungen in Echtzeit reagiert.
Die Evaluierung zeigt, dass der Transformer-basierte DQL-Agent im Vergleich zu traditionellen Methoden eine verbesserte Leistung und Flexibilität beim Load Balancing in SDN erzielt und somit als intelligenter Netzwerkagent agiert.

15. Titel: Raiders of the Lost Dependency: Fixing Dependency Conflicts in Python using LLMs
Link: http://arxiv.org/abs/2501.16191
Beschreibung:

Dieses Paper untersucht die Nutzung von Large Language Models (LLMs), um Abhängigkeitskonflikte in Python-Projekten zu lösen. Obwohl nicht explizit „Agent“, könnte ein solches LLM als Software-Engineering-Agent betrachtet werden.
Es demonstriert, wie LLMs genutzt werden können, um die oft komplexen und zeitaufwändigen Aufgaben der Abhängigkeitsverwaltung zu automatisieren.
Die Arbeit zeigt das Potential von LLMs, als intelligente Werkzeuge für Softwareentwickler zu dienen und den Entwicklungsprozess durch agentenartige Unterstützung zu vereinfachen.

16. Titel: Data Center Cooling System Optimization Using Offline Reinforcement Learning
Link: http://arxiv.org/abs/2501.XXXXX (Link wird nachgetragen, sobald verfügbar – Platzhalter)
Beschreibung:

Dieses Paper entwickelt einen auf Reinforcement Learning basierenden KI-Agenten zur Optimierung der Energieeffizienz von Kühlsystemen in Rechenzentren.

Der Agent wird mit historischen Daten trainiert, um Strategien zu entwickeln, die Betriebskosten senken und gleichzeitig die thermische Sicherheit gewährleisten.

Die Evaluierung im realen Einsatz zeigt eine Energieeinsparung von 15 % im Vergleich zu traditionellen Steuerungssystemen.

17. Titel: MISCON: A Mission-Driven Conversational Consultant for Pre-Venture Entrepreneurs in Food Deserts
Link: http://arxiv.org/abs/2501.YYYYY (Link wird nachgetragen, sobald verfügbar – Platzhalter)
Beschreibung:

Dieses Paper beschreibt den Einsatz eines KI-Agenten als „Mission-Driven Conversational Consultant“ (MISCON) für angehende Unternehmer in unterversorgten Lebensmittelwüsten („Food Deserts“).

MISCON soll Unternehmer in diesen Gebieten durch den Prozess der Geschäftsplanung und Ressourcenallokation führen.

Durch die Integration von Natural Language Processing (NLP) und domänenspezifischem Wissen bietet der Agent umsetzbare Empfehlungen und Ratschläge. Fallstudien zeigen einen positiven Einfluss auf die Erfolgsrate von Unternehmensgründungen in diesen Gebieten.

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 27.1.2025

1. MASTER: A Multi-Agent System with LLM Specialized MCTS

Link: arXiv:2501.14304

Beschreibung:
- Proposes a multi-agent framework combining Large Language Models (LLMs) with Monte Carlo Tree Search (MCTS) for strategic decision-making.
- Enhances collaborative problem-solving by integrating domain-specific knowledge and adaptive planning.
- Validated in complex scenarios like negotiation and resource allocation tasks.

2. Distributed Multi-Agent Coordination Using Multi-Modal Foundation Models

Link: arXiv:2501.14189

Beschreibung:
- Introduces a framework for decentralized coordination of AI agents using vision-language foundation models.
- Enables agents to interpret environmental cues and communicate via natural language.
- Tested in robotics and autonomous vehicle simulations for real-time adaptability.

3. Hybrid Quantum-Classical Multi-Agent Pathfinding

Link: arXiv:2501.14568

Beschreibung:
- Combines quantum computing with classical algorithms to optimize pathfinding for multi-agent systems.
- Demonstrates scalability in high-dimensional environments like logistics networks.
- Reduces computational overhead by 40% compared to purely classical approaches.

4. MedAgentBench: Dataset for Benchmarking LLMs as Agents in Medical Applications

Link: arXiv:2501.14654

Beschreibung:
- Presents a benchmark for evaluating LLM-based agents in clinical decision-making tasks.
- Includes tasks like diagnosis suggestion and treatment planning with real-world EHR data.
- Highlights challenges in ethical alignment and domain-specific reasoning.

5. Top Ten Challenges Towards Agentic Neural Graph Databases

Link: arXiv:2501.14224

Beschreibung:
- Identifies key obstacles in integrating AI agents with graph databases for dynamic query resolution.
- Discusses scalability, interpretability, and real-time adaptation issues.
- Proposes hybrid architectures combining symbolic reasoning with neural networks.

6. VERUS-LM: A Versatile Framework for Combining LLMs with Symbolic Reasoning

Link: arXiv:2501.14540

Beschreibung:
- Bridges neural and symbolic AI to enhance agent reasoning in rule-based environments.
- Achieves 98% accuracy in legal compliance and procedural task automation.
- Open-source implementation available for modular agent design.

7. Federated Domain Generalization with Data-free On-server Gradient Matching

Link: arXiv:2501.14653

Beschreibung:
- Addresses domain shift in federated learning for distributed AI agents.
- Uses gradient alignment to improve model generalization without sharing raw data.
- Validated in healthcare and IoT deployments with heterogeneous data sources.

8. Multi-agent KTO: Reinforcing Strategic Interactions of Large Language Model in Language Game

Link: arXiv:2501.14225

Beschreibung:
- Develops a reinforcement learning method to train LLM-based agents in competitive dialogue games.
- Improves strategic deception and cooperation metrics by 35% over baseline models.
- Analyzes emergent communication protocols among agents.

9. Prompt-Based Monte Carlo Tree Search for Mitigating Hallucinations in Large Models

Link: arXiv:2501.13942

Beschreibung:
- Integrates MCTS with LLM prompts to reduce factual errors in agent-generated content.
- Evaluated in QA and report-generation tasks, showing a 50% reduction in hallucinations.
- Provides interpretable decision trees for auditing agent reasoning.

10. Fast Think-on-Graph: Wider, Deeper and Faster Reasoning of Large Language Model on Knowledge Graph

Link: arXiv:2501.14300

Beschreibung:
- Enhances LLM-based agents’ ability to traverse knowledge graphs for complex query answering.
- Reduces latency by 60% through dynamic pruning of irrelevant graph paths.
- Applied in recommendation systems and academic literature synthesis.

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 24.1.2025

1) GUI-Bee: Align GUI Action Grounding to Novel Environments via Autonomous Exploration

Es wird ein Ansatz vorgestellt, bei dem ein KI-Agent eigenständig Oberflächen (GUIs) erkundet.
Durch selbstständiges Lernen werden Aktionen im Interface korrekt zugeordnet und ausgeführt.
Das Ziel ist eine robuste Anpassungsfähigkeit an neue oder unbekannte Nutzeroberflächen.
Link: https://arxiv.org/abs/2501.13896

2) EICopilot: Search and Explore Enterprise Information over Large-scale Knowledge Graphs with LLM-driven Agents

Das Paper beschreibt ein LLM-basiertes Agentensystem, das Unternehmensdaten in großen Wissensgraphen durchsucht und aufbereitet.
Der Agent interagiert in natürlicher Sprache und nutzt KI-Methoden, um relevante Informationen zu extrahieren.
Ziel ist die Unterstützung von Nutzern bei komplexen Recherchen in umfangreichen, vernetzten Datenbeständen.
Link: https://arxiv.org/abs/2501.13731

3) Scalable Safe Multi-Agent Reinforcement Learning for Multi-Agent System

Hier wird ein Verfahren für sicheres und skalierbares Multi-Agenten-Verstärkungslernen vorgestellt.
Mehrere Agenten lernen kollaboratives oder kooperatives Verhalten, ohne sicherheitskritische Zustände zu verletzen.
Die Autoren legen dabei besonderen Wert auf effiziente Trainingsmethoden für reale Anwendungen.
Link: https://arxiv.org/abs/2501.13727

4) Explainable AI-aided Feature Selection and Model Reduction for DRL-based V2X Resource Allocation

Das Paper beschreibt einen Deep-Reinforcement-Learning-Agenten für Ressourcenallokation im Fahrzeug-zu-Alles- (V2X-) Umfeld.
Durch erklärbare KI-Verfahren werden die wichtigsten Eingabefaktoren identifiziert und das Modell kompakter gestaltet.
Ziel ist eine effiziente, nachvollziehbare und performante Zuteilung knapper Netzwerkressourcen.
Link: https://arxiv.org/abs/2501.13545

5) BMG-Q: Localized Bipartite Match Graph Attention Q-Learning for Ride-Pooling Order Dispatch

Vorgestellt wird ein Multi-Agenten-Framework, das mittels Q-Learning Fahrgastanfragen passend auf Fahrzeuge verteilt.
Die Autoren verwenden ein spezielles bipartites Matching, um Dispatch-Entscheidungen effizient zu treffen.
Ziel ist die Optimierung von Wartezeiten und Auslastung in Ride-Pooling-Systemen.
Link: https://arxiv.org/abs/2501.13448

6) AgentRec: Agent Recommendation Using Sentence Embeddings Aligned to Human Feedback

Dieses Paper zeigt ein System, das KI-Agenten mithilfe von Sprachrepräsentationen an menschliche Präferenzen anpasst.
Ziel ist es, Agenten so zu empfehlen oder zu gestalten, dass sie mit menschlichem Feedback optimal übereinstimmen.
Dazu werden Techniken aus dem Natural Language Processing genutzt, um die Bewertungen und Hinweise der Menschen zu verstehen.
Link: https://arxiv.org/abs/2501.13333

7) SRMT: Shared Memory for Multi-agent Lifelong Pathfinding

Die Autoren stellen eine geteilte Speicherarchitektur vor, in der mehrere Agenten dauerhaft Pfade planen und koordinieren können.
Die Lösung lernt fortwährend, was für eine verbesserte Skalierbarkeit und Effizienz in Langzeit-Szenarien sorgt.
So sollen etwa Roboterflotten oder Logistiksysteme robuster agieren und ihre Routen dynamisch anpassen können.
Link: https://arxiv.org/abs/2501.13200

8) A Hierarchical Reinforcement Learning Framework for Multi-UAV Combat Using Leader-Follower Strategy

Ein hierarchisches RL-System, bei dem mehrere UAVs (Drohnen) mithilfe eines Führer-Gefolgsmann-Ansatzes kooperieren.
Die Hierarchie ermöglicht eine bessere Aufgabenteilung, indem ein übergeordneter Agent taktische Ziele vorgibt und andere Agenten deren Umsetzung übernehmen.
Dies verspricht effizientere und koordinierte Aktionen in simulierten Luftkampfszenarien.
Link: https://arxiv.org/abs/2501.13132

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 23.1.2025

1. Boosting MCTS with Free Energy Minimization

Das Paper kombiniert Monte Carlo Tree Search (MCTS) mit dem Prinzip der Freien-Energie-Minimierung.
Ziel ist es, die Exploration und Exploitation eines Such-Agents zu verbessern.
Diese Methode könnte insbesondere in komplexen Planungs- oder Spielumgebungen neue Wege eröffnen.
Link: https://arxiv.org/abs/2501.13083

2. Offline Critic-Guided Diffusion Policy for Multi-User Delay-Constrained Scheduling

Hier wird ein Reinforcement-Learning-Ansatz vorgestellt, der mithilfe eines Offline-Kritikers Richtlinien (Policies) für verzögerungskritische Ressourcenplanung lernt.
Der Fokus liegt darauf, mehrere Nutzer effizient zu bedienen, indem ein Diffusionsmodell als Policy eingesetzt wird.
Dieses Verfahren erlaubt Agenten eine bessere Entscheidungsfindung in Echtzeitszenarien.
Link: https://arxiv.org/abs/2501.12942

3. Kimi k1.5: Scaling Reinforcement Learning with LLMs

Das Paper präsentiert einen Ansatz, um Reinforcement Learning mithilfe großer Sprachmodelle (LLMs) zu skalieren.
Dabei werden LLMs als Teilkomponenten eines umfassenden Lern-Agents eingesetzt, um komplexe Zustände und Aktionen zu verarbeiten.
Ziel ist es, effizienter und schneller zu lernen, ohne an Flexibilität einzubüßen.
Link: https://arxiv.org/abs/2501.12599

4. R2D2: Remembering, Reflecting and Dynamic Decision Making for Web Agents

Dieses Paper beschreibt einen Web-Agenten, der Gedächtnisstrukturen und Reflexionsmechanismen kombiniert, um bessere Entscheidungen im Web zu treffen.
Ein Schwerpunkt liegt auf dynamischen Anpassungen und kontinuierlichem Lernen während Interaktionen im Internet.
So kann der Agent komplexe Aufgaben auf Webseiten verstehen und erledigen.
Link: https://arxiv.org/abs/2501.12485

5. Control-ITRA: Controlling the Behavior of a Driving Model

Vorgestellt wird ein Ansatz zur Verhaltenssteuerung eines autonomen Fahrmodells mittels KI-Methoden.
Ein zentraler Punkt ist die Interpretierbarkeit der Kontrollentscheidungen, die die Sicherheit erhöhen soll.
Dadurch kann das Fahrzeug-”Agentensystem” sein Fahrverhalten an dynamische Verkehrssituationen anpassen.
Link: https://arxiv.org/abs/2501.12408

6. FinSphere: A Conversational Stock Analysis Agent Equipped with Quantitative Tools based on Real-Time Database

Hier wird ein KI-Agent beschrieben, der in natürlicher Sprache über Finanzdaten interagiert und Aktien analysiert.
Der Agent verbindet Echtzeit-Datenbanken mit quantitativen Werkzeugen für fundierte Anlageentscheidungen.
Damit kann er menschlichen Nutzern automatisierte Börsenanalysen und -prognosen liefern.
Link: https://arxiv.org/abs/2501.12399

7. Attention-Driven Hierarchical Reinforcement Learning with Particle Filtering for Source Localization in Dynamic Fields

Dieses Paper kombiniert hierarchisches Reinforcement Learning mit Partikelfiltern, um Agenten bei der Quellensuche in dynamischen Umgebungen zu unterstützen.
Der Fokus liegt auf einer effizienten Positionsbestimmung und Navigation in wechselnden Feldern (z. B. Strömungen oder Verteilungen).
Der Agent kann dadurch seine Suche adaptiv anpassen und Ressourcen besser nutzen.
Link: https://arxiv.org/abs/2501.13084

8. AdaWM: Adaptive World Model based Planning for Autonomous Driving

Das Paper stellt ein adaptives Weltmodell vor, das einem autonomen Fahr-Agenten bei der Planung in komplexen Verkehrssituationen hilft.
Durch kontinuierliche Anpassung an Umweltveränderungen kann der Agent robust navigieren.
Ziel ist, sicheres und effizientes autonomes Fahren zu gewährleisten.
Link: https://arxiv.org/abs/2501.13072

9. Optimizing Return Distributions with Distributional Dynamic Programming

Dieser Ansatz erweitert klassisches Q-Learning um eine Verteilungsperspektive, damit der Agent nicht nur Erwartungswerte, sondern die komplette Rückgabelandschaft berücksichtigt.
Das führt zu einer feineren Steuerung von Risiko und Unsicherheit im Lernprozess.
Somit können Agenten Entscheidungen treffen, die besser zur jeweiligen Aufgabenstellung passen.
Link: https://arxiv.org/abs/2501.13028

10. MONA: Myopic Optimization with Non-myopic Approval Can Mitigate Multi-step Reward Hacking

Das Paper untersucht das Problem, dass RL-Agenten durch Kurzsichtigkeit (Myopie) ungeplante Belohnungsschlupflöcher ausnutzen.
Mit der vorgestellten Methode „MONA“ werden myopische Strategien teils durch zusätzliche, langfristige Bewertungen korrigiert.
Auf diese Weise soll „Reward Hacking“ minimiert werden und die Handlungen des Agenten stabiler werden.
Link: https://arxiv.org/abs/2501.13011

11. DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Dieses Paper setzt auf RL, um große Sprachmodelle (LLMs) besser zum logischen Schlussfolgern zu bringen.
Ein spezielles Belohnungsschema fördert präzisere Zwischenschritte im Reasoning-Prozess.
Dadurch könnten AI-Agenten in Sprachaufgaben fundiertere Antworten generieren.
Link: https://arxiv.org/abs/2501.12948

12. Reinforcement learning Based Automated Design of Differential Evolution Algorithm for Black-box Optimization

Das Paper kombiniert Reinforcement Learning mit einer Evolutionären Strategie, um neue Varianten des Differential-Evolution-Algorithmus zu entwerfen.
Ein Agent identifiziert dabei selbstständig, welche Operatoren und Parameter gut funktionieren.
Dadurch lässt sich für Black-Box-Optimierungsprobleme ein effizienterer Lösungsweg finden.
Link: https://arxiv.org/abs/2501.12881

13. Drone Carrier: An Integrated Unmanned Surface Vehicle for Autonomous Inspection and Intervention in GNSS-Denied Maritime Environment

Vorgestellt wird ein autonomes Trägersystem (USV) mit Drohne, das ohne GPS-Navigation (GNSS-Denied) arbeitet.
Der Agent muss seine Umgebung eigenständig erkennen und inspizieren, um Interventionen durchzuführen.
Damit können maritime Inspektionsaufgaben automatisiert und sicherer gestaltet werden.
Link: https://arxiv.org/abs/2501.12869

14. To Measure or Not: A Cost-Sensitive, Selective Measuring Environment for Agricultural Management Decisions with Reinforcement Learning

Hier wird ein RL-Agent beschrieben, der Entscheidungen im landwirtschaftlichen Kontext trifft und selbst bestimmt, wann Messungen lohnend sind.
Dies senkt die Kosten für unnötige Datenerhebungen und steigert zugleich die Qualität der agrarwirtschaftlichen Entscheidungen.
So können Landwirte ihre Ressourcen gezielter einsetzen.
Link: https://arxiv.org/abs/2501.12823

15. HEPPO: Hardware-Efficient Proximal Policy Optimization — A Universal Pipelined Architecture for Generalized Advantage Estimation

Dieses Paper zeigt eine hardwareoptimierte Variante des bekannten PPO-Verfahrens für Reinforcement Learning.
Der Agent nutzt ein pipeliniertes Design, um schnelle, ressourcenschonende Entscheidungen zu treffen.
Dadurch wird RL auch auf kostengünstiger Hardware mit hohem Durchsatz praktikabel.
Link: https://arxiv.org/abs/2501.12703

16. NBDI: A Simple and Efficient Termination Condition for Skill Extraction from Task-Agnostic Demonstrations

In diesem Paper wird ein Kriterium entwickelt, wann ein RL-Agent das Erlernen einer Fertigkeit aus Demonstrationen beenden sollte.
So können Agenten selbständig erkennen, wann sie genügend Erfahrung gesammelt haben, um eine Fähigkeit zu meistern.
Dies vereinfacht und beschleunigt die Konstruktion von Skill Libraries für komplexe Aufgaben.
Link: https://arxiv.org/abs/2501.12668

17. Inverse Reinforcement Learning with Switching Rewards and History Dependency for Characterizing Animal Behaviors

Die Autoren setzen Inverse Reinforcement Learning ein, um Tierverhalten zu analysieren und die zugrundeliegenden „Belohnungsfunktionen“ zu identifizieren.
Dabei wird berücksichtigt, dass sich die Belohnungsfunktionen im Zeitverlauf ändern („switching rewards“) und vom Verlauf abhängen.
Dieses Verfahren könnte in der Verhaltensforschung oder Robotik zum Nachahmen biologischer Strategien dienen.
Link: https://arxiv.org/abs/2501.12910

18. Adaptive Data Exploitation in Deep Reinforcement Learning

Das Paper fokussiert auf Strategien, um in RL-Systemen Daten effizienter zu nutzen und Overfitting zu vermeiden.
Hierzu werden adaptive Mechanismen eingeführt, die entscheiden, wann neue Daten erfasst und wann alte Daten erneut verwendet werden.
Dadurch kann ein Agent robuster trainiert und die Lerngeschwindigkeit gesteigert werden.
Link: https://arxiv.org/abs/2501.12620

19. Reinforcement Learning Constrained Beam Search for Parameter Optimization of Paper Drying Under Flexible Constraints

Ein RL-gestützter Algorithmus wird vorgestellt, um Strahlersysteme (Beam) beim Trocknen von Papier effizient zu steuern.
Der Agent muss dabei verschiedene Nebenbedingungen, wie Stromverbrauch oder Trocknungsqualität, gegeneinander abwägen.
So wird eine dynamische und ressourcenschonende Prozesssteuerung ermöglicht.
Link: https://arxiv.org/abs/2501.12542

20. Interaction Dataset of Autonomous Vehicles with Traffic Lights and Signs

Das Paper liefert einen Datensatz, der das Verhalten autonomer Fahr-Agenten im Zusammenspiel mit Ampeln und Verkehrsschildern erfasst.
Damit können Agenten trainiert und validiert werden, um sicher und regelkonform im Straßenverkehr zu navigieren.
Dieser Datensatz bildet eine realistische Grundlage für Entwicklungs- und Testzwecke.
Link: https://arxiv.org/abs/2501.12524

21. FREYR: A Framework for Recognizing and Executing Your Requests

FREYR ist ein KI-Framework, das Benutzereingaben versteht und automatisch entsprechende Aktionen ausführt – im Prinzip ein universeller Agent.
Es nutzt kontextbewusste Interpretationsmechanismen, um Befehle sicher und nachvollziehbar abzuarbeiten.
Damit könnten viele Arten von Alltagsaufgaben oder Systemsteuerungen automatisiert werden.
Link: https://arxiv.org/abs/2501.12423

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 22.1.2025

1. UI-TARS: Pioneering Automated GUI Interaction with Native Agents

Bietet ein System zur automatisierten Interaktion mit grafischen Benutzeroberflächen (GUIs) mithilfe sogenannter „Native Agents“.
Zeigt auf, wie diese Agenten selbstständig GUI-Elemente erkennen und Aktionen ausführen können.
Verspricht Verbesserungen bei der Effizienz und Zuverlässigkeit von Test- und Automatisierungsszenarien.
Link: arXiv:2501.12326

2. Episodic memory in AI agents poses risks that should be studied and mitigated

Diskutiert, wie KI-Agenten mit episodischem Gedächtnis potenzielle Risiken bezüglich Datenschutz und Fehlverhalten aufweisen.
Analysiert verschiedene Formen von speicherbasierten Angriffen und möglichen Sicherheitslücken.
Schlägt Methoden vor, um solche Risiken frühzeitig zu erkennen und zu minimieren.
Link: arXiv:2501.11739

3. Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training

Beschreibt ein Verfahren, bei dem Sprachmodelle als autonome Agenten durch wiederholtes Selbsttraining lernen, besser zu reflektieren.
Nutzt Feedback-Schleifen, um den Denkprozess und die Entscheidungsfindung kontinuierlich zu verbessern.
Demonstriert vielversprechende Resultate bei komplexen Aufgaben, die kognitive Fähigkeiten erfordern.
Link: arXiv:2501.11425

4. ColorGrid: A Multi-Agent Non-Stationary Environment for Goal Inference and Assistance

Führt eine mehragentige Umgebung ein, in der Ziele dynamisch und nicht-stationär sind.
Zeigt, wie Agenten kollaborativ Ziele erschließen und sich gegenseitig unterstützen können.
Liefert damit eine Testplattform für Forschung an adaptiven und lernfähigen Multi-Agenten-Systemen.
Link: arXiv:2501.10593

5. Adaptive Target Localization under Uncertainty using Multi-Agent Deep Reinforcement Learning with Knowledge Transfer

Beschäftigt sich mit der Mehragenten-Lokalisierung von Zielen in unsicheren Umgebungen.
Setzt auf Deep Reinforcement Learning und Techniken zum Wissenstransfer zwischen den Agenten.
Verbessert damit die Effizienz und Genauigkeit kooperativer Such- und Lokalisierungsaufgaben.
Link: arXiv:2501.10924

6. Learn-by-interact: A Data-Centric Framework for Self-Adaptive Agents in Realistic Environments

Stellt einen datenorientierten Ansatz vor, bei dem KI-Agenten sich in realitätsnahen Umgebungen selbstständig an neue Situationen anpassen.
Nutzt Interaktionen zur kontinuierlichen Verbesserung, ohne auf massive, vorab annotierte Datensätze angewiesen zu sein.
Vereinfacht das Deployment von lernfähigen Agenten in sich dynamisch ändernden Szenarien.
Link: arXiv:2501.10893

7. Graph Coloring to Reduce Computation Time in Prioritized Planning

Zeigt eine graphenbasierte Herangehensweise, um die Rechenzeit bei der Pfadplanung für mehrere Agenten zu reduzieren.
Nutzt Färbungsalgorithmen, um Konflikte zwischen Agentenpfaden effizient zu erkennen und zu vermeiden.
Hilft damit, große und komplexe Multi-Agenten-Planungsprobleme schneller und robuster zu lösen.
Link: arXiv:2501.10812

8. Simultaneous Computation with Multiple Prioritizations in Multi-Agent Motion Planning

Untersucht, wie mehrere Priorisierungsstrategien gleichzeitig genutzt werden können, um Multi-Agenten-Bewegungsplanung zu verbessern.
Liefert ein Framework, in dem Agenten ihre Routen koordinieren, ohne auf eine starre Hierarchie angewiesen zu sein.
Verspricht höhere Flexibilität und Robustheit in Echtzeitumgebungen.
Link: arXiv:2501.10781

9. Cooperative Search and Track of Rogue Drones using Multiagent Reinforcement Learning

Entwickelt ein mehragentiges System, das mithilfe von Reinforcement Learning gemeinsam nach Drohnen sucht und sie verfolgt.
Berücksichtigt dabei Unsicherheiten in der Umgebung sowie eine mögliche Gegenwehr der gesuchten Drohnen.
Zielt auf effektive Zusammenarbeit von Agenten in sicherheitskritischen Szenarien ab.
Link: arXiv:2501.10396

10. Beyond the Sum: Unlocking AI Agents Potential Through Market Forces

Setzt sich mit der Idee auseinander, LLM-basierte Agenten kollaborativ über Marktmechanismen zu koordinieren.
Zeigt auf, wie sich die „Intelligenz“ eines Agenten-Kollektivs steigern lässt, wenn man sie ökonomischen Prinzipien unterordnet.
Diskutiert dabei theoretische Modelle und praktische Anwendungsszenarien.
Link: arXiv:2501.10388

11. GTDE: Grouped Training with Decentralized Execution for Multi-agent Actor-Critic

Beschreibt einen Multi-Agenten-Ansatz im Kontext von Actor-Critic-Methoden, der Training in Gruppen nutzt, während die Ausführung dezentral bleibt.
Ermöglicht es den Agenten, voneinander zu lernen und dennoch eigenständig zu agieren.
Bietet bessere Skalierbarkeit für kooperative Aufgaben im Vergleich zu rein zentralen Lernverfahren.
Link: arXiv:2501.10367

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 20.1.2025

1. Titel: Infrastructure for AI Agents
arXiv-ID: 2501.10114

Beschreibung

Dieses Paper diskutiert grundlegende Anforderungen und Designprinzipien für eine robuste Infrastruktur, die KI-Agenten unterstützt.
Es werden zentrale Komponenten wie Kommunikation, Sicherheitsmechanismen und Schnittstellen beschrieben, die für den Einsatz verschiedener Agententypen notwendig sind.
Die Arbeit beleuchtet zudem organisatorische und rechtliche Aspekte, um die Einführung von KI-Agenten im industriellen Maßstab zu erleichtern.

Link zum Paper: https://arxiv.org/abs/2501.10114

2. Titel: LLM Reasoner and Automated Planner: A new NPC approach
arXiv-ID: 2501.10106

Beschreibung

In diesem Paper wird ein Konzept vorgestellt, wie Large Language Models als KI-Agenten zur Steuerung von NPCs (Non-Player Characters) eingesetzt werden können.
Die Autoren kombinieren Reasoning-Fähigkeiten von LLMs mit einem automatisierten Planer, um NPCs in virtuellen Umgebungen eine höhere Handlungsfreiheit und Glaubwürdigkeit zu verleihen.
Damit sollen sowohl die Interaktivität in Spielen als auch mögliche Anwendungen in anderen simulationsbasierten Kontexten verbessert werden.

Link zum Paper: https://arxiv.org/abs/2501.10106

3. Titel: ForestProtector: An IoT Architecture Integrating Machine Vision and Deep Reinforcement Learning for Efficient Wildfire Monitoring
arXiv-ID: 2501.09926

Beschreibung

Das Paper beschreibt einen KI-Agenten-Ansatz, der mittels Deep Reinforcement Learning und Bildverarbeitung Waldbrände frühzeitig erkennen und darauf reagieren soll.
Ein zentralisiertes Agenten-Framework überwacht Sensordaten, trifft autonome Entscheidungen und kann Ereignisse priorisieren, um Schäden zu minimieren.
Diese Lösung legt besonderen Wert auf die Integration in bestehende IoT-Systeme und skalierbare Datenerfassung in Echtzeit.

Link zum Paper: https://arxiv.org/abs/2501.09926

4. Titel: Agent4Edu: Generating Learner Response Data by Generative Agents for Intelligent Education Systems
arXiv-ID: 2501.10332

Beschreibung

Dieses Paper zeigt, wie generative KI-Agenten in Bildungssystemen automatisiert Schülerantworten erzeugen können, um Trainingsdaten anzureichern.
Dabei werden realistische Lernendenreaktionen simuliert, um KI-gestützte Tutor- oder Bewertungssysteme zu verbessern.
Die Studie legt dar, wie dadurch personalisierte Feedback-Mechanismen und adaptive Lernumgebungen effizienter entwickelt werden können.

Link zum Paper: https://arxiv.org/abs/2501.10332

5. Titel: Universal Actions for Enhanced Embodied Foundation Models
arXiv-ID: 2501.10105

Beschreibung

Die Autor*innen schlagen eine vereinheitlichte Aktionsdarstellung für KI-Agenten vor, damit Roboter und andere verkörperte Systeme komplexe Anweisungen besser umsetzen können.
Sie fokussieren sich darauf, wie multimodale Eingaben (z.B. Sprache) mit Aktionsempfehlungen verknüpft werden, um das Spektrum ausführbarer Aufgaben zu erweitern.
Ihr Ansatz soll die Lern- und Generalisierungsfähigkeit von Embodied Foundation Models im praktischen Einsatz steigern.

Link zum Paper: https://arxiv.org/abs/2501.10105

6. Titel: SpatialCoT: Advancing Spatial Reasoning through Coordinate Alignment and Chain-of-Thought for Embodied Task Planning
arXiv-ID: 2501.10074

Beschreibung

Das Paper kombiniert räumliches Denken (Spatial Reasoning) mit einem Chain-of-Thought-Ansatz, um KI-Agenten in simulierten 2D- und 3D-Umgebungen effektiver navigieren und Aufgaben ausführen zu lassen.
Ein Schwerpunkt liegt auf der präzisen Übersetzung natürlicher Sprachbefehle in agentenbasierte Aktionsabfolgen.
Dadurch sollen Embodied Agents menschenähnliches Planen und Problemlösen erlernen, was für Robotik- und Simulationsanwendungen interessant ist.

Link zum Paper: https://arxiv.org/abs/2501.10074

7. Titel: SLIM: Sim-to-Real Legged Instructive Manipulation via Long-Horizon Visuomotor Learning
arXiv-ID: 2501.09905

Beschreibung

Hier wird ein KI-Agent vorgestellt, der auf Bein-Robotern langhorizontige Aufgaben durch Visuomotorik erlernt, erst in einer Simulation und später in der realen Umgebung.
Das System nutzt eine hierarchische Steuerung, um komplexe Manipulations- und Bewegungsabfolgen selbstständig zu planen und auszuführen.
Besondere Beachtung findet die robuste Übertragung (Sim-to-Real Transfer), damit das in der Simulation Gelernte zuverlässig in der Praxis funktioniert.

Link zum Paper: https://arxiv.org/abs/2501.09905

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 17.1.2025

YETI (YET to Intervene) Proactive Interventions by Multimodal AI Agents in Augmented Reality Tasks
- Dieses Paper präsentiert YETI, einen multimodalen KI-Agenten, der proaktive Interventionen in Augmented Reality-Aufgaben durchführt.
- YETI nutzt verschiedene Modalitäten wie Bild und Text, um die Benutzerintention zu verstehen und entsprechende Maßnahmen einzuleiten.
- Das Paper beschreibt die Architektur und die experimentelle Evaluation von YETI und zeigt seine Fähigkeit, die Benutzererfahrung in AR-Anwendungen zu verbessern.
- Link zum Paper
SOP-Agent: Empower General Purpose AI Agent with Domain-Specific SOPs
- Dieses Paper stellt den SOP-Agenten vor, einen KI-Agenten, der allgemeine Fähigkeiten mit domänenspezifischen Standardarbeitsanweisungen (SOPs) kombiniert.
- Der SOP-Agent integriert diese SOPs, um seine Handlungen in spezifischen Bereichen zu führen und die Genauigkeit und Effizienz zu erhöhen.
- Das Paper demonstriert die Anwendung des SOP-Agenten in verschiedenen Szenarien und hebt die Vorteile der SOP-Integration hervor.
- Link zum Paper
Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG
- Dieses Paper bietet einen Überblick über Agentic RAG, eine Weiterentwicklung der Retrieval-Augmented Generation, bei der KI-Agenten den Abruf und die Generierung steuern.
- Es untersucht, wie Agenten den Retrieval-Prozess dynamisch anpassen und die Relevanz und Qualität der generierten Antworten verbessern können.
- Das Paper diskutiert die verschiedenen Ansätze und Herausforderungen von Agentic RAG und bietet Einblicke in zukünftige Forschung.
- Link zum Paper
Authenticated Delegation and Authorized AI Agents
- Dieses Paper befasst sich mit der Herausforderung der sicheren Delegierung von Aufgaben an KI-Agenten in einem dezentralen System.
- Es schlägt eine Methode zur authentifizierten Delegation vor, die sicherstellt, dass nur autorisierte Agenten auf bestimmte Ressourcen zugreifen oder Aktionen ausführen können.
- Das Paper diskutiert die architektonischen und sicherheitsrelevanten Aspekte dieser Delegationsmethode.
- Link zum Paper
AutoLoop: Fast Visual SLAM Fine-tuning through Agentic Curriculum Learning
- Dieses Paper stellt AutoLoop vor, ein System, das durch Agenten-basiertes Curriculum Learning die Feinabstimmung von visuellen SLAM-Systemen beschleunigt.
- AutoLoop nutzt KI-Agenten, um automatisch die optimale Reihenfolge von Trainingsdaten auszuwählen, um die Leistung von SLAM-Modellen zu verbessern.
- Das Paper zeigt, dass AutoLoop die Lernzeit reduziert und gleichzeitig die Genauigkeit von SLAM-Modellen erhöht.
- Link zum Paper
ADAGE: A generic two-layer framework for adaptive agent based modelling
- Das Paper präsentiert ADAGE, einen generischen zweischichtigen Rahmen für adaptive agentenbasierte Modellierung.
- ADAGE ermöglicht die Modellierung von Agenten, die sich an ihre Umgebung anpassen können.
- Es stellt einen Rahmen bereit, der ein breites Spektrum von Anwendungen in verschiedenen Bereichen unterstützt.
- Link zum Paper
Platform-Aware Mission Planning
- Dieses Paper befasst sich mit der plattformbewussten Missionsplanung unter Berücksichtigung der spezifischen Fähigkeiten und Beschränkungen von Agenten.
- Es werden Methoden zur automatisierten Planung von Missionen unter Berücksichtigung der zugrunde liegenden Hardware- und Softwareplattformen vorgestellt.
- Das Paper zeigt, wie eine solche plattformbewusste Planung die Effizienz und Robustheit von Agenten in realen Anwendungen verbessern kann.
- Link zum Paper
Solving the unsolvable: Translating case law in Hong Kong
* Dieses Paper untersucht den Einsatz von KI-Agenten für die Übersetzung von Rechtstexten in Hongkong.
* Es präsentiert die Entwicklung eines mehrsprachigen KI-Agenten der in der Lage ist, Rechtstexte mit hoher Genauigkeit zu übersetzen.
* Das Paper hebt die Herausforderungen und das Potenzial von KI für komplexe Übersetzungsaufgaben hervor.
- Link zum Paper
Decompose-ToM: Enhancing Theory of Mind Reasoning in Large Language Models through Simulation and Task Decomposition
- Dieses Paper stellt Decompose-ToM vor, eine Methode zur Verbesserung der „Theory of Mind“ (ToM) Fähigkeiten von Large Language Models (LLMs).
- Decompose-ToM nutzt Simulationen und Aufgabenzerlegung um LLMs zum besseren Verständnis von Überzeugungen und Absichten anderer zu trainieren.
- Das Paper demonstriert die Effektivität dieser Methode zur Steigerung der ToM-Fähigkeiten in LLMs.
- Link zum Paper

Liste der arXiv-Veröffentlichungen zu KI-Agenten 16.01.2025

2025-01-16, die sich mit dem Thema KI-Agenten befassen, wie gewünscht formatiert:

Titel: Leveraging Large Language Models as Knowledge-Driven Agents for Reliable Retrosynthesis Planning
Link:https://arxiv.org/abs/2501.08897
Beschreibung:
- Dieses Papier untersucht die Verwendung von Large Language Models (LLMs) als wissensgesteuerte Agenten für die Planung von Retrosynthesen.
- Es wird gezeigt, wie LLMs verwendet werden können, um zuverlässigere und effizientere Retrosynthesewege zu generieren.
- Die Studie demonstriert die Fähigkeit von LLMs, komplexe chemische Zusammenhänge zu verstehen und zu nutzen.
Titel: Personality Modeling for Persuasion of Misinformation using AI Agent
Link:https://arxiv.org/abs/2501.08985
Beschreibung:
- Dieses Paper untersucht, wie KI-Agenten mit Persönlichkeitsmodellen eingesetzt werden können, um Desinformation zu bekämpfen.
- Es werden unterschiedliche Persönlichkeitsansätze untersucht, um Menschen von Falschinformationen zu überzeugen.
- Die Ergebnisse geben Einblicke, wie KI-gestützte Methoden zur Verbesserung der Informationsintegrität eingesetzt werden könnten.
Titel: Leveraging LLM Agents for Translating Network Configurations
Link:https://arxiv.org/abs/2501.08760
Beschreibung:
- Dieses Papier untersucht die Nutzung von Large Language Model (LLM) Agenten für die Übersetzung von Netzwerkkonfigurationen.
- Es wird gezeigt, wie LLMs komplexe Konfigurationsdaten interpretieren und automatisch in verschiedene Formate übersetzen können.
- Der Ansatz zielt darauf ab, die Effizienz und Genauigkeit bei der Verwaltung von Netzwerkkonfigurationen zu verbessern.
Titel: LAMS: LLM-Driven Automatic Mode Switching for Assistive Teleoperation
Link:https://arxiv.org/abs/2501.08558
Beschreibung:
- Dieses Papier stellt LAMS vor, ein System, das LLMs verwendet, um automatisch zwischen verschiedenen Modi in der assistiven Teleoperation zu wechseln.
- Das System nutzt das semantische Verständnis von LLMs, um den Kontext der Aufgaben des Benutzers zu interpretieren und dynamisch den passenden Modus auszuwählen.
- Diese Methode vereinfacht die Teleoperation und verbessert die Benutzererfahrung durch Anpassung an die aktuellen Aufgaben und Ziele.
Titel: Doc-Guided Sent2Sent++: A Sent2Sent++ Agent with Doc-Guided memory for Document-level Machine Translation
Link:https://arxiv.org/abs/2501.08523
Beschreibung:
- In diesem Artikel wird ein neuer Ansatz für die maschinelle Dokumentenübersetzung vorgestellt.
- Der Ansatz verwendet einen Sent2Sent++-Agenten mit einem dokumentengeleiteten Gedächtnis.
- Diese Methode verbessert die Konsistenz und den Kontext der Übersetzungen von maschinellen Dokumenten.
Titel: AutoRestTest: A Tool for Automated REST API Testing Using LLMs and MARL
Link:https://arxiv.org/abs/2501.08600
Beschreibung:
- Das Paper stellt AutoRestTest vor, ein Werkzeug für automatisiertes Testen von REST APIs.
- Es kombiniert Large Language Models (LLMs) mit Multi-Agent Reinforcement Learning (MARL).
- Die Methode wird dazu genutzt, effektivere und umfassendere Tests für REST APIs zu erstellen.
Titel: How Developers Interact with AI: A Taxonomy of Human-AI Collaboration in Software Engineering
Link:https://arxiv.org/abs/2501.08774
Beschreibung:
- Dieses Paper analysiert die Interaktionen zwischen Softwareentwicklern und KI-Systemen.
- Es wird eine Taxonomie der Mensch-KI-Kollaboration im Software Engineering vorgeschlagen.
- Das Ziel ist es, ein besseres Verständnis für die Rolle von KI bei der Unterstützung von Entwicklern zu erlangen.
Titel: Networked Agents in the Dark: Team Value Learning under Partial Observability
Link:https://arxiv.org/abs/2501.08778
Beschreibung:
- Dieser Artikel untersucht das Lernen von Teamwerten unter partieller Beobachtbarkeit in Multi-Agenten-Systemen.
- Es werden Methoden vorgestellt, die es Agenten ermöglichen, den Beitrag jedes Teammitglieds zu bewerten, auch wenn sie nur begrenzte Informationen haben.
- Die Studie untersucht, wie agenten in diesen Szenarien besser zusammenarbeiten und bessere Ergebnisse erzielen können.
Titel: Modeling Discrimination with Causal Abstraction
Link:https://arxiv.org/abs/2501.08429
Beschreibung:
- Dieser Artikel untersucht Diskriminierung mithilfe von kausalen Abstraktionen.
- Es werden Methoden entwickelt, um die Ursachen und Mechanismen von Diskriminierung zu verstehen.
- Das Paper zeigt, wie kausale Modelle verwendet werden können, um Diskriminierung effektiver anzugehen.

Liste der arXiv-Veröffentlichungen zu KI-Agenten 15.01.2025

1.
Titel: Cooperative Patrol Routing: Optimizing Urban Crime Surveillance through Multi-Agent Reinforcement Learning
Link: arXiv:2501.08020
Beschreibung:

Stellt einen Multi-Agenten-Ansatz vor, um Überwachungsrouten in städtischen Gebieten zu optimieren.
Nutzt gemeinsames Verstärkungslernen, damit mehrere KI-Agenten koordiniert Verbrechen aufdecken.
Verspricht effektivere Verteilung knapper Ressourcen in der Sicherheitspolizei.

2.
Titel: LLM-Ehnanced Holonic Architecture for Ad-Hoc Scalable SoS
Link: arXiv:2501.07992
Beschreibung:

Beschreibt eine holonische, also hierarchisch organisierte System-of-Systems-Architektur für KI-Agenten.
Nutzt Large Language Models (LLMs), um dynamische Zusammenarbeit mehrerer Agenten zu ermöglichen.
Erleichtert so die flexible Skalierung und Selbstorganisation in komplexen Anwendungsszenarien.

3.
Titel: Governing AI Agents
Link: arXiv:2501.07913
Beschreibung:

Analysiert rechtliche und ethische Ansätze, um intelligente Agenten und ihre Interaktionen zu regulieren.
Diskutiert die Verantwortungsübernahme von KI-Agenten in komplexen Entscheidungsprozessen.
Bietet Empfehlungen für Governance-Strukturen, die KI-Agenten effektiv kontrollieren sollen.

4.
Titel: Flow: A Modular Approach to Automated Agentic Workflow Generation
Link: arXiv:2501.07834
Beschreibung:

Zeigt, wie sich Workflows in Unternehmen mit KI-Agenten automatisieren lassen.
Führt einen modularen Baukasten ein, in dem Agenten unterschiedliche Aufgaben selbstständig zuweisen und steuern.
Ermöglicht dadurch effizientere Abläufe und reduziert manuelle Interaktionen.

5.
Titel: Agent-Centric Projection of Prompting Techniques and Implications for Synthetic Training Data for Large Language Models
Link: arXiv:2501.07815
Beschreibung:

Untersucht, wie KI-Agenten Prompting-Techniken anwenden können, um hochwertigen Trainings-Content zu generieren.
Zeigt, wie ein agentenorientierter Fokus neue Möglichkeiten für LLM-Feinabstimmungen eröffnet.
Diskutiert potenzielle Vorteile und Risiken synthetisch erzeugter Trainingsdaten.

6.
Titel: Visual Language Models as Operator Agents in the Space Domain
Link: arXiv:2501.07802
Beschreibung:

Stellt vor, wie visuelle Sprachmodelle als agentenhafte Operatoren für Aufgaben in der Weltraumforschung eingesetzt werden.
Betont die Fähigkeit solcher Agenten, komplexe Bilder und Szenarien zu interpretieren und eigenständig zu handeln.
Zeigt Potenziale für automatisiertes Monitoring und Analyse in der Raumfahrt.

7.
Titel: PokerBench: Training Large Language Models to become Professional Poker Players
Link: arXiv:2501.08328
Beschreibung:

Entwickelt ein Framework, das LLMs zu Poker-Agenten ausbildet und Strategien trainiert.
Zeigt, wie Sprachmodelle durch Interaktion, Regelkenntnis und Strategieanpassung wettbewerbsfähig spielen können.
Bietet neue Einblicke in die Verknüpfung von natürlicher Sprachverarbeitung und agentenbasiertem Spielverhalten.

8.
Titel: Engineering LLM Powered Multi-agent Framework for Autonomous CloudOps
Link: arXiv:2501.08243
Beschreibung:

Beschreibt die Integration von Large Language Models in ein Multi-Agenten-System für automatisierte Cloud-Operationen.
Zeigt, wie unterschiedliche Agenten verteilte Cloud-Ressourcen überwachen und dynamisch verwalten können.
Vereinfacht somit Infrastrukturverwaltung und Skalierung in Echtzeit.

9.
Titel: Dynamic Pricing in High-Speed Railways Using Multi-Agent Reinforcement Learning
Link: arXiv:2501.08234
Beschreibung:

Präsentiert einen Multi-Agenten-RL-Ansatz, der Ticketpreise in Hochgeschwindigkeitszügen dynamisch optimiert.
Ermöglicht jeder Agentin (bzw. jedem Agenten) eine adaptive Preisstrategie unter Wettbewerbsbedingungen.
Verspricht gesteigerte Effizienz und Gewinnmaximierung bei gleichzeitiger Berücksichtigung der Kundennachfrage.

10.
Titel: Talk to Right Specialists: Routing and Planning in Multi-agent System for Question Answering
Link: arXiv:2501.07814
Beschreibung:

Nutzt ein mehrteiliges Agenten-System, das ankommende Fragen an die jeweils „besten Spezialisten“ weiterleitet.
Zeigt, wie eine koordinierte Planung unter Agenten schnellere und präzisere Antworten erzielt.

Liste der arXiv-Veröffentlichungen zu KI-Agenten 14.01.2025

Lifelong Learning of Large Language Model based Agents: A Roadmap
- Beschreibt einen Ansatz, wie KI-Agenten auf Basis großer Sprachmodelle ihre Fähigkeiten fortlaufend verbessern können.
- Behandelt das Problem der Wissenserhaltung über mehrere Aufgaben hinweg.
- Skizziert Herausforderungen und mögliche Zukunftsstrategien für nachhaltiges Lernen in Agentensystemen.
  Link: https://arxiv.org/abs/2501.07278
PoAct: Policy and Action Dual-Control Agent for Generalized Applications
- Führt ein Agentenmodell ein, das sowohl auf Policy-Ebene (Strategie) als auch auf Action-Ebene (Handlungen) lernt.
- Ermöglicht eine flexible Anpassung an vielfältige Aufgaben, indem Steuerung und Aktionen entkoppelt betrachtet werden.
- Zeigt Vorteile in unterschiedlichen Anwendungsszenarien, etwa in komplexen Multi-Step-Umgebungen.
  Link: https://arxiv.org/abs/2501.07054
LLMs Model Non-WEIRD Populations: Experiments with Synthetic Cultural Agents
- Untersucht, wie Large Language Models synthetische „kulturelle“ Agenten simulieren können, die nicht nur auf westliche Sichtweisen fokussiert sind.
- Beleuchtet kulturelle Verzerrungen und testet, wie gut Modelle unterschiedliche Perspektiven abbilden können.
- Zeigt Potenziale, aber auch Grenzen von LLMs bei der Simulation weniger repräsentierter Bevölkerungsgruppen.
  Link: https://arxiv.org/abs/2501.06834
Eliza: A Web3 friendly AI Agent Operating System
- Präsentiert ein Betriebs-Framework für KI-Agenten, das Web3-Technologien (z. B. Blockchain) einbindet.
- Ermöglicht das sichere und dezentrale Hosting und Ausführen von Agentenfunktionen.
- Bietet Anwendungsfälle für transparente und nachvollziehbare Agenteninteraktionen in verschiedenen Domains.
  Link: https://arxiv.org/abs/2501.06781
AIOpsLab: A Holistic Framework to Evaluate AI Agents for Enabling Autonomous Clouds
- Stellt eine Plattform vor, um KI-Agenten hinsichtlich ihrer Eignung für selbstverwaltende (autonome) Cloud-Umgebungen zu bewerten.
- Deckt vielfältige Metriken wie Effizienz, Skalierbarkeit und Fehlertoleranz ab.
- Dient als Testbed, um Agenten in realitätsnahen Cloud-Szenarien zu erproben und zu vergleichen.
  Link: https://arxiv.org/abs/2501.06706
DVM: Towards Controllable LLM Agents in Social Deduction Games
- Fokus auf der Entwicklung von steuerbaren KI-Agenten für Social-Deduction-Spiele (z. B. Werwolf/Mafia).
- Untersucht, wie Agenten menschliche Kommunikationsmuster erlernen und strategisch täuschen oder argumentieren können.
- Bietet Einblicke in Methoden, um LLM-basierte Agenten mit gezieltem Verhalten zu gestalten.
  Link: https://arxiv.org/abs/2501.06695
Multi-Agent Collaboration Mechanisms: A Survey of LLMs
- Liefert einen Überblick über aktuelle Forschungsansätze, wie Large Language Models in Multi-Agenten-Systemen kooperieren.
- Diskutiert sowohl theoretische Grundlagen als auch praktische Anwendungen, z. B. koordiniertes Problemlösen.
- Hebt Chancen und Herausforderungen bei der Integration von LLMs in Agententeams hervor.
  Link: https://arxiv.org/abs/2501.06322
BioAgents: Democratizing Bioinformatics Analysis with Multi-Agent Systems
- Zeigt, wie Multi-Agenten-Systeme die Bioinformatik-Analyse erleichtern und Forschenden den Zugang zu komplexen Tools ermöglichen.
- Beschreibt eine kollaborative Architektur, bei der KI-Agenten unterschiedliche Analyseaufgaben koordinieren.
- Adressiert sowohl technologische als auch organisatorische Aspekte der Umsetzung.
  Link: https://arxiv.org/abs/2501.06243
Agent TCP/IP: An Agent-to-Agent Transaction System
- Beschreibt ein Kommunikations- und Transaktionsprotokoll speziell für den Austausch zwischen KI-Agenten.
- Greift das TCP/IP-Prinzip auf, um robuste und skalierbare Agenteninteraktionen zu realisieren.
- Könnte den Grundstein für standardisierte, interoperable Agentensysteme legen.
  Link: https://arxiv.org/abs/2501.06231
A Novel Task-Driven Method with Evolvable Interactive Agents Using Event Trees for Enhanced Emergency Decision Support

Entwickelt ein Verfahren, bei dem Agenten durch „Event Trees“ flexible und anpassungsfähige Strategien für Notfallsituationen erarbeiten.
Ermöglicht eine dynamische Anpassung der Entscheidungsfindung bei unvorhersehbaren Szenarien.
Verbessert die Zusammenarbeit mehrerer interaktiver Agenten, um Krisen effizienter zu bewältigen.
Link: https://arxiv.org/abs/2501.06193

A Multimodal Social Agent

Präsentiert einen Agenten, der mehrere Modalitäten (z. B. Sprache, Gestik, Mimik) integriert, um in sozialen Kontexten zu agieren.
Ziel ist eine natürlicher wirkende Interaktion mit Menschen durch umfassende Wahrnehmungs- und Kommunikationsfähigkeiten.
Erörtert potenzielle Anwendungen in Bereichen wie Begleitrobotik oder virtuellen Assistenten.
Link: https://arxiv.org/abs/2501.06189

Liste der arXiv-Veröffentlichungen zu KI-Agenten 13.01.2025

Titel: Strategy Masking: A Method for Guardrails in Value-based Reinforcement Learning Agents
- Dieses Paper stellt eine Methode namens „Strategy Masking“ vor, die darauf abzielt, das Verhalten von verstärkungslernenden Agenten zu steuern.
- Es wird gezeigt, wie durch die Maskierung bestimmter Strategien unerwünschtes Verhalten verhindert werden kann.
- Diese Methode hilft, sichere und zuverlässige Agenten in komplexen Umgebungen zu trainieren.
- Strategie Maskierung, Verstärkungslernen, KI-Agenten, Guardrails, Wertbasiertes Lernen, Sicherheitsmechanismen, Agentenverhalten, Maschinenlernen
  Link: http://arxiv.org/abs/2501.05501
Titel: CoDriveVLM: VLM-Enhanced Urban Cooperative Dispatching and Motion Planning for Future Autonomous Mobility on Demand Systems
- Dieses Paper präsentiert CoDriveVLM, ein System, das Visual Language Models (VLMs) zur Verbesserung der kooperativen Dispositions- und Bewegungsplanung nutzt.
- Es zielt darauf ab, die Effizienz und Sicherheit autonomer Mobilitätssysteme in städtischen Gebieten zu verbessern.
- Die Nutzung von VLMs erlaubt eine detailliertere Interpretation von Umgebungsinformationen und eine bessere Planung.
- Autonome Fahrzeuge, Vision-Sprachmodelle, Kooperative Systeme, Bewegungsplanung, KI-Agenten, Mobilitätssysteme, Urbane Planung, Maschinenlernen
  Link: http://arxiv.org/abs/2501.06132
Titel: Towards Developing Socially Compliant Automated Vehicles: State of the Art, Experts Expectations, and A Conceptual Framework
- Dieses Paper untersucht den aktuellen Stand, die Erwartungen von Experten und ein konzeptionelles Rahmenwerk für die Entwicklung sozial konformer, automatisierter Fahrzeuge.
- Es wird analysiert, wie soziale Normen und das Verhalten von Menschen in die Entwicklung von KI-gesteuerten Fahrzeugen integriert werden können.
- Die Arbeit liefert wichtige Erkenntnisse für die Entwicklung von Fahrzeugen, die sich nahtlos in das menschliche Umfeld einfügen.
- Autonome Fahrzeuge, Soziale Konformität, KI-Ethik, KI-Agenten, Mensch-Roboter-Interaktion, Automatisierung, Verkehrssicherheit, Maschinenlernen
  Link: http://arxiv.org/abs/2501.06089
Titel: Real-Time Integrated Dispatching and Idle Fleet Steering with Deep Reinforcement Learning for A Meal Delivery Platform
- Dieses Paper präsentiert einen auf Deep Reinforcement Learning basierenden Ansatz für die Echtzeit-Disposition und Leerlaufsteuerung von Lieferflotten.
- Es wurde speziell für Essenslieferplattformen entwickelt und zielt auf die Optimierung von Lieferzeiten und Ressourcenallokation ab.
- Die Arbeit demonstriert die Wirksamkeit von Deep Reinforcement Learning zur Bewältigung komplexer logistischer Herausforderungen.
- Deep Reinforcement Learning, Logistik, KI-Agenten, Echtzeit-Disposition, Flottensteuerung, Lieferplattformen, Optimierung, Maschinenlernen
  Link: http://arxiv.org/abs/2501.05808
Titel: Multiagent Finetuning: Self Improvement with Diverse Reasoning Chains
- Dieses Paper untersucht die Feinabstimmung von multimodalen Modellen durch selbstständige Verbesserung mithilfe von vielfältigen Denkketten.
- Es wird gezeigt, wie Agenten durch die Analyse ihrer eigenen Fehler und dem Generieren verschiedener Problemlösungsansätze ihre Leistungen verbessern können.
- Diese Methode fördert selbstlernende Fähigkeiten in KI-Agenten.
- Multiagenten-Systeme, Feinabstimmung, Selbstverbesserung, KI-Agenten, Reasoning-Ketten, Multi-Modal-Modelle, Maschinenlernen, Sprachmodellierung
  Link: http://arxiv.org/abs/2501.05707
Titel: Network Diffuser for Placing-Scheduling Service Function Chains with Inverse Demonstration
- Dieses Paper präsentiert einen Netzwerk-Diffusor, der für das Platzieren und Planen von Service Function Chains (SFCs) entwickelt wurde.
- Es nutzt die umgekehrte Demonstration, um die Effizienz und Flexibilität in der Netzwerkplanung zu erhöhen.
- Der Ansatz ermöglicht es KI-Agenten, komplexe Netzwerkkonfigurationen optimal zu gestalten.
- Netzwerkplanung, KI-Agenten, Service Function Chains, Inverse Demonstration, Deep Learning, Optimierung, Ressourcenzuweisung, Maschinenlernen
  Link: http://arxiv.org/abs/2501.05673
Titel: RTLSquad: Multi-Agent Based Interpretable RTL Design
- Dieses Paper stellt RTLSquad vor, ein Multi-Agenten-System für das interpretierbare Design von RTL-Schaltkreisen.
- Es ermöglicht die Erstellung von Hardware-Designs durch die Zusammenarbeit mehrerer KI-Agenten.
- Der Fokus liegt auf der Nachvollziehbarkeit und Interpretierbarkeit der generierten Designs.
- Hardware-Design, Multi-Agenten-Systeme, KI-Agenten, RTL-Design, Interpretierbarkeit, Hardware-Architektur, Softwareentwicklung, Maschinenlernen
  Link: http://arxiv.org/abs/2501.05470

Liste der arXiv-Veröffentlichungen zu KI-Agenten 10.01.2025

Titel: Search-o1: Agentic Search-Enhanced Large Reasoning Models
Link:http://arxiv.org/abs/2501.05366
- Dieses Paper stellt Search-o1 vor, ein Framework, das die Fähigkeiten von großen Sprachmodellen mit einem agentenbasierten Suchprozess kombiniert.
- Es zielt darauf ab, die Genauigkeit und Effizienz von großen Modellen in Bezug auf komplexe Denkaufgaben zu verbessern.
- Das Framework integriert die Suche direkt in den Denkprozess, um detailliertere und genauere Antworten zu generieren.
Titel: ActPC-Geom: Towards Scalable Online Neural-Symbolic Learning via Accelerating Active Predictive Coding with Information Geometry & Diverse Cognitive Mechanisms
Link:http://arxiv.org/abs/2501.04832
- Dieses Paper stellt ActPC-Geom vor, einen Ansatz, der aktive prädiktive Codierung mit Methoden der Informationsgeometrie kombiniert.
- Es beschleunigt den Lernprozess und ermöglicht eine skalierbare, online-basierte neuronale-symbolische Lernmethode.
- Das Modell verwendet unterschiedliche kognitive Mechanismen, um die Effizienz und Anpassungsfähigkeit des Lernens zu erhöhen.
Titel: Constrained Optimization of Charged Particle Tracking with Multi-Agent Reinforcement Learning
Link:http://arxiv.org/abs/2501.05113
- Dieses Paper untersucht den Einsatz von Multi-Agenten-Reinforcement Learning zur Optimierung der Verfolgung geladener Teilchen.
- Es wird gezeigt, wie mehrere Agenten zusammenarbeiten können, um die Effizienz und Genauigkeit in diesem herausfordernden Bereich zu verbessern.
- Der Ansatz bietet eine neuartige Lösung für die schwierigen Probleme in der Teilchenphysik.
Titel: UAV-VLA: Vision-Language-Action System for Large Scale Aerial Mission Generation
Link:http://arxiv.org/abs/2501.05014
- Dieses Paper präsentiert ein Vision-Language-Action System (UAV-VLA) für die Erstellung von groß angelegten Luftmissionen.
- Das System integriert Vision, Sprache und Handlung, um komplexe Missionen mit autonomen Drohnen zu planen.
- UAV-VLA ermöglicht die Interpretation von menschlichen Anweisungen und deren Übersetzung in ausführbare Drohnen-Missionen.
Titel: CuRLA: Curriculum Learning Based Deep Reinforcement Learning for Autonomous Driving
Link:http://arxiv.org/abs/2501.04982
- In diesem Paper wird CuRLA vorgestellt, ein Ansatz, der auf Curriculum Learning basiert und mit Deep Reinforcement Learning für autonomes Fahren verwendet wird.
- Es wird demonstriert, wie durch sequentielles Training mit immer schwierigeren Aufgaben die Leistung in anspruchsvollen Umgebungen gesteigert werden kann.
- CuRLA bietet ein strukturiertes Lernverfahren, welches besonders nützlich für die Bewältigung komplexer Fahrsituationen ist.

Liste der arXiv-Veröffentlichungen zu KI-Agenten (09.01.205)

Titel: InfiGUIAgent: A Multimodal Generalist GUI Agent with Native Reasoning and Reflection
Link:http://arxiv.org/abs/2501.04575
- Dieses Paper stellt InfiGUIAgent vor, einen multimodalen Agenten, der für die Interaktion mit grafischen Benutzeroberflächen (GUI) entwickelt wurde.
- Der Agent ist in der Lage, komplexe Aufgaben auf GUIs mithilfe von internem Denken und Reflexion zu erledigen.
- InfiGUIAgent kann verschiedene Eingabeformen verarbeiten, was seine Flexibilität und Einsatzmöglichkeiten erhöht.
Titel: Research on environment perception and behavior prediction of intelligent UAV based on semantic communication
Link:http://arxiv.org/abs/2501.04480
- Das Paper befasst sich mit der Umfelderkennung und Verhaltensvorhersage intelligenter unbemannter Luftfahrzeuge (UAVs) mittels semantischer Kommunikation.
- Es untersucht, wie die Integration semantischer Kommunikation die Fähigkeit von UAVs zur Verarbeitung von Umgebungsdaten verbessern kann.
- Diese Forschung ist entscheidend für die Entwicklung autonomer UAVs, die in komplexen Umgebungen operieren können.
Titel: Hybrid Artificial Intelligence Strategies for Drone Navigation
Link:http://arxiv.org/abs/2501.04472
- Dieses Paper erforscht hybride KI-Strategien für die Navigation von Drohnen, die verschiedene KI-Techniken kombinieren.
- Es wird untersucht, wie die Integration von verschiedenen KI-Ansätzen die Navigationsfähigkeiten von Drohnen verbessern kann.
- Diese hybriden Strategien zielen darauf ab, präzisere und zuverlässigere Drohnenbewegungen zu erreichen.
Titel: Implementing Systemic Thinking for Automatic Schema Matching: An Agent-Based Modeling Approach
Link:http://arxiv.org/abs/2501.04136
- Hier wird ein agentenbasiertes Modell vorgestellt, das systemisches Denken für automatisches Schema-Matching verwendet.
- Das Modell verwendet mehrere Agenten, die zusammenarbeiten, um Datenstrukturen zu vergleichen und zu integrieren.
- Dieser Ansatz ist nützlich, um den Datenaustausch zwischen verschiedenen Systemen zu vereinfachen.
Titel: Beyond Sight: Finetuning Generalist Robot Policies with Heterogeneous Sensors via Language Grounding
Link:http://arxiv.org/abs/2501.04693
- Diese Arbeit untersucht die Feinabstimmung von Robotik-Richtlinien mit heterogenen Sensoren unter Verwendung von Sprachgrundlagen.
- Der Schwerpunkt liegt auf der Kombination visueller und nicht-visueller Sensordaten mit sprachbasierten Anweisungen.
- Das Ziel ist, generalisierte Roboterfähigkeiten für verschiedene Aufgaben zu erreichen.
Titel: Agent Laboratory: Using LLM Agents as Research Assistants
Link:http://arxiv.org/abs/2501.04227
- Das Paper schlägt vor, große Sprachmodell-Agenten als Forschungshilfen zu nutzen.
- Es untersucht, wie diese Agenten verschiedene Aufgaben in Forschungsprojekten unterstützen können.
- Der Fokus liegt auf der Verbesserung der Effizienz und Produktivität von Forschungsprozessen.
Titel: GNN-based Decentralized Perception in Multirobot Systems for Predicting Worker Actions
Link: http://arxiv.org/abs/2501.04193
Dieses Paper untersucht den Einsatz von Graph Neural Networks (GNNs) für die dezentrale Wahrnehmung in Multi-Roboter-Systemen.
Der Schwerpunkt liegt auf der Vorhersage des Verhaltens von Arbeitern durch den Einsatz von GNNs auf der Grundlage von Daten, die von mehreren Robotern erfasst wurden. Die entwickelte Lösung bietet eine Möglichkeit zur Verbesserung der Sicherheit und Effizienz in kooperativen robotischen Umgebungen.
Titel: HIVEX: A High-Impact Environment Suite for Multi-Agent Research (extended version)
Link:http://arxiv.org/abs/2501.04180
- Diese Arbeit präsentiert HIVEX, eine umfassende Umgebungssuite für die Mehragentenforschung.
- Die Suite umfasst Tools und Ressourcen, um komplexe Szenarien für die Erforschung des Verhaltens und der Interaktionen von Mehragentensystemen zu simulieren.
- HIVEX fördert die Entwicklung und Validierung fortschrittlicher Mehragentensysteme.

Liste der arXiv-Veröffentlichungen zu KI-Agenten (08.01.2025)

1. Titel: PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides
Link: https://arxiv.org/abs/2501.03936

o Dieses Paper präsentiert einen KI-Agenten namens PPTAgent, der Präsentationen über das bloße Umwandeln von Text in Folien hinaus generiert. Es behandelt auch die Bewertung solcher generierten Präsentationen. Es werden neue Methoden für die Inhaltsgestaltung und visuelle Anpassung von Präsentationen vorgestellt.

2. Titel: Dolphin: Closed-loop Open-ended Auto-research through Thinking, Practice, and Feedback
Link: https://arxiv.org/abs/2501.03916

o Das Paper stellt Dolphin vor, einen KI-Agenten, der in der Lage ist, eigenständig und in einem geschlossenen Kreislauf zu forschen. Dolphin nutzt dabei Denken, Ausprobieren und Feedback, um neue Erkenntnisse zu gewinnen. Der Agent zielt darauf ab, den Forschungsprozess durch Automatisierung zu beschleunigen und neue Möglichkeiten zu eröffnen.

3. Titel: Neural DNF-MT: A Neuro-symbolic Approach for Learning Interpretable and Editable Policies
Link: https://arxiv.org/abs/2501.03888

o Das Paper beschreibt einen neuro-symbolischen Ansatz namens Neural DNF-MT, der das Lernen von interpretierbaren und editierbaren Richtlinien ermöglicht. Es kombiniert neuronale Netze mit Disjunktiver Normalform (DNF), um eine klare und nachvollziehbare Politik zu entwickeln. Der Ansatz ist insbesondere für die KI-Planung von Bedeutung.

4. Titel: Online Reinforcement Learning-Based Dynamic Adaptive Evaluation Function for Real-Time Strategy Tasks
Link: https://arxiv.org/abs/2501.03824

o Dieses Paper präsentiert eine Methode für das Online-Reinforcement-Learning, um dynamische und adaptive Bewertungsfunktionen für Echtzeit-Strategieaufgaben zu entwickeln. Die Methode erlaubt es KI-Agenten, sich an veränderte Spielbedingungen anzupassen und ihre Leistung kontinuierlich zu verbessern. Es zeigt vielversprechende Ergebnisse in der Verwendung für komplexe Strategien.

5. Titel: Neural Deconstruction Search for Vehicle Routing Problems
Link: https://arxiv.org/abs/2501.03715

o Das Paper präsentiert eine neue Methode namens „Neural Deconstruction Search“ für Fahrzeugroutenplanungsprobleme. Es verwendet neuronale Netze, um komplexe Routen zu zerlegen und effizientere Lösungen zu finden. Die Methodik verbessert die Optimierung für logistische Herausforderungen.

6. Titel: SenseRAG: Constructing Environmental Knowledge Bases with Proactive Querying for LLM-Based Autonomous Driving
Link: https://arxiv.org/abs/2501.03535

o Dieses Paper stellt SenseRAG vor, einen Ansatz zum Aufbau von Umgebungs-Wissensdatenbanken für das autonome Fahren mit LLMs. Es nutzt proaktive Abfragen, um relevante Informationen zu sammeln und die Entscheidungsfindung des Fahrzeugs zu verbessern. Der Ansatz zielt darauf ab, die Sicherheit und Zuverlässigkeit des autonomen Fahrens zu erhöhen.

7. Titel: VLM-driven Behavior Tree for Context-aware Task Planning
Link: https://arxiv.org/abs/2501.03968

o Das Paper beschreibt die Verwendung von Vision-Language-Modellen (VLMs) zur Steuerung von Verhaltensbäumen für kontextbezogene Aufgabenplanung. Die Kombination von visueller und sprachlicher Verarbeitung ermöglicht es Robotern, komplexere Aufgaben in dynamischen Umgebungen auszuführen. Der Ansatz erweitert die Fähigkeit von Robotern zur intelligenten Interaktion.

8. Titel: Exploring the Potential of Large Language Models in Public Transportation: San Antonio Case Study
Link: https://arxiv.org/abs/2501.03904

o Dieses Paper untersucht das Potenzial großer Sprachmodelle (LLMs) im öffentlichen Verkehr anhand einer Fallstudie in San Antonio. Es zeigt, wie LLMs zur Verbesserung von Planung, Kundenservice und Effizienz beitragen können. Die Studie beleuchtet vielversprechende Anwendungen für den städtischen Nahverkehr.

9. Titel: Explainable Reinforcement Learning via Temporal Policy Decomposition
Link: https://arxiv.org/abs/2501.03902

o Das Paper stellt eine Methode zur Erklärung von Reinforcement Learning (RL) vor, die auf einer temporären Richtlinienzerlegung basiert. Die Methode zerlegt komplexe RL-Strategien in verständlichere Einzelteile, um die Entscheidungsfindung von KI-Agenten transparenter zu machen. Der Ansatz verbessert das Verständnis für das Verhalten von RL-Agenten.

10. Titel: Applying Large Language Models in Knowledge Graph-based Enterprise Modeling: Challenges and Opportunities
Link: https://arxiv.org/abs/2501.03566

o Dieses Paper untersucht die Herausforderungen und Chancen bei der Verwendung von großen Sprachmodellen (LLMs) in der unternehmensweiten Modellierung auf der Basis von Wissensgraphen. Es untersucht, wie LLMs zur Automatisierung der Modellerstellung, Datenintegration und Inferenz genutzt werden können. Der Artikel beleuchtet die Potenziale und Herausforderungen bei der Anwendung moderner KI-Technologien.

11. Titel: Rethinking Adversarial Attacks in Reinforcement Learning from Policy Distribution Perspective
Link: https://arxiv.org/abs/2501.03562

o Das Paper beleuchtet die Rolle der Richtlinienverteilung in adversarialen Angriffen im Bereich des Reinforcement Learnings. Es analysiert, wie Angreifer die Richtlinienverteilung manipulieren können, um die Leistung von RL-Agenten zu beeinträchtigen. Der Artikel bietet neue Einsichten in die Verwundbarkeit von RL-Systemen.

12. Titel: Self-Adaptive ERP: Embedding NLP into Petri-Net creation and Model Matching
Link: https://arxiv.org/abs/2501.03795
* Dieses Paper präsentiert ein selbstadaptives ERP-System (Enterprise Resource Planning), das NLP (Natural Language Processing) in die Erstellung von Petri-Netzen und den Modellabgleich integriert. Es wird aufgezeigt wie NLP-Techniken zur Automatisierung und Verbesserung der Modellierungs- und Anpassungsfähigkeit von ERP-Systemen eingesetzt werden können. Das Paper bietet eine innovative Perspektive auf die Integration von KI in Geschäftsprozesse.

13. Titel: A Soft Sensor Method with Uncertainty-Awareness and Self-Explanation Based on Large Language Models Enhanced by Domain Knowledge Retrieval
Link: https://arxiv.org/abs/2501.03295

Dieses Paper stellt eine Softsensor-Methode vor, die Unsicherheiten berücksichtigt und sich durch den Einsatz von großen Sprachmodellen (LLMs) selbst erklären kann. Es nutzt Retrieval-Methoden, um domänenspezifisches Wissen einzubinden und die Vorhersagegenauigkeit zu verbessern. Die Methode bietet mehr Transparenz und Zuverlässigkeit bei der Datenanalyse.

Liste der arXiv-Veröffentlichungen zu KI-Agenten (08.Januar 2025)

Titel: InfiGUIAgent: A Multimodal Generalist GUI Agent with Native Reasoning and Reflection
Link:arXiv:2501.04575
Beschreibung:
- Dieses Paper stellt einen multimodalen GUI-Agenten namens InfiGUIAgent vor, der in der Lage ist, mit grafischen Benutzeroberflächen zu interagieren.
- Der Agent verwendet native Reasoning- und Reflexionsfähigkeiten, um seine Interaktionen zu steuern.
- Das Ziel ist die Entwicklung eines universellen Agenten für verschiedene Aufgaben, die eine GUI-Interaktion erfordern.
Titel: Implementing Systemic Thinking for Automatic Schema Matching: An Agent-Based Modeling Approach
Link:arXiv:2501.04136
Beschreibung:
- Dieses Paper befasst sich mit der automatischen Schema-Abstimmung durch eine Agenten-basierte Modellierung.
- Es wird ein systemischer Ansatz zur Lösung dieses Problems vorgestellt, der die komplexen Beziehungen zwischen verschiedenen Datenschemata berücksichtigt.
- Das Ziel ist eine präzisere und flexiblere Methode für das Schema-Matching.
Titel: Agent Laboratory: Using LLM Agents as Research Assistants
Link:arXiv:2501.04227
Beschreibung:
- Das Paper präsentiert „Agent Laboratory“, ein System, das LLM-basierte Agenten als Forschungsassistenten nutzt.
- Diese Agenten können bei Aufgaben wie Literaturrecherche und Datenanalyse helfen.
- Das System zielt darauf ab, die Effizienz und den Output von Forschung zu verbessern.

Liste der arXiv-Veröffentlichungen zu KI-Agenten (07.Januar 2025)

Titel: PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides
Link:https://arxiv.org/abs/2501.03936
- Dieses Paper präsentiert einen KI-Agenten namens PPTAgent, der Präsentationen über das bloße Umwandeln von Text in Folien hinaus generiert. Es behandelt auch die Bewertung solcher generierten Präsentationen. Es werden neue Methoden für die Inhaltsgestaltung und visuelle Anpassung von Präsentationen vorgestellt.
Titel: Dolphin: Closed-loop Open-ended Auto-research through Thinking, Practice, and Feedback
Link:https://arxiv.org/abs/2501.03916
- Das Paper stellt Dolphin vor, einen KI-Agenten, der in der Lage ist, eigenständig und in einem geschlossenen Kreislauf zu forschen. Dolphin nutzt dabei Denken, Ausprobieren und Feedback, um neue Erkenntnisse zu gewinnen. Der Agent zielt darauf ab, den Forschungsprozess durch Automatisierung zu beschleunigen und neue Möglichkeiten zu eröffnen.
Titel: Neural DNF-MT: A Neuro-symbolic Approach for Learning Interpretable and Editable Policies
Link:https://arxiv.org/abs/2501.03888
- Das Paper beschreibt einen neuro-symbolischen Ansatz namens Neural DNF-MT, der das Lernen von interpretierbaren und editierbaren Richtlinien ermöglicht. Es kombiniert neuronale Netze mit Disjunktiver Normalform (DNF), um eine klare und nachvollziehbare Politik zu entwickeln. Der Ansatz ist insbesondere für die KI-Planung von Bedeutung.
Titel: Online Reinforcement Learning-Based Dynamic Adaptive Evaluation Function for Real-Time Strategy Tasks
Link:https://arxiv.org/abs/2501.03824
- Dieses Paper präsentiert eine Methode für das Online-Reinforcement-Learning, um dynamische und adaptive Bewertungsfunktionen für Echtzeit-Strategieaufgaben zu entwickeln. Die Methode erlaubt es KI-Agenten, sich an veränderte Spielbedingungen anzupassen und ihre Leistung kontinuierlich zu verbessern. Es zeigt vielversprechende Ergebnisse in der Verwendung für komplexe Strategien.
Titel: Neural Deconstruction Search for Vehicle Routing Problems
Link:https://arxiv.org/abs/2501.03715
- Das Paper präsentiert eine neue Methode namens „Neural Deconstruction Search“ für Fahrzeugroutenplanungsprobleme. Es verwendet neuronale Netze, um komplexe Routen zu zerlegen und effizientere Lösungen zu finden. Die Methodik verbessert die Optimierung für logistische Herausforderungen.
Titel: SenseRAG: Constructing Environmental Knowledge Bases with Proactive Querying for LLM-Based Autonomous Driving
Link:https://arxiv.org/abs/2501.03535
- Dieses Paper stellt SenseRAG vor, einen Ansatz zum Aufbau von Umgebungs-Wissensdatenbanken für das autonome Fahren mit LLMs. Es nutzt proaktive Abfragen, um relevante Informationen zu sammeln und die Entscheidungsfindung des Fahrzeugs zu verbessern. Der Ansatz zielt darauf ab, die Sicherheit und Zuverlässigkeit des autonomen Fahrens zu erhöhen.
Titel: VLM-driven Behavior Tree for Context-aware Task Planning
Link:https://arxiv.org/abs/2501.03968
- Das Paper beschreibt die Verwendung von Vision-Language-Modellen (VLMs) zur Steuerung von Verhaltensbäumen für kontextbezogene Aufgabenplanung. Die Kombination von visueller und sprachlicher Verarbeitung ermöglicht es Robotern, komplexere Aufgaben in dynamischen Umgebungen auszuführen. Der Ansatz erweitert die Fähigkeit von Robotern zur intelligenten Interaktion.
Titel: Exploring the Potential of Large Language Models in Public Transportation: San Antonio Case Study
Link:https://arxiv.org/abs/2501.03904
- Dieses Paper untersucht das Potenzial großer Sprachmodelle (LLMs) im öffentlichen Verkehr anhand einer Fallstudie in San Antonio. Es zeigt, wie LLMs zur Verbesserung von Planung, Kundenservice und Effizienz beitragen können. Die Studie beleuchtet vielversprechende Anwendungen für den städtischen Nahverkehr.
Titel: Explainable Reinforcement Learning via Temporal Policy Decomposition
Link:https://arxiv.org/abs/2501.03902
- Das Paper stellt eine Methode zur Erklärung von Reinforcement Learning (RL) vor, die auf einer temporären Richtlinienzerlegung basiert. Die Methode zerlegt komplexe RL-Strategien in verständlichere Einzelteile, um die Entscheidungsfindung von KI-Agenten transparenter zu machen. Der Ansatz verbessert das Verständnis für das Verhalten von RL-Agenten.
Titel: Applying Large Language Models in Knowledge Graph-based Enterprise Modeling: Challenges and Opportunities
Link:https://arxiv.org/abs/2501.03566
- Dieses Paper untersucht die Herausforderungen und Chancen bei der Verwendung von großen Sprachmodellen (LLMs) in der unternehmensweiten Modellierung auf der Basis von Wissensgraphen. Es untersucht, wie LLMs zur Automatisierung der Modellerstellung, Datenintegration und Inferenz genutzt werden können. Der Artikel beleuchtet die Potenziale und Herausforderungen bei der Anwendung moderner KI-Technologien.
Titel: Rethinking Adversarial Attacks in Reinforcement Learning from Policy Distribution Perspective
Link:https://arxiv.org/abs/2501.03562
- Das Paper beleuchtet die Rolle der Richtlinienverteilung in adversarialen Angriffen im Bereich des Reinforcement Learnings. Es analysiert, wie Angreifer die Richtlinienverteilung manipulieren können, um die Leistung von RL-Agenten zu beeinträchtigen. Der Artikel bietet neue Einsichten in die Verwundbarkeit von RL-Systemen.
Titel: Self-Adaptive ERP: Embedding NLP into Petri-Net creation and Model Matching
Link: https://arxiv.org/abs/2501.03795
* Dieses Paper präsentiert ein selbstadaptives ERP-System (Enterprise Resource Planning), das NLP (Natural Language Processing) in die Erstellung von Petri-Netzen und den Modellabgleich integriert. Es wird aufgezeigt wie NLP-Techniken zur Automatisierung und Verbesserung der Modellierungs- und Anpassungsfähigkeit von ERP-Systemen eingesetzt werden können. Das Paper bietet eine innovative Perspektive auf die Integration von KI in Geschäftsprozesse.
Titel: A Soft Sensor Method with Uncertainty-Awareness and Self-Explanation Based on Large Language Models Enhanced by Domain Knowledge Retrieval
Link: https://arxiv.org/abs/2501.03295

Dieses Paper stellt eine Softsensor-Methode vor, die Unsicherheiten berücksichtigt und sich durch den Einsatz von großen Sprachmodellen (LLMs) selbst erklären kann. Es nutzt Retrieval-Methoden, um domänenspezifisches Wissen einzubinden und die Vorhersagegenauigkeit zu verbessern. Die Methode bietet mehr Transparenz und Zuverlässigkeit bei der Datenanalyse.

Liste der arXiv-Veröffentlichungen zu KI-Agenten (06.Januar 2025)

SDPO: Segment-Level Direct Preference Optimization for Social Agents
Link:https://arxiv.org/abs/2501.01821
- Dieses Paper stellt eine neue Methode vor, die Präferenzoptimierung segmentweise angeht, um das Verhalten sozialer KI-Agenten anzupassen.
- Dabei berücksichtigt sie die individuellen Präferenzen in verschiedenen Handlungskontexten.
- Ziel ist, Agenten zu entwickeln, die flexibler und anpassungsfähiger auf Interaktionen reagieren.
Proposing Hierarchical Goal-Conditioned Policy Planning in Multi-Goal Reinforcement Learning
Link:https://arxiv.org/abs/2501.01727
- Dieses Paper führt ein hierarchisches Verfahren ein, das Agenten unterstützt, mehrere Ziele im Reinforcement Learning parallel anzugehen.
- Es kombiniert eine Planungs- mit einer Lernkomponente, um hochkomplexe Aufgaben zu meistern.
- Damit sollen KI-Agenten effizienter und koordinierter auf unterschiedliche Ziele hin trainiert werden.
AgentRefine: Enhancing Agent Generalization through Refinement Tuning
Link:https://arxiv.org/abs/2501.01702
- Diese Arbeit beschreibt ein Verfahren namens “Refinement Tuning”, das die Generalisierungsfähigkeit von KI-Agenten verbessern soll.
- Der Ansatz baut auf bereits trainierten Agenten auf und verfeinert deren Strategien in neuen Umgebungen.
- Dadurch können Agenten robuster und anpassungsfähiger auf variierende Aufgabenstellungen reagieren.
BLAST: A Stealthy Backdoor Leverage Attack against Cooperative Multi-Agent Deep Reinforcement Learning based Systems
Link:https://arxiv.org/abs/2501.01593
- Dieses Paper analysiert eine Backdoor-Angriffsstrategie in kooperativen Multi-Agenten-Systemen für Deep Reinforcement Learning.
- Es zeigt auf, wie bösartige Modifikationen unbemerkt eingestreut werden können, um das Gesamtsystem zu manipulieren.
- Die Studie verdeutlicht damit Schwachstellen und liefert zugleich Hinweise zum Schutz vor solchen Angriffen.
QuArch: A Question-Answering Dataset for AI Agents in Computer Architecture
Link:https://arxiv.org/abs/2501.01892
- Dieses Werk stellt ein neues Datenset namens “QuArch” vor, das KI-Agenten beim Verständnis von Computerarchitektur unterstützen soll.
- Es beinhaltet Fragen und Antworten zu technischen Details und Konzepten aus der Hardware-Architektur.
- Ziel ist es, KI-Agenten zu befähigen, komplexe Sachverhalte in der Computerarchitektur korrekt zu interpretieren und zu beantworten.
Multi-Agent Conversational Online Learning for Adaptive LLM Response Identification
Link:https://arxiv.org/abs/2501.01849
- In dieser Arbeit wird ein Mehr-Agenten-Ansatz vorgestellt, der laufend von Nutzerinteraktionen lernt, um bessere Antworten großer Sprachmodelle zu identifizieren.
- Dabei kommunizieren die Agenten untereinander, um Kontexte und Nutzerrückmeldungen gemeinsam auszuwerten.
- So sollen KI-Systeme anpassungsfähiger und nutzerzentrierter reagieren können.
MoColl: Agent-Based Specific and General Model Collaboration for Image Captioning
Link:https://arxiv.org/abs/2501.01834
- Dieses Paper schlägt einen agentenbasierten Ansatz vor, bei dem verschiedene Modelle für das Bildunterschreiben (Image Captioning) zusammenarbeiten.
- Ein spezieller Agent kümmert sich um fein abgestimmte, kontextbezogene Beschreibungen, während ein allgemeiner Agent universell einsetzbare Bildunterschriften generiert.
- Durch ihre Zusammenarbeit wird eine höhere Qualität und Vielfalt der generierten Bildbeschreibungen erzielt.
Goal Recognition using Actor-Critic Optimization
Link:https://arxiv.org/abs/2501.01463
- Das Paper behandelt ein Verfahren, um mithilfe von Actor-Critic-Methoden die Ziele eines beobachteten Agenten schnell zu erkennen.
- Dabei werden unvollständige oder teilweise Beobachtungen ausgewertet, um Rückschlüsse auf das wahrscheinliche Ziel des Agenten zu ziehen.
- Dieses Vorgehen erleichtert unter anderem die Anpassung kooperativer oder kompetitiver Strategien gegenüber anderen KI-Agenten.

Liste der arXiv-Veröffentlichungen zu KI-Agenten (03. Januar 2025):

Titel:Aviary: training language agents on challenging scientific tasks
- Link: https://arxiv.org/abs/2412.21154
- Beschreibung:
  - Dieses Paper präsentiert Aviary, eine Plattform, die speziell darauf ausgerichtet ist, Sprachagenten in anspruchsvollen wissenschaftlichen Bereichen zu trainieren.
  - Aviary nutzt eine Kombination aus neuen Trainingsmethoden und einer speziell kuratierten Aufgabenvielfalt, um die Fähigkeiten der Agenten zu verbessern.
  - Die Experimente zeigen, dass mit Aviary trainierte Sprachagenten eine signifikant bessere Leistung in komplexen wissenschaftlichen Aufgaben erzielen als andere Ansätze.
Titel:UnrealZoo: Enriching Photo-realistic Virtual Worlds for Embodied AI
- Link: https://arxiv.org/abs/2412.20977
- Beschreibung:
  - UnrealZoo ist eine neue Plattform, die es ermöglicht, hochrealistische virtuelle Umgebungen für das Training von Embodied AI-Agenten zu erstellen.
  - Die Plattform bietet eine Vielfalt an Umgebungen, die von einfachen Szenarien bis hin zu komplexen, lebensnahen Settings reichen.
  - Durch die Nutzung fotorealistischer Umgebungen sollen die Agenten besser auf reale Aufgaben vorbereitet werden.
Titel:Planning, Living and Judging: A Multi-agent LLM-based Framework for Cyclical Urban Planning
- Link: https://arxiv.org/abs/2412.20505
- Beschreibung:
  - Dieses Paper stellt ein Multi-Agenten-Framework vor, das auf Large Language Models (LLMs) basiert und für die zyklische Stadtplanung konzipiert wurde.
  - Das Framework integriert Planungs-, Lebens- und Bewertungsaspekte, um einen iterativen Planungsprozess zu ermöglichen.
  - Die Ergebnisse deuten darauf hin, dass LLMs in einem Multiagenten-System effektiv zur Lösung von Herausforderungen in der Stadtplanung genutzt werden können.
Titel:High-fidelity social learning via shared episodic memories enhances collaborative foraging through mnemonic convergence
- Link: https://arxiv.org/abs/2412.20271
- Beschreibung:
  - Diese Studie untersucht, wie sich das Teilen episodischer Erinnerungen auf das soziale Lernen und die kollaborative Futtersuche von KI-Agenten auswirkt.
  - Durch den Austausch von Gedächtnisinhalten können Agenten ihre Zusammenarbeit verbessern und effizienter zusammenarbeiten.
  - Die Forschungsergebnisse legen nahe, dass eine gemeinsame Erinnerungsbasis die mnemotechnische Konvergenz fördert und somit das kollaborative Lernen optimiert.
Titel:BaiJia: A Large Scale Role-Playing Agent Corpus of Chinese Historical Charcaters
- Link: https://arxiv.org/abs/2412.20024
- Beschreibung:
  - BaiJia ist ein umfangreiches Korpus, das für das Training und die Evaluation von Rollenspiel-KI-Agenten mit chinesischen historischen Figuren entwickelt wurde.
  - Das Korpus umfasst detaillierte Beschreibungen und Dialoge, die es den Agenten ermöglichen, glaubwürdige historische Persönlichkeiten darzustellen.
  - Diese Ressource soll die Forschung im Bereich der personalisierten und kulturell sensiblen KI-Interaktion fördern.
Titel:Exploring and Controlling Diversity in LLM-Agent Conversation
- Link: https://arxiv.org/abs/2412.21102
- Beschreibung:
  - Diese Arbeit untersucht Methoden zur Messung und Steuerung der inhaltlichen Vielfalt in Gesprächen, die von LLM-basierten Agenten geführt werden.
  - Es werden verschiedene Ansätze vorgestellt, um die Diversität von Konversationen zu erhöhen oder zu reduzieren, je nach Anwendungsfall.
  - Die Ergebnisse deuten darauf hin, dass eine gezielte Steuerung der Diversität die Qualität und Relevanz von Agenten-Konversationen verbessern kann.
Titel:Plancraft: an evaluation dataset for planning with LLM agents
- Link: https://arxiv.org/abs/2412.21033
- Beschreibung:
  - Plancraft ist ein neuer Datensatz, der speziell für die Bewertung der Planungsfähigkeiten von LLM-basierten Agenten entwickelt wurde.
  - Der Datensatz enthält eine Reihe komplexer Aufgaben, die von den Agenten erfordern, detaillierte Handlungsabläufe zu entwerfen.
  - Plancraft soll als Standard-Benchmark für die Forschung im Bereich des Planens mit LLMs dienen.
Titel:Game Theory and Multi-Agent Reinforcement Learning: From Nash Equilibria to Evolutionary Dynamics
- Link: https://arxiv.org/abs/2412.20519
- Beschreibung:
  - Dieses Paper bietet einen Überblick über die Grundlagen der Spieltheorie und deren Anwendung auf Multi-Agenten Reinforcement Learning.
  - Es werden verschiedene Methoden und Algorithmen vorgestellt, die von Nash-Gleichgewichten bis zur evolutionären Dynamik reichen.
  - Die Arbeit bietet sowohl theoretische als auch praktische Einblicke in die Gestaltung kooperativer und kompetitiver Multi-Agenten-Systeme.
Titel:Multi-Scenario Reasoning: Unlocking Cognitive Autonomy in Humanoid Robots for Multimodal Understanding
- Link: https://arxiv.org/abs/2412.20429
- Beschreibung:
  - Dieses Paper untersucht, wie humanoide Roboter durch Multi-Modal-Reasoning eine höhere kognitive Autonomie erreichen können.
  - Der Fokus liegt auf der Fähigkeit der Roboter, über verschiedene Szenarien hinweg zu schlussfolgern und zu verstehen.
  - Es wird ein Ansatz vorgestellt, der es Robotern ermöglicht, multimodale Eingaben zu integrieren und flexible Entscheidungen zu treffen.
Titel:Safe Multiagent Coordination via Entropic Exploration
- Link: https://arxiv.org/abs/2412.20361
- Beschreibung:
  - Dieses Paper präsentiert einen Ansatz, um die sichere Koordination von Multi-Agenten-Systemen durch die Nutzung von Entropie-basierter Exploration zu verbessern.
  - Es wird gezeigt, dass die kontrollierte Zufallsexploration das Risiko unkoordinierter Aktionen minimieren und gleichzeitig die Zusammenarbeit fördern kann.
  - Die Arbeit bietet eine vielversprechende Methode, um sichere und effiziente Multi-Agenten-Systeme zu entwickeln.
Titel:TradingAgents: Multi-Agents LLM Financial Trading Framework
- Link: https://arxiv.org/abs/2412.20138
- Beschreibung:
  - Dieses Paper stellt TradingAgents vor, ein Framework, das LLMs nutzt, um Multi-Agenten-Systeme für den Finanzhandel zu entwickeln.
  - Das Framework ermöglicht es, verschiedene Handelsstrategien zu testen und ihre Leistung in simulierten Marktszenarien zu bewerten.
  - Durch die Verwendung mehrerer Agenten kann eine robustere und vielseitigere Handelsstrategie erreicht werden.
Titel:M-MAD: Multidimensional Multi-Agent Debate Framework for Fine-grained Machine Translation Evaluation
- Link: https://arxiv.org/abs/2412.20127
- Beschreibung:
  - M-MAD ist ein Multi-Agenten-Framework, das auf Debatten basiert und zur präzisen Evaluierung maschineller Übersetzungen entwickelt wurde.
  - Es verwendet mehrere Agenten, die verschiedene Aspekte einer Übersetzung diskutieren und bewerten, um eine umfassendere Analyse zu ermöglichen.
  - Dieser Ansatz ermöglicht eine differenziertere Bewertung als herkömmliche Metriken.
Titel:OneKE: A Dockerized Schema-Guided LLM Agent-based Knowledge Extraction System
- Link: https://arxiv.org/abs/2412.20005
- Beschreibung:
  - OneKE ist ein dockerisiertes System, das schemageführte LLM-Agenten verwendet, um Wissen aus Dokumenten zu extrahieren.
  - Das System ist flexibel und ermöglicht eine einfache Integration in verschiedene Arbeitsabläufe durch den Einsatz von Docker-Containern.
  - OneKE ist ein Beispiel dafür, wie LLM-basierte Agenten für automatisierte Wissensextraktion genutzt werden können.
Titel:Can Large Language Models Adapt to Other Agents In-Context?
- Link: https://arxiv.org/abs/2412.19726
- Beschreibung:
  - Diese Forschung untersucht, ob Large Language Models (LLMs) ihre Verhaltensweisen während einer Interaktion mit anderen Agenten anpassen können.
  - Es wird analysiert, wie LLMs in-context lernen und ihre Strategien auf Grundlage der Interaktionspartner optimieren.
  - Die Ergebnisse geben Aufschluss über die Flexibilität und Anpassungsfähigkeit von LLMs in Multi-Agenten-Umgebungen.
Titel:OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis
- Link: https://arxiv.org/abs/2412.19723
- Beschreibung:
  - OS-Genesis ist ein System, welches automatisch Trajektorien für GUI-Agenten mittels Reverse Task Synthesis erstellen kann.
  - Der Ansatz kehrt den Prozess der Task-Ausführung um, indem es von einem gewünschten Ergebnis ausgehend eine Reihe von Schritten ableitet.
  - Dieses System zielt darauf ab, die Erstellung und Analyse von GUI-Agenten zu vereinfachen.
Titel:Hindsight Planner: A Closed-Loop Few-Shot Planner for Embodied Instruction Following
- Link: https://arxiv.org/abs/2412.19562
- Beschreibung:
  - Dieser Artikel stellt einen Planner vor, der nur wenige Beispiele benötigt und aus Erfahrung lernt, um Anweisungen in einer Umgebung zu befolgen.
  - Der Planner nutzt ein Hindsight-Konzept, um aus Fehlern zu lernen und den Planungsprozess anzupassen.
  - Das System zeigt, wie Agenten in dynamischen Umgebungen mit wenigen Beispielen komplexe Aufgaben erfolgreich bewältigen können.
Titel:Hierarchical Multi-agent Meta-Reinforcement Learning for Cross-channel Bidding
- Link: https://arxiv.org/abs/2412.19064
- Beschreibung:
  - Hier wird ein hierarchischer Multi-Agenten-Ansatz vorgestellt, der Meta-Reinforcement Learning (Meta-RL) verwendet, um Bietstrategien über verschiedene Kanäle zu optimieren.
  - Die Hierarchie ermöglicht es, dass Agenten auf verschiedenen Ebenen agieren und somit komplexere Entscheidungen treffen können.
  - Die Experimente zeigen, dass dieser Ansatz die Effizienz und Rentabilität von Bietprozessen verbessern kann.
Titel:TravelAgent: Generative Agents in the Built Environment
- Link: https://arxiv.org/abs/2412.18985
- Beschreibung:
  - TravelAgent ist ein System, das generative KI-Agenten nutzt, um das Verhalten von Menschen in einer bebauten Umgebung zu simulieren.
  - Die Agenten sind in der Lage, selbstständig Entscheidungen zu treffen und Interaktionen mit der Umgebung zu simulieren, die auf realen Mustern basieren.
  - Dies ermöglicht ein besseres Verständnis von räumlichen Interaktionen und kann in der Stadtplanung verwendet werden.
Titel:GAI: Generative Agents for Innovation
- Link: https://arxiv.org/abs/2412.18899
- Beschreibung:
  - Dieses Paper untersucht die Rolle von generativen Agenten bei der Förderung von Innovationen.
  - Es wird ein Framework vorgestellt, das verschiedene Agenten mit unterschiedlichen Rollen für die generative Ideenfindung und Problemlösung kombiniert.
  - Die Forschung zeigt das Potenzial generativer Agenten, die Entwicklung von neuen Lösungen in verschiedenen Bereichen zu beschleunigen.
Titel:Agents on the Bench: Large Language Model Based Multi Agent Framework for Trustworthy Digital Justice
- Link: https://arxiv.org/abs/2412.18697
- Beschreibung:
  - Nutzt ein Multi-Agenten-System mit LLMs, um bestimmte Aspekte der digitalen Justiz transparent und vertrauenswürdig abzubilden.
  - Die Arbeit zielt darauf ab, die Transparenz und das Vertrauen in die digitale Justiz zu stärken.
  - Die Arbeit adressiert wichtige ethische und praktische Aspekte im Kontext von KI und Rechtsprechung.
Titel:Multi-Agent Norm Perception and Induction in Distributed Healthcare
- Link: https://arxiv.org/abs/2412.18454
- Beschreibung:
  - Diese Arbeit untersucht die Normwahrnehmung und -induktion durch Multi-Agenten-Systeme im verteilten Gesundheitswesen.
  - Es wird analysiert, wie Agenten gemeinsame Verhaltensregeln erlernen und befolgen können, um eine effektive Zusammenarbeit zu gewährleisten.
  - Diese Forschung bietet Einblicke in die Schaffung sicherer und effizienter Multi-Agenten-Systeme in komplexen Umgebungen.
Titel:Explainable Multi-Modal Data Exploration in Natural Language via LLM Agent
- Link: https://arxiv.org/abs/2412.18428
- Beschreibung:
  - Hier wird ein LLM-Agent zur multimodalen Datenexploration durch natürliche Sprache vorgestellt.
  - Das System ermöglicht es, verschiedene Datenmodalitäten zu durchsuchen, abzufragen und besser zu verstehen.
  - Die Arbeit verbessert die Zugänglichkeit zu komplexen Datensätzen.
Titel:GUI Testing Arena: A Unified Benchmark for Advancing Autonomous GUI Testing Agent
- Link: https://arxiv.org/abs/2412.18426
- Beschreibung:
  - Stellt einen Benchmark bereit, um automatisierte Test-Agenten für grafische User-Interfaces (GUI) zu entwickeln und zu testen.
  - Die Benchmark zielt darauf ab, die Entwicklung effizienterer und effektiverer Testmethoden zu fördern.
  - Die Arbeit bietet einen umfassenden Testrahmen mit klaren Kriterien zur Bewertung der Testfähigkeiten.
Titel:MineStudio: A Streamlined Package for Minecraft AI Agent Development
- Link: https://arxiv.org/abs/2412.18293
- Beschreibung:
  - Bietet eine vereinfachte Entwicklungsumgebung, um KI-Agenten in Minecraft zu erstellen und zu evaluieren.
  - Das Paket stellt eine Reihe von Tools und Ressourcen bereit, die den Entwicklungsprozess erleichtern.
  - MineStudio soll die Anwendung von KI in Spielen durch benutzerfreundliche Tools ermöglichen.
Titel:AutoDroid-V2: Boosting SLM-based GUI Agents via Code Generation
- Link: https://arxiv.org/abs/2412.18111
- Beschreibung:
  - Zeigt, wie man GUI-Agenten durch Code-Generierung verbessert, unter Nutzung eines „SLM“-Ansatzes (vermutlich specialized LLM).
  - Der Fokus liegt auf der Effizienz von SLMs für GUI-bezogene Aufgaben.
  - Durch die Kombination von SLMs mit Codegenerierung sollen GUI-Agenten effektiver und robuster gemacht werden.
Titel:Dynamic Multi-Agent Orchestration and Retrieval for Multi-Source Question-Answer Systems using Large Language Models
- Link: https://arxiv.org/abs/2412.17964
- Beschreibung:
  - Dieses Paper beschreibt den Einsatz von LLMs für die dynamische Multi-Agenten-Orchestrierung in Q&A-Systemen, die verschiedene Datenquellen nutzen.
  - Die Agenten arbeiten zusammen, um Aufgaben koordiniert zu bearbeiten und Informationen aus verschiedenen Quellen abzurufen.
  - Die Arbeit zeigt, dass die Leistung und Effizienz solcher Systeme durch die Zusammenarbeit gesteigert wird.
Titel:Contrato360 2.0: A Document and Database-Driven Question-Answer System using Large Language Models and Agents
- Link: https://arxiv.org/abs/2412.17942
- Beschreibung:
  - Beschreibt ein QA-System, bei dem LLMs und mehrere Agenten Dokumente und Datenbanken gemeinsam nutzen, um Fragen zu beantworten.
  - Das System ist darauf ausgerichtet, komplexe Fragen aus heterogenen Datenquellen zu beantworten.
- Diese Arbeit demonstriert, wie leistungsfähige Q&A-Systeme durch die Kombination von LLM- und Agenten-Technologien realisiert werden können.
Titel:Decentralized Intelligence in GameFi: Embodied AI Agents and the Convergence of DeFi and Virtual Ecosystems
- Link: https://arxiv.org/abs/2412.18601
- Beschreibung:
  - Diskutiert „Embodied AI Agents“ für GameFi-Ökosysteme, bei denen DeFi und virtuelle Umgebungen verschmelzen.
  - Es wird untersucht, wie KI-Agenten autonome Entscheidungen treffen und zu einer dezentralisierten Intelligenz beitragen können.
- Die Forschung untersucht die Möglichkeiten und Herausforderungen in diesem neuen Feld.
Titel:A Paragraph is All It Takes: Rich Robot Behaviors from Interacting, Trusted LLMs
- Link: https://arxiv.org/abs/2412.18588
- Beschreibung:
  - Diese Studie zeigt, dass Roboter mithilfe von Interaktionen mit vertrauenswürdigen LLMs komplexe Verhaltensweisen erlernen können.
  - Es genügt eine kurze textuelle Anweisung, damit LLMs Roboter effektiv lenken und koordinieren können.
    *Die Ergebnisse zeigen eine verbesserte Flexibilität und Anpassungsfähigkeit der Roboter in dynamischen Umgebungen.
Titel:Multi-Modal Grounded Planning and Efficient Replanning For Learning Embodied Agents with A Few Examples
* Link:https://arxiv.org/abs/2412.17288
* Beschreibung:
* Die Forschung in diesem Paper konzentriert sich auf multimodale, geerdete Planung und effiziente Neuplanung für das Lernen von Embodied Agents mit wenigen Beispielen.
- Die Methode integriert visuelle und sprachliche Informationen, um die Planungsfähigkeit der Agenten zu verbessern.
- Die Arbeit zeigt, dass Agents mit dieser Methode effizient und flexibel in verschiedenen Szenarien planen und agieren können.
Titel:A3: Android Agent Arena for Mobile GUI Agents
- Link: https://arxiv.org/abs/2501.01149
- Beschreibung:
  - Ein Toolkit und Framework, das Agenten für Android-GUIs trainiert und testet, um automatisierte Bedienung und Interaktion auf mobilen Apps zu ermöglichen.
  - Die Plattform dient als standardisierte Umgebung für die Forschung in diesem Bereich.
  - Es ermöglicht die Entwicklung effizienterer und robusterer Agenten für mobile Geräte.
Titel:Beyond Text: Implementing Multimodal Large Language Model-Powered Multi-Agent Systems Using a No-Code Platform
* Link:https://arxiv.org/abs/2501.00750
* Beschreibung:
* Beschreibt den Einsatz von Multi-Agenten-Systemen (gestützt durch multimodale LLMs) über eine No-Code-Lösung.
- Ermöglicht die Automatisierung komplexer multimodaler Aufgaben ohne tiefgehende Programmierkenntnisse.
  * Die Forschung zielt auf eine breitere Anwendung von LLMs in Multi-Agenten-Systemen ab.
Titel:PIMAEX: Multi-Agent Exploration through Peer Incentivization
* Link:https://arxiv.org/abs/2501.01266
- Beschreibung:
  - Ein Multi-Agenten-Rahmenwerk, in dem Agenten sich gegenseitig motivieren, Explorationsaufgaben auszuführen.
  - Durch die peer-basierte Motivation sollen bessere Ergebnisse erzielt und eine effektivere Exploration erreicht werden.
    * Die Studie leistet einen wichtigen Beitrag zum Multi-Agenten-Lernen.
Titel:Harnessing Multi-Agent LLMs for Complex Engineering Problem-Solving: A Framework for Senior Design Projects
- Link: https://arxiv.org/abs/2501.01205
- Beschreibung:
  - Stellt einen Multi-Agenten-Ansatz (basierend auf LLMs) vor, um hochkomplexe technische Aufgaben und Projektarbeit im akademischen Umfeld zu unterstützen.
  - Ziel ist es, durch die Nutzung von LLMs die Zusammenarbeit bei komplexen Ingenieursprojekten zu verbessern.
  - Die Studie demonstriert die Anwendbarkeit von LLMs in praktischen Szenarien.
Titel:Large Language Model Based Multi-Agent System Augmented Complex Event Processing Pipeline for Internet of Multimedia Things
- Link:https://arxiv.org/abs/2501.00891
  - Beschreibung:
    - Dieses Paper beschreibt eine Multi-Agenten-Lösung mit LLMs für die Verarbeitung komplexer Ereignisse in IoT-Umgebungen.
    - Die Agenten kooperieren dabei, um relevante Ereignisse zu identifizieren und zu analysieren.
  - Diese Forschung leistet einen Beitrag zur intelligenten Verarbeitung von Daten aus dem Internet der Dinge.
Titel:AI Agent for Education: von Neumann Multi-Agent System Framework
- Link: https://arxiv.org/abs/2501.00083
  * Beschreibung:
- Ein Multi-Agenten-System-Framework, das speziell für den Bildungsbereich entwickelt wurde und den Ansatz eines „von-Neumann-Systems“ verfolgt.
- Ziel ist es, durch KI-Agenten Lehre und Lernen zu personalisieren und zu unterstützen.
- Das System bietet einen vielseitigen Rahmen für die Entwicklung von KI-gestützten Lernsystemen.

Liste der arXiv-Veröffentlichungen zu KI-Agenten (02. Januar 2025):

Titel:Aviary: training language agents on challenging scientific tasks
- Link: https://arxiv.org/abs/2412.21154
- Beschreibung:
  - Dieses Paper präsentiert Aviary, eine Plattform, die speziell darauf ausgerichtet ist, Sprachagenten in anspruchsvollen wissenschaftlichen Bereichen zu trainieren.
  - Aviary nutzt eine Kombination aus neuen Trainingsmethoden und einer speziell kuratierten Aufgabenvielfalt, um die Fähigkeiten der Agenten zu verbessern.
  - Die Experimente zeigen, dass mit Aviary trainierte Sprachagenten eine signifikant bessere Leistung in komplexen wissenschaftlichen Aufgaben erzielen als andere Ansätze.
Titel:UnrealZoo: Enriching Photo-realistic Virtual Worlds for Embodied AI
- Link: https://arxiv.org/abs/2412.20977
- Beschreibung:
  - UnrealZoo ist eine neue Plattform, die es ermöglicht, hochrealistische virtuelle Umgebungen für das Training von Embodied AI-Agenten zu erstellen.
  - Die Plattform bietet eine Vielfalt an Umgebungen, die von einfachen Szenarien bis hin zu komplexen, lebensnahen Settings reichen.
  - Durch die Nutzung fotorealistischer Umgebungen sollen die Agenten besser auf reale Aufgaben vorbereitet werden.
Titel:Planning, Living and Judging: A Multi-agent LLM-based Framework for Cyclical Urban Planning
- Link: https://arxiv.org/abs/2412.20505
- Beschreibung:
  - Dieses Paper stellt ein Multi-Agenten-Framework vor, das auf Large Language Models (LLMs) basiert und für die zyklische Stadtplanung konzipiert wurde.
  - Das Framework integriert Planungs-, Lebens- und Bewertungsaspekte, um einen iterativen Planungsprozess zu ermöglichen.
  - Die Ergebnisse deuten darauf hin, dass LLMs in einem Multiagenten-System effektiv zur Lösung von Herausforderungen in der Stadtplanung genutzt werden können.
Titel:High-fidelity social learning via shared episodic memories enhances collaborative foraging through mnemonic convergence
- Link: https://arxiv.org/abs/2412.20271
- Beschreibung:
  - Diese Studie untersucht, wie sich das Teilen episodischer Erinnerungen auf das soziale Lernen und die kollaborative Futtersuche von KI-Agenten auswirkt.
  - Durch den Austausch von Gedächtnisinhalten können Agenten ihre Zusammenarbeit verbessern und effizienter zusammenarbeiten.
  - Die Forschungsergebnisse legen nahe, dass eine gemeinsame Erinnerungsbasis die mnemotechnische Konvergenz fördert und somit das kollaborative Lernen optimiert.
Titel:BaiJia: A Large Scale Role-Playing Agent Corpus of Chinese Historical Charcaters
- Link: https://arxiv.org/abs/2412.20024
- Beschreibung:
  - BaiJia ist ein umfangreiches Korpus, das für das Training und die Evaluation von Rollenspiel-KI-Agenten mit chinesischen historischen Figuren entwickelt wurde.
  - Das Korpus umfasst detaillierte Beschreibungen und Dialoge, die es den Agenten ermöglichen, glaubwürdige historische Persönlichkeiten darzustellen.
  - Diese Ressource soll die Forschung im Bereich der personalisierten und kulturell sensiblen KI-Interaktion fördern.
Titel:Exploring and Controlling Diversity in LLM-Agent Conversation
- Link: https://arxiv.org/abs/2412.21102
- Beschreibung:
  * Diese Arbeit untersucht Methoden zur Messung und Steuerung der inhaltlichen Vielfalt in Gesprächen, die von LLM-basierten Agenten geführt werden.
  * Es werden verschiedene Ansätze vorgestellt, um die Diversität von Konversationen zu erhöhen oder zu reduzieren, je nach Anwendungsfall.
  * Die Ergebnisse deuten darauf hin, dass eine gezielte Steuerung der Diversität die Qualität und Relevanz von Agenten-Konversationen verbessern kann.
Titel:Plancraft: an evaluation dataset for planning with LLM agents
- Link: https://arxiv.org/abs/2412.21033
- Beschreibung:
  * Plancraft ist ein neuer Datensatz, der speziell für die Bewertung der Planungsfähigkeiten von LLM-basierten Agenten entwickelt wurde.
  - Der Datensatz enthält eine Reihe komplexer Aufgaben, die von den Agenten erfordern, detaillierte Handlungsabläufe zu entwerfen.
    * Plancraft soll als Standard-Benchmark für die Forschung im Bereich des Planens mit LLMs dienen.
Titel:Game Theory and Multi-Agent Reinforcement Learning: From Nash Equilibria to Evolutionary Dynamics
- Link: https://arxiv.org/abs/2412.20519
- Beschreibung:
  - Dieses Paper bietet einen Überblick über die Grundlagen der Spieltheorie und deren Anwendung auf Multi-Agenten Reinforcement Learning.
  - Es werden verschiedene Methoden und Algorithmen vorgestellt, die von Nash-Gleichgewichten bis zur evolutionären Dynamik reichen.
    * Die Arbeit bietet sowohl theoretische als auch praktische Einblicke in die Gestaltung kooperativer und kompetitiver Multi-Agenten-Systeme.
Titel:Multi-Scenario Reasoning: Unlocking Cognitive Autonomy in Humanoid Robots for Multimodal Understanding
- Link: https://arxiv.org/abs/2412.20429
- Beschreibung:
  - Dieses Paper untersucht, wie humanoide Roboter durch Multi-Modal-Reasoning eine höhere kognitive Autonomie erreichen können.
  - Der Fokus liegt auf der Fähigkeit der Roboter, über verschiedene Szenarien hinweg zu schlussfolgern und zu verstehen.
  - Es wird ein Ansatz vorgestellt, der es Robotern ermöglicht, multimodale Eingaben zu integrieren und flexible Entscheidungen zu treffen.
Titel:Safe Multiagent Coordination via Entropic Exploration
- Link: https://arxiv.org/abs/2412.20361
- Beschreibung:
  - Dieses Paper präsentiert einen Ansatz, um die sichere Koordination von Multi-Agenten-Systemen durch die Nutzung von Entropie-basierter Exploration zu verbessern.
  - Es wird gezeigt, dass die kontrollierte Zufallsexploration das Risiko unkoordinierter Aktionen minimieren und gleichzeitig die Zusammenarbeit fördern kann.
  - Die Arbeit bietet eine vielversprechende Methode, um sichere und effiziente Multi-Agenten-Systeme zu entwickeln.
Titel:TradingAgents: Multi-Agents LLM Financial Trading Framework
- Link: https://arxiv.org/abs/2412.20138
- Beschreibung:
  - Dieses Paper stellt TradingAgents vor, ein Framework, das LLMs nutzt, um Multi-Agenten-Systeme für den Finanzhandel zu entwickeln.
  - Das Framework ermöglicht es, verschiedene Handelsstrategien zu testen und ihre Leistung in simulierten Marktszenarien zu bewerten.
  - Durch die Verwendung mehrerer Agenten kann eine robustere und vielseitigere Handelsstrategie erreicht werden.
Titel:M-MAD: Multidimensional Multi-Agent Debate Framework for Fine-grained Machine Translation Evaluation
- Link: https://arxiv.org/abs/2412.20127
- Beschreibung:
  - M-MAD ist ein Multi-Agenten-Framework, das auf Debatten basiert und zur präzisen Evaluierung maschineller Übersetzungen entwickelt wurde.
  - Es verwendet mehrere Agenten, die verschiedene Aspekte einer Übersetzung diskutieren und bewerten, um eine umfassendere Analyse zu ermöglichen.
  - Dieser Ansatz ermöglicht eine differenziertere Bewertung als herkömmliche Metriken.
Titel:OneKE: A Dockerized Schema-Guided LLM Agent-based Knowledge Extraction System
- Link: https://arxiv.org/abs/2412.20005
- Beschreibung:
  * OneKE ist ein dockerisiertes System, das schemageführte LLM-Agenten verwendet, um Wissen aus Dokumenten zu extrahieren.
  * Das System ist flexibel und ermöglicht eine einfache Integration in verschiedene Arbeitsabläufe durch den Einsatz von Docker-Containern.
  * OneKE ist ein Beispiel dafür, wie LLM-basierte Agenten für automatisierte Wissensextraktion genutzt werden können.
Titel:Can Large Language Models Adapt to Other Agents In-Context?
- Link: https://arxiv.org/abs/2412.19726
- Beschreibung:
  * Diese Forschung untersucht, ob Large Language Models (LLMs) ihre Verhaltensweisen während einer Interaktion mit anderen Agenten anpassen können.
  * Es wird analysiert, wie LLMs in-context lernen und ihre Strategien auf Grundlage der Interaktionspartner optimieren.
  * Die Ergebnisse geben Aufschluss über die Flexibilität und Anpassungsfähigkeit von LLMs in Multi-Agenten-Umgebungen.
Titel:OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis
- Link: https://arxiv.org/abs/2412.19723
- Beschreibung:
  - OS-Genesis ist ein System, welches automatisch Trajektorien für GUI-Agenten mittels Reverse Task Synthesis erstellen kann.
  - Der Ansatz kehrt den Prozess der Task-Ausführung um, indem es von einem gewünschten Ergebnis ausgehend eine Reihe von Schritten ableitet.
  - Dieses System zielt darauf ab, die Erstellung und Analyse von GUI-Agenten zu vereinfachen.
Titel:Hindsight Planner: A Closed-Loop Few-Shot Planner for Embodied Instruction Following
- Link: https://arxiv.org/abs/2412.19562
- Beschreibung:
  - Dieser Artikel stellt einen Planner vor, der nur wenige Beispiele benötigt und aus Erfahrung lernt, um Anweisungen in einer Umgebung zu befolgen.
  - Der Planner nutzt ein Hindsight-Konzept, um aus Fehlern zu lernen und den Planungsprozess anzupassen.
  - Das System zeigt, wie Agenten in dynamischen Umgebungen mit wenigen Beispielen komplexe Aufgaben erfolgreich bewältigen können.
Titel:Hierarchical Multi-agent Meta-Reinforcement Learning for Cross-channel Bidding
- Link: https://arxiv.org/abs/2412.19064
- Beschreibung:
  - Hier wird ein hierarchischer Multi-Agenten-Ansatz vorgestellt, der Meta-Reinforcement Learning (Meta-RL) verwendet, um Bietstrategien über verschiedene Kanäle zu optimieren.
  - Die Hierarchie ermöglicht es, dass Agenten auf verschiedenen Ebenen agieren und somit komplexere Entscheidungen treffen können.
    * Die Experimente zeigen, dass dieser Ansatz die Effizienz und Rentabilität von Bietprozessen verbessern kann.
Titel:TravelAgent: Generative Agents in the Built Environment
- Link:https://arxiv.org/abs/2412.18985
  - Beschreibung:
    - TravelAgent ist ein System, das generative KI-Agenten nutzt, um das Verhalten von Menschen in einer bebauten Umgebung zu simulieren.
    - Die Agenten sind in der Lage, selbstständig Entscheidungen zu treffen und Interaktionen mit der Umgebung zu simulieren, die auf realen Mustern basieren.
  - Dies ermöglicht ein besseres Verständnis von räumlichen Interaktionen und kann in der Stadtplanung verwendet werden.
Titel:GAI: Generative Agents for Innovation
* Link:https://arxiv.org/abs/2412.18899
- Beschreibung:
  - Dieses Paper untersucht die Rolle von generativen Agenten bei der Förderung von Innovationen.
  - Es wird ein Framework vorgestellt, das verschiedene Agenten mit unterschiedlichen Rollen für die generative Ideenfindung und Problemlösung kombiniert.
  - Die Forschung zeigt das Potenzial generativer Agenten, die Entwicklung von neuen Lösungen in verschiedenen Bereichen zu beschleunigen.
Titel:Agents on the Bench: Large Language Model Based Multi Agent Framework for Trustworthy Digital Justice
- Link: https://arxiv.org/abs/2412.18697
- Beschreibung:
  - Dieses Paper präsentiert ein Multi-Agenten-Framework, basierend auf LLMs, das für Anwendungen im Bereich der digitalen Justiz entwickelt wurde.
  - Das Framework soll die Transparenz und das Vertrauen in die digitale Justiz stärken.
  - Die Arbeit adressiert wichtige ethische und praktische Aspekte im Kontext von KI und Rechtsprechung.
Titel:Multi-Agent Norm Perception and Induction in Distributed Healthcare
- Link: https://arxiv.org/abs/2412.18454
- Beschreibung:
  - Dieses Paper untersucht die Wahrnehmung und Induktion von Normen in Multi-Agenten-Systemen, die im verteilten Gesundheitswesen eingesetzt werden.
  - Es wird analysiert, wie Agenten gemeinsame Verhaltensregeln erlernen und befolgen können, um eine effektive Zusammenarbeit zu gewährleisten.
  - Diese Forschung bietet Einblicke in die Schaffung sicherer und effizienter Multi-Agenten-Systeme in komplexen Umgebungen.
Titel:Explainable Multi-Modal Data Exploration in Natural Language via LLM Agent
* Link:https://arxiv.org/abs/2412.18428
- Beschreibung:
  - Hier wird ein Ansatz vorgestellt, wie LLMs genutzt werden können, um multimodale Daten in natürlicher Sprache zu explorieren.
  - Ein LLM-Agent dient dabei als Schnittstelle, über die Benutzer Fragen stellen und Ergebnisse interpretieren können.
  - Dieser Ansatz soll die Zugänglichkeit von komplexen multimodalen Datensätzen verbessern.
Titel:GUI Testing Arena: A Unified Benchmark for Advancing Autonomous GUI Testing Agent
- Link: https://arxiv.org/abs/2412.18426
- Beschreibung:
  - Dieses Paper präsentiert eine vereinheitlichte Benchmark für die Entwicklung und Evaluierung von autonomen GUI-Testagenten.
  - Die Benchmark soll die Entwicklung effizienterer und effektiverer Testmethoden in GUI-basierten Systemen fördern.
  - Die Arbeit bietet einen umfassenden Testrahmen mit klaren Kriterien zur Bewertung der Testfähigkeiten.
Titel:MineStudio: A Streamlined Package for Minecraft AI Agent Development
- Link: https://arxiv.org/abs/2412.18293
- Beschreibung:
  - MineStudio ist ein Paket, das den Entwicklungsprozess von KI-Agenten in Minecraft vereinfacht und optimiert.
  - Das Paket bietet eine Reihe von Werkzeugen und Ressourcen, die es Entwicklern erleichtern, Agenten zu erstellen, zu trainieren und zu testen.
  - MineStudio zielt darauf ab, die Hürden für den Einsatz von KI in Spielen zu senken.
Titel:AutoDroid-V2: Boosting SLM-based GUI Agents via Code Generation
- Link: https://arxiv.org/abs/2412.18116
- Beschreibung:
  - AutoDroid-V2 ist eine Methode, um die Leistung von GUI-Agenten durch Codegenerierung zu verbessern.
  - Der Fokus liegt auf der Effizienz von speziell trainierten Sprachmodellen (SLMs) für GUI-bezogene Aufgaben.
  - Durch die Kombination von SLMs mit Codegenerierung sollen GUI-Agenten effektiver und robuster gemacht werden.
Titel:Dynamic Multi-Agent Orchestration and Retrieval for Multi-Source Question-Answer Systems using Large Language Models
- Link: https://arxiv.org/abs/2412.17964
- Beschreibung:
  - Dieses Paper beschreibt einen Ansatz zur dynamischen Orchestrierung mehrerer KI-Agenten mit LLMs in Frage-Antwort-Systemen, die auf verschiedene Datenquellen zugreifen.
  - Das Framework ermöglicht es, dass die Agenten ihre Aufgaben koordiniert ausführen und aus verschiedenen Quellen benötigte Informationen beziehen.
  - Die Studie untersucht die verbesserte Genauigkeit und Effizienz dieser Systeme im Vergleich zu anderen Ansätzen.
Titel:Contrato360 2.0: A Document and Database-Driven Question-Answer System using Large Language Models and Agents
- Link: https://arxiv.org/abs/2412.17942
- Beschreibung:
  - Contrato360 2.0 ist ein Frage-Antwort-System, welches LLMs und Agenten nutzt, um Dokumente und Datenbanken gemeinsam zu analysieren.
  - Das System ist darauf ausgerichtet, komplexe Fragen aus heterogenen Datenquellen zu beantworten.
  - Diese Forschung zeigt, wie verschiedene LLM- und Agenten-Technologien kombiniert werden können, um leistungsfähige Q&A-Systeme zu entwickeln.
Titel:Decentralized Intelligence in GameFi: Embodied AI Agents and the Convergence of DeFi and Virtual Ecosystems
- Link: https://arxiv.org/abs/2412.18601
- Beschreibung:
  - Das Paper analysiert den Einsatz von „Embodied AI Agents“ in GameFi-Systemen, wo DeFi (Dezentrale Finanzen) und virtuelle Ökosysteme interagieren.
  - Es wird untersucht, wie KI-Agenten autonome Entscheidungen treffen und zu einer dezentralisierten Intelligenz beitragen können.
  - Die Forschung untersucht die Möglichkeiten und Herausforderungen in diesem neuen Feld.
Titel:A Paragraph is All It Takes: Rich Robot Behaviors from Interacting, Trusted LLMs
- Link: https://arxiv.org/abs/2412.18588
- Beschreibung:
  - Diese Studie zeigt, dass Roboter mithilfe von Interaktionen mit vertrauenswürdigen LLMs komplexe Verhaltensweisen erlernen können.
  - Es genügt eine kurze textuelle Anweisung, damit LLMs Roboter effektiv lenken und koordinieren können.
  - Die Ergebnisse zeigen eine verbesserte Flexibilität und Anpassungsfähigkeit der Roboter in dynamischen Umgebungen.
Titel:Multi-Modal Grounded Planning and Efficient Replanning For Learning Embodied Agents with A Few Examples
* Link:https://arxiv.org/abs/2412.17288
* Beschreibung:
- Dieses Paper präsentiert eine Methode für multimodale, geerdete Planung, die es Embodied Agents ermöglicht, mit wenigen Beispielen zu lernen.
  * Die Methode integriert visuelle und sprachliche Informationen, um die Planungsfähigkeit der Agenten zu verbessern.
- Die Arbeit zeigt, dass Agents mit dieser Methode effizient und flexibel in verschiedenen Szenarien planen und agieren können.

KI-Agenten, Multi-Agentensysteme, Reinforcement Learning, Generative Agenten, autonome Systeme, Vision-Language-Modelle, LLM-Anwendungen, kollaborative Robotik, agentenbasierte KI, wissenschaftliche Fortschritte.

KI-Agenten und AI-Agents – 2025 Science Papers Daily: Ihr täglicher Vorteil

Ihre Anlaufstelle für KI-Agenten Forschung

Zusammenfassung der AI-Agents – 2025 Science Papers Daily der tägliche Blick auf die Forschung zu KI-Agenten

Liste der arXiv-Veröffentlichungen vom 7. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Liste der arXiv-Veröffentlichungen vom 6. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Liste der arXiv-Veröffentlichungen vom 5. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Liste der arXiv-Veröffentlichungen vom 4. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Liste der arXiv-Veröffentlichungen vom 3. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Liste der arXiv-Veröffentlichungen vom 28. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Liste der arXiv-Veröffentlichungen vom 27. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Liste der arXiv-Veröffentlichungen vom 26. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Liste der arXiv-Veröffentlichungen vom 25. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Liste der arXiv-Veröffentlichungen vom 24. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Liste der arXiv-Veröffentlichungen vom 21. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Liste der arXiv-Veröffentlichungen vom 20. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Liste der arXiv-Veröffentlichungen vom 19. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

Liste der arXiv-Veröffentlichungen vom 18. Februar 2025 zu KI-Agenten und Multi-Agenten-Frameworks

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 17.2.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 14.2.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 13.2.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 12.2.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 11.2.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 10.2.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 7.2.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 6.2.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 5.2.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 4.2.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 3.2.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 31.1.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 30.1.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 29.1.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 28.1.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 27.1.2025

1. MASTER: A Multi-Agent System with LLM Specialized MCTS

2. Distributed Multi-Agent Coordination Using Multi-Modal Foundation Models

3. Hybrid Quantum-Classical Multi-Agent Pathfinding

4. MedAgentBench: Dataset for Benchmarking LLMs as Agents in Medical Applications

5. Top Ten Challenges Towards Agentic Neural Graph Databases

6. VERUS-LM: A Versatile Framework for Combining LLMs with Symbolic Reasoning

7. Federated Domain Generalization with Data-free On-server Gradient Matching

8. Multi-agent KTO: Reinforcing Strategic Interactions of Large Language Model in Language Game

9. Prompt-Based Monte Carlo Tree Search for Mitigating Hallucinations in Large Models

10. Fast Think-on-Graph: Wider, Deeper and Faster Reasoning of Large Language Model on Knowledge Graph

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 24.1.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 23.1.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 22.1.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 20.1.2025

KI-Agenten-bezogene arXiv-Veröffentlichungen vom 17.1.2025

Liste der arXiv-Veröffentlichungen zu KI-Agenten 16.01.2025

Liste der arXiv-Veröffentlichungen zu KI-Agenten 15.01.2025

Liste der arXiv-Veröffentlichungen zu KI-Agenten 14.01.2025

Liste der arXiv-Veröffentlichungen zu KI-Agenten 13.01.2025

Liste der arXiv-Veröffentlichungen zu KI-Agenten 10.01.2025

Liste der arXiv-Veröffentlichungen zu KI-Agenten (09.01.205)

Liste der arXiv-Veröffentlichungen zu KI-Agenten (08.01.2025)

Liste der arXiv-Veröffentlichungen zu KI-Agenten (08.Januar 2025)

Liste der arXiv-Veröffentlichungen zu KI-Agenten (07.Januar 2025)

Liste der arXiv-Veröffentlichungen zu KI-Agenten (06.Januar 2025)

Liste der arXiv-Veröffentlichungen zu KI-Agenten (03. Januar 2025):

Liste der arXiv-Veröffentlichungen zu KI-Agenten (02. Januar 2025):

Related Post