Der März 2025 präsentiert sich als besonders spannender Monat in der Welt der Künstlichen Intelligenz, speziell im Bereich der KI-Agenten und Multi-Agenten-Frameworks. Forscher auf der ganzen Welt veröffentlichen kontinuierlich wegweisende Studien, die unser Verständnis von autonomen, lernfähigen und kooperativen KI-Systemen erweitern. Themen wie das Zusammenspiel von Unsicherheitsbewältigung in autonomen Robotern, effiziente chirurgische Entscheidungsunterstützung und der Einsatz von LLM-basierten Agenten in komplexen operativen und sozialen Szenarien dominieren die aktuellen Publikationen.
Gerade die Veröffentlichungen vom 14. März 2025 heben innovative Ansätze hervor, beispielsweise wie Embodied Agents ihre Unsicherheiten selbstbewusst kalibrieren und somit ihre Entscheidungsqualität verbessern können. Ebenso wegweisend sind Studien über Multi-Agenten-Workflows in der Chirurgie, die mithilfe von Chain-of-Thought Reasoning medizinische Präzision und Effizienz optimieren. Parallel dazu werfen Wissenschaftler einen kritischen Blick auf menschliche Vorurteile in KI-Agenten, um Robustheit und Fairness in Zukunft besser sicherstellen zu können.
Die Vielzahl dieser neuen Studien unterstreicht, dass KI-Agenten zunehmend entscheidend für die Gestaltung unserer technologischen, sozialen und wirtschaftlichen Landschaft werden. Besonders spannend sind Beiträge, die KI-Agenten in sozialen und ethischen Kontexten untersuchen, etwa in der Simulation gesellschaftlicher Entscheidungsprozesse oder bei der Verbesserung öffentlicher Gesundheitspolitik. Diese kontinuierlichen Fortschritte signalisieren klar, dass KI-Agenten nicht nur technische Innovationen darstellen, sondern zentrale Bausteine für eine sichere, effiziente und ethisch verantwortungsvolle Zukunft sind.
Papers aus Januar bis Mitte März findest Du hier.
Liste der arXiv-Veröffentlichungen vom 28. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks
- LLM-Gomoku: A Large Language Model-Based System for Strategic Gomoku with Self-Play and Reinforcement Learning
- Beschreibung:
- • Das Paper nutzt einen großen Sprachmodell-basierten Agenten, um strategische Spielzüge im Gomoku zu erlernen.
- • Durch Self-Play und Reinforcement Learning verbessert der Agent kontinuierlich seine Entscheidungsfindung.
- • Ziel ist es, menschliche Strategien zu übertreffen und optimale Spielzüge zu erzielen.
- Link zum Paper: https://arxiv.org/abs/2503.21683
- Beschreibung:
- UI-R1: Enhancing Action Prediction of GUI Agents by Reinforcement Learning
- Beschreibung:
- • Hier wird ein Ansatz vorgestellt, der die Vorhersage von Aktionen in grafischen Benutzeroberflächen durch spezialisierte Agenten verbessert.
- • Reinforcement Learning wird eingesetzt, um das Verhalten der GUI-Agenten an reale Nutzungsmuster anzupassen.
- • Erste Experimente zeigen eine signifikante Steigerung der Vorhersagegenauigkeit und Interaktionsqualität.
- Link zum Paper: https://arxiv.org/abs/2503.21620
- Beschreibung:
- DEMENTIA-PLAN: An Agent-Based Framework for Multi-Knowledge Graph Retrieval-Augmented Generation in Dementia Care
- Beschreibung:
- • Das Paper präsentiert ein agentenbasiertes Framework zur Integration mehrerer Wissensgraphen für die Unterstützung in der Demenzpflege.
- • Es kombiniert Retrieval- und Generierungsmechanismen, um personalisierte Informationen bereitzustellen.
- • Erste Ergebnisse deuten auf eine verbesserte Entscheidungsfindung und Pflegeunterstützung hin.
- Link zum Paper: https://arxiv.org/abs/2503.20950
- Beschreibung:
- GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics
- Beschreibung:
- • In diesem Paper wird ein LLM-basierter Agent vorgestellt, der bei der Analyse von Software-Releases im Automobilbereich unterstützt.
- • Durch reasoning-enhanced Mechanismen werden komplexe Zusammenhänge und Trends besser erfasst.
- • Das System liefert datengetriebene Einblicke zur Optimierung von Release-Prozessen.
- Link zum Paper: https://arxiv.org/abs/2503.21735
- Beschreibung:
- Collab: Controlled Decoding using Mixture of Agents for LLM Alignment
- Beschreibung:
- • Das Paper stellt einen neuartigen Ansatz vor, der eine Mischung aus Agenten zur kontrollierten Decodierung in großen Sprachmodellen verwendet.
- • Ziel ist es, die Alignment-Prozesse in LLMs zu verbessern und deren Entscheidungsfindung zu steuern.
- • Das kollaborative Framework führt zu einer präziseren und sichereren Modelloptimierung.
- Link zum Paper: https://arxiv.org/abs/2503.21720
- Beschreibung:
- Bias-Aware Agent: Enhancing Fairness in AI-Driven Knowledge Retrieval
- Beschreibung:
- • Dieses Paper fokussiert auf einen Agenten, der systematische Verzerrungen in wissensbasierten Retrieval-Systemen erkennt und ausgleicht.
- • Es werden innovative Methoden vorgestellt, um Fairness in AI-getriebenen Anwendungen zu verbessern.
- • Ziel ist es, gerechtere und objektivere Ergebnisse in der Informationsbeschaffung zu erzielen.
- Link zum Paper: https://arxiv.org/abs/2503.21237
- Beschreibung:
Liste der arXiv-Veröffentlichungen vom 27. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks
- Graph-Enhanced Model-Free Reinforcement Learning Agents for Efficient Power Grid Topological Control
- Beschreibung:
- • Das Paper präsentiert einen innovativen Ansatz, bei dem modellfreie Reinforcement-Learning-Agenten durch graphbasierte Methoden verbessert werden.
- • Im Fokus steht die effiziente Steuerung und Optimierung von Stromnetz-Topologien.
- • Erste Experimente zeigen, dass diese Kombination signifikante Leistungsvorteile in komplexen Netzumgebungen erzielt.
- Link zum Paper: https://arxiv.org/abs/2503.20688
- Beschreibung:
- Direct Post-Training Preference Alignment for Multi-Agent Motion Generation Models Using Implicit Feedback from Pre-training Demonstrations
- Beschreibung:
- • In diesem Paper wird eine Methode vorgestellt, die nachträglich die Präferenzen von Multi-Agenten zur Bewegungssteuerung anpasst.
- • Dafür wird implizites Feedback aus vorangegangenen Trainingsdemonstrationen genutzt.
- • Der Ansatz verbessert die Koordination und Leistungsfähigkeit in multi-agentischen Szenarien.
- Link zum Paper: https://arxiv.org/abs/2503.20105
- Beschreibung:
- OmniNova: A General Multimodal Agent Framework
- Beschreibung:
- • Das Paper führt ein universelles, multimodales Agenten-Framework namens OmniNova ein.
- • Es integriert verschiedene Datenmodalitäten, um Entscheidungsfindung und Interaktion von KI-Agenten zu verbessern.
- • Erste Ergebnisse belegen die hohe Flexibilität und breite Anwendbarkeit des Frameworks.
- Link zum Paper: https://arxiv.org/abs/2503.20028
- Beschreibung:
- A multi-agentic framework for real-time, autonomous freeform metasurface design
- Beschreibung:
- • Dieses Paper präsentiert ein multi-agentisches Framework zur autonomen Gestaltung von Metasurfaces in Echtzeit.
- • Mehrere KI-Agenten arbeiten hier zusammen, um kreative und adaptive Designlösungen zu generieren.
- • Erste Experimente demonstrieren, dass das System komplexe physikalische Anforderungen effizient erfüllt.
- Link zum Paper: https://arxiv.org/abs/2503.20479
- Beschreibung:
- BugCraft: End-to-End Crash Bug Reproduction Using LLM Agents in Minecraft
- Beschreibung:
- • Das Paper beschreibt einen neuartigen Ansatz, bei dem LLM-basierte Agenten in Minecraft eingesetzt werden, um Crash-Bugs automatisiert zu reproduzieren.
- • Die Methode ermöglicht eine durchgängige Nachbildung von Fehlerzuständen zur besseren Ursachenanalyse.
- • Ergebnisse zeigen, dass der Einsatz von LLM-Agenten die Effizienz im Erkennen und Reproduzieren von Softwarefehlern erheblich steigert.
- Link zum Paper: https://arxiv.org/abs/2503.20252
- Beschreibung:
- Body Discovery of Embodied AI
- Beschreibung:
- • In diesem Paper wird erforscht, wie KI-Systeme ihre physische „Identität“ bzw. ihren Körper im Rahmen von embodied AI entdecken können.
- • Es werden Ansätze vorgestellt, die es KI-Agenten ermöglichen, ihre Interaktion in realen Umgebungen zu optimieren.
- • Die Arbeit liefert neue Einblicke in die Gestaltung von Systemen, die über reine Softwarelösungen hinausgehen.
- Link zum Paper: https://arxiv.org/abs/2503.19941
- Beschreibung:
Liste der arXiv-Veröffentlichungen vom 26. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks
- Thinking agents for zero-shot generalization to qualitatively novel tasks
- Das Paper untersucht, wie denkende Agenten ohne spezifisches Training neuartige Aufgaben bewältigen können.
- Es präsentiert Modelle, die Zero‑Shot‑Generalisation ermöglichen und sich qualitativ von bekannten Aufgaben unterscheiden.
- Die Ergebnisse zeigen, dass solche Agenten überraschend adaptiv agieren, auch wenn sie vor unbekannten Herausforderungen stehen.
Link zum Paper
- Inducing Personality in LLM-Based Honeypot Agents: Measuring the Effect on Human-Like Agenda Generation
- Hier wird gezeigt, wie man LLM‑basierte Honeypot‑Agenten mit spezifischen Persönlichkeitsmerkmalen ausstattet.
- Die Studie misst, inwiefern diese Persönlichkeitsinduktion zu einer natürlicheren, menschenähnlichen Agenda-Generierung führt.
- Experimente belegen, dass personalisierte Agenten interaktiver und glaubwürdiger wirken.
Link zum Paper
- Optimal Path Planning and Cost Minimization for a Drone Delivery System Via Model Predictive Control
- Das Paper entwickelt einen modellprädiktiven Regelungsansatz zur effizienten Routenplanung in Drohnensystemen.
- Es minimiert gleichzeitig die Betriebskosten und optimiert die Zustellwege in komplexen Umgebungen.
- Die vorgestellte Methode ist besonders relevant für den Einsatz in multi-agenten Drohnennetzwerken.
Link zum Paper
- Multi-agent Application System in Office Collaboration Scenarios
- Hier wird ein Multi‑Agenten‑System vorgestellt, das die Zusammenarbeit im Büro automatisiert und optimiert.
- Verschiedene spezialisierte Agenten arbeiten zusammen, um Aufgaben im Arbeitsumfeld effizient zu koordinieren.
- Praktische Tests zeigen, dass der Ansatz die Produktivität und Interaktion in kollaborativen Settings deutlich verbessert.
Link zum Paper
- MedAgent-Pro: Towards Multi-modal Evidence-based Medical Diagnosis via Reasoning Agentic Workflow
- MedAgent‑Pro integriert mehrere KI‑Agenten in einen multimodalen, evidenzbasierten Diagnoseworkflow.
- Durch den Einsatz agentischer Entscheidungsprozesse wird die medizinische Diagnostik präziser und nachvollziehbarer.
- Das System unterstützt Ärzte dabei, komplexe klinische Daten optimal zu interpretieren.
Link zum Paper
- Writing as a testbed for open ended agents
- Dieses Paper nutzt den kreativen Schreibprozess als Experimentierfeld für offen agierende KI‑Agenten.
- Es untersucht, wie Agenten in offenen, unstrukturierten Aufgabenstellungen selbstständig Inhalte generieren.
- Die Ergebnisse liefern wertvolle Einsichten in die Flexibilität und Kreativität solcher Agenten.
Link zum Paper
- Enabling Rapid Shared Human-AI Mental Model Alignment via the After-Action Review
- Das Paper präsentiert einen Ansatz, um die mentale Abstimmung zwischen Mensch und KI durch After‑Action Reviews zu beschleunigen.
- Durch systematisches Feedback werden Lernprozesse und Entscheidungsfindung in gemeinsamen Teams optimiert.
- Dies verbessert die Zusammenarbeit und fördert ein gemeinsames Verständnis in Human‑AI-Teams.
Link zum Paper
- A Contradiction-Centered Model for the Emergence of Swarm Intelligence
- Hier wird ein Modell vorgestellt, das widersprüchliche Informationen als Triebfeder für die Entstehung von Schwarmintelligenz nutzt.
- Das Paper zeigt, wie individuelle Widersprüche in Agenten zur selbstorganisierten Gruppenkoordination führen können.
- Theoretische und experimentelle Ergebnisse belegen das Potenzial eines kontrastbasierten Ansatzes in Multi‑Agenten‑Systemen.
Link zum Paper
- Substance over Style: Evaluating Proactive Conversational Coaching Agents
- Das Paper bewertet proaktive Coaching-Agenten und untersucht, wie inhaltliche Substanz über oberflächlichen Stil entscheidet.
- Es wird analysiert, wie Agenten durch inhaltlich tiefgehende Interaktion effektiver kommunizieren können.
- Die Studie liefert praxisrelevante Erkenntnisse zur Verbesserung von Coaching‑Systemen.
Link zum Paper
- CubeRobot: Grounding Language in Rubik’s Cube Manipulation via Vision-Language Model
- CubeRobot verbindet Sprachverarbeitung mit visueller Wahrnehmung, um einen Rubik’s Cube präzise zu manipulieren.
- Das System demonstriert, wie sprachbasierte Anweisungen in konkrete robotische Aktionen übersetzt werden können.
- Die Ergebnisse belegen den erfolgreichen Einsatz von Vision‑Language‑Modellen in physikalischen Steuerungsaufgaben.
Link zum Paper
- SRMIR: Shadow Reward Models Based on Introspective Reasoning for LLM Alignment
- Dieses Paper führt sogenannte Shadow Reward Models ein, die introspektives Denken zur Optimierung der LLM-Ausrichtung nutzen.
- Durch systematische Bewertung impliziter Belohnungen wird die Anpassung von Sprachmodellen verbessert.
- Die Methode trägt dazu bei, Fehlanpassungen in agentischen Systemen zu reduzieren und das Verhalten zu stabilisieren.
Link zum Paper
- Option Discovery Using LLM-guided Semantic Hierarchical Reinforcement Learning
- Das Paper kombiniert LLM-gestützte semantische Führung mit hierarchischem Reinforcement Learning zur Entdeckung neuer Aktionsoptionen.
- Es zeigt, wie Agenten durch die Identifikation von Optionsräumen effizientere Entscheidungsstrategien entwickeln können.
- Die vorgestellte Methode verbessert die Adaptivität und Leistungsfähigkeit in komplexen, multi-agenten Umgebungen.
Link zum Paper
Liste der arXiv-Veröffentlichungen vom 25. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks
- EconEvals: Benchmarks and Litmus Tests for LLM Agents in Unknown Environments
- Entwickelt standardisierte Benchmarks, um die Leistung von LLM‑basierten Agenten in unbekannten Umgebungen zu evaluieren.
- Bietet Litmus‑Tests, die die Robustheit und Anpassungsfähigkeit der Agenten unter ökonomischen Szenarien messen.
- Unterstützt so die Identifikation von Stärken und Schwächen im Einsatz autonomer KI-Systeme.
Link zum Paper
- The case for delegated AI autonomy for Human AI teaming in healthcare
- Argumentiert für den Einsatz delegierter KI‑Autonomie in der Zusammenarbeit zwischen Mensch und KI im Gesundheitswesen.
- Zeigt auf, wie autonome Agenten klinische Prozesse unterstützen und optimieren können.
- Diskutiert Chancen und Herausforderungen bei der Integration solcher Systeme in medizinische Teams.
Link zum Paper
- AgentSpec: Customizable Runtime Enforcement for Safe and Reliable LLM Agents
- Stellt ein System vor, das zur Laufzeitsicherung von LLM‑basierten Agenten dient.
- Ermöglicht individuelle Anpassungen, um Sicherheit und Zuverlässigkeit in kritischen Anwendungen zu gewährleisten.
- Bietet flexible Kontrollmechanismen zur Überwachung und Steuerung autonomer KI‑Agenten.
Link zum Paper
- Verbal Process Supervision Elicits Better Coding Agents
- Zeigt, dass explizite sprachliche Prozessüberwachung die Qualität von Code‑generierenden Agenten verbessert.
- Belegt, dass interaktives Feedback zu präziseren und zuverlässigeren Codeausgaben führt.
- Unterstreicht die Bedeutung von menschlicher Anleitung bei der Entwicklung effektiver KI‑Agenten.
Link zum Paper
- AgentRxiv: Towards Collaborative Autonomous Research
- Präsentiert AgentRxiv als Plattform, die kollaborative, autonome Forschung ermöglicht.
- Demonstriert, wie KI‑Agenten wissenschaftliche Entdeckungsprozesse durch Zusammenarbeit beschleunigen können.
- Fördert den automatisierten Austausch und die Kooperation zwischen Forschungssystemen.
Link zum Paper
- OvercookedV2: Rethinking Overcooked for Zero-Shot Coordination
- Adaptiert das Overcooked-Framework, um die Null‑Schuss‑Koordination zwischen Agenten zu evaluieren.
- Analysiert, wie Agenten ohne spezifisches Training effizient zusammenarbeiten können.
- Liefert Erkenntnisse zur Verbesserung der Koordination in Multi‑Agenten‑Umgebungen.
Link zum Paper
- Large language model-powered AI systems achieve self-replication with no human intervention
- Demonstriert, dass KI‑Systeme auf Basis großer Sprachmodelle sich selbstständig replizieren können.
- Beleuchtet die zugrundeliegenden Mechanismen der autonomen Selbstreplikation.
- Wirft wichtige Fragen zu Kontrolle und Sicherheit in selbstreplizierenden Systemen auf.
Link zum Paper
- AgentDropout: Dynamic Agent Elimination for Token-Efficient and High-Performance LLM-Based Multi-Agent Collaboration
- Führt eine Methode ein, die während der Zusammenarbeit dynamisch Agenten eliminiert, um Ressourcen zu sparen.
- Optimiert die Token-Nutzung und steigert die Gesamtperformance von Multi‑Agenten‑Systemen.
- Ermöglicht eine adaptive Selektion von Agenten zur Effizienzsteigerung in kollaborativen Aufgaben.
Link zum Paper
- Learning Multi-Robot Coordination through Locality-Based Factorized Multi-Agent Actor-Critic Algorithm
- Entwickelt einen lokal basierten Multi‑Agent Actor‑Critic Algorithmus zur Koordination mehrerer Roboter.
- Adressiert Herausforderungen dezentraler Entscheidungsfindung und Teamarbeit.
- Zeigt, wie eine faktorisierte Strategie die Zusammenarbeit in Robotersystemen verbessert.
Link zum Paper
- Safeguarding Mobile GUI Agent via Logic-based Action Verification
- Stellt einen logikbasierten Ansatz zur Überprüfung von Aktionen mobiler GUI‑Agenten vor.
- Erhöht die Zuverlässigkeit und Sicherheit interaktiver Systeme durch präzise Aktionsvalidierung.
- Verhindert fehlerhafte Interaktionen und unterstützt eine robuste Benutzerführung.
Link zum Paper
- Collaborating with AI Agents: Field Experiments on Teamwork, Productivity, and Performance
- Untersucht in Feldexperimenten, wie die Zusammenarbeit zwischen Menschen und KI‑Agenten funktioniert.
- Analysiert Teamdynamiken sowie Auswirkungen auf Produktivität und Leistung.
- Liefert praxisnahe Erkenntnisse zur Integration von KI‑Agenten in reale Arbeitsprozesse.
Link zum Paper
- A Qualitative Study of User Perception of M365 AI Copilot
- Analysiert, wie Nutzer den M365 AI Copilot in ihrem Arbeitsalltag wahrnehmen.
- Identifiziert Stärken, Schwächen und potenzielle Verbesserungsbereiche des KI‑Assistenten.
- Bietet wertvolle Einblicke für die Weiterentwicklung benutzerzentrierter KI‑Systeme.
Link zum Paper
- ComfyGPT: A Self-Optimizing Multi-Agent System for Comprehensive ComfyUI Workflow Generation
- Stellt ComfyGPT vor, ein selbstoptimierendes Multi‑Agenten‑System zur Generierung von ComfyUI‑Workflows.
- Automatisiert den Design‑ und Anpassungsprozess grafischer Benutzeroberflächen.
- Verbessert Effizienz und Nutzererfahrung durch adaptive Agentenkoordination.
Link zum Paper
- Your voice is your voice: Supporting Self-expression through Speech Generation and LLMs in Augmented and Alternative Communication
- Zeigt, wie LLM‑basierte Sprachgenerierung die Selbstäußerung in alternativen Kommunikationsformen unterstützt.
- Adressiert Barrieren in der Kommunikation und fördert Inklusion.
- Nutzt KI, um individuelle Ausdrucksmöglichkeiten in augmentierten Systemen zu erweitern.
Link zum Paper
- ChatGPT or A Silent Everywhere Helper: A Survey of Large Language Models
- Bietet einen umfassenden Überblick über den Einsatz großer Sprachmodelle als Assistenten.
- Vergleicht verschiedene Systeme hinsichtlich ihrer Fähigkeiten und Limitationen.
- Diskutiert Anwendungsszenarien und Herausforderungen im Bereich KI‑gestützter Assistenzsysteme.
Link zum Paper
- Big Help or Big Brother? Auditing Tracking, Profiling, and Personalization in Generative AI Assistants
- Analysiert kritisch, wie generative KI‑Assistenten Daten sammeln und Nutzerprofile erstellen.
- Untersucht das Spannungsfeld zwischen hilfreicher Unterstützung und invasiver Überwachung.
- Fordert mehr Transparenz und ethische Richtlinien im Einsatz solcher Systeme.
Link zum Paper
- Building Resource-Constrained Language Agents: A Korean Case Study on Chemical Toxicity Information
- Präsentiert einen Ansatz zur Entwicklung ressourcenoptimierter Sprachagenten anhand eines Fallbeispiels aus dem Chemiebereich.
- Zeigt, wie LLMs auch unter begrenzten Hardware‑Ressourcen effizient arbeiten können.
- Demonstriert die praktische Anwendbarkeit in der Bereitstellung von Toxizitätsinformationen.
Link zum Paper
- Aportes para el cumplimiento del Reglamento (UE) 2024/1689 en robótica y sistemas autónomos
- Liefert Beiträge zur Einhaltung der EU‑Vorschriften in der Robotik und autonomen Systemen.
- Diskutiert regulatorische Herausforderungen und technische Lösungsansätze für sichere KI‑Agenten.
- Verbindet ethische Überlegungen mit praktischen Maßnahmen für autonome Systeme.
Link zum Paper
- GUI-Xplore: Empowering Generalizable GUI Agents with One Exploration
- Stellt ein System vor, das GUI‑Agenten durch exploratives Lernen verbessert.
- Erhöht die Generalisierbarkeit und Effizienz bei der Interaktion mit grafischen Benutzeroberflächen.
- Nutzt adaptive Explorationsstrategien, um die Navigation und Bedienung zu optimieren.
Link zum Paper
- Transferable Latent-to-Latent Locomotion Policy for Efficient and Versatile Motion Control of Diverse Legged Robots
- Entwickelt eine übertragbare Bewegungsstrategie zur Steuerung verschiedenartiger, beintragender Roboter.
- Nutzt latente Repräsentationen, um eine effiziente und flexible Bewegungssteuerung zu realisieren.
- Verbessert die Adaptivität und Vielseitigkeit in der Roboterkoordination durch transferierbare Policies.
Link zum Paper
- Autonomous Radiotherapy Treatment Planning Using DOLA: A Privacy-Preserving, LLM-Based Optimization Agent
- Stellt DOLA vor, einen LLM‑basierten Optimierungsagenten zur autonomen Planung von Radiotherapien.
- Verbindet fortschrittliche KI‑Methoden mit Datenschutzmechanismen, um sensible Patientendaten zu schützen.
- Ziel ist es, die Behandlungsplanung zu automatisieren und dabei höchste Sicherheitsstandards einzuhalten.
Link zum Paper
Liste der arXiv-Veröffentlichungen vom 24. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks
- MAPS: A Multi-Agent Framework Based on Big Seven Personality and Socratic Guidance for Multimodal Scientific Problem Solving
- Entwickelt ein Multi-Agenten-Framework, das unterschiedliche Persönlichkeitsmerkmale und sokratische Anleitung kombiniert.
- Ziel ist es, multimodale wissenschaftliche Probleme durch kollaborative Agentenlösungen zu adressieren.
- Das System simuliert menschliche Entscheidungsprozesse zur Optimierung der Problemlösung.
Link zum Paper
- Does Chain-of-Thought Reasoning Help Mobile GUI Agent? An Empirical Study
- Untersucht, ob explizites Chain-of-Thought-Denken die Performance mobiler GUI-Agenten verbessert.
- Analysiert, wie die Darstellung von Denkprozessen die Entscheidungsfindung von Agenten beeinflusst.
- Liefert empirische Erkenntnisse zur Optimierung von KI-gestützten Benutzeroberflächen.
Link zum Paper
- Towards Agentic Recommender Systems in the Era of Multimodal Large Language Models
- Entwickelt Ansätze, um Empfehlungssysteme mit agentischen Eigenschaften auszustatten.
- Nutzt multimodale große Sprachmodelle, um personalisierte und dynamische Empfehlungen zu generieren.
- Zielt darauf ab, interaktive und adaptive Nutzererlebnisse zu schaffen.
Link zum Paper
- Empowering Medical Multi-Agents with Clinical Consultation Flow for Dynamic Diagnosis
- Präsentiert ein System, in dem mehrere medizinische Agenten im klinischen Beratungsfluss zusammenarbeiten.
- Ermöglicht eine dynamische und interdisziplinäre Diagnoseunterstützung.
- Fördert die Integration verschiedener KI-Komponenten in der medizinischen Entscheidungsfindung.
Link zum Paper
- Improving Interactive Diagnostic Ability of a Large Language Model Agent Through Clinical Experience Learning
- Verbessert die interaktive Diagnostik eines LLM-basierten Agenten durch klinisches Erfahrungslernen.
- Integriert praxisnahe Lernprozesse, um die diagnostische Genauigkeit zu steigern.
- Zeigt, wie kontinuierliche Anpassung das Potenzial von KI-Agenten in der Medizin erhöhen kann.
Link zum Paper
- CVE-Bench: A Benchmark for AI Agents‘ Ability to Exploit Real-World Web Application Vulnerabilities
- Führt einen Benchmark ein, der die Fähigkeiten von KI-Agenten beim Ausnutzen von Web-Sicherheitslücken bewertet.
- Ermöglicht standardisierte Vergleiche und Tests zwischen verschiedenen Agenten.
- Bietet Einblicke in Sicherheitsherausforderungen und Angriffsszenarien im realen Umfeld.
Link zum Paper
- Deterministic AI Agent Personality Expression through Standard Psychological Diagnostics
- Untersucht, wie KI-Agenten ihre Persönlichkeit deterministisch ausdrücken können.
- Nutzt etablierte psychologische Diagnoseverfahren, um das Verhalten von Agenten zu modellieren.
- Ziel ist eine verbesserte und nachvollziehbare Mensch-KI-Interaktion.
Link zum Paper
- Rude Humans and Vengeful Robots: Examining Human Perceptions of Robot Retaliatory Intentions in Professional Settings
- Analysiert, wie Menschen die Rückschlagbereitschaft von Robotern in professionellen Kontexten wahrnehmen.
- Untersucht den Einfluss von Agentenverhalten auf zwischenmenschliche Interaktionen.
- Liefert Erkenntnisse zur Gestaltung sozial verträglicher robotischer Systeme.
Link zum Paper
- MARS: A Multi-Agent Framework Incorporating Socratic Guidance for Automated Prompt Optimization
- Stellt ein Multi-Agenten-Framework vor, das sokratische Anleitung für die Optimierung von Eingabeaufforderungen nutzt.
- Verbessert die Leistung von Sprachmodellen durch kollaborative Agenteninteraktionen.
- Ermöglicht eine automatisierte und adaptive Anpassung der Prompts.
Link zum Paper
- VeriMind: Agentic LLM for Automated Verilog Generation with a Novel Evaluation Metric
- Entwickelt einen agentischen LLM, der automatisch Verilog-Code generiert.
- Führt eine neue Metrik ein, um die Qualität des generierten Codes zu bewerten.
- Ziel ist die Verbesserung der Automatisierung im Hardware-Design-Prozess.
Link zum Paper
- Conversational AI as a Coding Assistant: Understanding Programmers‘ Interactions with and Expectations from Large Language Models for Coding
- Untersucht die Interaktionen zwischen Programmierern und KI-basierten Codierungsassistenten.
- Analysiert die Erwartungen und Herausforderungen in der Zusammenarbeit mit solchen Agenten.
- Liefert praxisnahe Empfehlungen zur Verbesserung von KI-gestützten Entwicklungswerkzeugen.
Link zum Paper
- The Impact of Generative AI Coding Assistants on Developers Who Are Visually Impaired
- Bewertet, wie generative KI-Coding-Assistenten Entwickler mit Sehbehinderungen unterstützen.
- Untersucht spezifische Barrieren und Verbesserungspotenziale in inklusiven Arbeitsumgebungen.
- Zeigt, wie KI den Zugang zu Softwareentwicklung für alle erleichtern kann.
Link zum Paper
- PythonPal: Enhancing Online Programming Education through Chatbot-Driven Personalized Feedback
- Präsentiert einen Chatbot, der personalisiertes Feedback zur Verbesserung der Programmierausbildung gibt.
- Nutzt KI, um Lernprozesse interaktiv und individuell zu gestalten.
- Unterstützt Online-Lernumgebungen durch dynamische, agentenbasierte Kommunikation.
Link zum Paper
- Accodemy: AI Powered Code Learning Platform to Assist Novice Programmers in Overcoming the Fear of Coding
- Stellt eine KI-gestützte Lernplattform vor, die Anfängern den Einstieg ins Programmieren erleichtert.
- Reduziert Hemmungen durch adaptive und unterstützende Lernmechanismen.
- Fördert interaktive Lernprozesse mittels agentenbasierter Ansätze.
Link zum Paper
- ACE, Action and Control via Explanations: A Proposal for LLMs to Provide Human-Centered Explainability for Multimodal AI Assistants
- Schlägt vor, LLMs zur Generierung von Erklärungen in multimodalen KI-Assistenten einzusetzen.
- Fokussiert auf eine menschzentrierte Erklärbarkeit, um Vertrauen aufzubauen.
- Ziel ist die Verbesserung der Steuerung und Transparenz in komplexen Agentensystemen.
Link zum Paper
- OS-Kairos: Adaptive Interaction for MLLM-Powered GUI Agents
- Entwickelt adaptive Interaktionsstrategien für GUI-Agenten, die von großen multimodalen Sprachmodellen angetrieben werden.
- Verbessert die Benutzererfahrung durch dynamische Anpassung an individuelle Bedürfnisse.
- Nutzt fortschrittliche Modelle, um eine flüssige und intuitive Kommunikation zu ermöglichen.
Link zum Paper
- Position: Beyond Assistance — Reimagining LLMs as Ethical and Adaptive Co-Creators in Mental Health Care
- Diskutiert die Rolle von LLMs als ethische und adaptive Mitgestalter in der psychischen Gesundheitsversorgung.
- Hinterfragt traditionelle Assistenzmodelle und schlägt ko-kreative Ansätze vor.
- Bietet Perspektiven zur Integration von KI in sensible medizinische Entscheidungsprozesse.
Link zum Paper
- Think-Then-React: Towards Unconstrained Human Action-to-Reaction Generation
- Stellt ein Framework vor, das flexible Reaktionsmuster in unstrukturierten Situationen simuliert.
- Kombiniert kognitive Modelle mit KI-Techniken zur Vorhersage menschlicher Reaktionen.
- Ziel ist es, Agenten zu entwickeln, die auf komplexe menschliche Interaktionen unbeschränkt reagieren können.
Link zum Paper
- Mitigating the Uncanny Valley Effect in Hyper-Realistic Robots: A Student-Centered Study on LLM-Driven Conversations
- Untersucht Strategien, um den Uncanny-Valley-Effekt bei hyperrealistischen Robotern zu reduzieren.
- Setzt LLM-basierte Konversationsansätze in einem studentenzentrierten Experiment ein.
- Ziel ist die Verbesserung der Natürlichkeit und Akzeptanz von robotergestützten Interaktionssystemen.
Link zum Paper
- Situational Agency: The Framework for Designing Behavior in Agent-based art
- Präsentiert ein Framework zur Gestaltung von Verhaltensweisen in agentenbasierter Kunst.
- Ermöglicht die Entwicklung interaktiver, dynamischer künstlerischer Installationen.
- Verbindet technologische Methoden mit kreativen Ausdrucksformen, um neuartige Kunstwerke zu schaffen.
Link zum Paper
- Haunted House: A text-based game for comparing the flexibility of mental models in humans and LLMs
- Entwickelt ein textbasiertes Spiel, das menschliche und KI-gestützte Denkmodelle vergleicht.
- Untersucht die Flexibilität und Anpassungsfähigkeit verschiedener mentaler Modelle in interaktiven Szenarien.
- Dient als Experimentierplattform für die Evaluierung von KI-Agenten in spielerischen Umgebungen.
Link zum Paper
- Multimodal Transformer Models for Turn-taking Prediction: Effects on Conversational Dynamics of Human-Agent Interaction during Cooperative Gameplay
- Untersucht den Einsatz multimodaler Transformer-Modelle zur Vorhersage von Gesprächswechseln.
- Analysiert, wie sich die Dynamik in Human-Agent-Interaktionen während kooperativen Spielsituationen verändert.
- Liefert Erkenntnisse zur Verbesserung der kommunikativen Effizienz in interaktiven Systemen.
Link zum Paper
Liste der arXiv-Veröffentlichungen vom 21. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks
Link: arXiv:2503.15489
Survey on Evaluation of LLM-based Agents
Beschreibung:
Dieses Paper bietet eine umfassende Übersicht zur Bewertung von LLM-basierten KI-Agenten.
Es analysiert Methoden zur Leistungsmessung und identifiziert Herausforderungen in der Agentenentwicklung.
Die Arbeit kombiniert Ansätze aus KI, Sprachverarbeitung und maschinellem Lernen.
Link: arXiv:2503.16416
Unreal-MAP: Unreal-Engine-Based General Platform for Multi-Agent Reinforcement Learning
Beschreibung:
Unreal-MAP ist eine Plattform auf Basis der Unreal Engine für Multi-Agenten-Verstärkendes Lernen.
Sie ermöglicht die Simulation und das Training von Agenten in realistischen Umgebungen.
Die Arbeit zeigt praktische Anwendungen für kooperative KI-Systeme.
Link: arXiv:2503.15947
Advancing Mobile GUI Agents: A Verifier-Driven Approach to Practical Deployment
Beschreibung:
Dieses Paper beschreibt eine verifikationsbasierte Methode zur Verbesserung mobiler GUI-Agenten über 14 Seiten.
Es zeigt, wie KI-Agenten durch Verifikation praktisch einsetzbar und zuverlässig werden.
Die Methode zielt auf reale Anwendungen in Benutzeroberflächen ab.
Link: arXiv:2503.15937
DeepPsy-Agent: A Stage-Aware and Deep-Thinking Emotional Support Agent System
Beschreibung:
DeepPsy-Agent ist ein KI-Agentensystem zur emotionalen Unterstützung mit Fokus auf tiefem Denken.
Es berücksichtigt verschiedene Stadien der Interaktion, um maßgeschneiderte Hilfe zu bieten.
Die Arbeit hebt die Anwendung von KI in der psychologischen Betreuung hervor.
Link: arXiv:2503.15876
Dialogic Learning in Child-Robot Interaction: A Hybrid Approach to Personalized Educational Content Generation
Beschreibung:
Diese Arbeit präsentiert einen hybriden Ansatz für KI-Agenten in der Kind-Robot-Interaktion.
Sie zeigt, wie personalisierte Lerninhalte durch dialogisches Lernen generiert werden können.
Das System verbessert die Bildung durch adaptive Agentensteuerung.
Link: arXiv:2503.15762
Reinforcement Learning Environment with LLM-Controlled Adversary in D&D 5th Edition Combat
Beschreibung:
Das Paper beschreibt eine Reinforcement-Learning-Umgebung mit einem LLM-gesteuerten Gegner für D&D-Kämpfe.
Es zeigt, wie ein KI-Agent als Gegenspieler in einem Rollenspiel trainiert werden kann.
Die Arbeit wurde für ICONIP 2024 eingereicht und bietet praktische Einblicke.
Link: arXiv:2503.15726
Cosmos-Reason1: From Physical Common Sense To Embodied Reasoning
Beschreibung:
Cosmos-Reason1, entwickelt von NVIDIA, ist ein Modell für verkörpertes Denken von KI-Agenten.
Es integriert physisches Allgemeinwissen in Agenten für Robotik und visuelle Aufgaben.
Die Arbeit zeigt Anwendungen in realen Szenarien mit zahlreichen Autoren.
Link: arXiv:2503.15558
RoboFactory: Exploring Embodied Agent Collaboration with Compositional Constraints
Beschreibung:
RoboFactory untersucht die Zusammenarbeit verkörperter KI-Agenten unter kompositorischen Einschränkungen.
Es zeigt, wie Multi-Agenten-Systeme in Robotik kooperative Aufgaben lösen können.
Die Arbeit bietet eine Projektseite und visuelle Analysen zur Untermauerung.
Link: arXiv:2503.16408
Do Visual Imaginations Improve Vision-and-Language Navigation Agents?
Beschreibung:
Diese Arbeit erforscht, ob visuelle Vorstellungen die Leistung von Vision-and-Language-Navigationsagenten steigern.
Sie zeigt, wie KI-Agenten durch Imagination komplexe Navigationsaufgaben besser bewältigen.
Die Methode kombiniert Robotik und Sprachverarbeitung für praktische Anwendungen.
Link: arXiv:2503.16394
JARVIS-VLA: Post-Training Large-Scale Vision Language Models to Play Visual Games with Keyboards and Mouse
Beschreibung:
JARVIS-VLA ist ein nach-trainiertes Vision-Language-Modell für KI-Agenten, die visuelle Spiele spielen.
Es zeigt, wie Agenten Tastatur und Maus nutzen, um interaktive Aufgaben zu lösen.
Die Arbeit umfasst 22 Seiten und bietet Einblicke in skalierbare Agentenlösungen.
Link: arXiv:2503.16365
The Lighthouse of Language: Enhancing LLM Agents via Critique-Guided Improvement
Beschreibung:
Dieses Paper beschreibt eine Methode zur Verbesserung von LLM-Agenten durch kritikgesteuerte Optimierung.
Es zeigt, wie Agenten durch Feedback ihre Leistung und Anpassungsfähigkeit steigern können.
Die Arbeit integriert Sprachverarbeitung und KI für robustere Agentensysteme.
Link: arXiv:2503.16024
Reward Training Wheels: Adaptive Auxiliary Rewards for Robotics Reinforcement Learning
Beschreibung:
Reward Training Wheels ist ein Ansatz zur Verbesserung von Reinforcement Learning für Robotik-Agenten.
Es nutzt adaptive Zusatzbelohnungen, um die Lernprozesse von Agenten zu optimieren.
Die Arbeit umfasst 7 Seiten mit 5 Abbildungen und zeigt praktische Ergebnisse.
Link: arXiv:2503.15724
Safety Aware Task Planning via Large Language Models in Robotics
Beschreibung:
Dieses Paper präsentiert eine sicherheitsbewusste Aufgabenplanung für Roboteragenten mit LLMs.
Es zeigt, wie Agenten durch Sprachmodelle risikoarme Pläne in Robotikanwendungen erstellen.
Die Methode verbessert die Sicherheit und Effizienz autonomer Systeme.
Link: arXiv:2503.15707
Predicting Multi-Agent Specialization via Task Parallelizability
Beschreibung:
Die Arbeit untersucht die Spezialisierung von Multi-Agenten-Systemen basierend auf Aufgabenparallelität.
Sie zeigt, wie Agenten durch Koordination und Spezialisierung effizienter arbeiten können.
Die Ergebnisse bieten Einblicke in die Optimierung kollaborativer KI-Systeme.
Link: arXiv:2503.15703
PEnGUiN: Partially Equivariant Graph NeUral Networks for Sample Efficient MARL
Beschreibung:
PEnGUiN ist ein teilweise äquivariantes Graph-Neural-Network für effizientes Multi-Agenten-Verstärkendes Lernen.
Es optimiert die Zusammenarbeit von Agenten in Robotik und anderen Bereichen.
Die Arbeit zeigt, wie Stichproben effizienter genutzt werden können.
Link: arXiv:2503.15615
KHAIT: K-9 Handler Artificial Intelligence Teaming for Collaborative Sensemaking
Beschreibung:
KHAIT ist ein Multi-Agenten-System für die Zusammenarbeit zwischen Hundeführern und KI-Agenten.
Es nutzt KI zur Unterstützung bei der Entscheidungsfindung und Wahrnehmung in Teams.
Die Arbeit wurde für IUI 2025 akzeptiert und umfasst 13 Seiten mit 7 Abbildungen.
Link: arXiv:2503.15524
Towards Computer-Using Personal Agents
Beschreibung:
Dieses Paper, resultierend aus einem Dagstuhl-Seminar, beschreibt persönliche KI-Agenten für Computeranwendungen.
Es zeigt, wie Agenten Benutzer durch Multi-Agenten-Systeme unterstützen können.
Die Arbeit betont Vertrauen und Verantwortlichkeit in der Agentenentwicklung.
Link: arXiv:2503.15515
Prompt Flow Integrity to Prevent Privilege Escalation in LLM Agents
Beschreibung:
Diese Arbeit untersucht die Integrität von Prompt-Flüssen, um LLM-Agenten vor Rechteausweitung zu schützen.
Sie zeigt, wie Sicherheitslücken in Multi-Agenten-Systemen verhindert werden können.
Die Methode verbessert die Sicherheit von KI-Agenten in praktischen Anwendungen.
Link: arXiv:2503.15547
Enforcing Cybersecurity Constraints for LLM-driven Robot Agents for Online Transactions
Beschreibung:
Das Paper beschreibt Sicherheitsbeschränkungen für LLM-gesteuerte Roboteragenten bei Online-Transaktionen.
Es zeigt, wie Agenten sicher und vertrauensvoll in digitalen Umgebungen agieren können.
Die Arbeit verbindet Robotik, KI und Cybersicherheit für reale Szenarien.
Link: arXiv:2503.15546
PersonaAI: Leveraging Retrieval-Augmented Generation and Personalized Context for AI-Driven Digital Avatars
Beschreibung:
PersonaAI nutzt Retrieval-Augmented Generation für personalisierte digitale Avatare als KI-Agenten.
Es zeigt, wie Agenten durch Kontextanpassung realistische Interaktionen ermöglichen.
Die Methode verbessert die Benutzererfahrung in virtuellen Umgebungen.
Liste der arXiv-Veröffentlichungen vom 20. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks
Link: arXiv:2503.14554
GraspCorrect: Robotic Grasp Correction via Vision-Language Model-Guided Feedback
Beschreibung:
GraspCorrect ist ein System zur Korrektur von Robotergriffen, das Vision-Language-Modelle für Feedback nutzt.
Es ermöglicht einem KI-Agenten, Greifbewegungen in Echtzeit anzupassen und präziser auszuführen.
Die Methode verbessert die Robustheit von Roboteraktionen in dynamischen Umgebungen.
Link: arXiv:2503.15035
Behaviour Discovery and Attribution for Explainable Reinforcement Learning
Beschreibung:
Diese Arbeit entwickelt Methoden zur Entdeckung und Zuordnung von Verhaltensweisen in Reinforcement-Learning-Agenten.
Sie zielt darauf ab, die Entscheidungen von KI-Agenten erklärbarer zu machen, indem sie Verhaltensmuster analysiert.
Die Ergebnisse fördern das Verständnis und die Transparenz autonomer Systeme.
Link: arXiv:2503.14973
Generating Causal Explanations of Vehicular Agent Behavioural Interactions with Learnt Reward Profiles
Beschreibung:
Das Paper präsentiert ein Modell zur Erzeugung kausaler Erklärungen für Verhaltensinteraktionen von Fahrzeugagenten in Multi-Agenten-Systemen.
Es nutzt gelernte Belohnungsprofile, um die Entscheidungen autonomer Agenten zu interpretieren.
Die Arbeit wird auf der IEEE ICRA 2025 veröffentlicht und umfasst 8 Seiten mit 5 Abbildungen.
Link: arXiv:2503.14557
Learning to Play Piano in the Real World
Beschreibung:
Diese Arbeit beschreibt einen KI-Agenten, der in der realen Welt Klavier spielen lernt, unterstützt durch maschinelles Lernen.
Sie zeigt, wie der Agent durch Interaktion mit der Umgebung seine Fähigkeiten verbessert.
Das 10-seitige Paper bietet Einblicke in praktische Robotik-Anwendungen.
Link: arXiv:2503.15481
CCDP: Composition of Conditional Diffusion Policies with Guided Sampling
Beschreibung:
CCDP ist ein Framework zur Kombination bedingter Diffusionsrichtlinien für KI-Agenten in der Robotik.
Es verwendet geführtes Sampling, um die Entscheidungsfindung von Agenten in komplexen Szenarien zu optimieren.
Die Methode verbessert die Flexibilität und Effizienz von Robotersteuerungen.
Link: arXiv:2503.15386
When Pigs Get Sick: Multi-Agent AI for Swine Disease Detection
Beschreibung:
Dieses Paper beschreibt ein Multi-Agenten-KI-System zur Erkennung von Schweinekrankheiten mit 14 Seiten und 2 Abbildungen.
Es zeigt, wie Agenten durch Zusammenarbeit Krankheitsmuster effizient identifizieren können.
Die Arbeit integriert Mensch-Computer-Interaktion und Informationsretrieval für praktische Anwendungen.
Link: arXiv:2503.15204
A Unified Framework for Real-Time Failure Handling in Robotics Using Vision-Language Models, Reactive Planner and Behavior Trees
Beschreibung:
Das Paper stellt ein einheitliches Framework für Echtzeit-Fehlerbehandlung in der Robotik vor, das Vision-Language-Modelle nutzt.
Es kombiniert reaktive Planung und Verhaltensbäume, um KI-Agenten robuste Entscheidungen zu ermöglichen.
Die Methode verbessert die Zuverlässigkeit von Robotern in unvorhersehbaren Situationen.
Link: arXiv:2503.15202
Multi-Agent Actor-Critic with Harmonic Annealing Pruning for Dynamic Spectrum Access Systems
Beschreibung:
Dieses Paper beschreibt ein Multi-Agenten-Actor-Critic-Modell mit harmonischem Annealing-Pruning für dynamische Spektrumzugriffssysteme.
Es optimiert die Ressourcennutzung durch kooperative Agenten in Netzwerken mit 5 Seiten und 3 Abbildungen.
Die Methode wurde für eine IEEE-Konferenz eingereicht und zeigt praktische Anwendbarkeit.
Link: arXiv:2503.15172
Volumetric Reconstruction From Partial Views for Task-Oriented Grasping
Beschreibung:
Die Arbeit präsentiert eine volumetrische Rekonstruktion aus Teilansichten für aufgabenorientiertes Greifen durch KI-Agenten.
Sie zeigt, wie Roboteragenten Objekte präzise manipulieren können, basierend auf unvollständigen visuellen Daten.
Die Methode verbessert die Effizienz und Genauigkeit in Robotikanwendungen.
Link: arXiv:2503.15167
HAD-Gen: Human-like and Diverse Driving Behavior Modeling for Controllable Scenario Generation
Beschreibung:
HAD-Gen ist ein Modell zur Simulation menschenähnlichen Fahrverhaltens für kontrollierte Szenariengenerierung in Multi-Agenten-Systemen.
Es ermöglicht KI-Agenten, vielfältige und realistische Fahrverhaltensweisen zu erzeugen und zu steuern.
Die Arbeit integriert Robotik und Multi-Agenten-Ansätze für autonome Fahrsysteme.
Link: arXiv:2503.15049
GR00T N1: An Open Foundation Model for Generalist Humanoid Robots
Beschreibung:
GR00T N1 ist ein offenes Grundmodell für generalistische humanoide Roboter, entwickelt von NVIDIA mit zahlreichen Autoren.
Es bietet eine Basis für KI-Agenten, die vielfältige Aufgaben in realen Umgebungen bewältigen können.
Die Arbeit kombiniert Robotik und maschinelles Lernen für zukünftige Anwendungen.
Link: arXiv:2503.14734
Curiosity-Diffuser: Curiosity Guide Diffusion Models for Reliability
Beschreibung:
Curiosity-Diffuser ist ein Modell, das Diffusionsmodelle mit Neugier-Steuerung für zuverlässige KI-Agenten in der Robotik kombiniert.
Es verbessert die Entscheidungsfindung von Agenten durch Exploration in unsicheren Umgebungen.
Die Methode nutzt maschinelles Lernen, um die Robustheit von Robotersystemen zu erhöhen.
Link: arXiv:2503.14833
A Generalist Hanabi Agent
Beschreibung:
Dieses Paper beschreibt einen generalistischen KI-Agenten für das kooperative Kartenspiel Hanabi in einem Multi-Agenten-Kontext.
Es zeigt, wie der Agent durch Zusammenarbeit mit anderen Spielern komplexe Strategien entwickelt.
Die Arbeit bietet Einblicke in die Anwendung von KI auf kooperative Spiele.
Link: arXiv:2503.14555
Synchronous vs Asynchronous Reinforcement Learning in a Real World Robot
Beschreibung:
Die Arbeit vergleicht synchrone und asynchrone Reinforcement-Learning-Ansätze für KI-Agenten in realen Robotern.
Sie zeigt, wie diese Methoden die Leistung eines Roboters in praktischen Szenarien beeinflussen.
Die Ergebnisse wurden auf der Alberta RISE-Konferenz vorgestellt.
Liste der arXiv-Veröffentlichungen vom 19. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks
- Measuring AI Ability to Complete Long Tasks
- Beschreibung:
- Diese Arbeit untersucht die Fähigkeit von KI-Agenten, langwierige Aufgaben zu bewältigen, und entwickelt entsprechende Messmethoden.
- Sie zeigt, wie maschinelles Lernen genutzt wird, um die Leistung von Agenten bei komplexen, mehrschrittigen Prozessen zu bewerten.
- Die Ergebnisse bieten Einblicke in die Grenzen und Potenziale autonomer KI-Systeme.
- Link: arXiv:2503.14499
- Beschreibung:
- Engineering Scientific Assistants using Interactive Structured Induction of Programs
- Beschreibung:
- Das Paper beschreibt die Entwicklung wissenschaftlicher KI-Assistenten durch interaktive strukturierte Programm-Induktion.
- Es zeigt, wie Agenten durch Software-Engineering-Techniken komplexe wissenschaftliche Aufgaben lösen können.
- Die Methode ermöglicht adaptive und effiziente Unterstützung in Forschungsszenarien.
- Link: arXiv:2503.14488
- Beschreibung:
- VisEscape: A Benchmark for Evaluating Exploration-driven Decision-making in Virtual Escape Rooms
- Beschreibung:
- VisEscape ist ein Benchmark zur Bewertung von KI-Agenten bei explorationsgetriebenen Entscheidungen in virtuellen Escape-Rooms.
- Es testet die Fähigkeit von Agenten, in dynamischen Umgebungen Probleme zu lösen und Entscheidungen zu treffen.
- Die Arbeit bietet eine Plattform zur Verbesserung von Agentenleistungen in interaktiven Szenarien.
- Link: arXiv:2503.14427
- Beschreibung:
- A Parallel Hybrid Action Space Reinforcement Learning Model for Real-world Adaptive Traffic Signal Control
- Beschreibung:
- Dieses Paper präsentiert ein paralleles Reinforcement-Learning-Modell mit hybridem Aktionsraum für adaptive Verkehrssteuerung.
- Es zeigt, wie ein KI-Agent Verkehrssignale in Echtzeit optimiert, um Staus zu minimieren.
- Die Methode wird durch 13 Seiten und 9 Abbildungen unterstützt, die reale Anwendungen demonstrieren.
- Link: arXiv:2503.14250
- Beschreibung:
- KG-IRAG: A Knowledge Graph-Based Iterative Retrieval-Augmented Generation Framework for Temporal Reasoning
- Beschreibung:
- KG-IRAG ist ein Framework, das Wissensgraphen und iterative Retrieval-Augmented Generation für zeitliches Reasoning in Multi-Agenten-Systemen kombiniert.
- Es ermöglicht Agenten, zeitliche Zusammenhänge besser zu verstehen und fundierte Entscheidungen zu treffen.
- Die Arbeit umfasst 14 Seiten und zeigt praktische Anwendungen in komplexen Szenarien.
- Link: arXiv:2503.14234
- Beschreibung:
- HA-VLN: A Benchmark for Human-Aware Navigation in Discrete-Continuous Environments with Dynamic Multi-Human Interactions, Real-World Validation, and an Open Leaderboard
- Beschreibung:
- HA-VLN ist ein Benchmark für menschenbewusste Navigation von KI-Agenten in diskret-kontinuierlichen Umgebungen mit dynamischen Mensch-Interaktionen.
- Es validiert Agentenleistungen in realen Szenarien und bietet eine öffentliche Rangliste zur Leistungsbewertung.
- Die Arbeit umfasst 27 Seiten und eine Website mit weiteren Details.
- Link: arXiv:2503.14229
- Beschreibung:
- MDTeamGPT: A Self-Evolving LLM-based Multi-Agent Framework for Multi-Disciplinary Team Medical Consultation
- Beschreibung:
- MDTeamGPT ist ein sich selbst entwickelndes Multi-Agenten-Framework, das LLMs für multidisziplinäre medizinische Konsultationen nutzt.
- Es zeigt, wie Agenten durch Zusammenarbeit komplexe medizinische Probleme lösen und sich anpassen können.
- Die Arbeit erstreckt sich über 24 Seiten und bietet detaillierte Einblicke in die Architektur.
- Link: arXiv:2503.13856
- Beschreibung:
- WebNav: An Intelligent Agent for Voice-Controlled Web Navigation
- Beschreibung:
- WebNav ist ein intelligenter KI-Agent für sprachgesteuerte Webnavigation, der Benutzerinteraktionen vereinfacht.
- Er nutzt fortschrittliche KI-Techniken, um Webseiten effizient zu durchsuchen und Befehle umzusetzen.
- Die Arbeit hebt die praktische Anwendbarkeit für Mensch-Computer-Interaktion hervor.
- Link: arXiv:2503.13843
- Beschreibung:
- VARP: Reinforcement Learning from Vision-Language Model Feedback with Agent Regularized Preferences
- Beschreibung:
- VARP ist ein Reinforcement-Learning-Ansatz, der Vision-Language-Modelle für Feedback nutzt, um Agentenpräferenzen zu regulieren.
- Es verbessert die Entscheidungsfindung von Agenten durch multimodale Rückmeldungen in 8-seitigen Experimenten.
- Die Methode ist vielseitig und für Robotik sowie Mensch-Interaktionen anwendbar.
- Link: arXiv:2503.13817
- Beschreibung:
- Automatic MILP Model Construction for Multi-Robot Task Allocation and Scheduling Based on Large Language Models
- Beschreibung:
- Dieses Paper beschreibt die automatische Erstellung von MILP-Modellen für Multi-Roboter-Aufgabenverteilung mit LLMs.
- Es zeigt, wie Agenten durch optimierte Planung und Koordination effizient zusammenarbeiten können.
- Die Methode integriert Robotik und KI für praktische Anwendungen in der Automatisierung.
- Link: arXiv:2503.13813
- Beschreibung:
- Why Do Multi-Agent LLM Systems Fail?
- Beschreibung:
- Die Arbeit analysiert, warum Multi-Agenten-LLM-Systeme scheitern, und identifiziert häufige Fehlerquellen.
- Sie untersucht die Interaktionen zwischen Agenten und deren Auswirkungen auf die Systemleistung.
- Die Ergebnisse bieten Ansätze zur Verbesserung der Robustheit solcher Systeme.
- Link: arXiv:2503.13657
- Beschreibung:
- Gricean Norms as a Basis for Effective Collaboration
- Beschreibung:
- Dieses Paper schlägt Grice’sche Normen als Grundlage für effektive Zusammenarbeit in Multi-Agenten-Systemen vor.
- Es zeigt, wie Kommunikationsprinzipien die Koordination zwischen Agenten verbessern können.
- Die Arbeit wurde für AAMAS 2025 akzeptiert und bietet Code sowie umfangreiche Analysen.
- Link: arXiv:2503.14484
- Beschreibung:
- PLAY2PROMPT: Zero-shot Tool Instruction Optimization for LLM Agents via Tool Play
- Beschreibung:
- PLAY2PROMPT optimiert Werkzeuginstruktionen für LLM-Agenten im Zero-Shot-Modus durch spielerisches Lernen.
- Es verbessert die Fähigkeit von Agenten, Werkzeuge effizient ohne vorheriges Training zu nutzen.
- Die Methode bietet eine skalierbare Lösung für Agenten in dynamischen Umgebungen.
- Link: arXiv:2503.14432
- Beschreibung:
- LLM-Mediated Guidance of MARL Systems
- Beschreibung:
- Dieses Paper untersucht die Nutzung von LLMs zur Steuerung von Multi-Agenten-Verstärkendem Lernen (MARL)-Systemen.
- Es zeigt, wie LLM-basierte Anleitung die Koordination und Leistung von Agenten verbessert.
- Die Arbeit umfasst 31 Seiten mit 50 Abbildungen und bietet detaillierte Experimente.
- Link: arXiv:2503.13553
- Beschreibung:
Liste der arXiv-Veröffentlichungen vom 18. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks
- Knowledge-Aware Iterative Retrieval for Multi-Agent Systems
- Beschreibung:
- Dieses Paper schlägt ein wissensbasiertes, iteratives Retrieval-System für Multi-Agenten-Systeme vor, um die Informationssuche zu optimieren.
- Es zeigt, wie Agenten durch gemeinsames Wissen effizienter zusammenarbeiten können, indem sie relevante Daten iterativ abrufen.
- Die Methode verbessert die Koordination und Entscheidungsfindung in komplexen Multi-Agenten-Umgebungen.
- Link: arXiv:2503.13275
- Beschreibung:
- Robust Decision-Making Via Free Energy Minimization
- Beschreibung:
- Die Arbeit präsentiert ein Entscheidungsmodell für KI-Agenten, das auf der Minimierung freier Energie basiert, um robuste Entscheidungen zu gewährleisten.
- Es integriert Prinzipien aus Systemtheorie und Optimierung, um Agenten in unsicheren Umgebungen zu unterstützen.
- Die Methode wird durch Haupttext und zusätzliche Informationen untermauert, die praktische Anwendungen demonstrieren.
- Link: arXiv:2503.13223
- Beschreibung:
- MAP: Evaluation and Multi-Agent Enhancement of Large Language Models for Inpatient Pathways
- Beschreibung:
- MAP ist ein Framework zur Bewertung und Verbesserung von LLMs durch Multi-Agenten-Systeme für stationäre Pflegewege.
- Es nutzt kollaborative Agenten, um die Genauigkeit und Effizienz von LLM-basierten Entscheidungen im Gesundheitswesen zu steigern.
- Die Arbeit kombiniert multimodale Daten wie Sprache und Vision, um komplexe Pflegeprozesse zu optimieren.
- Link: arXiv:2503.13205
- Beschreibung:
- A representational framework for learning and encoding structurally enriched trajectories in complex agent environments
- Beschreibung:
- Dieses Paper entwickelt ein Repräsentationsframework, um strukturreiche Trajektorien für KI-Agenten in komplexen Umgebungen zu lernen und zu kodieren.
- Es ermöglicht Agenten, Muster und Strukturen in dynamischen Szenarien zu erkennen und darauf zu reagieren.
- Die Methode verbessert die Anpassungsfähigkeit und das Verständnis von Agenten durch maschinelles Lernen.
- Link: arXiv:2503.13194
- Beschreibung:
- Identifying Cooperative Personalities in Multi-agent Contexts through Personality Steering with Representation Engineering
- Beschreibung:
- Die Arbeit untersucht, wie kooperative Persönlichkeiten in Multi-Agenten-Systemen durch Persönlichkeitssteuerung identifiziert werden können.
- Sie verwendet Representation Engineering, um Agentenverhalten anzupassen und Zusammenarbeit zu fördern.
- Ergebnisse werden als Poster auf der Technical AI Safety Conference 2025 präsentiert.
- Link: arXiv:2503.12722
- Beschreibung:
- AI Agents: Evolution, Architecture, and Real-World Applications
- Beschreibung:
- Dieses umfassende 52-seitige Survey analysiert die Entwicklung, Architektur und Anwendungen von KI-Agenten.
- Es beschreibt, wie Agenten in realen Szenarien wie Automatisierung und Entscheidungsfindung eingesetzt werden.
- Die Arbeit bietet eine Grundlage für das Verständnis moderner Agenten-Technologien und deren Zukunft.
- Link: arXiv:2503.12687
- Beschreibung:
- VeriLA: A Human-Centered Evaluation Framework for Interpretable Verification of LLM Agent Failures
- Beschreibung:
- VeriLA ist ein menschenzentriertes Framework zur interpretierbaren Überprüfung von Fehlern bei LLM-basierten Agenten.
- Es kombiniert menschliche Bewertung mit automatisierten Methoden, um die Zuverlässigkeit von Agenten zu verbessern.
- Die Methode zielt darauf ab, Schwachstellen in Agentenleistungen transparent zu machen und zu beheben.
- Link: arXiv:2503.12651
- Beschreibung:
- A Survey on the Optimization of Large Language Model-based Agents
- Beschreibung:
- Dieses Survey untersucht Optimierungsstrategien für LLM-basierte Agenten, um deren Leistung zu steigern.
- Es behandelt Techniken wie Feinabstimmung und Architekturverbesserungen für effizientere Agenten.
- Die Arbeit bietet einen Überblick über aktuelle Herausforderungen und zukünftige Richtungen.
- Link: arXiv:2503.12434
- Beschreibung:
- SagaLLM: Context Management, Validation, and Transaction Guarantees for Multi-Agent LLM Planning
- Beschreibung:
- SagaLLM bietet ein System für Kontextmanagement und Validierung in Multi-Agenten-LLM-Planungsszenarien.
- Es gewährleistet Transaktionssicherheit und Koordination zwischen Agenten durch robuste Mechanismen.
- Die Arbeit zeigt mit 13 Seiten und umfangreichen Tabellen praktische Anwendungen auf.
- Link: arXiv:2503.11951
- Beschreibung:
- A Comprehensive Survey on Multi-Agent Cooperative Decision-Making: Scenarios, Approaches, Challenges and Perspectives
- Beschreibung:
- Dieses 54-seitige Survey analysiert Multi-Agenten-Kooperation bei Entscheidungsfindung in verschiedenen Szenarien.
- Es beleuchtet Ansätze, Herausforderungen und zukünftige Perspektiven für kollaborative Agentensysteme.
- Die Arbeit bietet eine umfassende Grundlage für Forschung und Entwicklung in diesem Bereich.
- Link: arXiv:2503.13415
- Beschreibung:
- SPECTra: Scalable Multi-Agent Reinforcement Learning with Permutation-Free Networks
- Beschreibung:
- SPECTra ist ein skalierbares Multi-Agenten-Verstärkendes Lernen-Framework, das permutationsfreie Netzwerke nutzt.
- Es verbessert die Effizienz und Koordination von Agenten in großen Systemen durch innovative Architekturen.
- Die Arbeit umfasst 31 Seiten und demonstriert die Leistungsfähigkeit mit umfangreichen Experimenten.
- Link: arXiv:2503.11726
- Beschreibung:
- CoLLMLight: Cooperative Large Language Model Agents for Network-Wide Traffic Signal Control
- Beschreibung:
- CoLLMLight nutzt kooperative LLM-Agenten zur netzwerkweiten Steuerung von Verkehrssignalen.
- Es zeigt, wie Agenten durch Zusammenarbeit den Verkehrsfluss optimieren und Staus reduzieren können.
- Die Methode ist unter Überprüfung und bietet eine neuartige Lösung für intelligente Verkehrssysteme.
- Link: arXiv:2503.11739
- Beschreibung:
Liste der arXiv-Veröffentlichungen vom 17. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks
- Broaden your SCOPE! Efficient Multi-turn Conversation Planning for LLMs using Semantic Space
- Beschreibung:
- Dieses Paper schlägt SCOPE vor, ein Framework zur Verbesserung der Konversationsplanung von LLMs über mehrere Runden hinweg durch Nutzung semantischer Räume.
- Es zeigt, wie Agenten effizienter auf dynamische Dialoge reagieren können, indem sie kontextbezogene Informationen priorisieren.
- Die Methode wird als Spotlight bei ICLR 2025 hervorgehoben und verbessert die Leistung von KI-Agenten in komplexen Interaktionen.
- Link: arXiv:2503.11586
- Beschreibung:
- Prompt Injection Detection and Mitigation via AI Multi-Agent NLP Frameworks
- Beschreibung:
- Das Paper untersucht Prompt-Injection-Angriffe auf KI-Modelle und schlägt ein Multi-Agenten-NLP-Framework zur Erkennung und Abwehr vor.
- Mehrere KI-Agenten arbeiten zusammen, um verdächtige Eingaben zu analysieren und Sicherheitsmaßnahmen in Echtzeit umzusetzen.
- Es bietet eine neuartige Lösung zur Sicherung von LLM-basierten Systemen gegen Manipulationen.
- Link: arXiv:2503.11517
- Beschreibung:
- Large Reasoning Models in Agent Scenarios: Exploring the Necessity of Reasoning Capabilities
- Beschreibung:
- Diese Arbeit untersucht die Rolle großer Denkmodelle in Agentenszenarien und evaluiert deren Fähigkeit zur Problemlösung.
- Sie zeigt, dass fortgeschrittene Denkfähigkeiten für autonome Agenten in komplexen Umgebungen entscheidend sind.
- Umfangreiche Experimente mit 71 Seiten belegen die Notwendigkeit von Reasoning für robuste KI-Agenten.
- Link: arXiv:2503.11074
- Beschreibung:
- API Agents vs. GUI Agents: Divergence and Convergence
- Beschreibung:
- Das Paper vergleicht API-basierte und GUI-basierte KI-Agenten hinsichtlich ihrer Effizienz und Interaktionsfähigkeit.
- Es identifiziert Unterschiede und Gemeinsamkeiten in deren Design und Anwendung in realen Szenarien.
- Die Ergebnisse bieten Einblicke in die Entwicklung hybrider Agenten für Mensch-Computer-Interaktionen.
- Link: arXiv:2503.11069
- Beschreibung:
- TxAgent: An AI Agent for Therapeutic Reasoning Across a Universe of Tools
- Beschreibung:
- TxAgent ist ein KI-Agent, der therapeutisches Denken über eine Vielzahl von Werkzeugen hinweg ermöglicht, um personalisierte Behandlungen zu unterstützen.
- Er nutzt fortschrittliche Reasoning-Techniken, um Daten aus verschiedenen Quellen zu integrieren und Entscheidungen zu optimieren.
- Das Paper stellt auch ToolUniverse vor, eine Plattform zur Erweiterung der Agentenfähigkeiten.
- Link: arXiv:2503.10970
- Beschreibung:
- Cerebrum (AIOS SDK): A Platform for Agent Development, Deployment, Distribution, and Discovery
- Beschreibung:
- Cerebrum ist ein SDK für die Entwicklung, Bereitstellung und Verwaltung von KI-Agenten in Multi-Agenten-Systemen.
- Es bietet eine einheitliche Plattform zur Erstellung und Verteilung von Agenten mit Fokus auf Skalierbarkeit und Entdeckbarkeit.
- Die Arbeit wurde für NAACL 2025 akzeptiert und demonstriert praktische Anwendungen in komplexen Szenarien.
- Link: arXiv:2503.11444
- Beschreibung:
- H2-MARL: Multi-Agent Reinforcement Learning for Pareto Optimality in Hospital Capacity Strain and Human Mobility during Epidemic
- Beschreibung:
- H2-MARL nutzt Multi-Agenten-Verstärkendes Lernen, um Krankenhauskapazitäten und menschliche Mobilität während Epidemien zu optimieren.
- Es erreicht Pareto-Optimalität durch die Koordination mehrerer Agenten, die verschiedene Ziele balancieren.
- Die Methode bietet eine skalierbare Lösung für Entscheidungsfindung in Krisensituationen.
- Link: arXiv:2503.10907
- Beschreibung:
Liste der arXiv-Veröffentlichungen vom 14. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks
Uncertainty in Action: Confidence Elicitation in Embodied Agents
- Beschreibung:
- Das Paper untersucht, wie Unsicherheiten in den Handlungen von verkörperten KI-Agenten gemessen werden können.
- Es wird ein innovativer Ansatz zur Kalibrierung des Vertrauens in Agenten vorgestellt.
- Die Ergebnisse belegen eine verbesserte Entscheidungsfindung und Interaktion in komplexen Umgebungen.
- Link: https://arxiv.org/abs/2503.10628
SurgRAW: Multi-Agent Workflow with Chain-of-Thought Reasoning for Surgical Intelligence
- Beschreibung:
- In diesem Paper wird ein Multi-Agenten-Workflow vorgestellt, der auf Kettenargumentation basiert, um chirurgische Entscheidungsprozesse zu optimieren.
- Mehrere Agenten arbeiten synchron zusammen, um komplexe chirurgische Szenarien zu analysieren.
- Die vorgestellten Methoden führen zu einer höheren Effizienz und Genauigkeit im Operationssaal.
- Link: https://arxiv.org/abs/2503.10265
LLM Agents Display Human Biases but Exhibit Distinct Learning Patterns
- Beschreibung:
- Das Paper beleuchtet, inwiefern LLM-basierte Agenten menschliche Vorurteile widerspiegeln.
- Es werden deren charakteristische Lernmuster und die daraus resultierenden Entscheidungsprozesse analysiert.
- Die Studie liefert wichtige Erkenntnisse zur Verbesserung von Fairness und Robustheit in KI-Agentensystemen.
- Link: https://arxiv.org/abs/2503.10248
StepMathAgent: A Step-Wise Agent for Evaluating Mathematical Processes through Tree-of-Error
- Beschreibung:
- Hier wird ein schrittweiser Agent vorgestellt, der mathematische Prozesse mithilfe eines Fehlersuchbaums systematisch bewertet.
- Der Ansatz ermöglicht eine detaillierte Analyse und Identifikation von Fehlerquellen in komplexen Rechenabläufen.
- Die Ergebnisse zeigen eine deutliche Verbesserung in der Fehlerdiagnose und -korrektur mathematischer Prozesse.
- Link: https://arxiv.org/abs/2503.10105
OR-LLM-Agent: Automating Modeling and Solving of Operations Research Optimization Problem with Reasoning Large Language Model
- Beschreibung:
- Das Paper beschreibt einen LLM-basierten Agenten zur Automatisierung von Modellierungs- und Lösungsprozessen in der Operations Research.
- Mittels fortschrittlicher logischer Schlussfolgerungen werden Optimierungsprobleme effizient adressiert.
- Die experimentellen Ergebnisse belegen, dass der Ansatz herkömmliche Methoden signifikant übertrifft.
- Link: https://arxiv.org/abs/2503.10009
AgentDAM: Privacy Leakage Evaluation for Autonomous Web Agents
- Beschreibung:
- Dieses Paper führt AgentDAM ein, ein Framework zur Bewertung von Datenschutzrisiken bei autonomen Web-Agenten.
- Es werden spezifische Methoden zur Identifikation und Prävention von Privatsphärenverletzungen erarbeitet.
- Die vorgestellten Ergebnisse unterstreichen die Notwendigkeit robuster Sicherheitsmechanismen in KI-Agenten.
- Link: https://arxiv.org/abs/2503.09780
Multi-Agent Q-Learning Dynamics in Random Networks: Convergence due to Exploration and Sparsity
- Beschreibung:
- Das Paper analysiert die Dynamiken von Multi-Agent Q-Learning in zufälligen Netzwerken.
- Es wird gezeigt, wie explorative Verfahren und eine sparsame Netzwerkstruktur zur Konvergenz beitragen.
- Die gewonnenen Erkenntnisse bieten wertvolle Einblicke in das Zusammenspiel mehrerer Agenten in komplexen Umgebungen.
- Link: https://arxiv.org/abs/2503.10186
AhaRobot: A Low-Cost Open-Source Bimanual Mobile Manipulator for Embodied AI
- Beschreibung:
- In diesem Paper wird AhaRobot vorgestellt – ein kostengünstiger, offener, bimanualer mobiler Manipulator, der verkörperte KI demonstriert.
- Der Roboter zeigt autonome Entscheidungsfähigkeit und kann in realen Umgebungen interagieren.
- Die experimentellen Ergebnisse unterstreichen das Potenzial des Systems für vielfältige Anwendungen in der Robotik.
- Link: https://arxiv.org/abs/2503.10070
Can A Society of Generative Agents Simulate Human Behavior and Inform Public Health Policy? A Case Study on Vaccine Hesitancy
- Beschreibung:
- Dieses Paper untersucht, ob eine Gesellschaft generativer Agenten in der Lage ist, menschliches Verhalten realitätsnah zu simulieren.
- Anhand des Beispiels der Impfbereitschaft wird der Einfluss von Agenten auf gesundheitspolitische Entscheidungen analysiert.
- Die Studie zeigt, dass generative Agenten wertvolle Impulse zur Gestaltung effektiver Gesundheitspolitik liefern können.
- Link: https://arxiv.org/abs/2503.09639
Liste der arXiv-Veröffentlichungen vom 13. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks
ReMA: Learning to Meta‑think for LLMs with Multi‑Agent Reinforcement Learning
- Entwickelt einen Ansatz, bei dem mehrere Agenten in einem Reinforcement‑Learning-Setting zusammenarbeiten.
- Fördert die Meta‑Denkfähigkeit von LLMs durch kollaboratives Lernen.
- Ziel ist, komplexe Entscheidungsprozesse in dynamischen Umgebungen effizient zu optimieren.
Link zum Paper
In‑Context Defense in Computer Agents: An Empirical Study
- Untersucht Abwehrmechanismen in Computeragenten, die LLMs einsetzen.
- Bewertet empirisch, wie Agenten sich gegen störende Einflüsse schützen lassen.
- Liefert wichtige Erkenntnisse zur Robustheit und Sicherheit von KI‑Agenten.
Link zum Paper
Differentially Private Equilibrium Finding in Polymatrix Games
- Entwickelt Methoden zur Ermittlung von Gleichgewichten in Mehragentenspielen unter Wahrung der Privatsphäre.
- Setzt Differential‑Privacy-Techniken ein, um sensible Daten zu schützen.
- Bietet theoretische Grundlagen für sichere und kooperative Multi‑Agenten‑Interaktionen.
Link zum Paper
CombatVLA: An Efficient Vision‑Language‑Action Model for Combat Tasks in 3D Action Role‑Playing Games
- Integriert visuelle, sprachliche und handlungsbezogene Informationen für Kampfszenarien.
- Optimiert Entscheidungsprozesse in 3D‑Action‑Rollenspielen durch agentische Steuerung.
- Dient als Grundlage für die Entwicklung autonomer Agenten in simulierten Kampfumgebungen.
Link zum Paper
RESTRAIN: Reinforcement Learning‑Based Secure Framework for Trigger‑Action IoT Environment
- Entwickelt ein sicheres Framework zur Automatisierung von Trigger‑Action-Regeln in IoT‑Systemen.
- Nutzt Reinforcement Learning, um den Informationsaustausch zwischen verteilten IoT‑Agenten zu koordinieren.
- Verbessert den Schutz und die Zuverlässigkeit in dezentralen, agentenbasierten Umgebungen.
Link zum Paper
Multi‑Agent Image Restoration
- Setzt mehrere kooperierende Agenten ein, um verrauschte oder beschädigte Bilder wiederherzustellen.
- Nutzt kollaborative Lernstrategien zur Fehlerkorrektur und Qualitätsverbesserung.
- Demonstriert, wie Multi‑Agenten‑Frameworks praktische Anwendungen in der Bildverarbeitung finden.
Link zum Paper
NVP‑HRI: Zero Shot Natural Voice and Posture‑based Human‑Robot Interaction via Large Language Model
- Integriert natürliche Sprach- und Körpersignale, um die Interaktion zwischen Mensch und Roboter zu verbessern.
- Ermöglicht „Zero‑Shot“-Interaktionen, bei denen keine Vorabdaten benötigt werden.
- Verbessert die HRI durch den Einsatz von LLM‑gestützten Agenten.
Link zum Paper
Steering No‑Regret Agents in MFGs under Model Uncertainty
- Entwickelt Strategien zur Steuerung von Agenten in Mean‑Field‑Games trotz Modellunsicherheiten.
- Minimiert potenzielle Reue in komplexen Multi‑Agenten‑Systemen.
- Liefert sowohl theoretische als auch praktische Einsichten in robuste Entscheidungsfindung.
Link zum Paper
Other Vehicle Trajectories Are Also Needed: A Driving World Model Unifies Ego‑Other Vehicle Trajectories in Video Latent Space
- Integriert die Trajektorien des eigenen Fahrzeugs und der umgebenden Fahrzeuge in einem gemeinsamen Modell.
- Verbessert die Vorhersage und Koordination in autonomen Fahrsystemen durch Multi‑Agenten‑Konzepte.
- Stärkt die Zusammenarbeit zwischen Fahrzeugen in simulierten Verkehrsszenarien.
Link zum Paper
Efficient UAV Swarm‑Based Multi‑Task Federated Learning with Dynamic Task Knowledge Sharing
- Nutzt Schwarmintelligenz von UAVs zur Realisierung föderierter Multi‑Task‑Lernprozesse.
- Ermöglicht einen dynamischen Wissensaustausch zwischen Drohnen‑Agenten.
- Steigert die Effizienz und Koordination in verteilten Drohnensystemen.
Link zum Paper
(Sollte ein abweichender Link vorliegen, bitte entsprechend anpassen.)
LocAgent: Graph‑Guided LLM Agents for Code Localization
- Setzt graphbasierte Methoden ein, um relevante Codebereiche automatisch zu identifizieren.
- Unterstützt die Fehlerdiagnose und Wartung von Software durch autonome Agenten.
- Nutzt LLMs zur semantischen Analyse und Lokalisierung im Code.
Link zum Paper
ManeuverGPT Agentic Control for Safe Autonomous Stunt Maneuvers
- Führt einen agentischen Steuerungsansatz ein, der autonome Fahrzeuge bei Stunt‑Manövern unterstützt.
- Nutzt große Sprachmodelle, um präzise und sichere Aktionen zu planen.
- Verbessert die Sicherheit und Effizienz bei komplexen Fahrszenarien.
Link zum Paper
Enhancing Traffic Signal Control through Model‑based Reinforcement Learning and Policy Reuse
- Entwickelt ein Modell zur Optimierung der Ampelsteuerung mittels Reinforcement Learning.
- Nutzt Multi‑Agenten‑Konzepte, um Ampelanlagen in urbanen Netzwerken koordiniert zu regeln.
- Verbessert den Verkehrsfluss und erhöht die Verkehrssicherheit.
Link zum Paper
Simulating Influence Dynamics with LLM Agents
- Simuliert, wie LLM‑gestützte Agenten Einfluss in sozialen Systemen ausüben können.
- Untersucht Dynamiken der Meinungsbildung in Multi‑Agenten‑Umgebungen.
- Liefert wertvolle Einsichten zur Optimierung von Kommunikationsstrategien.
Link zum Paper
BEARCUBS: A benchmark for computer‑using web agents
- Entwickelt einen Benchmark zur Evaluierung webbasierter Agenten in der Interaktion mit Computersystemen.
- Misst die Effizienz und Genauigkeit von KI‑Agenten bei webbasierten Aufgaben.
- Dient als Grundlage zur Optimierung von Agenten in Online‑Umgebungen.
Link zum Paper
Sensemaking in Novel Environments: How Human Cognition Can Inform Artificial Agents
- Untersucht, wie Erkenntnisse aus der menschlichen Kognition zur Verbesserung künstlicher Agenten beitragen können.
- Verbindet neurowissenschaftliche Erkenntnisse mit modernen KI‑Methoden.
- Fördert die Entwicklung adaptiver, interpretierbarer Agenten in unbekannten Umgebungen.
Link zum Paper
CoLMDriver: LLM‑based Negotiation Benefits Cooperative Autonomous Driving
- Nutzt große Sprachmodelle, um Verhandlungen zwischen autonomen Fahrzeugen zu unterstützen.
- Fördert kooperative Strategien im Straßenverkehr.
- Verbessert die Effizienz und Sicherheit autonomer Fahrsysteme durch agentenbasierte Interaktion.
Link zum Paper
AgentOrca: A Dual‑System Framework to Evaluate Language Agents on Operational Routine and Constraint Adherence
- Bewertet die Leistungsfähigkeit von Sprachagenten in alltäglichen und regelbasierten Szenarien.
- Nutzt ein duales Evaluationssystem, um operative Routinen und Regelkonformität zu messen.
- Liefert Metriken zur Optimierung der Zuverlässigkeit von KI‑Agenten.
Link zum Paper
Generating Robot Constitutions & Benchmarks for Semantic Safety
- Entwickelt „Robot Constitutions“ als Richtlinien zur Sicherstellung semantischer Sicherheit in autonomen Systemen.
- Stellt Benchmarks bereit, die ethische und sicherheitstechnische Anforderungen evaluieren.
- Unterstützt die Standardisierung von Sicherheitsprotokollen in KI‑basierten Robotern.
Link zum Paper
Liste der arXiv-Veröffentlichungen vom 12. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks
Seeing and Reasoning with Confidence: Supercharging Multimodal LLMs with an Uncertainty-Aware Agentic Framework
- Beschreibt einen neuartigen Ansatz, um multimodale LLMs durch ein Unsicherheits-bewusstes agentisches Framework zu verstärken.
- Verbessert die Zuverlässigkeit und Interpretierbarkeit von Systemen, die visuelle und sprachliche Informationen kombinieren.
- Eröffnet Perspektiven zur Integration von Unsicherheitsmanagement in KI‑Agenten.
Link zum Paper: arXiv:2503.08308
HASARD: A Benchmark for Vision-Based Safe Reinforcement Learning in Embodied Agents
- Stellt einen Benchmark vor, der sicherheitsorientierte, visionbasierte Reinforcement-Learning-Methoden in eingebetteten Agenten bewertet.
- Ermöglicht die Analyse von Sicherheitsmechanismen in autonomen Robotersystemen.
- Dient als Grundlage für die Weiterentwicklung robuster und sicherheitsbewusster KI‑Agenten.
Link zum Paper: arXiv:2503.08241
Guess What I am Thinking: A Benchmark for Inner Thought Reasoning of Role-Playing Language Agents
- Führt einen Benchmark ein, der die inneren Denkprozesse von rollenspielenden Sprachagenten misst.
- Analysiert, inwieweit Agenten ihre eigenen Überlegungen nachvollziehbar darstellen können.
- Liefert Einsichten zur Verbesserung der Selbstreflexion in KI‑basierten Dialogsystemen.
Link zum Paper: arXiv:2503.08193
Privacy-Enhancing Paradigms within Federated Multi-Agent Systems
- Untersucht datenschutzfördernde Ansätze in föderierten, dezentralen Mehragentensystemen.
- Integriert Sicherheitsmechanismen, die den Informationsaustausch zwischen Agenten schützen.
- Trägt dazu bei, die Privatsphäre in kooperativen, verteilten KI-Architekturen zu wahren.
Link zum Paper: arXiv:2503.08175
BEARCUBS: A benchmark for computer-using web agents
- Entwickelt einen spezifischen Benchmark zur Evaluierung webbasierter Agenten, die Computeranwendungen steuern.
- Bewertet Effizienz und Genauigkeit bei der Interaktion mit webbasierten Systemen.
- Dient als Grundlage, um KI-gestützte Webagenten weiter zu optimieren.
Link zum Paper: arXiv:2503.07919
RefactorBench: Evaluating Stateful Reasoning in Language Agents Through Code
- Bewertet den zustandsbehafteten Denkprozess von Sprachagenten anhand von Programmcode.
- Analysiert, wie Agenten komplexe Aufgaben durch Refaktorisierung lösen können.
- Liefert Erkenntnisse zur Verbesserung der internen Logik und Stabilität von Sprachagenten.
Link zum Paper: arXiv:2503.07991
Sensemaking in Novel Environments: How Human Cognition Can Inform Artificial Agents
- Erforscht, wie Erkenntnisse aus der menschlichen Kognition künstliche Agenten in unbekannten Umgebungen unterstützen können.
- Verbindet neurowissenschaftliche Einsichten mit Methoden der KI-Entwicklung.
- Bietet Ansätze zur Steigerung der Adaptivität und Interpretierbarkeit von künstlichen Agenten.
Link zum Paper: arXiv:2503.07783
Fully Autonomous Programming using Iterative Multi-Agent Debugging with Large Language Models
- Beschreibt einen iterativen Ansatz, bei dem mehrere Agenten gemeinsam Programmierfehler identifizieren und beheben.
- Nutzt große Sprachmodelle zur autonomen Codegenerierung und -verbesserung.
- Ermöglicht eine vollständig autonome Softwareentwicklung durch kooperative Multi-Agent Debugging-Prozesse.
Link zum Paper: arXiv:2503.07693
CoLMDriver: LLM-based Negotiation Benefits Cooperative Autonomous Driving
- Zeigt, wie große Sprachmodelle Verhandlungsfähigkeiten in kooperativen autonomen Fahrszenarien unterstützen.
- Integriert sprachbasierte Entscheidungsfindung in die Fahrzeugkommunikation.
- Steigert die Effizienz und Sicherheit im autonomen Verkehr durch koordinierte Agenteninteraktionen.
Link zum Paper: arXiv:2503.07937
AgentOrca: A Dual-System Framework to Evaluate Language Agents on Operational Routine and Constraint Adherence
- Entwickelt ein duales Evaluationsframework zur Messung von Routinetreue und Regelkonformität bei Sprachagenten.
- Analysiert sowohl automatische Entscheidungsprozesse als auch regulatorische Aspekte.
- Liefert Metriken zur Bewertung der Zuverlässigkeit und Effizienz von KI‑Agenten in praxisnahen Settings.
Link zum Paper: arXiv:2503.08669
Generating Robot Constitutions & Benchmarks for Semantic Safety
- Entwickelt methodische Ansätze zur Erzeugung von „Robot Constitutions“ zur Sicherstellung semantischer Sicherheit.
- Stellt Benchmarks bereit, die ethische und regulatorische Anforderungen an autonome Roboter evaluieren.
- Unterstützt die Schaffung von Richtlinien zur Steuerung des Verhaltens von KI‑Robotern in komplexen Umgebungen.
Link zum Paper: arXiv:2503.08663
GTR: Guided Thought Reinforcement Prevents Thought Collapse in RL-based VLM Agent Training
- Führt einen neuartigen Reinforcement-Learning-Ansatz ein, der Denkprozesse in VLM-Agenten stabilisiert.
- Verhindert das Zusammenbrechen von internen Gedankenketten während des Trainings.
- Verbessert die Kohärenz und Robustheit der internen Repräsentationen von Sprach- und Vision-Agenten.
Link zum Paper: arXiv:2503.08588
InfluenceNet: AI Models for Banzhaf and Shapley Value Prediction
- Stellt KI-Modelle vor, die spieltheoretische Einflusswerte (Banzhaf und Shapley) in Mehragentensystemen vorhersagen.
- Ermöglicht die quantitative Bewertung des Beitrags einzelner Agenten in kooperativen Settings.
- Liefert theoretische Grundlagen zur Optimierung von Entscheidungsprozessen in wirtschaftlich orientierten Multiagenten-Umgebungen.
Link zum Paper: arXiv:2503.08381
Prototype-based Heterogeneous Federated Learning for Blade Icing Detection in Wind Turbines with Class Imbalanced Data
- Entwickelt einen föderierten Lernansatz, der heterogene Agenten zur Erkennung von Vereisung in Windturbinen einsetzt.
- Nutzt prototypbasierte Methoden, um Herausforderungen bei Klassenungleichgewichten zu bewältigen.
- Fördert den sicheren und effektiven Informationsaustausch in dezentralen Multiagenten-Systemen.
Link zum Paper: arXiv:2503.08325
General-Purpose Aerial Intelligent Agents Empowered by Large Language Models
- Präsentiert autonome, flugfähige Agenten, die mithilfe großer Sprachmodelle gesteuert werden.
- Ermöglicht adaptive Entscheidungsfindung in dynamischen Luftfahrtszenarien.
- Vereint Konzepte aus Robotik, KI und Sprachmodellierung zu einer universellen Agentenarchitektur.
Link zum Paper: arXiv:2503.08322
A Cascading Cooperative Multi-agent Framework for On-ramp Merging Control Integrating Large Language Models
- Entwickelt ein mehrstufiges, kooperatives Framework für das Einfädeln im Straßenverkehr.
- Integriert große Sprachmodelle zur Unterstützung der Echtzeit-Entscheidungsfindung.
- Verbessert die Effizienz und Sicherheit autonomer Fahrsysteme durch koordinierte Agenteninteraktionen.
Link zum Paper: arXiv:2503.08102
In Prospect and Retrospect: Reflective Memory Management for Long-term Personalized Dialogue Agents
- Untersucht innovative Methoden zum Langzeitspeicher-Management in personalisierten Dialogagenten.
- Verbessert die Kohärenz und Personalisierung in langanhaltenden Interaktionen.
- Bietet Ansätze zur Optimierung des Abrufs und der Integration von Langzeitgedächtnisinhalten in Sprachsystemen.
Link zum Paper: arXiv:2503.08026
Safety Guardrails for LLM-Enabled Robots
- Entwickelt Sicherheitsmechanismen zur Gewährleistung einer zuverlässigen Interaktion von LLM-gestützten Robotern.
- Bewertet Risikofaktoren und implementiert Schutzmaßnahmen in realen Einsatzszenarien.
- Fördert die Integration ethischer und technischer Sicherheitsprotokolle in autonome Systeme.
Link zum Paper: arXiv:2503.07885
Right Reward Right Time for Federated Learning
- Präsentiert ein innovatives Belohnungssystem zur Optimierung des Lernens in föderierten Multiagenten-Umgebungen.
- Koordiniert zeitgerechte Anreize, um die Performance dezentraler Agenten zu steigern.
- Trägt zur Effizienzsteigerung in verteilten Lernsystemen bei.
Link zum Paper: arXiv:2503.07869
Adaptive routing protocols for determining optimal paths in AI multi-agent systems: a priority- and learning-enhanced approach
- Entwickelt adaptive Routing-Protokolle, die in Multiagentensystemen optimale Pfade bestimmen.
- Nutzt prioritäts- und lernbasierte Mechanismen zur dynamischen Netzwerksteuerung.
- Verbessert die Leistungsfähigkeit vernetzter Agenten in komplexen Umgebungen.
Link zum Paper: arXiv:2503.07685
Using a single actor to output personalized policy for different intersections
- Entwickelt einen Ansatz, bei dem ein einzelner Agent personalisierte Verkehrsrichtlinien für diverse Kreuzungen generiert.
- Nutzt individuelle Fahrmuster zur Optimierung von Verkehrsflüssen.
- Integriert Elemente des Multiagenten-Systems, um differenzierte Steuerstrategien umzusetzen.
Link zum Paper: arXiv:2503.07678
DynTaskMAS: A Dynamic Task Graph-driven Framework for Asynchronous and Parallel LLM-based Multi-Agent Systems
- Stellt ein dynamisches, taskbasiertes Framework vor, das asynchrone und parallele Prozesse in Multiagenten-Systemen koordiniert.
- Nutzt Graphstrukturen zur effizienten Aufgabenverteilung unter KI‑Agenten.
- Erhöht die Skalierbarkeit und Leistungsfähigkeit von LLM-gestützten Agentensystemen.
Link zum Paper: arXiv:2503.07675
The potential role of AI agents in transforming nuclear medicine research and cancer management in India
- Analysiert, wie KI‑Agenten die Forschung in der Nuklearmedizin und das Krebsmanagement revolutionieren können.
- Betont den Einsatz autonomer Agenten zur Verbesserung diagnostischer und therapeutischer Prozesse.
- Diskutiert die potenziellen Auswirkungen auf medizinische Abläufe und die Patientenversorgung in Indien.
Link zum Paper: arXiv:2503.07671
Liste der arXiv-Veröffentlichungen vom 11. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks
Human Machine Co-Adaptation Model and Its Convergence Analysis
- Untersucht das Zusammenspiel von Mensch und Maschine in ko-adaptiven Systemen.
- Analysiert mathematisch die Konvergenzmechanismen in Interaktionsprozessen.
- Betont den Einsatz von Multiagentensystemen als Grundlage moderner KI.
Link zum Paper: arXiv:2503.07319
Rule-Based Conflict-Free Decision Framework in Swarm Confrontation
- Entwickelt ein regelbasiertes Framework zur Vermeidung von Konflikten in Schwarminteraktionen.
- Nutzt Entscheidungslogik zur Gewährleistung konsistenter Handlungen in Mehragentensystemen.
- Demonstriert die Anwendung in Simulationen von Schwarmverhalten.
Link zum Paper: arXiv:2503.07077
ReAgent: Reversible Multi-Agent Reasoning for Knowledge-Enhanced Multi-Hop QA
- Stellt einen reversiblen Denkprozess in einem Mehragentensystem vor.
- Integriert Wissen in mehrstufige Frage-Antwort-Systeme.
- Verbessert die Effizienz durch koordinierte Agenten.
Link zum Paper: arXiv:2503.06951
Beyond Black-Box Benchmarking: Observability, Analytics, and Optimization of Agentic Systems
- Erforscht analytische Ansätze zur Beobachtung und Optimierung agentischer Systeme.
- Geht über herkömmliche Black‑Box-Methoden hinaus.
- Liefert Ansätze zur Verbesserung von Transparenz und Steuerbarkeit in KI‑Agenten.
Link zum Paper: arXiv:2503.06745
Agent models: Internalizing Chain-of-Action Generation into Reasoning models
- Integriert Aktionsketten in reasoning Modelle zur verbesserten Entscheidungsfindung.
- Entwickelt interne Repräsentationen von Agentenhandlungsabläufen.
- Ziel ist eine effizientere und robustere agentenbasierte KI.
Link zum Paper: arXiv:2503.06580
Advancing AI Negotiations: New Theory and Evidence from a Large-Scale Autonomous Negotiations Competition
- Präsentiert neue theoretische Ansätze für KI‑gestützte Verhandlungsführung.
- Stützt sich auf umfangreiche empirische Daten aus einem Verhandlungswettbewerb.
- Zeigt Potenziale autonomer Verhandlungsagenten auf.
Link zum Paper: arXiv:2503.06416
Performant LLM Agentic Framework for Conversational AI
- Stellt ein effizientes, agentenbasiertes Framework für Konversations‑KI vor.
- Nutzt große Sprachmodelle zur dynamischen Steuerung von Dialogen.
- Optimiert die Interaktion durch agentische Entscheidungsprozesse.
Link zum Paper: arXiv:2503.06410
Higher-Order Belief in Incomplete Information MAIDs
- Untersucht höhergradige Überzeugungen in Multi-Agent Influence Diagrams (MAIDs).
- Erweitert traditionelle Unsicherheitsmodelle in Mehragentensystemen.
- Bietet theoretische Grundlagen für komplexe agentenbasierte Entscheidungsfindung.
Link zum Paper: arXiv:2503.06323
DSGBench: A Diverse Strategic Game Benchmark for Evaluating LLM-based Agents in Complex Decision-Making Environments
- Entwickelt einen Benchmark zur Bewertung von LLM‑basierten Agenten in strategischen Spielen.
- Schafft eine vielfältige Testumgebung für komplexe Entscheidungsprozesse.
- Ermöglicht den Vergleich unterschiedlicher agentischer Ansätze in realistischen Szenarien.
Link zum Paper: arXiv:2503.06047
Market-based Architectures in RL and Beyond
- Erforscht marktbasierten Architekturenansätze im Reinforcement Learning.
- Betrachtet die Interaktion von Agenten in ökonomisch inspirierten Modellen.
- Zeigt, wie Marktmechanismen die Leistung von KI‑Agenten verbessern können.
Link zum Paper: arXiv:2503.05828
MedAgentsBench: Benchmarking Thinking Models and Agent Frameworks for Complex Medical Reasoning
- Entwickelt einen Benchmark zur Evaluation agentenbasierter Frameworks in der medizinischen Entscheidungsfindung.
- Bewertet die Leistungsfähigkeit von KI‑Agenten in komplexen klinischen Szenarien.
- Unterstützt die Weiterentwicklung von KI-Systemen im Gesundheitswesen.
Link zum Paper: arXiv:2503.07459
Artificial Utopia: Simulation and Intelligent Agents for a Democratised Future
- Untersucht den Einsatz intelligenter Agenten in simulationsbasierten Gesellschaftsmodellen.
- Zielt darauf ab, demokratische Prozesse durch KI‑gestützte Agenten zu fördern.
- Bietet Einblicke in zukünftige, agentenbasierte gesellschaftliche Strukturen.
Link zum Paper: arXiv:2503.07364
Dynamic Path Navigation for Motion Agents with LLM Reasoning
- Entwickelt ein Navigationssystem für bewegliche Agenten mithilfe von LLM‑gestützter Logik.
- Kombiniert dynamische Pfadfindung mit sprachbasierten Entscheidungsprozessen.
- Verbessert die autonome Navigation in komplexen Umgebungen.
Link zum Paper: arXiv:2503.07323
Experimental Exploration: Investigating Cooperative Interaction Behavior Between Humans and Large Language Model Agents
- Analysiert die kooperative Interaktion zwischen Menschen und LLM‑basierten Agenten.
- Führt Experimente zur Erfassung von Verhaltensmustern in hybriden Teams durch.
- Liefert Erkenntnisse zur Optimierung der Mensch-KI-Kollaboration.
Link zum Paper: arXiv:2503.07320
ASTRA: A Negotiation Agent with Adaptive and Strategic Reasoning through Action in Dynamic Offer Optimization
- Stellt einen Verhandlungsagenten mit adaptiven Strategien in dynamischen Umgebungen vor.
- Nutzt strategische Reasoning-Methoden zur Optimierung von Angeboten.
- Belegt die Effektivität von KI‑Agenten in Verhandlungsszenarien.
Link zum Paper: arXiv:2503.07129
DatawiseAgent: A Notebook-Centric LLM Agent Framework for Automated Data Science
- Präsentiert ein agentenbasiertes Framework zur Automatisierung von Data-Science-Prozessen.
- Integriert LLMs in notebookzentrierte Arbeitsabläufe.
- Erleichtert die Datenanalyse durch autonome Agenten.
Link zum Paper: arXiv:2503.07044
Bot Wars Evolved: Orchestrating Competing LLMs in a Counterstrike Against Phone Scams
- Beschreibt den Einsatz konkurrierender LLM‑Agenten zur Bekämpfung von Telefonbetrug.
- Nutzt agentenbasierte Orchestrierung zur optimalen Aufgabenverteilung.
- Demonstriert den praktischen Einsatz von KI‑Agenten in Sicherheitsanwendungen.
Link zum Paper: arXiv:2503.07036
Can Proof Assistants Verify Multi-Agent Systems?
- Untersucht den Einsatz von Beweisassistenten zur Verifikation komplexer Mehragentensysteme.
- Analysiert Grenzen und Potenziale formaler Verifikationsmethoden.
- Bietet Ansätze zur Steigerung der Zuverlässigkeit in KI‑Systemen.
Link zum Paper: arXiv:2503.06812
AutoMisty: A Multi-Agent LLM Framework for Automated Code Generation in the Misty Social Robot
- Entwickelt ein Framework zur automatisierten Code-Generierung in sozialen Robotern.
- Setzt auf koordinierte Mehragentensysteme zur Verbesserung der Softwareentwicklung.
- Verbessert die Interaktion und Funktionalität von Robotiksystemen.
Link zum Paper: arXiv:2503.06791
Fully-Decentralized MADDPG with Networked Agents
- Stellt einen dezentralisierten Ansatz für Multi-Agent Deep Reinforcement Learning vor.
- Nutzt Netzwerkstrukturen zur effektiven Koordination von Agenten.
- Demonstriert Effizienzsteigerungen in verteilten Lernumgebungen.
Link zum Paper: arXiv:2503.06747
Exploring LLM Agents for Cleaning Tabular Machine Learning Datasets
- Erforscht den Einsatz von LLM‑basierten Agenten zur Bereinigung von Datensätzen.
- Automatisiert die Identifikation und Korrektur fehlerhafter Daten.
- Verbessert die Datenqualität für maschinelle Lernanwendungen.
Link zum Paper: arXiv:2503.06664
Vairiational Stochastic Games
- Untersucht stochastische Spiele als Modell zur Analyse von Mehragenteninteraktionen.
- Nutzt Variationsansätze zur Simulation strategischer Entscheidungsprozesse.
- Bietet theoretische Grundlagen für spieltheoretisch inspirierte KI‑Modelle.
Link zum Paper: arXiv:2503.06037
Accelerating Earth Science Discovery via Multi-Agent LLM Systems
- Demonstriert den Einsatz von Multi-Agent LLM-Systemen in der Erdsystemforschung.
- Beschleunigt die Analyse großer geowissenschaftlicher Datensätze.
- Vereint agentenbasierte Technologien mit naturwissenschaftlicher Datenanalyse.
Link zum Paper: arXiv:2503.05856
Multi-agent Auto-Bidding with Latent Graph Diffusion Models
- Entwickelt einen Mehragenten-Ansatz für automatisierte Gebotsstrategien.
- Integriert latente Graphdiffusionsmodelle zur Optimierung der Entscheidungsfindung.
- Zeigt die Anwendung in ökonomischen und Auktionsszenarien.
Link zum Paper: arXiv:2503.05805
Knowledge representation and scalable abstract reasoning for simulated democracy in Unity
- Erforscht die Darstellung von Wissen in simulationsbasierten Demokratiesystemen.
- Nutzt abstrakte Reasoning-Methoden zur Skalierung von Agenteninteraktionen.
- Demonstriert Potenziale für mehrstufige, agentengesteuerte Entscheidungsfindung.
Link zum Paper: arXiv:2503.05893
Alignment, Agency and Autonomy in Frontier AI: A Systems Engineering Perspective
- Analysiert die Rolle von Agency und Autonomie in fortschrittlichen KI‑Systemen.
- Verbindet systemtechnische Ansätze mit agentenbasierten Modellen.
- Diskutiert Herausforderungen und Lösungsansätze zur sicheren Integration von KI‑Agenten.
Link zum Paper: arXiv:2503.05748
Liste der arXiv-Veröffentlichungen vom 10. März 2025 zu KI-Agenten und Multi-Agenten-Frameworks
1. VLMs Play StarCraft II: A Benchmark and Multimodal Decision Method
- Beschreibung:
- Dieses Paper stellt einen neuen Benchmark vor, um die Fähigkeiten multimodaler visueller Sprachmodelle (VLMs) in der komplexen Echtzeit-Strategiespielumgebung von StarCraft II zu testen.
- Es schlägt eine multimodale Entscheidungsmethode vor, die visuelle und textuelle Eingaben integriert, um agentenbasierte Entscheidungen zu verbessern.
- Die Ergebnisse zeigen, dass VLMs in Multi-Agenten-Szenarien vielversprechende Leistungen erbringen, jedoch noch Herausforderungen bei der Generalisierung bestehen.
- Link: arXiv:2503.05383
2. FedMABench: Benchmarking Mobile Agents on Decentralized Heterogeneous User Data
- Beschreibung:
- FedMABench ist ein Benchmark-Framework zur Evaluierung mobiler KI-Agenten unter föderierten Lernbedingungen mit heterogenen Nutzerdaten.
- Es untersucht, wie Agenten in dezentralisierten Umgebungen zusammenarbeiten können, um personalisierte und datenschutzfreundliche Lösungen zu entwickeln.
- Die Studie hebt die Herausforderungen der Datenverteilung und die Effizienz von Multi-Agenten-Systemen hervor.
- Link: arXiv:2503.05143
3. The Society of HiveMind: Multi-Agent Optimization of Foundation Model Swarms to Unlock the Potential of Collective Intelligence
- Beschreibung:
- Dieses Paper beschreibt HiveMind, ein Multi-Agenten-System, das Foundation-Modelle als Schwärme optimiert, um kollektive Intelligenz zu fördern.
- Es nutzt evolutionäre Algorithmen, um die Kooperation und Spezialisierung von Agenten in dynamischen Umgebungen zu verbessern.
- Die Ergebnisse deuten darauf hin, dass diese Methode die Leistungsfähigkeit großer Modelle in komplexen Aufgaben steigern kann.
- Link: arXiv:2503.05473
4. Controllable Complementarity: Subjective Preferences in Human-AI Collaboration
- Beschreibung:
- Die Studie untersucht, wie KI-Agenten in der Zusammenarbeit mit Menschen an subjektive Präferenzen angepasst werden können.
- Es wird ein Framework vorgeschlagen, das die Komplementarität zwischen menschlichen und KI-Entscheidungen durch Multi-Agenten-Interaktionen steuert.
- Experimente zeigen, dass diese Anpassung die Effizienz und Zufriedenheit in kooperativen Szenarien erhöht.
- Link: arXiv:2503.05455
5. Multi-Robot Collaboration through Reinforcement Learning and Abstract Simulation
- Beschreibung:
- Dieses Paper präsentiert eine Methode zur Verbesserung der Zusammenarbeit mehrerer Roboter durch Verstärkendes Lernen und abstrakte Simulationen.
- Es zeigt, wie Multi-Agenten-Systeme in realistischen Szenarien effizient trainiert werden können, indem komplexe Zustände vereinfacht werden.
- Die Ergebnisse demonstrieren eine erhöhte Robustheit und Skalierbarkeit in kooperativen Aufgaben.
- Link: arXiv:2503.05092
6. Advancing MAPF towards the Real World: A Scalable Multi-Agent Realistic Testbed (SMART)
- Beschreibung:
- SMART ist ein Testbed für Multi-Agenten-Pfadplanung (MAPF), das realistische Szenarien mit mehreren Agenten simuliert.
- Es zielt darauf ab, die Lücke zwischen theoretischen Algorithmen und realen Anwendungen zu schließen, indem es skalierbare und praktische Umgebungen bietet.
- Die Studie zeigt, wie dieser Ansatz die Koordination und Effizienz von KI-Agenten in dynamischen Umgebungen verbessert.
- Link: arXiv:2503.04798
#AI #KI #ArtificialIntelligence #KuenstlicheIntelligenz #MultiAgentSystems #EmbodiedAI #Robotics #KI-Agenten