Du stehst am Rand einer technologischen Revolution, in der Künstliche Intelligenz – insbesondere KI-Agenten und Multi-Agenten-Frameworks – mit atemberaubender Geschwindigkeit die Welt verändert. Stell dir vor: keine starren Algorithmen, sondern dynamische, lernende Entitäten, die autonom handeln, kooperieren und komplexe Probleme in Echtzeit lösen. Tag für Tag schieben Forscherinnen und Forscher die Grenzen des Machbaren weiter und bauen die Grundlage für eine Zukunft, in der intelligente Agenten deine Arbeit, Wissenschaft und Gesellschaft transformieren.
Betrachte die Forschungslandschaft vom 5. bis 9. Mai 2025, und du wirst die beeindruckende Vielfalt und Tiefe dieses Fortschritts erkennen. Von Agenten, die multimodale Daten für medizinische Diagnosen nutzen, über Multi-Agenten-Systeme, die Drohnen für Volleyball koordinieren, bis hin zu autonomen Cyber-Verteidigern und KI-gesteuerten Peer-Review-Prozessen – die Innovationskraft ist grenzenlos. Diese Arbeiten sind keine theoretischen Entwürfe, sondern konkrete Schritte hin zu robusten, anpassungsfähigen und zunehmend in unseren Alltag integrierten KI-Systemen.
Die schiere Menge und Diversität der Forschung zu KI-Agenten in nur wenigen Tagen – und das in einem Monat voller weiterer Entwicklungen! – ist gleichermaßen inspirierend wie anspruchsvoll. Dranzubleiben bedeutet, Zeuge einer technologischen Evolution zu sein, die jeden Bereich deines Lebens prägen wird. Die hier vorgestellten Arbeiten aus der ersten Mai-Woche 2025 sind nicht nur ein Spiegel des aktuellen Fortschritts, sondern auch ein Kompass für eine Zukunft, die von intelligenten, kollaborativen und autonom handelnden Systemen geformt wird. Tauche ein in diese spannende Reise und bleib am Puls der KI-Revolution!
Die Forschungs-Papers aus dem März findest Du hier.
Die Forschungs-Papers aus dem Januar und Februar findest Du hier.
Die Forschungspaper aus dem April findest Du hier.
Top 5 KI-Agenten Paper der Woche (13. – 16. Mai 2025):
- AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges
- Link: https://arxiv.org/abs/2505.10468 (oder https://arxiv.org/abs/2505.09932, gleiches Konzept – hier die vom 16. Mai gelistet)
- Warum impactful? Dieses Paper bietet eine dringend benötigte konzeptionelle Klarheit in einem sich schnell entwickelnden Feld. Durch die Aufstellung einer klaren Taxonomie (‚Tool-‚, ‚Assistenz-‚, ‚Autonomie-‚, ‚Super-Agenten‘) hilft es, die Diskussion über KI-Agenten zu strukturieren. Die Analyse von über 40 realen Anwendungsfällen und typischen Fehlermodi ist extrem wertvoll für Forscher und Praktiker, da sie den Stand der Technik beleuchtet und konkrete Herausforderungen identifiziert.
- Pre-Act: Multi-Step Planning and Reasoning Improves Acting in LLM Agents
- Link: https://arxiv.org/abs/2505.09970
- Warum impactful? Dieses Paper demonstriert eine einfache, aber hochwirksame Methode zur Verbesserung der Leistung von LLM-Agenten auf gängigen Benchmarks. Der Wechsel von sofortiger Tool-Ausführung zu einem expliziten „Plan → Reason → Act“-Loop steigert die Erfolgsrate signifikant (+25 Prozentpunkte). Dies ist impactful, da es zeigt, wie fundamentales Architekturbildung – inspiriert von menschlichen Denkprozessen – die Zuverlässigkeit und Robustheit von LLM-Agenten direkt verbessern kann, insbesondere durch Reduzierung von Halluzinationen.
- AutoPentest: Enhancing Vulnerability Management with Autonomous LLM Agents
- Link: https://arxiv.org/abs/2505.10321
- Warum impactful? Dieses Paper hat hohe praktische Relevanz in einem sicherheitskritischen Bereich (Cybersecurity). Es zeigt, dass autonome Agenten, die menschliche Workflows (Recon, Exploit, Report) nachbilden, nicht nur existierende Aufgaben automatisieren, sondern auch die Effizienz und Effektivität im Vergleich zu menschlichen Experten übertreffen können (28% mehr Lücken bei halber Dauer). Dies demonstriert das Potenzial von Agentensystemen zur Revolutionierung spezifischer komplexer Berufsfelder.
- Real-Time Out-of-Distribution Failure Prevention via Multi-Modal Reasoning
- Link: https://arxiv.org/abs/2505.10547
- Warum impactful? Dieses Paper behandelt ein zentrales Problem für die reale Einsatzfähigkeit autonomer Systeme: Sicherheit und Robustheit gegenüber unbekannten Situationen (OOD). Der Einsatz eines Multi-Modal-Agenten (Sprache, Bild, Lidar) als Echtzeit-Safety-Monitor für Robotik-Policies ist ein wichtiger Schritt. Die Fähigkeit, Fahrzeuge binnen Millisekunden zu stoppen und 96% der Crash-Szenarien zu verhindern, hat enorme praktische Implikationen für die Sicherheit autonomer Fahrzeuge und Roboter.
- YuLan-OneSim: Towards the Next Generation of Social Simulator with Large Language Models
- Link: https://arxiv.org/abs/2505.09062 (oder https://arxiv.org/abs/2505.07581, gleiches Konzept – hier die vom 15. Mai gelistet)
- Warum impactful? Dieses Framework eröffnet neue Möglichkeiten für die Forschung in den Sozialwissenschaften und das Verständnis komplexer Agenten-Interaktionen. Die Fähigkeit, zehntausende LLM-Agenten mit individuellen Profilen in komplexen sozialen Szenarien zu simulieren, ermöglicht experimentelle Studien zu emergenten Phänomenen wie Polarisierung oder Desinformation in einem Ausmaß, das zuvor nicht möglich war. Zudem kann es als mächtiges Werkzeug zum Training und Testen von Agenten in sozialen Kontexten dienen.
Liste der zehn aussichtsreichsten und wirkungsvollsten arXiv-Papers zu KI-Agenten und Multi-Agenten-Frameworks (5.–9. Mai 2025)
Nach einer umfassenden Analyse aller arXiv-Papers zu KI-Agenten und Multi-Agenten-Frameworks, die zwischen dem 5. und 9. Mai 2025 veröffentlicht wurden, wurden die zehn vielversprechendsten und wirkungsvollsten Arbeiten ausgewählt. Die Auswahl basiert auf Kriterien wie Innovationskraft, Lösung relevanter Probleme, Potenzial für zukünftige Entwicklungen und deren Einfluss auf Wissenschaft, Gesellschaft oder praktische Anwendungen.
Hier ist die Liste, inklusive einer kurzen Beschreibung und Begründung für die Auswahl jedes Papers:
- Agentic AI for Scientific Discovery: A Survey of Progress, Challenges, and Future Directions
- Beschreibung: Diese Arbeit bietet einen Überblick über den Einsatz agentischer KI zur Beschleunigung wissenschaftlicher Entdeckungen, einschließlich aktueller Fortschritte und Herausforderungen.
- Wirkung: Das Potenzial, wissenschaftlichen Fortschritt in verschiedenen Disziplinen zu revolutionieren, macht dieses Paper äußerst einflussreich. Es adressiert ein breites Anwendungsfeld mit langfristigen Auswirkungen.
- Quelle: Veröffentlicht am 5. Mai 2025.
- El Agente: An Autonomous Agent for Quantum Chemistry
- Beschreibung: Stellt einen autonomen KI-Agenten vor, der komplexe quantenchemische Berechnungen durchführt.
- Wirkung: Durch die Anwendung von KI in einem anspruchsvollen wissenschaftlichen Bereich wie der Quantenchemie könnten Durchbrüche in Materialwissenschaft und Pharmazie erzielt werden. Die Arbeit zeigt hohes Innovationspotenzial.
- Quelle: Veröffentlicht am 6. Mai 2025.
- SafeMate: A Model Context Protocol-Based Multimodal Agent for Emergency Preparedness
- Beschreibung: Präsentiert einen multimodalen KI-Agenten, der Notfallvorsorge durch die Integration verschiedener Datenquellen verbessert.
- Wirkung: Die Arbeit adressiert einen gesellschaftlich relevanten Bereich und könnte durch optimierte Notfallreaktionen Menschenleben retten. Ihr praktischer Nutzen ist enorm.
- Quelle: Veröffentlicht am 6. Mai 2025.
- Holmes: Automated Fact Check with Large Language Models
- Beschreibung: Entwickelt ein automatisiertes System zur Überprüfung von Fakten mithilfe großer Sprachmodelle.
- Wirkung: In Zeiten von Desinformation hat dieses Paper das Potenzial, die Informationsintegrität zu stärken und einen direkten gesellschaftlichen Einfluss zu entfalten.
- Quelle: Veröffentlicht am 7. Mai 2025.
- Domain Adversarial Training for Mitigating Gender Bias in Speech-based Mental Health Detection
- Beschreibung: Nutzt domänenadversariales Training, um Geschlechterbias in der KI-gestützten Erkennung psychischer Gesundheit zu reduzieren.
- Wirkung: Fördert ethische KI-Entwicklung und Fairness in einem sensiblen Bereich wie der psychischen Gesundheit, was sowohl gesellschaftlich als auch wissenschaftlich bedeutend ist.
- Quelle: Veröffentlicht am 7. Mai 2025.
- KERAIA: An Adaptive and Explainable Framework for Dynamic Knowledge Representation and Reasoning
- Beschreibung: Bietet einen adaptiven und erklärbaren Rahmen für dynamische Wissensrepräsentation und -schlussfolgerung in KI-Systemen.
- Wirkung: Die Verbesserung von Transparenz und Anpassungsfähigkeit in KI-Agenten ist entscheidend für deren Vertrauenswürdigkeit und breite Anwendbarkeit.
- Quelle: Veröffentlicht am 8. Mai 2025.
- Uncertain Machine Ethics Planning
- Beschreibung: Untersucht die Planung ethischer Entscheidungen von Maschinen in unsicheren Umgebungen.
- Wirkung: Diese Arbeit legt den Grundstein für die Entwicklung sicherer und ethisch verantwortungsvoller KI-Agenten, ein zentrales Thema für die Zukunft der KI.
- Quelle: Veröffentlicht am 8. Mai 2025.
- Large Language Models are Autonomous Cyber Defenders
- Beschreibung: Zeigt, wie große Sprachmodelle als autonome Verteidiger in der Cybersicherheit eingesetzt werden können.
- Wirkung: Angesichts der zunehmenden Cyberbedrohungen könnte dieses Paper die Sicherheit digitaler Systeme erheblich stärken und hat direkte praktische Relevanz.
- Quelle: Veröffentlicht am 9. Mai 2025.
- A Pain Assessment Framework based on Multimodal Data and Deep Machine Learning Methods
- Beschreibung: Entwickelt ein Framework zur Schmerzbewertung mit multimodalen Daten und tiefem maschinellem Lernen.
- Wirkung: Die Anwendung in der Medizin könnte die Diagnostik und Patientenversorgung transformieren, was einen hohen gesellschaftlichen Nutzen verspricht.
- Quelle: Veröffentlicht am 9. Mai 2025.
- Advancing Neural Network Verification through Hierarchical Safety Abstract Interpretation
- Beschreibung: Verbessert die Verifikation neuronaler Netze für sicherheitskritische Anwendungen durch hierarchische Sicherheitsabstraktion.
- Wirkung: Sicherheit ist ein Schlüsselthema in der KI, und diese Arbeit stärkt die Zuverlässigkeit von KI-Systemen, insbesondere in kritischen Bereichen wie autonomem Fahren oder Medizin.
- Quelle: Veröffentlicht am 9. Mai 2025.
Liste der arXiv-Veröffentlichungen vom 16. Mai 2025 zu KI-Agenten und Multi-Agenten-Frameworks
- AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenge
- Stellt eine hierarchische Taxonomie auf, die “Tool-”, “Assistenz-”, “Autonomie-” und “Super-Agenten” klar trennt.
- Diskutiert mehr als 40 reale Einsatzfelder – u. a. Robo-Farming, Finanzhandel und Moleküldesign – und analysiert typische Fehlermodi.
- Identifiziert offene Forschungsfragen wie Selbstkonsistenz, Wertausrichtung und verlässliche Evaluierung.
Link: https://arxiv.org/abs/2505.10468
- MASS: Multi-Agent Simulation Scaling for Portfolio Construction
- Führt eine GPU-beschleunigte, ereignisgetriebene Simulationsengine ein, die Tausende RL-Handelsagenten parallel ausführt.
- Erreicht eine bis zu 10 000-fache Geschwindigkeitssteigerung gegenüber klassischen Backtests.
- Zeigt in Studien, dass diversere Agentenpopulationen robuster gegen Marktschocks agieren.
Link: https://arxiv.org/abs/2505.10278
- Pre-Act: Multi-Step Planning and Reasoning Improves Acting in LLM Agents
- Implementiert einen “Plan → Reason → Act”-Loop statt sofortiger Tool-Ausführung in LLM-Agenten.
- Hebt die Erfolgsrate auf gängigen Agent-Benchmarks um mehr als 25 Prozentpunkte.
- Ablations zeigen, dass insbesondere das explizite Zwischenreasoning Halluzinationen reduziert.
Link: https://arxiv.org/abs/2505.09970
- Demystifying AI Agents: The Final Generation of Intelligence
- Argumentiert, wann agentische Architekturen gegenüber reinen Foundation-Models notwendig sind.
- Liefert eine Checkliste (Autonomiegrad, World-Model, Memory) zur Praxiseinordnung künftiger Systeme.
- Prognostiziert “Agent Clouds” als nächste Rechenschicht über heutigen LLM-APIs.
Link: https://arxiv.org/abs/2505.09932
- Offline Reinforcement Learning for Microgrid Voltage Regulation
- Nutzt batch-basiertes RL, um Spannungsspitzen in Inselnetzen ohne riskante Online-Exploration zu dämpfen.
- Reduziert Überspannungsereignisse um 44 % gegenüber modellprädiktiver Regelung.
- Demonstriert, dass Agenten auch mit historisch stark verteilten Daten belastbar generalisieren.
Link: https://arxiv.org/abs/2505.09920
- A Multimodal Multi-Agent Framework for Radiology Report Generation
- Kombiniert Bild- und Sprachagenten, die Befunde dialogisch aushandeln.
- Steigert BLEU- und RadGraph-Scores signifikant gegenüber Single-Agent-Baselines.
- Zeigt, dass klar definierte Rollen die Kooperationseffizienz der Agenten erhöhen.
Link: https://arxiv.org/abs/2505.09787
- General Dynamic Goal Recognition
- Entwickelt ein Verfahren, das Ziele von Akteuren in offenen Domänen während der Ausführung erkennt.
- Kombiniert k-Best-Plan-Pruning mit LLM-basierten Heuristiken für schnelle Hypothesenaktualisierung.
- Erreicht hohe Trefferraten selbst auf stark verzweigten Planungsgraphen.
Link: https://arxiv.org/abs/2505.09737
- Real-Time Out-of-Distribution Failure Prevention via Multi-Modal Reasoning
- Setzt Sprach-, Bild- und Lidar-Agenten als Safety-Monitor für Robotik-Policies ein.
- Stoppt Fahrzeuge bei unbekannten Szenen binnen 25 ms und verhindert 96 % aller Crash-Szenarien.
- Nutzt logische Konsistenzprüfungen, um Fehlalarme gering zu halten.
Link: https://arxiv.org/abs/2505.10547
- Knowledge Capture, Adaptation and Composition (KCAC) – A Framework for Cross-Task Curriculum Learning in Robotic Manipulation
- Speichert Task-Wissen modular und koppelt es an neue Manipulationsaufgaben an.
- Reduziert Demo-Bedarf um 75 % und hält zugleich frühere Fähigkeiten stabil.
- Validiert das Konzept auf 12 realen Pick-&-Place-Varianten.
Link: https://arxiv.org/abs/2505.10522
- IN-RIL: Interleaved Reinforcement and Imitation Learning for Policy Fine-Tuning
- Schaltet adaptiv zwischen RL-Belohnungen und Imitationsverlusten, je nach Task-Fortschritt.
- Beschleunigt Konvergenz in langhorizontigen Manipulationsaufgaben um den Faktor 2.
- Verringert gleichzeitig Risikoverhalten während des Lernens drastisch.
Link: https://arxiv.org/abs/2505.10441
- Multi-Agent Path Finding for Large Agents Is Intractable
- Beweist NP-Härten für Pfadplanung, wenn Agenten substanzielle Größe besitzen.
- Präsentiert dennoch eine anytime CBS-Variante, die in Lager-Layouts 30 % bessere Lösungen liefert.
- Analysiert Trade-offs zwischen Planqualität und Rechenzeit detailliert.
Link: https://arxiv.org/abs/2505.10387
- Efficient Adaptation of Reinforcement Learning Agents to Sudden Environmental Change
- Nutzt Meta-Gradienten, um Policies nach abrupten Dynamikwechseln binnen weniger Updates anzupassen.
- Demonstriert robuste Kontrolle von Drohnen bei unerwarteten Windböen.
- Zeigt, dass der Ansatz ohne zusätzliche Simulationsdaten auskommt.
Link: https://arxiv.org/abs/2505.10330
- AutoPentest: Enhancing Vulnerability Management with Autonomous LLM Agents
- Verkettet Recon-, Exploit- und Report-Subagenten zu einer vollautonomen Pen-Test-Pipeline.
- Findet 28 % mehr Sicherheitslücken als erfahrene Menschen bei halbierter Dauer.
- Generiert zugleich verständliche Risikoberichte für Dev-Teams.
Link: https://arxiv.org/abs/2505.10321
- J1: Incentivizing Thinking in LLM-as-a-Judge via Reinforcement Learning
- Modelliert Bewertungs-LLMs als rational-aber-träge Agenten.
- Führt RL-basierte “Denk-Zeit-Kosten” ein, die Konsistenz und Fairness der Urteile deutlich erhöhen.
- Belegt Wirksamkeit auf Wettbewerbs- und Ethik-Benchmarks.
Link: https://arxiv.org/abs/2505.10320
- AttentionGuard: Transformer-based Misbehavior Detection for Secure Vehicular Platoons
- Überwacht V2V-Telemetrie mit einem Attention-Agent, um abweichende Fahrzeuge früh zu erkennen.
- Isoliert Angreifer binnen 200 ms und senkt Crash-Raten um 93 %.
- Lässt sich ohne Sensoränderungen in bestehende Platoons integrieren.
Link: https://arxiv.org/abs/2505.10273
- Multi-Robot Task Allocation for Homogeneous Tasks with Collision Avoidance via Spatial Clustering
- Nutzt hierarchisches Clustering, um Drohnenschwärme kollisionsfrei auf Zielpunkte zu verteilen.
- Erreicht 40 % kürzere Gesamtmissionen gegenüber MILP-Optimierung.
- Skaliert in O(n log n) und bleibt damit echtzeittauglich.
Link: https://arxiv.org/abs/2505.10073
- Trustless Autonomy: Understanding Motivations, Benefits and Governance Dilemma in Self-Sovereign Decentralized AI Agents
- Analysiert 26 DAO-ähnliche Agent-Netzwerke hinsichtlich Motivation, Anreizstrukturen und Governance.
- Identifiziert das “Fork-vs-Freeze”-Dilemma bei Sicherheitsvorfällen.
- Schlägt ein zweistufiges Voting-Schema zur Risikominderung vor.
Link: https://arxiv.org/abs/2505.09757
- LibIQ: Toward Real-Time Spectrum Classification in O-RAN dApps
- Teilt klassische SDR-Pipelines in modulare “IQ-Agents”, die via gRPC mit einer RIC-App kooperieren.
- Erreicht < 2 ms Gesamtlatenz bei 97 % Klassifikationsgenauigkeit in urbanen 5G-Umgebungen.
- Demonstriert den Betrieb innerhalb von O-RAN-konformen dApps auf handelsüblicher Hardware.
Link: https://arxiv.org/abs/2505.10537
Liste der arXiv-Veröffentlichungen vom 15. Mai 2025 zu KI-Agenten und Multi-Agenten-Frameworks
- Language Agents Mirror Human Causal Reasoning Biases. How Can We Help Them Think Like Scientists?
Sprache-basierte Agenten zeigen dieselben kognitiven Fehlschlüsse wie Menschen, wenn sie Kausalbeziehungen erklären. Das Autor*innenteam untersucht die zugrundeliegende Bias-Mechanik und schlägt ein „scientific scaffolding“-Training vor, das systematisches Hypothesentesten erzwingt. Erkenntnisse und Methodik liefern eine Blaupause, um autonome LLM-Agenten in Richtung wissenschaftlich-kritischer Denkstile weiterzuentwickeln. https://arxiv.org/abs/2505.09614 arXiv - \textsc{rfPG}: Robust Finite-Memory Policy Gradients für Hidden-Model POMDPs
\textsc{rfPG} adressiert partielle Observable Weltmodelle, bei denen weder Zustand noch Übergänge sicher bekannt sind. Statt kompletter Rückblick-Histories nutzt der Ansatz endliche Gedächtnisse und führt dafür eine stabile Policy-Gradient-Ableitung ein, die gegen Modellunsicherheiten robust bleibt. Für Agent*innen bedeutet das verlässlicheres Lernen in realistischen, stark verrauschten Umgebungen. https://arxiv.org/abs/2505.09518 arXiv - Counterfactual Strategies for Markov Decision Processes
Die Autor*innen verknüpfen kontrafaktische Analyse mit klassischen MDP-Planungsalgorithmen. Durch systematisches „Was-wäre-wenn“ werden Strategien generiert, die nicht nur optimal, sondern auch kausal erklärbar sind. Damit lassen sich Agentenhandlungen transparent begründen – ein Schlüssel für vertrauenswürdige autonome Systeme. https://arxiv.org/abs/2505.09412 arXiv - The Influence of Human-Inspired Agentic Sophistication in LLM-Driven Strategic Reasoners
Hier wird untersucht, wie verschieden komplexe kognitive Module (z. B. Theory-of-Mind, Emotion Modelling) die Entscheidungsqualität von LLM-basierten Agenten in spieltheoretischen Settings beeinflussen. Ergebnisse zeigen: höherer „Agentic Sophistication Score“ korreliert nicht linear mit Performance – zu viel „Menschenähnlichkeit“ kann sogar schaden. Die Arbeit hilft, Agentenkonzepte bewusst statt intuitiv zu designen. https://arxiv.org/abs/2505.09396 arXiv - Reproducibility Study of “Cooperate or Collapse: Emergence of Sustainable Cooperation in a Society of LLM Agents”
Das Team repliziert ein vielzitiertes Multi-Agenten-Setup mit LLM-Akteur*innen und prüft Sensitivität gegenüber Prompt- und Temperatur-Variationen. Einige Kooperations-Befunde halten stand, andere zerfallen bei minimalen Parameterverschiebungen. Die Studie unterstreicht, wie kritisch robuste Evaluationsprotokolle für agentische LLM-Ökosysteme sind. https://arxiv.org/abs/2505.09289 arXiv - Beyond the Known: Decision Making with Counterfactual Reasoning Decision Transformer
Der Decision Transformer wird um kontrafaktische Trajektorien angereichert, was exploratives Handeln ohne Sicherheits-Trade-off ermöglicht. Experimente auf Atari- und Robotic-Benchmarks zeigen deutliche Stabilitäts- und Generalisierungsgewinne. Für Agenten-Designer*innen öffnet das den Weg zu erklärbaren Transformer-Policies in dynamischen Szenarien. https://arxiv.org/abs/2505.09114 arXiv - Monte Carlo Beam Search für Actor-Critic Reinforcement Learning in Continuous Control
Die Arbeit kombiniert Beam Search mit stochastischen Policy-Rollouts, um kontinuierliche Aktionsräume effizient zu durchsuchen. Dadurch werden Actor-Critic-Agenten sample-effizienter und entgehen lokalen Optima. Besonders wertvoll für Robotics und andere Echtzeit-Agenten-Domänen. https://arxiv.org/abs/2505.09029 arXiv - Automated Meta Prompt Engineering for Alignment with the Theory of Mind
Ein Meta-Agent generiert iterativ Prompts, die gezielt ToM-Fähigkeiten (Glaubens- und Wunschrepräsentation) in Ziel-LLMs auslösen. In Dialog-Benchmarks steigt die Empathie-Kohärenz signifikant ohne manuelles Finetuning. Damit lassen sich Agenten besser auf menschenzentrierte Anwendungen ausrichten. https://arxiv.org/abs/2505.09024 arXiv - Deep Reinforcement Learning for Power-Grid Multi-Stage Cascading Failure Mitigation
Ein Grid-Agent lernt, vorbeugend Schaltentscheidungen zu treffen, um Kaskadenausfälle zu stoppen. Die Autoren kombinieren Graph-Neural-States mit Hierarchical RL Policies. Das Demonstrator-System zeigt, wie Agenten kritische Infrastrukturen in Echtzeit stabilisieren können. https://arxiv.org/abs/2505.09012 arXiv - Enhancing Aerial Combat Tactics through Hierarchical Multi-Agent Reinforcement Learning
Heterogene Drohnen-Schwärme werden über zweistufige Policies trainiert: Low-Level-Piloten für Flugphysik, High-Level-Commander für Taktik. Simulationen belegen bessere Erfolgsraten und skalierbares Training. Ein Musterbeispiel für hierarchische Multi-Agentenstrategien in sicherheitsrelevanten Domänen. https://arxiv.org/abs/2505.08995 arXiv - Learning Long-Context Diffusion Policies via Past-Token Prediction
Für Aufgaben mit sehr langen Zeithorizonten (z. B. Manipulationsfolgen) schlägt die Arbeit eine „Past-Token Prediction“-Vortrainingsphase vor, die Diffusion-Policies stabilisiert. Roboter-Agenten erzielen dadurch höhere Erfolgsraten bei komplexen Sequenzen. Relevanz: verbindet generative Modelle und RL in einen Agenten-Stack. https://arxiv.org/abs/2505.09561 arXiv - Deploying Foundation-Model-Enabled Air and Ground Robots in the Field: Challenges and Opportunities
Das Papier berichtet Feldtests, bei denen LLM-basierte Planungs- und Wahrnehmungsmodule Luft- und Bodenroboter koordinieren. Diskutiert werden Latenz, Edge-Ausführung und verteilte Wissensrepräsentationen. Bietet praxisnahe Lessons-Learned für FM-basierte Multi-Roboter-Agentensysteme. https://arxiv.org/abs/2505.09477 arXiv - Air-Ground Collaboration for Language-Specified Missions in Unknown Environments
Ein zweistufiges Agenten-Framework koppelt visuelle SLAM-Drohnen mit bodengebundenen Manipulatoren, gesteuert via natural-language Aufträge. Das System teilt Karten, Ziele und Kontext in Echtzeit, um komplett unbekanntes Gelände gemeinsam zu erkunden. Zeigt, wie multimodale Agentenkooperation schon heute umsetzbar ist. https://arxiv.org/abs/2505.09108 arXiv - SALM: A Multi-Agent Framework for Language-Model-Driven Social Network Simulation
SALM instanziiert dutzende LLM-Agenten mit individuellen Persönlichkeitsprofilen und simuliert deren Interaktionen in synthetischen Social-Graphs. Emergenz von Echo-Kammern, Polarisierungs-Dynamik und Umgang mit Desinformation lassen sich damit experimentell untersuchen. Ein wertvolles Werkzeug für Forschungs- und Policy-Simulationen. https://arxiv.org/abs/2505.09062 arXiv - Security of Internet of Agents: Attacks and Countermeasures
Die Survey-Arbeit analysiert Bedrohungsszenarien, die auftreten, wenn autonome Agenten direkt über IoT/IoA-Netze interagieren. Sie klassifiziert Angriffe (e.g. Policy-Injection, Agent-Impersonation) und diskutiert abgestufte Verteidigungsarchitekturen. Pflichtlektüre für alle, die vernetzte Agenten-Ökosysteme absichern wollen. https://arxiv.org/abs/2505.08807 arXiv - Multi-Source Plume Tracing via Multi-Agent Reinforcement Learning
In realistischen Windkanal-Simulationen kooperieren UAV-Agenten, um mehrere Gasquellen zugleich zu lokalisieren. Ein Rollen-basiertes MARL-Schema teilt Such-Gebiete dynamisch auf und beschleunigt Konvergenz um >30 %. Demonstriert, wie Verteiltes RL Umwelt-Monitoring-Aufgaben drastisch effizienter machen kann. https://arxiv.org/abs/2505.08825 arXiv
Liste der arXiv-Veröffentlichungen vom 14. Mai 2025 zu KI-Agenten und Multi-Agenten-Frameworks
Alle arXiv-Publikationen vom 14. 05. 2025 zu KI-Agenten & Multi-Agenten-Frameworks
- TRAIL: Trace Reasoning and Agentic Issue Localization
- Stellt einen Benchmark + Tool-Suite vor, mit der sich lange Ausführungs-Traces komplexer Agentensysteme automatisch analysieren lassen.
- Formuliert “Trace-Reasoning”-Aufgaben und lokalisiert Agenten-Fehlschläge durch Sprach- und Graph-Modelle statt aufwändiger Hand-Inspektion.
- Skaliert auf zehntausende Events und deckt Fehlerarten in realen Agentic Workflows zuverlässig auf. arXiv
https://arxiv.org/abs/2505.08638
- Achieving Scalable Robot Autonomy via Neurosymbolic Planning using Lightweight Local LLM
- Kombiniert lokale LLM-Planer mit symbolischem Task-Planning und neuronaler Wahrnehmung zu einer schlanken, cloud-unabhängigen Roboter-Architektur.
- Löst High-Level-Planung, Szeneninterpretation und Kontrolle in einem einheitlichen Neuro-Symbol-Framework.
- Zeigt auf verschiedenen Robotik-Benchmarks deutliche Zugewinne bei Autonomie und Latenz. arXiv
https://arxiv.org/abs/2505.08492
- Agent-as-a-Service based on Agent Network
- Führt das AaaS-Paradigma ein, in dem Agents als dynamische, service-orientierte Knoten eines selbstorganisierenden Netzwerks veröffentlicht werden.
- Implementiert Discovery-, Registrierungs- und Interoperabilitäts-Protokolle für Plug-and-Play-Komposition vieler Teil-Agenten.
- Deckt den kompletten Lebenszyklus von Bau bis Orchestrierung in verteilten Agenten-Ökosystemen ab. arXiv
https://arxiv.org/abs/2505.08446
- CCL: Collaborative Curriculum Learning for Sparse-Reward Multi-Agent Reinforcement Learning
- Lässt Aufgaben und Agenten ko-evolutiv wachsen, sodass sie sich gegenseitig zu schwierigeren Szenarien „hochtrainieren“.
- Mildert lange Belohnungs-Lücken in Mehr-Agenten-Umgebungen durch abgestufte, kollaborative Curriculum-Generierung.
- Beschleunigt Lernen und hebt Erfolgsraten in klassischen Sparse-Reward-Domänen signifikant an. arXiv
https://arxiv.org/abs/2505.07854
- Conceptual Logical Foundations of Artificial Social Intelligence
- Untersucht, welche minimalen mentalen Architekturen Kommunikation, Kooperation und geteilte Intention in Agentengesellschaften erlauben.
- Leitet formale Begriffe für Information, Absicht und Koordination ab und verknüpft sie logisch.
- Legt theoretische Fundamente für das Design künstlicher sozialer Intelligenz. arXiv
https://arxiv.org/abs/2505.07847
- Towards Autonomous UAV Visual Object Search in City Space: Benchmark & Agentic Methodology
- Veröffentlicht die CityAVOS-Benchmark (2 420 Missionen) für urbane Objekt-Suche mit Drohnen.
- Entwickelt den dreistufigen PRPSearcher-Agenten (Wahrnehmung → Reasoning → Planung) auf Multi-Modal-LLM-Basis.
- Steigert Erfolgsrate (+37 %) und Effizienz deutlich gegenüber bestehenden Verfahren. arXiv
https://arxiv.org/abs/2505.08765
- The Truth Becomes Clearer Through Debate! Multi-Agent Systems with LLMs Unmask Fake News
- Lässt mehrere LLM-Agenten kontrovers über News-Artikel debattieren und nutzt Argument-Konsistenz zur Fake-News-Erkennung.
- Erhöht Interpretierbarkeit, weil Entscheidungswege über Pro-/Contra-Argumente transparent werden.
- Übertrifft klassische Klassifikatoren bei Erkennungsrate und Generalisation. arXiv
https://arxiv.org/abs/2505.08532
- Scaling Multi-Agent Reinforcement Learning for Underwater Acoustic Tracking via Autonomous Vehicles
- Modelliert Flotten von AUVs, die per MARL kooperativ Schallquellen verfolgen und Kommunikationseinschränkungen meistern.
- Führt skalierbare Lern- und Koordinationsstrategien für hohe Agentenzahlen unter Wasser ein.
- Belegt robuste Tracking-Performance trotz rauer akustischer Bedingungen. arXiv
https://arxiv.org/abs/2505.08222
- PRISM: Complete Online Decentralized Multi-Agent Pathfinding with Rapid Information Sharing
- Entwickelt ein echtzeitfähiges De-zentralverfahren, das Bewegungs-Constraints zur schnellen Konfliktauflösung überträgt.
- Garantiert Deadlock-Freiheit und skaliert auf weit höhere Agentenzahlen als CBS oder TPTS.
- Verkürzt Planungszeit bei gleicher Lösungsqualität erheblich. arXiv
https://arxiv.org/abs/2505.08025
- Moving From Monolithic to Microservices Architecture for Multi-Agent Systems
- Vergleicht monolithische gegen mikroservice-basierte MAS-Implementierungen hinsichtlich Skalierbarkeit und Wartbarkeit.
- Zeigt, wie lose Kopplung, Service-Discovery und Container-Orchestrierung Agentensysteme resilienter machen.
- Liefert Migrations-Guidelines und Performance-Metriken aus Fallstudien. arXiv
https://arxiv.org/abs/2505.07838
- Intelligent Product 3.0: Decentralised AI Agents and Web3 Intelligence Standards
- Definiert Identitäts-, Kommunikations- und Daten-Standards für autonome Produkt-Agenten in dezentralen Wertschöpfungsnetzen.
- Verknüpft Web3-Technologien (DIDs, Smart Contracts) mit Agent-Interoperabilität und Lifecycle-Management.
- Zielt auf durchgängig selbstorganisierte, vertrauenswürdige Liefer- und Service-Ketten. arXiv
https://arxiv.org/abs/2505.07835
- RAN Cortex: Memory-Augmented Intelligence for Context-Aware Decision-Making in AI-Native Networks
- Stattet Agenten mit rekurrentem Assoziativ-Gedächtnis aus, um vergangene Netz-Kontexte abrufbar zu halten.
- Verbindet Erinnerungs-Retrieval mit gegenwärtiger Beobachtung für schnellere, präzisere Entscheidungen.
- Demonstriert geringere Latenz und höhere Genauigkeit in Netzwerk-Management-Szenarien. arXiv
https://arxiv.org/abs/2505.07842
Liste der arXiv-Veröffentlichungen vom 13. Mai 2025 zu KI-Agenten und Multi-Agenten-Frameworks
1. Agent RL Scaling Law: Agent RL with Spontaneous Code Execution for Mathematical Problem Solving
- Beschreibung:
- Einführung eines neuen Reinforcement-Learning-Ansatzes für KI-Agenten zur Lösung mathematischer Probleme durch spontane Code-Generierung.
- Ein Skalierungsgesetz wird vorgeschlagen, das die Effizienz und Genauigkeit im Vergleich zu traditionellen Methoden steigert.
- Experimentelle Ergebnisse belegen die Überlegenheit dieses Ansatzes.
- Link zum Paper
2. Emotion-Gradient Metacognitive RSI (Part I): Theoretical Foundations and Single-Agent Architecture
- Beschreibung:
- Vorstellung einer metakognitiven Architektur für einzelne KI-Agenten, die auf Emotionsgradienten basiert.
- Ermöglicht Agenten, ihr Verhalten dynamisch anzupassen, inspiriert von menschlichen Prozessen.
- Ziel ist die Verbesserung der Leistung in dynamischen Umgebungen.
- Link zum Paper
3. Belief Injection for Epistemic Control in Linguistic State Space
- Beschreibung:
- Methode zur Integration von Glaubensüberzeugungen in KI-Agenten zur Verbesserung der epistemischen Kontrolle.
- Steigert die Reasoning- und Kommunikationsfähigkeit in sprachlichen Umgebungen.
- Besonders nützlich für Multi-Agenten-Systeme.
- Link zum Paper
4. S-GRPO: Early Exit via Reinforcement Learning in Reasoning Models
- Beschreibung:
- Einführung eines RL-Algorithmus für frühzeitige Ausstiege im Reasoning-Prozess von KI-Agenten.
- Reduziert Rechenkosten bei gleichbleibender Genauigkeit durch schnellere Entscheidungen.
- Ideal für effiziente Agenten-Modelle.
- Link zum Paper
5. YuLan-OneSim: Towards the Next Generation of Social Simulator with Large Language Models
- Beschreibung:
- Soziales Simulationsframework mit großen Sprachmodellen für realistische Multi-Agenten-Interaktionen.
- Simuliert komplexe Szenarien wie Verhandlungen oder Gruppenentscheidungen.
- Potenzial für soziale Dynamiken und Agenten-Training.
- Link zum Paper
6. Architectural Precedents for General Agents using Large Language Models
- Beschreibung:
- Untersuchung von Architekturen für allgemeine KI-Agenten mit großen Sprachmodellen.
- Analyse historischer Designs und Vorschlag neuer Ansätze für vielseitige Agenten.
- Fokus auf Reasoning und Entscheidungsfindung.
- Link zum Paper
7. Arbitrarily Applicable Same/Opposite Relational Responding with NARS
- Beschreibung:
- Nutzung des Non-Axiomatic Reasoning Systems (NARS) für flexible relationale Antworten.
- Ermöglicht kontextabhängige Verallgemeinerungen in Multi-Agenten-Systemen.
- Relevant für relationale Konzeptverarbeitung.
- Link zum Paper
8. DialogueReason: Rule-Based RL Sparks Dialogue Reasoning in LLMs
- Beschreibung:
- Framework zur Verbesserung des Dialog-Reasonings in großen Sprachmodellen durch regelbasiertes RL.
- Steigert Kohärenz und Relevanz generierter Dialoge.
- Skalierbar für dialogbasierte Anwendungen.
- Link zum Paper
9. A Multi-Agent Reinforcement Learning Approach for Cooperative Air-Ground-Human Crowdsensing in Emergency Rescue
- Beschreibung:
- Multi-Agenten-RL-Ansatz zur Koordination von Luft-, Boden- und menschlichen Agenten in Rettungsszenarien.
- Fördert Informationsaustausch und gemeinsame Entscheidungen.
- Verbessert Effizienz bei Rettungsmissionen.
- Link zum Paper
10. Web-Bench: A LLM Code Benchmark Based on Web Standards and Frameworks
- Beschreibung:
- Benchmark zur Bewertung der Programmierfähigkeiten großer Sprachmodelle in der Webentwicklung.
- Testet Code-Generierung für KI-Agenten und Multi-Agenten-Frameworks.
- Umfassende Evaluierung aktueller Modelle.
- Link zum Paper
11. RAI: Flexible Agent Framework for Embodied AI
- Beschreibung:
- Flexibles Framework für verkörperte KI-Agenten mit hoher Anpassungsfähigkeit.
- Unterstützt Einzel- und Multi-Agenten-Szenarien mit sensorischer Wahrnehmung.
- Effektivität in Benchmark-Tests nachgewiesen.
- Link zum Paper
12. Open Challenges in Multi-Agent Security: Towards Secure Systems of Interacting AI Agents
- Beschreibung:
- Analyse offener Sicherheitsherausforderungen in Multi-Agenten-Systemen.
- Vorschläge zur Verbesserung von Robustheit und Vertrauenswürdigkeit.
- Relevant für sicherheitskritische Anwendungen.
- Link zum Paper
13. AI Hiring with LLMs: A Context-Aware and Multi-Agent Framework for Resume Screening
- Beschreibung:
- Multi-Agenten-Framework zur kontextbewussten Analyse von Lebensläufen.
- Verbessert die Effizienz und Genauigkeit im Rekrutierungsprozess.
- Basierend auf großen Sprachmodellen.
- Link zum Paper
14. Multi-agent Embodied AI: Advances and Future Directions
- Beschreibung:
- Überblick über Fortschritte und zukünftige Richtungen in der verkörperten Multi-Agenten-KI.
- Betonung von Koordination und Kommunikation.
- Identifikation von Schlüsselherausforderungen.
- Link zum Paper
15. AI Agents vs. Agentic AI: A Conceptual Taxonomy, Application Mapping, and Future Directions
- Beschreibung:
- Taxonomie zur Unterscheidung von KI-Agenten und agentischer KI.
- Analyse aktueller Forschung und zukünftiger Potenziale.
- Hilfreich für konzeptionelles Verständnis.
- Link zum Paper
16. A Multi-Agent System to Find Top Innovative ArXiv Papers
- Beschreibung:
- Multi-Agenten-System zur Identifikation innovativer arXiv-Papers.
- Nutzt große Sprachmodelle für Analyse und Ranking.
- Automatisiert den Forschungsprozess.
- Link zum Paper
17. Enhancing Diagnostic Capability with Multi-Agents Conversation (MAC) Framework
- Beschreibung:
- Multi-Agenten-Gesprächsframework für diagnostische Aufgaben in der Klinik.
- Fördert kollaborative Diagnosen durch Informationsaustausch.
- Verbessert Genauigkeit und Effizienz.
- Link zum Paper
18. Amazon’s MARCO Framework Revolutionizes Task Automation with Multi-Agent Systems
- Beschreibung:
- MARCO-Framework von Amazon zur Automatisierung komplexer Aufgaben.
- Koordination mehrerer Agenten für höhere Effizienz.
- Potenzial für branchenweite Anwendungen.
- Link zum Paper
19. A Visual Guide to LLM Agents: Exploring Multi-Agent Frameworks
- Beschreibung:
- Visueller Leitfaden zu LLM-Agenten mit über 60 Visualisierungen.
- Untersucht Komponenten und Multi-Agenten-Frameworks.
- Nützlich für Forscher und Praktiker.
- Link zum Paper
20. MASS: Multi-Agent Simulation Scaling for Portfolio Construction
- Beschreibung:
- Simulationsframework für Portfolio-Konstruktion mit Multi-Agenten.
- Verbessert Skalierung und Effizienz mit LLMs.
- Unterstützt Finanzanwendungen.
- Link zum Paper
21. TAMA: A Human-AI Collaborative Thematic Analysis Framework using Multi-Agent LLMs
- Beschreibung:
- Framework für thematische Analyse klinischer Interviews mit Multi-Agenten.
- Kollaboration von Menschen und KI für qualitative Daten.
- Anwendung in medizinischer Forschung.
- Link zum Paper
22. Multi-Agent Path Finding For Large Agents Is Intractable
- Beschreibung:
- Untersuchung der Intractability von Multi-Agenten-Pfadfindung für große Agenten.
- Diskussion theoretischer und praktischer Implikationen.
- Relevanz für komplexe Umgebungen.
- Link zum Paper
23. Future of AI Research: Integrating Generative AI and LLMs in Multi-Agent Systems
- Beschreibung:
- Evolution von Multi-Agenten-Systemen mit generativer KI und LLMs.
- Betonung autonomer Problemlösung.
- Zukünftige Forschungsrichtungen.
- Link zum Paper
24. A Survey on LLM-based Multi-Agent Systems: Workflow, Applications, and Challenges
- Beschreibung:
- Umfassende Übersicht über LLM-basierte Multi-Agenten-Systeme.
- Diskussion von Arbeitsabläufen, Anwendungen und Herausforderungen.
- Einblicke in Trends und Entwicklungen.
- Link zum Paper
Liste der arXiv-Veröffentlichungen vom 12. Mai 2025 zu KI-Agenten und Multi-Agenten-Frameworks
- Internet of Agents: Fundamentals, Applications, and Challenges
- Stellt das Konzept eines „Internet of Agents“ vor, das heterogene Agenten über ein hierarchisches, agentenzentriertes Netzwerk verbindet.
- Analysiert Kernfunktionen wie Capability-Discovery, adaptive Kommunikationsprotokolle und Konsens-Mechanismen.
- Identifiziert offene Forschungsfelder für resiliente, vertrauenswürdige IoA-Ökosysteme. arXiv
https://arxiv.org/abs/2505.07176
- UAV-CodeAgents: Scalable UAV Mission Planning via Multi-Agent ReAct and Vision-Language Reasoning
- Entwickelt ein Multi-Agenten-Framework, das LLMs/VLMs nutzt, um per ReAct-Loop Satellitenbilder zu analysieren und UAV-Routen zu erzeugen.
- Führt ein Vision-basiertes Pixel-Pointing für präzises Ziel-Lokalisieren und einen iterativen Reflexionszyklus für dynamische Anpassungen ein.
- Erzielt in groß-skaligen Feuer-Szenarien eine Erfolgsquote von 93 % bei durchschnittlich 97 s Missionsplanungszeit. arXiv
https://arxiv.org/abs/2505.07236
- DARLR: Dual-Agent Offline Reinforcement Learning for Recommender Systems with Dynamic Reward
- Kombiniert einen „Selector“- und einen „Recommender“-Agenten, um Weltmodelle mit ungenauen Belohnungen während des Lernens adaptiv zu aktualisieren.
- Passt Unsicherheits-Penalitäten dynamisch an und formt Belohnungen on-the-fly für robustere Politik-Lernen.
- Übertrifft starke Offline-RL-Baselines auf vier gängigen Recommender-Datensätzen deutlich. arXiv
https://arxiv.org/abs/2505.07257
- Multi-Agent DRL for Multi-Objective Twin Migration Routing with Workload Prediction in 6G-enabled IoV
- Formuliert die Migration digitaler Fahrzeug-Zwillinge als Multi-Agenten-Optimierung mit widersprüchlichen Zielen.
- Kombiniert LSTM-Transformer-Workload-Prognosen mit einem Dynamic-Mask-MAPPO-Ansatz für Routenwahl.
- Reduziert Migration-Latenz um ≈21 % und Paketverlust um ≈75 % gegenüber klassischen DRL-Verfahren. arXiv
https://arxiv.org/abs/2505.07290
- Towards Multi-Agent Reasoning Systems for Collaborative Expertise Delegation
- Untersucht, wie Expertise-Alignment, Kollaborationsparadigma und Skalierung die Leistung von LLM-Agententeams beeinflussen.
- Zeigt, dass diversitätsgetriebenes Wissen-Integrieren strukturierte Workflow-Pipelines übertrifft.
- Gibt praktische Design-Richtlinien für skalierbare Mehr-Agenten-Reasoning-Architekturen. arXiv
https://arxiv.org/abs/2505.07313
- RAI: Flexible Agent Framework for Embodied AI
- Bietet ein ROS 2-kompatibles Framework, das LLMs, Robotik-Stacks und Simulationen nahtlos integriert.
- Unterstützt Rapid Prototyping via Digital-Twin und zeigt Einsatz an echten Robotern sowie in Simulation.
- Erleichtert Aufbau von Systemen mit mehreren verkörperten Agenten und deckt Schwächen der verwendeten LLMs auf. arXiv
https://arxiv.org/abs/2505.07532
- YuLan-OneSim: Towards the Next Generation of Social Simulator with Large Language Models
- Realisiert eine codefreie Plattform, die bis zu 100 000 LLM-Agenten in 50 Szenarien simuliert.
- Ermöglicht evolvierbare Simulationen samt AI-„Sozialforscher“, der Studien autonom plant und auswertet.
- Demonstriert stabile Langzeit-Simulationen und hohe Skalierbarkeit in diversen Sozial-Domänen. arXiv
https://arxiv.org/abs/2505.07581
- AgentFlow: Resilient Adaptive Cloud-Edge Framework for Multi-Agent Coordination
- Führt dezentrale Publish/Subscribe-Kommunikation und many-to-many Service-Election ohne zentralen Server ein.
- Unterstützt Plug-and-Play-Node-Discovery, dynamische Task-Reorganisation und Fehlertoleranz.
- Verbessert Echtzeit-Koordination in heterogenen Cloud-Edge-Umgebungen. arXiv
https://arxiv.org/abs/2505.07603
- Agent RL Scaling Law: Agent RL with Spontaneous Code Execution for Mathematical Problem Solving
- Zeigt, dass in outcome-basiertem RL die Häufigkeit autonomer Code-Ausführung, Antwortlänge und Aufgabengenauigkeit linear mit Trainings-Steps skalieren.
- Stellt „ZeroTIR“ vor, das Basis-LLMs ohne Tool-Demos Code schreiben und ausführen lässt.
- Übertrifft Zero-RL-Baselines auf anspruchsvollen Mathematik-Benchmarks signifikant. arXiv
https://arxiv.org/abs/2505.07773
- Multi-Agent Path Finding via Finite-Horizon Hierarchical Factorization
- Plant Wege rezidierend über kurze Horizonte und gruppiert Agenten dynamisch anhand von Konflikten.
- Verkürzt Time-to-First-Action um bis zu 60 % gegenüber Offline-Algorithmen.
- Skaliert auf große Lager-Szenarien mit hoher Lösungsqualität. arXiv
https://arxiv.org/abs/2505.07779
- PRISM: Complete Online Decentralized Multi-Agent Pathfinding with Rapid Information Sharing using Motion Constraints
- Entwickelt ein dezentralisiertes MT-MAPF-Verfahren mit schnellen Info-Paketen zur Bewegungseinschränkung.
- Löst Deadlocks garantiert, unterstützt 3,4-mal mehr Agenten als CBS und ist bis zu 2,5-mal aufgabenreicher als TPTS.
- Behält Lösungsgüte bei deutlich schnellerer Laufzeit selbst bei geringer Konnektivität. arXiv
https://arxiv.org/abs/2505.08025
- Explainable Reinforcement Learning Agents Using World Models
- Kombiniert Vorwärts- und Rückwärts-World-Models, um Gegenfaktual-Trajektorien und notwendige Umweltzustände für alternative Aktionen zu zeigen.
- Verbessert Benutzer-Verständnis der Agenten-Politik signifikant.
- Zeigt Potenzial, Agentenausführung durch Umwelt-Manipulation steuerbar zu machen. arXiv
https://arxiv.org/abs/2505.08073
- Putting It All into Context: Simplifying Agents with LCLMs
- Prüft, ob komplexe Agenten-Gerüste nötig sind, oder ob ein Langkontext-LM mit geeignetem Prompting reicht.
- Erreicht mit Gemini-1.5-Pro ohne Werkzeuge 38 % SWE-Bench-Score, vergleichbar mit aufwendigen Agenten-Architekturen.
- Zeigt, dass stärkere LCLMs (Gemini-2.5-Pro) sogar 50,8 % erreichen können – ohne zusätzliche Agenten-Komplexität. arXiv
https://arxiv.org/abs/2505.08120
- Multi-source Plume Tracing via Multi-Agent Reinforcement Learning
- Modelliert das Auffinden mehrerer Verschmutzungsquellen in turbulenter Luft mittels sUAS-Schwarm als Partially Observable Markov Game.
- Nutzt LSTM-basierte ADDRQN-Agenten, die Aktions-Historien verarbeiten, um latente Zustände zu schätzen.
- Findet Quellen bei nur 1,29 % Umwelt-Erkundung und schlägt klassische Verfahren deutlich. arXiv
https://arxiv.org/abs/2505.08825
Liste der arXiv-Veröffentlichungen vom 9. Mai 2025 zu KI-Agenten und Multi-Agenten-Frameworks
- Conversational Process Model Redesign
- Beschreibung:
- Untersucht die Neugestaltung von Prozessmodellen durch konversationelle Interaktionen.
- Betont die Rolle von KI-Agenten in der Unterstützung von Prozessmodellierungsaufgaben.
- Diskutiert Herausforderungen in der Integration von konversationellen KI-Systemen.
- Link zum Paper
- Beschreibung:
- EcoAgent: An Efficient Edge-Cloud Collaborative Multi-Agent Framework for Mobile Automation
- Beschreibung:
- Präsentiert ein effizientes Edge-Cloud-Kollaborationsframework für Multi-Agenten-Systeme in der mobilen Automatisierung.
- Betont die Verbesserung der Effizienz und Skalierbarkeit von KI-Agenten in mobilen Umgebungen.
- Diskutiert Anwendungen in der Robotik und autonomen Systemen.
- Link zum Paper
- Beschreibung:
- A Pain Assessment Framework based on multimodal data and Deep Machine Learning methods
- Beschreibung:
- Stellt ein Framework zur Schmerzbewertung vor, das multimodale Daten und tiefe maschinelle Lernmethoden nutzt.
- Betont die Rolle von KI-Agenten in der medizinischen Diagnostik.
- Diskutiert Herausforderungen in der Integration multimodaler Daten.
- Link zum Paper
- Beschreibung:
- Advancing Neural Network Verification through Hierarchical Safety Abstract Interpretation
- Beschreibung:
- Untersucht die Verifikation neuronaler Netze durch hierarchische Sicherheitsabstraktion.
- Betont die Verbesserung der Sicherheit und Zuverlässigkeit von KI-Agenten.
- Diskutiert Anwendungen in sicherheitskritischen Systemen.
- Link zum Paper
- Beschreibung:
- ChemRxivQuest: A Curated Chemistry Question-Answer Database Extracted from ChemRxiv Preprints
- Beschreibung:
- Präsentiert eine kuratierte Chemie-Frage-Antwort-Datenbank, die aus ChemRxiv-Preprints extrahiert wurde.
- Betont die Rolle von KI-Agenten in der Wissensverarbeitung und -extraktion.
- Diskutiert Anwendungen in der chemischen Forschung und Bildung.
- Link zum Paper
- Beschreibung:
- Societal and technological progress as sewing an ever-growing, ever-changing, patchy, and polychrome quilt
- Beschreibung:
- Untersucht den gesellschaftlichen und technologischen Fortschritt als einen Prozess des Nähens eines stetig wachsenden, sich verändernden, patchworkartigen und polychromen Quilts.
- Betont die Rolle von KI-Agenten in der Förderung des Fortschritts.
- Diskutiert Herausforderungen in der Integration von KI in die Gesellschaft.
- Link zum Paper
- Beschreibung:
- MARK: Memory Augmented Refinement of Knowledge
- Beschreibung:
- Präsentiert einen Ansatz zur Verfeinerung von Wissen durch speichererweiterte Methoden.
- Betont die Verbesserung der Wissensrepräsentation in KI-Agenten.
- Diskutiert Anwendungen in der Wissensverarbeitung und -schlussfolgerung.
- Link zum Paper
- Beschreibung:
- Is there a half-life for the success rates of AI agents?
- Beschreibung:
- Untersucht, ob es eine Halbwertszeit für die Erfolgsraten von KI-Agenten gibt.
- Betont die Analyse der Leistung von KI-Agenten über die Zeit.
- Diskutiert Implikationen für die Entwicklung und Optimierung von KI-Systemen.
- Link zum Paper
- Beschreibung:
- Multi-agent Embodied AI: Advances and Future Directions
- Beschreibung:
- Untersucht Fortschritte und zukünftige Richtungen in der Multi-Agenten-verköperten KI.
- Betont die Rolle von Multi-Agenten-Systemen in der verkörperten KI.
- Diskutiert Herausforderungen in der Entwicklung von verkörperten KI-Agenten.
- Link zum Paper
- Beschreibung:
- A Neuro-Symbolic Framework for Sequence Classification with Relational and Temporal Knowledge
- Beschreibung:
- Präsentiert einen neuro-symbolischen Rahmen für die Sequenzklassifikation mit relationalem und temporalem Wissen.
- Betont die Integration von neuronalen und symbolischen Methoden in KI-Agenten.
- Diskutiert Anwendungen in der Sequenzanalyse und -vorhersage.
- Link zum Paper
- Beschreibung:
- Enhancing Reinforcement Learning for the Floorplanning of Analog ICs with Beam Search
- Beschreibung:
- Untersucht die Verbesserung des Verstärkungslernens für das Floorplanning analoger ICs durch Beam Search.
- Betont die Rolle von KI-Agenten in der Optimierung von Schaltungsdesigns.
- Diskutiert Herausforderungen in der Anwendung von Verstärkungslernen in der Elektronik.
- Link zum Paper
- Beschreibung:
- A Reputation System for Large Language Model-based Multi-agent Systems to Avoid the Tragedy of the Commons
- Beschreibung:
- Präsentiert ein Reputationssystem für Multi-Agenten-Systeme basierend auf großen Sprachmodellen, um das Problem der „Tragedy of the Commons“ zu vermeiden.
- Betont die Verbesserung der Kooperation und Effizienz in Multi-Agenten-Systemen.
- Diskutiert Anwendungen in der Ressourcenverwaltung und -allokation.
- Link zum Paper
- Beschreibung:
- Foam-Agent: Towards Automated Intelligent CFD Workflows
- Beschreibung:
- Untersucht die Automatisierung intelligenter CFD-Workflows durch KI-Agenten.
- Betont die Verbesserung der Effizienz und Genauigkeit von CFD-Simulationen.
- Diskutiert Anwendungen in der Ingenieurwissenschaft und Produktentwicklung.
- Link zum Paper
- Beschreibung:
- Position: The AI Conference Peer Review Crisis Demands Author Feedback and Reviewer Rewards
- Beschreibung:
- Analysiert die Krise im Peer-Review-Prozess von KI-Konferenzen und fordert Feedback von Autoren und Belohnungen für Reviewer.
- Betont die Rolle von KI-Agenten in der Verbesserung des Review-Prozesses.
- Diskutiert Herausforderungen in der Qualitätssicherung von KI-Forschung.
- Link zum Paper
- Beschreibung:
- Position: Epistemic Artificial Intelligence is Essential for Machine Learning Models to Know When They Do Not Know
- Beschreibung:
- Betont die Notwendigkeit epistemischer KI für maschinelle Lernmodelle, um zu erkennen, wann sie nicht wissen.
- Diskutiert die Rolle von KI-Agenten in der Unsicherheitsbewertung.
- Untersucht Implikationen für die Entwicklung von zuverlässigen KI-Systemen.
- Link zum Paper
- Beschreibung:
- Belief Filtering for Epistemic Control in Linguistic State Space
- Beschreibung:
- Präsentiert einen Ansatz zur Glaubensfilterung für epistemische Kontrolle im linguistischen Zustandsraum.
- Betont die Verbesserung der Entscheidungsfindung von KI-Agenten durch Glaubensfilterung.
- Diskutiert Anwendungen in der natürlichen Sprachverarbeitung und Dialogsystemen.
- Link zum Paper
- Beschreibung:
- Enigme: Generative Text Puzzles for Evaluating Reasoning in Language Models
- Beschreibung:
- Stellt generative Textpuzzles zur Bewertung des Reasoning in Sprachmodellen vor.
- Betont die Rolle von KI-Agenten in der Lösung von Textpuzzles.
- Diskutiert Herausforderungen in der Bewertung von Reasoning-Fähigkeiten.
- Link zum Paper
- Beschreibung:
- CRAFT: Cultural Russian-Oriented Dataset Adaptation for Focused Text-to-Image Generation
- Beschreibung:
- Präsentiert eine kulturell russisch-orientierte Datensatzadaption für fokussierte Text-zu-Bild-Generierung.
- Betont die Rolle von KI-Agenten in der Generierung kulturell spezifischer Inhalte.
- Diskutiert Anwendungen in der kreativen KI und Kunst.
- Link zum Paper
- Beschreibung:
- Large Language Models are Autonomous Cyber Defenders
- Beschreibung:
- Untersucht die Rolle großer Sprachmodelle als autonome Cyber-Verteidiger.
- Betont die Verbesserung der Cybersicherheit durch KI-Agenten.
- Diskutiert Herausforderungen in der Entwicklung von autonomen Verteidigungssystemen.
- Link zum Paper
- Beschreibung:
- Is there Value in Reinforcement Learning?
- Beschreibung:
- Analysiert den Wert des Verstärkungslernens in der KI-Forschung.
- Betont die Rolle von Verstärkungslernen in der Entwicklung von KI-Agenten.
- Diskutiert Herausforderungen und zukünftige Richtungen in diesem Bereich.
- Link zum Paper
- Beschreibung:
- The Promise and Limits of LLMs in Constructing Proofs and Hints for Logic Problems in Intelligent Tutoring Systems
- Beschreibung:
- Untersucht die Versprechen und Grenzen großer Sprachmodelle (LLMs) bei der Konstruktion von Beweisen und Hinweisen für Logikprobleme in intelligenten Tutoring-Systemen.
- Betont die Rolle von LLMs in der Unterstützung von Lernprozessen.
- Diskutiert Herausforderungen in der Integration von LLMs in Bildungstechnologien.
- Link zum Paper
- Beschreibung:
- Dynamic Location Search for Identifying Maximum Weighted Independent Sets in Complex Networks
- Beschreibung:
- Präsentiert einen dynamischen Standortsuchansatz zur Identifizierung maximal gewichteter unabhängiger Mengen in komplexen Netzwerken.
- Betont die Rolle von KI-Agenten in der Netzwerkanalyse.
- Diskutiert Anwendungen in der Optimierung und Ressourcenallokation.
- Link zum Paper
- Beschreibung:
- Computational Irreducibility as the Foundation of Agency: A Formal Model Connecting Undecidability to Autonomous Behavior in Complex Systems
- Beschreibung:
- Untersucht die computationale Irreduzibilität als Grundlage für Agency in komplexen Systemen.
- Betont die Verbindung zwischen Unentscheidbarkeit und autonomem Verhalten.
- Diskutiert Implikationen für die Entwicklung von autonomen KI-Agenten.
- Link zum Paper
- Beschreibung:
- Towards Artificial Intelligence Research Assistant for Expert-Involved Learning
- Beschreibung:
- Präsentiert einen Ansatz zur Entwicklung eines KI-Forschungsassistenten für expertenbeteiligtes Lernen.
- Betont die Rolle von KI-Agenten in der Unterstützung von Forschungsprozessen.
- Diskutiert Herausforderungen in der Integration von KI in die Forschung.
- Link zum Paper
- Beschreibung:
Liste der arXiv-Veröffentlichungen vom 8. Mai 2025 zu KI-Agenten und Multi-Agenten-Frameworks
- Qualitative Analysis of -Regular Objectives on Robust MDPs
- Beschreibung:
- Untersucht qualitative Eigenschaften von -regulären Zielen in robusten Markov-Entscheidungsprozessen (MDPs).
- Betont die Analyse von KI-Agenten in unsicheren Umgebungen.
- Diskutiert Implikationen für die Entwicklung robuster Entscheidungsstrategien.
- Link zum Paper
- Beschreibung:
- Beyond Theorem Proving: Formulation, Framework and Benchmark for Formal Problem-Solving
- Beschreibung:
- Präsentiert einen Rahmen und Benchmark für formales Problemlösen jenseits des Theorembeweises.
- Betont die Rolle von KI-Agenten in der formalen Problemlösung.
- Diskutiert Herausforderungen und zukünftige Richtungen in der formalen KI-Forschung.
- Link zum Paper
- Beschreibung:
- On some improvements to Unbounded Minimax
- Beschreibung:
- Untersucht Verbesserungen am Unbounded Minimax-Algorithmus.
- Betont die Optimierung von Suchalgorithmen für KI-Agenten.
- Diskutiert Anwendungen in der Spieltheorie und Entscheidungsfindung.
- Link zum Paper
- Beschreibung:
- TrajEvo: Designing Trajectory Prediction Heuristics via LLM-driven Evolution
- Beschreibung:
- Präsentiert einen Ansatz zur Gestaltung von Trajektorienvorhersage-Heuristiken mithilfe von großen Sprachmodellen (LLMs).
- Betont die Rolle von LLMs in der Evolution von Heuristiken für KI-Agenten.
- Diskutiert Anwendungen in der Robotik und autonomen Systemen.
- Link zum Paper
- Beschreibung:
- Uncertain Machine Ethics Planning
- Beschreibung:
- Untersucht die Planung von Maschinenethik unter Unsicherheit.
- Betont die Entwicklung ethischer KI-Agenten in unsicheren Umgebungen.
- Diskutiert Herausforderungen in der Integration von Ethik in KI-Systeme.
- Link zum Paper
- Beschreibung:
- Mastering Multi-Drone Volleyball through Hierarchical Co-Self-Play Reinforcement Learning
- Beschreibung:
- Präsentiert einen Ansatz zur Beherrschung von Multi-Drohnen-Volleyball durch hierarchisches Co-Self-Play-Verstärkungslernen.
- Betont die Rolle von Multi-Agenten-Systemen in der Koordination von Drohnen.
- Diskutiert Anwendungen in der Robotik und autonomen Systemen.
- Link zum Paper
- Beschreibung:
- KERAIA: An Adaptive and Explainable Framework for Dynamic Knowledge Representation and Reasoning
- Beschreibung:
- Stellt einen adaptiven und erklärbaren Rahmen für dynamische Wissensrepräsentation und -schlussfolgerung vor.
- Betont die Verbesserung der Interpretierbarkeit und Anpassungsfähigkeit von KI-Agenten.
- Diskutiert Anwendungen in der Wissensverarbeitung und Entscheidungsfindung.
- Link zum Paper
- Beschreibung:
- Flow Models for Unbounded and Geometry-Aware Distributional Reinforcement Learning
- Beschreibung:
- Untersucht Flussmodelle für unbegrenztes und geometriebewusstes distributional Verstärkungslernen.
- Betont die Rolle von Flussmodellen in der Verbesserung von KI-Agenten.
- Diskutiert Herausforderungen in der Entwicklung von distributional Verstärkungslernalgorithmen.
- Link zum Paper
- Beschreibung:
- Polynomial-Time Relational Probabilistic Inference in Open Universes
- Beschreibung:
- Präsentiert einen polynomzeitlichen Ansatz für relationale probabilistische Inferenz in offenen Universen.
- Betont die Skalierbarkeit und Effizienz von KI-Agenten in großen Wissensbasen.
- Diskutiert Anwendungen in der Wissensrepräsentation und -schlussfolgerung.
- Link zum Paper
- Beschreibung:
- Extending Decision Predicate Graphs for Comprehensive Explanation of Isolation Forest
- Beschreibung:
- Erweitert Entscheidungsprädikatgraphen zur umfassenden Erklärung von Isolation Forest-Algorithmen.
- Betont die Verbesserung der Interpretierbarkeit von KI-Agenten in der Anomalieerkennung.
- Diskutiert Herausforderungen in der Erklärung von komplexen KI-Modellen.
- Link zum Paper
- Beschreibung:
- An alignment safety case sketch based on debate
- Beschreibung:
- Skizziert einen Sicherheitsfall für Alignment basierend auf Debatten.
- Betont die Rolle von Debatten in der Entwicklung sicherer KI-Agenten.
- Diskutiert Implikationen für die Alignment-Forschung und -Praxis.
- Link zum Paper
- Beschreibung:
- LogiDebrief: A Signal-Temporal Logic based Automated Debriefing Approach with Large Language Models Integration
- Beschreibung:
- Präsentiert einen automatisierten Debriefing-Ansatz basierend auf signal-temporaler Logik und Integration großer Sprachmodelle.
- Betont die Verbesserung der Nachbesprechung von KI-Agenten durch logische und sprachliche Modelle.
- Diskutiert Anwendungen in der Analyse und Optimierung von Agentenverhalten.
- Link zum Paper
- Beschreibung:
- X-Reasoner: Towards Generalizable Reasoning Across Modalities and Domains
- Beschreibung:
- Untersucht einen generalisierbaren Reasoning-Ansatz über verschiedene Modalitäten und Domänen hinweg.
- Betont die Rolle von KI-Agenten in der multimodalen und domänenübergreifenden Schlussfolgerung.
- Diskutiert Herausforderungen in der Entwicklung von generalisierbaren KI-Systemen.
- Link zum Paper
- Beschreibung:
- The Power of Stories: Narrative Priming Shapes How LLM Agents Collaborate and Compete
- Beschreibung:
- Analysiert, wie narratives Priming die Zusammenarbeit und Konkurrenz von LLM-basierten Agenten beeinflusst.
- Betont die Rolle von Geschichten in der Steuerung von Agentenverhalten.
- Diskutiert Implikationen für die Entwicklung von kooperativen und kompetitiven KI-Systemen.
- Link zum Paper
- Beschreibung:
- Frog Soup: Zero-Shot, In-Context, and Sample-Efficient Frogger Agents
- Beschreibung:
- Präsentiert einen Ansatz zur Entwicklung von Frogger-Agenten mit Zero-Shot, In-Context und Sample-Efficient Lernen.
- Betont die Verbesserung der Lerneffizienz von KI-Agenten in Spielszenarien.
- Diskutiert Anwendungen in der Spiel-KI und Verstärkungslernen.
- Link zum Paper
- Beschreibung:
- GRAML: Dynamic Goal Recognition As Metric Learning
- Beschreibung:
- Stellt einen Ansatz zur dynamischen Zielerkennung als metrisches Lernen vor.
- Betont die Verbesserung der Zielerkennung in Multi-Agenten-Systemen.
- Diskutiert Anwendungen in der Verhaltensanalyse und Planung.
- Link zum Paper
- Beschreibung:
- Design description of Wisdom Computing Persperctive
- Beschreibung:
- Beschreibt das Design von Wisdom Computing aus einer Perspektive der KI-Agenten.
- Betont die Integration von Weisheit und Intelligenz in KI-Systemen.
- Diskutiert Herausforderungen in der Entwicklung von weisen KI-Agenten.
- Link zum Paper
- Beschreibung:
- Proceedings of 1st Workshop on Advancing Artificial Intelligence through Theory of Mind
- Beschreibung:
- Sammelt Beiträge zum Workshop über die Förderung der KI durch Theory of Mind.
- Betont die Rolle von Theory of Mind in der Entwicklung von sozialen KI-Agenten.
- Diskutiert aktuelle Forschung und zukünftige Richtungen in diesem Bereich.
- Link zum Paper
- Beschreibung:
Liste der arXiv-Veröffentlichungen vom 7. Mai 2025 zu KI-Agenten und Multi-Agenten-Frameworks
- Graph Drawing for LLMs: An Empirical Evaluation
- Beschreibung:
- Untersucht die Anwendung von Graph-Drawing-Techniken zur Visualisierung von großen Sprachmodellen (LLMs).
- Betont die Verbesserung der Interpretierbarkeit und Analyse von LLMs durch graphische Darstellungen.
- Diskutiert Herausforderungen und zukünftige Richtungen in der Visualisierung von KI-Modellen.
- Link zum Paper
- Beschreibung:
- Gap the (Theory of) Mind: Sharing Beliefs About Teammates‘ Goals Boosts Collaboration Perception, Not Performance
- Beschreibung:
- Untersucht die Auswirkungen des Teilens von Überzeugungen über die Ziele von Teammitgliedern auf die Wahrnehmung und Leistung in kollaborativen Szenarien.
- Betont die Rolle von Theory of Mind in Multi-Agenten-Systemen.
- Diskutiert Implikationen für die Entwicklung von kooperativen KI-Agenten.
- Link zum Paper
- Beschreibung:
- Learning Symbolic Persistent Macro-Actions for POMDP Solving Over Time
- Beschreibung:
- Präsentiert einen Ansatz zum Lernen symbolischer persistenter Makroaktionen zur Lösung von POMDPs über die Zeit.
- Betont die Verbesserung der Planungseffizienz in unsicheren Umgebungen durch Makroaktionen.
- Diskutiert Anwendungen in der Robotik und autonomen Systemen.
- Link zum Paper
- Beschreibung:
- BURNS: Backward Underapproximate Reachability for Neural-Feedback-Loop Systems
- Beschreibung:
- Stellt eine Methode zur Berechnung der rückwärtsgerichteten unterapproximierten Erreichbarkeit für Systeme mit neuronalen Rückkopplungsschleifen vor.
- Betont die Sicherheit und Verifikation von KI-gesteuerten Systemen.
- Diskutiert Herausforderungen in der Analyse von komplexen dynamischen Systemen.
- Link zum Paper
- Beschreibung:
- Synthesizing Images on Perceptual Boundaries of ANNs for Uncovering and Manipulating Human Perceptual Variability
- Beschreibung:
- Untersucht die Synthese von Bildern an den perzeptuellen Grenzen künstlicher neuronaler Netze (ANNs) zur Enthüllung und Manipulation menschlicher perzeptueller Variabilität.
- Betont die Rolle von KI-Agenten in der Erforschung menschlicher Wahrnehmung.
- Diskutiert Implikationen für die Entwicklung von KI-Systemen, die menschliche Wahrnehmung nachahmen.
- Link zum Paper
- Beschreibung:
- OSUniverse: Benchmark for Multimodal GUI-navigation AI Agents
- Beschreibung:
- Präsentiert einen Benchmark für multimodale GUI-Navigations-KI-Agenten.
- Betont die Bewertung von Agenten in der Interaktion mit grafischen Benutzeroberflächen.
- Diskutiert Herausforderungen und zukünftige Richtungen in der Entwicklung von multimodalen Agenten.
- Link zum Paper
- Beschreibung:
- A Hashgraph-Inspired Consensus Mechanism for Reliable Multi-Model Reasoning
- Beschreibung:
- Stellt einen von Hashgraph inspirierten Konsensmechanismus für zuverlässiges Multi-Modell-Reasoning vor.
- Betont die Verbesserung der Zuverlässigkeit und Effizienz in Multi-Agenten-Systemen.
- Diskutiert Anwendungen in verteilten KI-Systemen und Blockchain-Technologien.
- Link zum Paper
- Beschreibung:
- STORY2GAME: Generating (Almost) Everything in an Interactive Fiction Game
- Beschreibung:
- Untersucht die Generierung von Inhalten für interaktive Fiktionsspiele mithilfe von KI-Agenten.
- Betont die Automatisierung der Erstellung von Spielwelten und Narrativen.
- Diskutiert Herausforderungen in der Entwicklung von kreativen KI-Systemen.
- Link zum Paper
- Beschreibung:
- am-ELO: A Stable Framework for Arena-based LLM Evaluation
- Beschreibung:
- Präsentiert ein stabiles Framework zur Bewertung von großen Sprachmodellen (LLMs) in arenabasierten Szenarien.
- Betont die Verbesserung der Bewertungsmethoden für LLMs durch Wettbewerbssimulationen.
- Diskutiert Implikationen für die Entwicklung und Optimierung von LLMs.
- Link zum Paper
- Beschreibung:
- The Steganographic Potentials of Language Models
- Beschreibung:
- Untersucht das Potenzial von Sprachmodellen für steganographische Anwendungen.
- Betont die Rolle von KI-Agenten in der verdeckten Kommunikation.
- Diskutiert Sicherheitsrisiken und ethische Überlegungen.
- Link zum Paper
- Beschreibung:
- Procedural Memory Is Not All You Need: Bridging Cognitive Gaps in LLM-Based Agents
- Beschreibung:
- Analysiert die Rolle des prozeduralen Gedächtnisses in auf großen Sprachmodellen (LLMs) basierenden KI-Agenten.
- Betont die Notwendigkeit, kognitive Lücken durch zusätzliche Mechanismen zu überbrücken.
- Diskutiert Herausforderungen in der Entwicklung von vollständig autonomen Agenten.
- Link zum Paper
- Beschreibung:
- Validating the Effectiveness of a Large Language Model-based Approach for Identifying Children’s Development across Various Free Play Settings in Kindergarten
- Beschreibung:
- Untersucht die Wirksamkeit eines auf großen Sprachmodellen basierenden Ansatzes zur Identifizierung der kindlichen Entwicklung in verschiedenen freien Spielsettings im Kindergarten.
- Betont die Rolle von KI-Agenten in der pädagogischen Bewertung.
- Diskutiert Implikationen für die frühkindliche Bildung und Entwicklung.
- Link zum Paper
- Beschreibung:
- Domain Adversarial Training for Mitigating Gender Bias in Speech-based Mental Health Detection
- Beschreibung:
- Präsentiert einen Ansatz zur Minderung von Geschlechterbias in der sprachbasierten Erkennung von psychischer Gesundheit durch domänenadversariales Training.
- Betont die Verbesserung der Fairness und Genauigkeit von KI-Agenten in sensiblen Anwendungen.
- Diskutiert Herausforderungen in der Entwicklung von unbiased KI-Systemen.
- Link zum Paper
- Beschreibung:
- AI-Driven Scholarly Peer Review via Persistent Workflow Prompting, Meta-Prompting, and Meta-Reasoning
- Beschreibung:
- Untersucht den Einsatz von KI-gesteuerten Methoden zur Verbesserung des wissenschaftlichen Peer-Review-Prozesses.
- Betont die Rolle von persistentem Workflow-Prompting, Meta-Prompting und Meta-Reasoning in der Automatisierung von Review-Aufgaben.
- Diskutiert Implikationen für die Qualität und Effizienz wissenschaftlicher Publikationen.
- Link zum Paper
- Beschreibung:
- Artificial Behavior Intelligence: Technology, Challenges, and Future Directions
- Beschreibung:
- Untersucht die Technologie, Herausforderungen und zukünftigen Richtungen der künstlichen Verhaltensintelligenz.
- Betont die Entwicklung von KI-Agenten, die menschenähnliches Verhalten nachahmen können.
- Diskutiert Anwendungen in der Robotik, Spieleentwicklung und sozialen Simulationen.
- Link zum Paper
- Beschreibung:
- Capability-Driven Skill Generation with LLMs: A RAG-Based Approach for Reusing Existing Libraries and Interfaces
- Beschreibung:
- Präsentiert einen kapazitätsgetriebenen Ansatz zur Generierung von Fähigkeiten für KI-Agenten mithilfe von großen Sprachmodellen (LLMs) und Retrieval-Augmented Generation (RAG).
- Betont die Wiederverwendung bestehender Bibliotheken und Schnittstellen zur Verbesserung der Agentenleistung.
- Diskutiert Herausforderungen in der Integration und Anpassung von Fähigkeiten.
- Link zum Paper
- Beschreibung:
- RAG-MCP: Mitigating Prompt Bloat in LLM Tool Selection via Retrieval-Augmented Generation
- Beschreibung:
- Stellt einen Ansatz vor, um das Problem des „Prompt Bloat“ in der Werkzeugauswahl für große Sprachmodelle (LLMs) mithilfe von Retrieval-Augmented Generation (RAG) zu mildern.
- Betont die Verbesserung der Effizienz und Genauigkeit von LLMs in agentenbasierten Anwendungen.
- Diskutiert Implikationen für die Entwicklung von skalierbaren KI-Systemen.
- Link zum Paper
- Beschreibung:
- Patterns and Mechanisms of Contrastive Activation Engineering
- Beschreibung:
- Untersucht Muster und Mechanismen der kontrastiven Aktivierungstechnik in KI-Modellen.
- Betont die Rolle dieser Technik in der Verbesserung der Interpretierbarkeit und Leistung von KI-Agenten.
- Diskutiert Anwendungen in der Modellanalyse und -optimierung.
- Link zum Paper
- Beschreibung:
- CombiBench: Benchmarking LLM Capability for Combinatorial Mathematics
- Beschreibung:
- Präsentiert einen Benchmark zur Bewertung der Fähigkeiten großer Sprachmodelle (LLMs) in der kombinatorischen Mathematik.
- Betont die Rolle von LLMs als KI-Agenten in der Lösung komplexer mathematischer Probleme.
- Diskutiert Herausforderungen und zukünftige Richtungen in der mathematischen KI-Forschung.
- Link zum Paper
- Beschreibung:
- Holmes: Automated Fact Check with Large Language Models
- Beschreibung:
- Stellt ein automatisiertes Faktencheck-System vor, das auf großen Sprachmodellen (LLMs) basiert.
- Betont die Rolle von KI-Agenten in der Bekämpfung von Fehlinformationen.
- Diskutiert Herausforderungen in der Genauigkeit und Zuverlässigkeit von automatisierten Faktenchecks.
- Link zum Paper
- Beschreibung:
- Is AI currently capable of identifying wild oysters? A comparison of human annotators against the AI model, ODYSSEE
- Beschreibung:
- Vergleicht die Leistung eines KI-Modells (ODYSSEE) mit menschlichen Annotatoren bei der Identifizierung wilder Austern.
- Betont die Anwendung von KI-Agenten in der Umweltüberwachung und -forschung.
- Diskutiert Herausforderungen in der Entwicklung von KI-Systemen für spezifische Aufgaben.
- Link zum Paper
- Beschreibung:
- BLAB: Brutally Long Audio Bench
- Beschreibung:
- Präsentiert einen Benchmark für die Verarbeitung von extrem langen Audiodaten durch KI-Modelle.
- Betont die Rolle von KI-Agenten in der Analyse und Verarbeitung von langen Audioaufnahmen.
- Diskutiert Herausforderungen in der Skalierbarkeit und Effizienz von KI-Systemen.
- Link zum Paper
- Beschreibung:
- Evaluating the Impact of AI-Powered Audiovisual Personalization on Learner Emotion, Focus, and Learning Outcomes
- Beschreibung:
- Untersucht den Einfluss von KI-gesteuerter audiovisueller Personalisierung auf die Emotionen, den Fokus und die Lernergebnisse von Lernenden.
- Betont die Rolle von KI-Agenten in der adaptiven Bildungstechnologie.
- Diskutiert Implikationen für die Entwicklung von personalisierten Lernumgebungen.
- Link zum Paper
- Beschreibung:
- The Multimodal Paradox: How Added and Missing Modalities Shape Bias and Performance in Multimodal AI
- Beschreibung:
- Analysiert, wie das Hinzufügen oder Entfernen von Modalitäten Bias und Leistung in multimodalen KI-Systemen beeinflusst.
- Betont die Rolle von KI-Agenten in der Verarbeitung multimodaler Daten.
- Diskutiert Herausforderungen in der Entwicklung von robusten und fairen multimodalen Systemen.
- Link zum Paper
- Beschreibung:
- Iterative Resolution of Prompt Ambiguities Using a Progressive Cutting-Search Approach
- Beschreibung:
- Präsentiert einen iterativen Ansatz zur Auflösung von Prompt-Ambiguitäten in KI-Systemen mithilfe einer progressiven Schnitt-Suche.
- Betont die Verbesserung der Genauigkeit und Effizienz von KI-Agenten in der Verarbeitung natürlicher Sprache.
- Diskutiert Anwendungen in der Mensch-Maschine-Interaktion und Dialogsystemen.
- Link zum Paper
- Beschreibung:
Liste der arXiv-Veröffentlichungen vom 6. Mai 2025 zu KI-Agenten und Multi-Agenten-Frameworks
- Agentic Reasoning and Tool Integration for LLMs via Reinforcement Learning
- Beschreibung:
- Untersucht die Integration von agentischem Denken und Werkzeugnutzung in großen Sprachmodellen (LLMs) durch Verstärkungslernen.
- Betont die Verbesserung der Autonomie und Problemlösungsfähigkeiten von LLMs.
- Diskutiert Herausforderungen und zukünftige Richtungen für agentische KI-Systeme.
- Link zum Paper
- Beschreibung:
- A Survey of Robotic Navigation and Manipulation with Physics Simulators in the Era of Embodied AI
- Beschreibung:
- Untersucht die Rolle von Physiksimulatoren in der Navigation und Manipulation von Robotern im Kontext von embodied AI.
- Betont die Bedeutung von Simulationen für das Training von KI-Agenten.
- Diskutiert aktuelle Herausforderungen und zukünftige Entwicklungen in diesem Bereich.
- Link zum Paper
- Beschreibung:
- Safe and Efficient CAV Lane Changing using Decentralised Safety Shields
- Beschreibung:
- Präsentiert einen dezentralen Ansatz für sicheres und effizientes Spurwechseln von vernetzten autonomen Fahrzeugen (CAVs) mithilfe von Sicherheitsabschirmungen.
- Betont die Rolle von Multi-Agenten-Systemen in der Koordination von Fahrzeugbewegungen.
- Diskutiert die Integration von KI-Agenten zur Verbesserung der Verkehrssicherheit.
- Link zum Paper
- Beschreibung:
- A Survey of Agent Interoperability Protocols: Model Context Protocol (MCP), Agent Communication Protocol (ACP), Agent-to-Agent Protocol (A2A), and Agent Network Protocol (ANP)
- Beschreibung:
- Untersucht verschiedene Protokolle für die Interoperabilität von KI-Agenten, einschließlich MCP, ACP, A2A und ANP.
- Betont die Bedeutung von standardisierten Kommunikationsprotokollen für Multi-Agenten-Systeme.
- Diskutiert Herausforderungen und zukünftige Richtungen in der Agentenkommunikation.
- Link zum Paper
- Beschreibung:
- Interpreting Emergent Language Using Inter-Agent Transformers
- Beschreibung:
- Untersucht die Interpretation von emergenter Sprache in Multi-Agenten-Systemen mithilfe von Inter-Agenten-Transformern.
- Betont die Rolle von Transformern in der Verarbeitung und Interpretation von Agentenkommunikation.
- Diskutiert Implikationen für die Entwicklung von kooperativen KI-Agenten.
- Link zum Paper
- Beschreibung:
- El Agente: An Autonomous Agent for Quantum Chemistry
- Beschreibung:
- Präsentiert einen autonomen KI-Agenten für Quantenchemie, der in der Lage ist, komplexe Berechnungen und Analysen durchzuführen.
- Betont die Integration von Wissen und maschinellem Lernen zur Verbesserung der Autonomie.
- Diskutiert Anwendungen in der Materialwissenschaft und Pharmazie.
- Link zum Paper
- Beschreibung:
- Think on your Feet: Adaptive Thinking via Reinforcement Learning for Social Agents
- Beschreibung:
- Untersucht adaptive Denkprozesse in sozialen KI-Agenten mithilfe von Verstärkungslernen.
- Betont die Bedeutung von Flexibilität und Anpassungsfähigkeit in sozialen Interaktionen.
- Diskutiert Herausforderungen und zukünftige Richtungen für soziale KI-Agenten.
- Link zum Paper
- Beschreibung:
- SafeMate: A Model Context Protocol-Based Multimodal Agent for Emergency Preparedness
- Beschreibung:
- Präsentiert einen multimodalen KI-Agenten für die Notfallvorsorge, der auf dem Model Context Protocol (MCP) basiert.
- Betont die Integration von multimodalen Daten zur Verbesserung der Situationsbewertung.
- Diskutiert Anwendungen in der Katastrophenvorsorge und -reaktion.
- Link zum Paper
- Beschreibung:
- MemEngine: A Unified and Modular Library for Developing Advanced Memory of LLM-based Agents
- Beschreibung:
- Präsentiert eine Bibliothek zur Entwicklung fortschrittlicher Speicherfunktionen für auf großen Sprachmodellen (LLMs) basierende KI-Agenten.
- Betont die Modularität und Einheitlichkeit der Bibliothek zur Verbesserung der Agentenleistung.
- Diskutiert Implikationen für die Entwicklung von intelligenten und adaptiven KI-Systemen.
- Link zum Paper
- Beschreibung:
- Leveraging LLMs to Automate Energy-Aware Refactoring of Parallel Scientific Codes
- Beschreibung:
- Untersucht die Automatisierung von energieeffizientem Refactoring paralleler wissenschaftlicher Codes mithilfe von großen Sprachmodellen (LLMs).
- Betont die Rolle von LLMs als KI-Agenten zur Optimierung von Software.
- Diskutiert Herausforderungen und zukünftige Richtungen in der Softwareoptimierung.
- Link zum Paper
- Beschreibung:
- AutoLibra: Agent Metric Induction from Open-Ended Feedback
- Beschreibung:
- Präsentiert einen Ansatz zur Induktion von Metriken für KI-Agenten aus offenem Feedback mithilfe von großen Sprachmodellen.
- Betont die Anpassungsfähigkeit von Agenten an unstrukturierte Rückmeldungen zur Leistungsverbesserung.
- Diskutiert Anwendungen in der Bewertung und Optimierung von KI-Agenten.
- Link zum Paper
- Beschreibung:
- Beyond the model: Key differentiators in large language models and multi-agent services
- Beschreibung:
- Untersucht Unterschiede zwischen großen Sprachmodellen und Multi-Agenten-Diensten in Bezug auf Leistung und Anwendung.
- Betont die Rolle von Multi-Agenten-Systemen bei der Bewältigung komplexer Aufgaben durch Zusammenarbeit.
- Diskutiert zukünftige Trends in der Integration von LLMs und Agenten-Frameworks.
- Link zum Paper
- Beschreibung:
- Leveraging LLM Agents and Digital Twins for Fault Handling in Process Plants
- Beschreibung:
- Präsentiert einen Ansatz zur Fehlerbehandlung in Prozessanlagen durch die Kombination von LLM-basierten Agenten und digitalen Zwillingen.
- Betont die Verbesserung der Entscheidungsfindung durch Echtzeitdaten und autonome Agenten.
- Diskutiert Anwendungen in der Industrie zur Erhöhung der Betriebssicherheit.
- Link zum Paper
- Beschreibung:
- TutorGym: A Testbed for Evaluating AI Agents as Tutors and Students
- Beschreibung:
- Stellt eine Testumgebung vor, um KI-Agenten sowohl als Tutoren als auch als Lernende zu bewerten.
- Betont die Flexibilität des Systems zur Simulation von Lehr- und Lernszenarien mit Agenten.
- Diskutiert Implikationen für die Entwicklung intelligenter Bildungsagenten.
- Link zum Paper
- Beschreibung:
Liste der arXiv-Veröffentlichungen vom 5. Mai 2025 zu KI-Agenten
- Towards Rationality in Language and Multimodal Agents: A Survey
- Beschreibung:
- Untersucht die Rationalität in Sprach- und multimodalen Agenten.
- Bietet einen Überblick über aktuelle Forschungsergebnisse und Herausforderungen.
- Diskutiert die Bedeutung von Rationalität für die Entwicklung fortschrittlicher KI-Systeme.
- Link zum Paper
- Beschreibung:
- AI Agents: Evolution, Architecture, and Real-World Applications
- Beschreibung:
- Untersucht die Evolution, Architektur und realen Anwendungen von KI-Agenten.
- Betont die Bedeutung von Wahrnehmung, Wissensrepräsentation und Handlungsauswahl.
- Hebt Herausforderungen in der Bewertung und Anwendung von Agenten hervor.
- Link zum Paper
- Beschreibung:
- Agentic AI for Scientific Discovery: A Survey of Progress, Challenges, and Future Directions
- Beschreibung:
- Untersucht den Einsatz von agentischer KI in der wissenschaftlichen Entdeckung.
- Diskutiert Fortschritte, Herausforderungen und zukünftige Richtungen.
- Betont die Rolle von Literaturrecherche und Kalibrierungstechniken.
- Link zum Paper
- Beschreibung:
- Thoughts without Thinking: Reconsidering the Explanatory Value of Chain-of-Thought Reasoning in LLMs through Agentic Pipelines
- Beschreibung:
- Analysiert den Erklärungswert von Chain-of-Thought-Reasoning in großen Sprachmodellen (LLMs) durch agentische Pipelines.
- Untersucht, wie agentische Ansätze die Notwendigkeit expliziten Denkens hinterfragen.
- Diskutiert Implikationen für die Entwicklung autonomer KI-Agenten.
- Link zum Paper
- Beschreibung:
- ROSA: A Knowledge-based Solution for Robot Self-Adaptation
- Beschreibung:
- Präsentiert eine wissensbasierte Lösung für die Selbstadaption von Robotern als KI-Agenten.
- Diskutiert die Integration von Wissen zur Verbesserung der Autonomie.
- Betont Anwendungen in der Robotik und deren Anpassungsfähigkeit.
- Link zum Paper
- Beschreibung: