Starten Sie Ihre KI-Reise mit Deutschlands modernster KI-Beratung

Open-Source DeepResearch: Eine Revolution für KI-Agenten?

Von Oliver Welling
KINEWS24.de - Open-Source DeepResearch

Open-Source DeepResearch – BÄM – da zeigt die Community, was Open Soruce Power ist: Am 4. Februar 2025 veröffentlichte OpenAI mit DeepResearch ein bahnbrechendes System, das das Web durchforstet, Inhalte zusammenfasst und Fragen basierend auf diesen Zusammenfassungen beantwortet. Besonders beeindruckend ist die drastische Leistungssteigerung, die DeepResearch im GAIA-Benchmark (General AI Assistants) zeigt – einem anspruchsvollen Test für KI-Assistenten.

Allerdings hat OpenAI nur einen Teil dieser Technologie offengelegt: Das LLM kann ausgewählt werden (z. B. GPT-4o), doch das entscheidende agentische Framework bleibt proprietär. Dieses Framework ermöglicht es der KI, eigenständig Suchvorgänge durchzuführen, Informationen zu verknüpfen und strukturierte Antworten zu generieren.

Daraufhin startete die Open-Source-Community rund um Hugging Face eine Initiative, um eine vergleichbare Technologie zu entwickeln – und das in nur 24 Stunden. Ziel ist es, ein frei verfügbares DeepResearch-ähnliches System zu schaffen, das jeder mit eigenen Modellen nutzen kann.

Aber kann eine Open-Source-Version mit OpenAIs DeepResearch mithalten? Welche neuen Methoden und Benchmarks wurden eingeführt? Dieser Artikel gibt einen umfassenden Überblick über den aktuellen Stand und die nächsten Schritte dieser spannenden Entwicklung.


Das musst Du wissen – Open-Source DeepResearch

  • OpenAI’s DeepResearch erreicht im GAIA-Benchmark 67,36 % – eine massive Verbesserung gegenüber Standard-LLMs, die nur 7 % erzielen.
  • Das Geheimnis hinter DeepResearch: Ein agentisches Framework, das den LLMs ermöglicht, eigenständig Aktionen auszuführen, Informationen zu verknüpfen und komplexe Fragen zu beantworten.
  • Die Open-Source-Gemeinschaft reagiert schnell und entwickelt in nur 24 Stunden eine erste Version eines offenen Frameworks.
  • CodeAgent statt JSON – Die Verwendung von Code zur Steuerung der KI verbessert die Effizienz und reduziert Kosten um bis zu 30 %.
  • Bereits 55,15 % im GAIA-Benchmark erreicht – ein bedeutender Fortschritt für Open-Source-KI-Agenten.

Was sind agentische Frameworks und warum sind sie entscheidend?

Ein agentisches Framework ist eine Schicht über einem LLM, die es ermöglicht, gezielte Aktionen auszuführen, z. B. das Web zu durchsuchen, PDFs zu lesen oder Bilder zu analysieren. Im Gegensatz zu einfachen Chatbots können solche Agenten komplexe mehrstufige Aufgaben erledigen, indem sie Daten sammeln, logisch verknüpfen und daraus fundierte Antworten generieren.

Eine aktuelle Studie zeigt, dass ein LLM allein oft ineffizient arbeitet. Erst durch ein agentisches Framework steigt die Leistung um bis zu 60 Prozentpunkte.

Ein Beispiel:

  • GPT-4 allein erzielt nur 7 % im GAIA-Benchmark.
  • Mit DeepResearch steigt die Leistung auf 67,36 %.

Das zeigt: Agentische Systeme sind essenziell für die nächste Generation intelligenter KI-Assistenten.


Der GAIA-Benchmark: Die ultimative Herausforderung für KI-Agenten

GAIA ist einer der anspruchsvollsten Benchmarks für KI-Agenten. Die Fragen erfordern:

Multimodale Fähigkeiten (Text- und Bildverarbeitung).
Komplexes logisches Denken (mehrstufige Informationsverknüpfung).
Präzise Antwortformate (z. B. Listen in einer bestimmten Reihenfolge).

Beispiel-Frage aus GAIA:

„Welche Früchte aus dem Gemälde ‚Embroidery from Uzbekistan‘ (2008) wurden im Frühstücksmenü eines Ozeandampfers im Oktober 1949 serviert? Ordne sie in der Reihenfolge des Gemäldes von 12 Uhr im Uhrzeigersinn auf.

Diese Aufgabe erfordert:

  1. Bildanalyse, um die Früchte zu identifizieren.
  2. Historische Recherche, um den Ozeandampfer zu ermitteln.
  3. Menüsuche, um die im Jahr 1949 servierten Früchte zu finden.
  4. Richtige Reihenfolge, um die Antwort exakt zu formatieren.

Solche Aufgaben zeigen, dass klassische LLMs schnell an ihre Grenzen stoßen. Erst durch ein intelligentes agentisches Framework wird eine effektive Lösung möglich.


Wie Open-Source DeepResearch gebaut wurde

Die Open-Source-Entwicklung fokussierte sich auf zwei Schlüsselbereiche:

  1. Einführung eines CodeAgents statt JSON-basiertem Agentensystem.
  2. Erstellung der richtigen Tools für Websuche und Datenverarbeitung.

1. Der CodeAgent: Bessere Effizienz durch Code

Die Open-Source-Version nutzt eine Technik, die von Wang et al. (2024) vorgeschlagen wurde:

🔹 Agenten schreiben Code anstelle von JSON zur Steuerung ihrer Aktionen.
🔹 Vorteile gegenüber JSON:

  • 30 % weniger Schritte → schnellere und günstigere Verarbeitung.
  • Effiziente Wiederverwendung von Tools aus bestehenden Bibliotheken.
  • Verbesserte Steuerung komplexer Prozesse.

🔹 Ergebnis:

  • JSON-Agent: 33 % im GAIA-Benchmark.
  • CodeAgent: 55,15 % – ein Sprung von über 20 %!

2. Die richtigen Tools für Open-Source DeepResearch

Die Entwickler stellten zwei wesentliche Werkzeuge bereit:

  • Textbasierter Web-Browser: Eine erste einfache Version für Recherche-Aufgaben.
  • Text-Inspector: Ein Tool zur Analyse und Verarbeitung von Textdateien.

Diese Tools basieren auf Microsofts Magentic-One Agent und können durch die Community weiter verbessert werden.


Erste Ergebnisse: Open-Source DeepResearch erreicht 55,15 % im GAIA-Benchmark

Nach nur 24 Stunden Entwicklungszeit konnte das Open-Source-Team bereits folgende Fortschritte erzielen:

📈 46 % → 55,15 % Verbesserung im GAIA-Benchmark gegenüber bisherigen Open-Source-Agenten.
💰 30 % weniger Kosten durch effizienteren Code-Einsatz.
🛠 Erste funktionsfähige Version veröffentlicht – bereit für Community-Weiterentwicklung.

Ein großer Sprung für Open-Source-Agenten, aber noch nicht auf dem Niveau von OpenAIs 67,36 %.


Die nächsten Schritte: Open-Source Agenten auf ein neues Level bringen

Die Entwickler haben bereits eine Roadmap für die nächsten Verbesserungen:

🔜 Ersetzen des textbasierten Browsers durch einen visuell-interaktiven Browser (ähnlich OpenAI’s Operator).
🔜 Mehr Unterstützung für multimodale Datenverarbeitung (Bilder, PDFs, Audiodateien).
🔜 Integration von besseren Open-Source-Modellen wie DeepSeek R1.
🔜 Entwicklung von GUI-Agenten, die mit Maus & Tastatur agieren können.

Das ultimative Ziel: Ein vollständig offenes, leistungsstarkes DeepResearch-Agentensystem, das jeder nutzen kann!


Fazit: Ist Open-Source DeepResearch eine echte Alternative?

Während OpenAI mit DeepResearch neue Maßstäbe setzt, zeigt die Open-Source-Community, dass sich mit cleveren Ansätzen viel erreichen lässt:

🔹 Erste Open-Source-Version erreicht 55,15 % im GAIA-Benchmark.
🔹 CodeAgent-Ansatz reduziert Kosten und steigert Effizienz.
🔹 Schnelle Fortschritte durch Community-Engagement.

Noch gibt es Unterschiede zur proprietären Version von OpenAI, doch die Entwicklung schreitet rasant voran. Wenn die geplanten Verbesserungen umgesetzt werden, könnte Open-Source DeepResearch bald eine ernstzunehmende Alternative sein.


🔗 Willst Du mehr über KI-Agenten lernen? Tausche Dich mit einer aktiven Community aus und entdecke praxisnahe KI-Anwendungen auf https://KINEWS24-academy.de – KI. Direkt. Verständlich. Anwendbar.


Quellen zu Open-Source DeepResearch

  1. Originalartikel von Hugging Face

Über den Autor

Ich bin Oliver Welling, 57, und beschäftige mich mit Chatbots, seit ich ELIZA 1987 zum ersten Mal erlebt habe. Seit knapp zwei Jahren arbeite ich an den KINEWS24.de – jeden Tag gibt es die neuesten News und die besten KI-Tools – und eben auch: Jede Menge AI-Science. KI erlebe ich als Erweiterung meiner Fähigkeiten und versuche, mein Wissen zu teilen.

Nach dem kometenhaften Aufstieg von DeepSeek R1 hat auch OpenAI etwas Open Source probiert und DeepResearch quelloffen bereitgestellt, naja, immerhin teilweise, also ein bisschen Und in nur 24 Stunden zeigt die Open Source Community, was POWER ist! Ja, es ist noch nicht so GANZ auf dem Level von OpenAI – aber warten wir einfach noch 24 weitere Stunden. Falls irgendjemand noch einen Leistungsbeweis für Open Source benötigte: Check, der wurde erbracht!

Ähnliche Beiträge

Business AI-Agents Science

AI Agent Index 2025: Dein umfassender Leitfaden zu KI-Agenten

AI Agent Index 2025: Dein umfassender Leitfaden zu KI-Agenten für 2025. Entdecke die Welt der KI-Agenten, ihre Möglichkeiten & Risiken.

Business AI-Agents

Open-Source DeepResearch: Eine Revolution für KI-Agenten?

Open-Source DeepResearch: Das LLM kann ausgewählt werden (z. B. GPT-4o), doch das entscheidende agentische Framework bleibt proprietär.

Folge uns

Beliebte Artikel

About Author

Maßgeschneiderte KI-Lösungen für Ihr Unternehmen

TechNow ist Ihr strategischer Partner für den erfolgreichen Einsatz von Künstlicher Intelligenz.

Beraten lassen

HOT CATEGORIES

de_DEGerman