Starten Sie Ihre KI-Reise mit Deutschlands modernster KI-Beratung

🚀 Deep Cogito aufgetaucht: Cogito v1 Modelle toppen die Charts – Was kann die neue Open Source KI?

Von Oliver Welling
KINEWS24.de Deep Cogito Cogito v1

Deep Cogito schlägt Wellen in der KI-Welt! Dieses neue KI-Forschungs-Startup aus San Francisco ist erst kürzlich aus dem Stealth-Modus aufgetaucht und präsentiert mit Cogito v1 eine beeindruckende Reihe von Open Source Large Language Models (LLMs). Diese Modelle, feinabgestimmt auf Metas Llama 3.2 (vor wenigen Tagen ist Meta Llama 4 erschienen – wir dürfen davon ausgehen, dass zeitnah das neue Llama hier für Antrieb sorgt) und ausgestattet mit innovativen Hybrid Reasoning-Fähigkeiten, sorgen bereits für Aufsehen, indem sie etablierte Konkurrenten in wichtigen Benchmarks übertreffen. Doch was steckt wirklich hinter diesem neuen Player und seiner Technologie?

Die Cogito v1 Modelle sind nicht einfach nur weitere Sprachmodelle. Sie bringen eine besondere Fähigkeit mit: Sie können entweder blitzschnell direkte Antworten liefern oder, ähnlich wie OpenAIs „o“-Serie oder DeepSeek R1, einen Schritt zurücktreten und „selbstreflektieren“, um komplexere Probleme zu lösen. Dieser Hybrid Reasoning-Ansatz, kombiniert mit einer neuartigen Trainingsmethode namens Iterated Distillation and Amplification (IDA), soll die Grenzen dessen verschieben, was KI heute leisten kann. Deep Cogito verfolgt dabei die ambitionierte Mission, eine generelle Superintelligenz zu entwickeln – eine KI, die Menschen in allen Bereichen übertrifft.

Einen faszinierenden Einblick in den Moment der Wissensexplosion, die dann zu einer Superintelligenz führen könnte, beschreibt der deutsche Forscher Aschenbrenner in seinem Paper: Situational Awareness – absolut lesenswert!

Das Besondere an Deep Cogito ist: Trotz dieses hochgesteckten Ziels verpflichtet sich Deep Cogito zur Offenheit. „Alle Modelle, die wir entwickeln, werden Open Source sein“, betont das Unternehmen. Das bedeutet, dass Entwickler und Unternehmen weltweit Zugang zu dieser potenziell bahnbrechenden Technologie haben. Die ersten Modelle sind bereits auf Plattformen wie Hugging Face und Ollama verfügbar und zeigen in Benchmarks beeindruckende Ergebnisse. Lass uns tiefer eintauchen und herausfinden, was Deep Cogito und die Cogito v1 Modelle so spannend macht.

Das musst Du wissen – Deep Cogito & Cogito v1 Highlights

  • Neues KI-Startup: Deep Cogito, gegründet im Juni 2024 in San Francisco, will die Grenzen der KI mit Fokus auf generelle Superintelligenz verschieben.
  • Cogito v1 Modelle: Eine Familie neuer Open Source LLMs (3B bis 70B Parameter), die auf Llama und Qwen basieren und für ihre Leistung gelobt werden.
  • Innovative Technologie: Nutzt Hybrid Reasoning (schnelle Antworten oder tiefes Nachdenken) und die Iterated Distillation and Amplification (IDA)-Trainingsmethode zur iterativen Selbstverbesserung.
  • Benchmark-Erfolge: Übertreffen laut ersten Tests namhafte Konkurrenten wie LLaMA, DeepSeek und Qwen in ihrer jeweiligen Größenklasse deutlich.
  • Frei zugänglich: Die Modelle sind Open Source (Llama-Lizenz) und verfügbar über Hugging Face, Ollama sowie APIs bei Fireworks AI und Together AI.

Was macht Deep Cogito und seine Cogito v1 Modelle so besonders im aktuellen KI-Wettbewerb?

Die KI-Landschaft ist dicht besiedelt und hart umkämpft. Jede Woche scheinen neue Modelle und Unternehmen aufzutauchen. Die zentrale Frage ist also: Was hebt Deep Cogito mit seinen Cogito v1 Modellen von der Masse ab und warum solltest Du diesem Newcomer Aufmerksamkeit schenken? Die Antwort liegt in der Kombination aus ambitionierter Vision, innovativer Technologie und einem starken Bekenntnis zu Open Source.

Wer oder was ist Deep Cogito genau?

Deep Cogito ist ein junges KI-Forschungsunternehmen mit Sitz in San Francisco, das offiziell im April 2025 aus dem Stealth-Modus hervorgetreten ist, aber bereits im Juni 2024 gegründet wurde. Ihr erklärtes Ziel ist nichts Geringeres als die Entwicklung einer generellen Superintelligenz. Sie wollen KI-Systeme schaffen, die nicht nur menschliche Fähigkeiten erreichen, sondern diese übertreffen und völlig neue Problemlösungsstrategien entwickeln können. Dabei liegt der Fokus auf wissenschaftlichen Durchbrüchen im Bereich des fortgeschrittenen logischen Denkens (Reasoning) und der iterativen Selbstverbesserung von KI-Modellen. Das Unternehmen gilt als „gut finanziert“ durch Top-VCs im KI-Bereich, wobei South Park Commons als einer der Investoren bestätigt ist.

Was sind die Cogito v1 Modelle und was können sie?

Cogito v1 ist die erste Serie von Large Language Models (LLMs), die Deep Cogito veröffentlicht hat. Es handelt sich um Hybrid Reasoning Modelle, die auf den Architekturen von Metas Llama und Alibabas Qwen aufbauen, aber durch Deep Cogitos eigene Trainingsmethoden erheblich verbessert wurden. Hier sind die Kernpunkte:

  • Modellgrößen: Verfügbar in den Größen 3B, 8B, 14B, 32B und 70B Parameter. Größere Modelle (109B, 400B, 671B, teils als Mixture-of-Experts/MoE) sind geplant.
  • Hybrid Reasoning: Jedes Modell kann in zwei Modi arbeiten:
    • Standard-Modus: Liefert schnelle, direkte Antworten wie herkömmliche LLMs.
    • Reasoning-Modus: Aktiviert eine „Selbstreflexions“-Phase vor der Antwort, um komplexere Aufgaben besser zu bewältigen. Dies erfordert mehr Rechenzeit, liefert aber oft präzisere Ergebnisse bei anspruchsvollen Fragen.
  • Fähigkeiten: Die Modelle sind optimiert für:
    • Coding und STEM-Aufgaben (Mathematik, Naturwissenschaften etc.)
    • Function Calling / Tool Calling: Die Fähigkeit, externe Tools oder APIs aufzurufen und zu nutzen.
    • Agentenhafte Anwendungsfälle: Unterstützung autonomer Systeme.
    • Mehrsprachigkeit: Trainiert in über 30 Sprachen.
    • Kontextlänge: Unterstützen bis zu 128.000 Tokens Kontext.
  • Open Source: Alle Modelle sind unter der Llama 3.2 Community Lizenz veröffentlicht, die eine kommerzielle Nutzung bis zu einer Grenze von 700 Millionen monatlichen Nutzern erlaubt (danach ist eine Lizenz von Meta erforderlich).

Wie funktioniert die Trainingsmethode IDA (Iterated Distillation and Amplification)?

Das Herzstück der Cogito v1 Modelle ist die Trainingsmethode Iterated Distillation and Amplification (IDA). Deep Cogito beschreibt sie als einen skalierbaren und effizienten Weg zur Superintelligenz, der nicht durch die Fähigkeiten menschlicher „Aufseher“ oder größerer „Lehrer“-Modelle begrenzt ist. Der Prozess funktioniert iterativ in zwei Schritten:

  1. Amplification (Verstärkung): Das Modell bekommt mehr Rechenzeit (Compute), um eine Aufgabe zu lösen und eine bessere Lösung oder Denkstrategie zu entwickeln, als es normalerweise tun würde (z.B. durch Chain-of-Thought, Selbst-Verifikation, Sampling mehrerer Antworten).
  2. Distillation (Destillation): Dieser verbesserte Denkprozess oder die Fähigkeit, zur besseren Lösung zu gelangen, wird dann zurück in die Parameter des Modells „destilliert“ (internalisiert). Das Modell lernt also, wie es selbstständig zu besseren Ergebnissen kommt.

Dieser Zyklus wird wiederholt. Mit jeder Iteration wird das Modell intelligenter, und der „Amplification“-Schritt wird potenziell noch leistungsfähiger. Es entsteht eine positive Feedbackschleife, bei der die Fähigkeiten des Modells stärker von den verfügbaren Rechenressourcen und der Effektivität des IDA-Prozesses abhängen als von externen Begrenzungen. Deep Cogito vergleicht diesen Ansatz konzeptionell mit der Selbst-Spiel-Strategie von AlphaGo, angewandt auf Sprache. Sie betonen, dass IDA effizienter und skalierbarer sei als traditionelles RLHF (Reinforcement Learning from Human Feedback) oder die Destillation von größeren Modellen.

Wie schneiden die Cogito v1 Modelle in Benchmarks ab?

Deep Cogito hat umfangreiche Benchmark-Ergebnisse veröffentlicht, die darauf hindeuten, dass ihre Modelle die aktuelle Open-Source-Konkurrenz übertreffen. Hier einige Highlights:

ModellBenchmark Highlight (Beispiel)Vergleichsmodell (Beispiel)
Cogito 3BMMLU: 65.4% (Standard) / 72.6% (Reasoning)Llama 3.2 3B: 58.7%
Cogito 8BMMLU: 80.5% (Standard) / 83.1% (Reasoning)Llama 3.1 8B: 67.7%
Cogito 14B/32BÜbertreffen Qwen2.5-Äquivalente um ca. 2-3 Prozentpunkte in aggregierten Benchmarks. Cogito 32B (Reasoning) erreicht 90.2% MMLU.Qwen2.5 14B/32B
Cogito 70BMMLU: 91.7% (Standard) / 91.0% (Reasoning). Übertrifft Llama 3.3 70B (85.3% MMLU) und sogar Llama 4 Scout 109B (MoE) in aggregierten Scores (z.B. LiveBench).Llama 3.3 70B, Llama 4 Scout 109B
Tool CallingDeutlich bessere native Tool-Calling-Fähigkeiten als Llama-Äquivalente (z.B. Cogito 8B >89% vs. Llama 3.1 8B 35-54%), was auf spezifisches Post-Training zurückgeführt wird.Llama 3.1 8B

Wichtig: Deep Cogito weist selbst darauf hin, dass Benchmarks nur ein Indikator sind und die Leistung in realen Anwendungen der eigentliche Maßstab ist. Die Ergebnisse im Reasoning-Modus sind oft höher, es gibt jedoch Trade-offs, z.B. im MATH-Benchmark, wo DeepSeek R1 teilweise vorne liegt. Beeindruckend ist, dass das 70B-Modell laut Deep Cogito von einem kleinen Team in nur etwa 75 Tagen entwickelt wurde.

Wo kannst Du die Cogito v1 Modelle finden und nutzen?

Deep Cogito macht den Zugang zu seinen Modellen einfach:

Wer steht hinter Deep Cogito?

Die Gründer von Deep Cogito bringen Erfahrung von Google mit:

  • Drishan Arora: CEO und Mitgründer, war zuvor Senior Software Engineer bei Google und leitete laut eigener Aussage das LLM-Modeling für Googles generative Suchfunktion.
  • Dhruv Malhotra: Mitgründer, war Product Manager bei Google DeepMind und arbeitete dort ebenfalls an generativer Suchtechnologie.

Das Unternehmen rekrutiert aktiv Top-Talente im Bereich LLMs und KI-Infrastruktur, um sein Team in San Francisco zu erweitern.

Was ist die langfristige Vision von Deep Cogito?

Die Vision ist klar und ambitioniert: „Building general superintelligence.“ Sie wollen nicht nur KI auf menschlichem Niveau (AGI), sondern darüber hinausgehen. Der Weg dorthin führt über wissenschaftliche Durchbrüche bei Reasoning und iterativer Selbstverbesserung mittels Methoden wie IDA. Die Tatsache, dass sie alle Modelle als Open Source veröffentlichen, deutet darauf hin, dass sie diese Reise gemeinsam mit der Community antreten wollen und Vertrauen in ihren technologischen Vorsprung haben.

Konkrete Tipps: So nutzt Du die Cogito v1 Modelle

Möchtest Du die Cogito v1 Modelle selbst ausprobieren? Hier sind ein paar praktische Schritte:

  1. Wähle Deine Plattform: Entscheide, ob Du die Modelle lokal (Ollama, Hugging Face/Transformers) oder über eine API (Fireworks AI, Together AI) nutzen möchtest. Ollama ist oft der einfachste Weg für den lokalen Einstieg.
  2. Installation (Lokal mit Ollama):
    • Installiere Ollama von der offiziellen Website.
    • Öffne Dein Terminal und führe den Befehl für die gewünschte Modellgröße aus, z.B.: ollama run cogito:8b oder ollama run cogito:70b. Das Modell wird heruntergeladen und ist dann einsatzbereit.
  3. Den Reasoning-Modus aktivieren: Um die erweiterten Denkfähigkeiten („Self-Reflection“) zu nutzen, musst Du dies explizit angeben:
    • In Ollama (Chat): Setze den System-Prompt: /set system """Enable deep thinking subroutine."""
    • Per API oder in Code (Hugging Face Transformers): Füge "Enable deep thinking subroutine." als System-Nachricht hinzu oder setze einen entsprechenden Parameter (enable_thinking=True) beim Anwenden des Chat-Templates. Beispiel API-Call (Ollama): Bashcurl http://localhost:11434/api/chat -d '{ "model": "cogito:70b", "messages": [ { "role": "system", "content": "Enable deep thinking subroutine." }, { "role": "user", "content": "Erkläre das Konzept von Iterated Distillation and Amplification in einfachen Worten." } ] }'
  4. Experimentiere: Teste die Modelle mit verschiedenen Prompts, sowohl im Standard- als auch im Reasoning-Modus. Probiere Aufgaben aus den optimierten Bereichen (Coding, Tool Calling, komplexe Fragen) aus, um ein Gefühl für ihre Stärken zu bekommen.

Fazit: Deep Cogito – Ein vielversprechender neuer Stern am Open Source KI-Himmel?

Deep Cogito hat mit seinem Auftritt und den Cogito v1 Modellen definitiv für Aufsehen in der Künstliche Intelligenz-Community gesorgt. Das Startup aus San Francisco betritt die Bühne nicht leise, sondern mit der klaren Ansage, die Entwicklung hin zur generellen Superintelligenz maßgeblich mitzugestalten – und das auf Basis von Open Source-Prinzipien. Die Kombination aus einer ambitionierten Vision, erfahrenen Gründern mit Google-Background und einer soliden Finanzierung durch namhafte VCs wie South Park Commons schafft eine vielversprechende Grundlage.

Das technologische Herzstück, die Cogito v1-Familie von Large Language Models (LLMs), überzeugt durch innovative Ansätze. Das Hybrid Reasoning, also die Fähigkeit, je nach Bedarf schnell zu antworten oder tiefgehend zu reflektieren, adressiert eine zentrale Herausforderung aktueller LLMs: die Balance zwischen Geschwindigkeit und Gründlichkeit. Noch spannender ist die Trainingsmethode Iterated Distillation and Amplification (IDA). Dieser Ansatz der iterativen Selbstverbesserung, der darauf abzielt, die Begrenzungen durch menschliche oder maschinelle „Aufseher“ zu überwinden, könnte tatsächlich ein Schlüssel zu neuen Leistungsdimensionen sein. Wenn eine KI lernt, ihre eigenen Denkprozesse zu optimieren und zu internalisieren, entsteht eine potenziell exponentielle Entwicklungskurve.

Die veröffentlichten KI Benchmarks sind beeindruckend und positionieren Cogito v1 – zumindest auf dem Papier – an die Spitze der frei verfügbaren Modelle in ihren jeweiligen Größenklassen, wobei sie sogar etablierte Größen wie Llama, DeepSeek und Qwen übertreffen sollen. Besonders die Leistung des Cogito 70B-Modells, das angeblich sogar das größere Llama 4 109B Scout Modell schlägt und in nur 75 Tagen von einem kleinen Team entwickelt wurde, unterstreicht die Effizienz und Potenz des IDA-Ansatzes. Die Stärken in Coding, Tool Calling und Mehrsprachigkeit machen die Modelle zudem für praktische Anwendungen attraktiv.

Natürlich sind Benchmarks nur die halbe Miete, und die Praxistauglichkeit muss sich erst noch erweisen. Auch die genauen Details der Finanzierung und die langfristige Skalierbarkeit von IDA bleiben abzuwarten. Doch der konsequente Open Source-Ansatz senkt die Einstiegshürden erheblich und lädt Entwickler weltweit ein, die Modelle zu testen, zu nutzen und weiterzuentwickeln. Die Verfügbarkeit über Plattformen wie Hugging Face, Ollama, Fireworks AI und Together AI erleichtert den Zugang zusätzlich.

Mit der Ankündigung noch größerer Modelle (bis 671B Parameter) und kontinuierlicher Verbesserungen der bestehenden Checkpoints signalisiert Deep Cogito, dass dies erst der Anfang ist. Sie positionieren sich als ernstzunehmender Akteur, der nicht nur aufholt, sondern potenziell neue Maßstäbe im Bereich der Open Source AI setzen könnte. Für Entwickler, Forscher und Unternehmen, die auf der Suche nach leistungsstarken, frei zugänglichen und innovativen KI-Modellen sind, ist Deep Cogito definitiv ein Name, den man im Auge behalten sollte. Die Reise zur Superintelligenz mag noch lang sein, aber Deep Cogito hat gerade einen bemerkenswerten ersten Schritt getan.


www.KINEWS24-academy.de – KI. Direkt. Verständlich. Anwendbar. Erlebe, wie du KI in deinem Unternehmen effektiv einsetzt, deine Prozesse automatisierst und dein Wachstum beschleunigst.


Quellen

#KI #AI #ArtificialIntelligence #KuenstlicheIntelligenz #DeepCogito #OpenSourceAI #LLM #HybridReasoning, Deep Cogito

Ähnliche Beiträge

Business

Claude Research Funktion & Google Workspace: Dein Turbo für Wissen & Produktivität von Anthropic erklärt

Claude AI Recherche Funktion von Anthropic: Erfahre alles über die agentische Suche, Zitate & Google Workspace Integration für mehr Produktivität..

Business

Google Whitepaper Prompt Engineering Insights: Optimiere Deine LLM-Prompts wie ein Profi – Alle Techniken!

Prompt Engineering & Google Whitepaper kompakt: Der 2025 Guide zur LLM Optimierung von Google (Lee Boonstra). Lerne Zero-Shot, CoT, ReAct.

Folge uns

Beliebte Artikel

About Author

Maßgeschneiderte KI-Lösungen für Ihr Unternehmen

TechNow ist Ihr strategischer Partner für den erfolgreichen Einsatz von Künstlicher Intelligenz.

Beraten lassen

HOT CATEGORIES

de_DEGerman