Business

Neue Entwicklungen bei Anthropic: Claude 3.5 Sonnet, Claude 3.5 Haiku und bahnbrechende Computersteuerung

KINEWS24.de - Neue Entwicklungen bei Anthropic Claude 3.5 Sonnet, Claude 3.5 Haiku und bahnbrechende Computersteuerung

KINEWS24.de - Neue Entwicklungen bei Anthropic Claude 3.5 Sonnet, Claude 3.5 Haiku und bahnbrechende Computersteuerung

Am 22. Oktober 2024 hat Anthropic eine Reihe neuer AI-Modelle und Funktionen vorgestellt, die die Art und Weise, wie künstliche Intelligenz genutzt wird, erheblich erweitern. In diesem Artikel erfährst du mehr über die neueste Generation von Claude, speziell Claude 3.5 Sonnet und Claude 3.5 Haiku, sowie eine innovative Funktion, die es Entwicklern ermöglicht, Claude zur Steuerung von Computern einzusetzen. Wir werfen einen detaillierten Blick auf die Verbesserungen dieser Modelle, die technischen Fortschritte im Bereich des Codings und die potenziellen Anwendungen für Entwickler.

Was macht Claude 3.5 Sonnet so besonders?

Die aktualisierte Version von Claude 3.5 Sonnet hebt sich vor allem durch ihre verbesserten Fähigkeiten im Bereich des Codings und der Nutzung von Tools ab. Claude 3.5 Sonnet übertrifft seine Vorgänger in mehreren Benchmark-Tests und bietet Entwicklern eine leistungsstarke Lösung für agentic coding – die Fähigkeit, Softwareprozesse eigenständig zu steuern und zu automatisieren.

Wichtige Verbesserungen und Benchmark-Ergebnisse:

  1. Steigerung der Leistung im Coding: Claude 3.5 Sonnet verbessert seine Performance auf dem SWE-bench Verified Benchmark, einem Test für Softwareentwicklung, von 33,4 % auf 49,0 %. Dies positioniert das Modell vor allen anderen öffentlich verfügbaren Systemen, einschließlich spezialisierter Tools und Modelle wie OpenAI o1-preview.
  2. Stärkere Tool-Nutzung: In Aufgaben, bei denen Tools verwendet werden, erzielt Claude 3.5 Sonnet ebenfalls erhebliche Fortschritte. Auf dem TAU-bench, einem Test für die Nutzung von Werkzeugen in spezifischen Szenarien wie Einzelhandel und Luftfahrt, verbesserte sich die Leistung des Modells in der Einzelhandelsbranche von 62,6 % auf 69,2 %, in der Luftfahrt von 36,0 % auf 46,0 %.
  3. Rückmeldungen von Kunden: Unternehmen wie GitLab und Cognition berichten von deutlichen Verbesserungen in der Qualität und Geschwindigkeit der Softwareentwicklung. GitLab verzeichnete bis zu 10 % verbesserte Ergebnisse im Bereich DevSecOps, während Cognition die Fortschritte in den Bereichen Planung, Problemlösung und autonomes Codieren hervorhob.

Die neuen Fähigkeiten machen Claude 3.5 Sonnet zu einem vielseitigen Werkzeug, das besonders für Multi-Step-Softwareentwicklungsprozesse und andere komplexe technische Anwendungen geeignet ist.

Was ist Claude 3.5 Haiku?

Parallel zu Sonnet hat Anthropic auch das Claude 3.5 Haiku Modell angekündigt, das für Entwickler mit Fokus auf Schnelligkeit und Effizienz konzipiert wurde. Claude 3.5 Haiku übertrifft sogar Claude 3 Opus, das bisher größte Modell von Anthropic, und ist zu einem ähnlichen Preis und mit vergleichbarer Geschwindigkeit verfügbar.

Hauptmerkmale von Claude 3.5 Haiku:

  • Hervorragende Leistung bei Codieraufgaben: Mit einer Punktzahl von 40,6 % auf dem SWE-bench Verified übertrifft Claude 3.5 Haiku viele spezialisierte KI-Agenten, darunter auch ältere Claude-Modelle und GPT-4o.
  • Niedrige Latenz und verbesserte Werkzeugnutzung: Haiku punktet besonders bei Anwendungen, die schnelle Reaktionszeiten und präzises Werkzeug-Handling erfordern. Es eignet sich ideal für benutzerorientierte Produkte, bei denen große Datenmengen wie Kaufhistorien oder Bestandsaufzeichnungen verarbeitet werden müssen.

Claude 3.5 Haiku wird zunächst als reines Textmodell über die API, Amazon Bedrock und Google Cloud’s Vertex AI verfügbar sein, bevor es später in diesem Jahr auch Bildverarbeitungsfunktionen erhält.

Revolutionäre Computersteuerung: Claude als digitaler Navigator

Eine der spannendsten Neuerungen ist die Einführung der Computersteuerung durch Claude. Diese Funktion ist aktuell als öffentliche Beta-Version verfügbar und ermöglicht es Entwicklern, Claude zu nutzen, um digitale Aufgaben direkt über die Benutzeroberfläche eines Computers zu erledigen. Statt spezielle Werkzeuge für bestimmte Aufgaben zu entwickeln, hat Anthropic Claude beigebracht, allgemeine Computerfähigkeiten zu erlernen. Das bedeutet, dass Claude wie ein Mensch auf Bildschirme schauen, Mauszeiger bewegen, Schaltflächen klicken und Texteingaben tätigen kann.

Anwendungsszenarien:

  • Automatisierung repetitiver Prozesse: Claude kann beispielsweise wiederkehrende Büroarbeiten automatisieren, indem es Daten aus Tabellen verwendet, Webformulare ausfüllt oder Softwaretests durchführt.
  • Offene Aufgaben: Auch für Aufgaben wie Recherchen oder das Ausführen von Software, die viele Schritte erfordern, wird diese Fähigkeit nützlich sein.

Erste Testergebnisse:

Auf OSWorld, einer Plattform, die KI-Modelle in der Nutzung von Computerschnittstellen bewertet, erzielte Claude 3.5 Sonnet eine beeindruckende Punktzahl von 14,9 % im „Screenshot-only“-Modus, was fast doppelt so gut ist wie das nächstbeste System (7,8 %). Wenn Claude mehr Schritte zur Lösung einer Aufgabe erhielt, stieg die Punktzahl auf 22,0 %.

Trotz der vielversprechenden Ergebnisse ist die Technologie noch nicht perfekt. Claude hat derzeit Schwierigkeiten bei Aufgaben wie Scrollen, Zoomen oder Ziehen von Objekten – Prozesse, die für Menschen einfach sind. Entwickler werden dazu ermutigt, die Funktion zunächst für risikolose Aufgaben zu nutzen, bis sich die Technologie weiter verbessert.

Sicherheitsmaßnahmen:

Da die Fähigkeit zur Computersteuerung neue Angriffsvektoren für Bedrohungen wie Spam oder Betrug eröffnen könnte, hat Anthropic spezielle Klassifikatoren entwickelt, die den Einsatz dieser Funktion überwachen und schädliche Aktionen erkennen sollen. Sicherheit bleibt ein zentraler Aspekt der Entwicklung von Claude.

Blick in die Zukunft

Die Einführung der neuen Modelle Claude 3.5 Sonnet und Claude 3.5 Haiku sowie die bahnbrechende Computersteuerung markiert einen wichtigen Schritt in der Entwicklung von KI. Anthropic setzt darauf, durch das Feedback von Entwicklern die Modelle weiter zu verbessern und die Möglichkeiten dieser Technologie voll auszuschöpfen. Insbesondere die Fähigkeit, Computer wie ein Mensch zu nutzen, könnte in den kommenden Monaten tiefgreifende Veränderungen für die Automatisierung und Effizienz von Arbeitsprozessen bringen.

Wenn du Entwickler bist, hast du jetzt die Möglichkeit, die Beta-Version der Computersteuerung über die Anthropic API, Amazon Bedrock und Google Cloud’s Vertex AI auszuprobieren. Die Modelle Claude 3.5 Sonnet und Haiku stehen dir ebenfalls zur Verfügung, um deine Projekte zu unterstützen und zu optimieren.

Quelle:

Die mobile Version verlassen