Am 29. Oktober 2024 kündigten GitHub und Anthropic die Integration von Claude 3.5 Sonnet in GitHub Copilot an. Diese Integration bringt die neuesten KI-Funktionen von Claude direkt in Visual Studio Code und GitHub.com und ermöglicht es über 100 Millionen Entwicklern, die Vorteile von Claudes fortschrittlichen Programmierfähigkeiten zu nutzen.
Herausragende Leistung auf SWE-bench und HumanEval
Claude 3.5 Sonnet, entwickelt von Anthropic, ist das aktuell leistungsstärkste Modell auf SWE-bench Verified, einem Benchmark, der die Fähigkeit von KI-Modellen bewertet, reale Programmierprobleme zu lösen. Zudem hat Claude 3.5 Sonnet im HumanEval-Benchmark eine beeindruckende Genauigkeitsrate von 93,7 % erreicht. HumanEval testet die Fähigkeit, aus einer natürlichen Sprache heraus korrekte Python-Funktionen zu erstellen.
Verwendungsmöglichkeiten von Claude 3.5 Sonnet in GitHub Copilot
Claude 3.5 Sonnet eröffnet Entwicklern viele neue Funktionen, die speziell auf die Bedürfnisse von GitHub Copilot-Nutzern zugeschnitten sind:
- Produktionsreife Codeerstellung: GitHub Copilot Chat kann beschreibende Texte in hochqualitativen Code umwandeln, der auf die spezifischen Muster und Konventionen eines Projekts abgestimmt ist.
- Fehleranalyse im Inline-Chat: Entwickler können fehlerhaften Code markieren und sofortige Analysen und Lösungsvorschläge erhalten. Copilot Chat erklärt Fehlermeldungen und bietet passende Korrekturen an.
- Automatisierte Tests: Entwickler können Funktionen auswählen, um automatisch umfassende Tests zu generieren, die auf das jeweilige Testframework abgestimmt sind und Randfälle abdecken.
- Kontextuelle Code-Erklärung: Mit Claude 3.5 Sonnet lassen sich Codeblöcke und Funktionen in VS Code markieren, um sofortige Erläuterungen zu erhalten, wie diese in das Projekt passen.
Erste Schritte mit Claude 3.5 Sonnet
Die Veröffentlichung von Claude 3.5 Sonnet für GitHub Copilot erfolgt über Amazons Bedrock-Framework. Die öffentliche Vorschau ist seit dem 29. Oktober 2024 verfügbar, und alle Entwickler sowie Organisationen sollten in den nächsten Wochen darauf zugreifen können. Weitere Informationen finden sich im GitHub-Blog und in der Dokumentation.