Google Gemini 1.5 Pro jetzt in über 180 Ländern verfügbar: Vor weniger als zwei Monaten haben wir unser Gemini 1.5 Pro Modell der nächsten Generation in Google AI Studio für Entwickler zum Ausprobieren bereitgestellt. Wir waren begeistert von dem, was die Community mit unserem bahnbrechenden 1-Million-Kontext-Fenster debuggen, erstellen und lernen konnte.

Heute machen wir Gemini 1.5 Pro in über 180 Ländern über die Gemini API in öffentlicher Vorschau verfügbar, mit einer erstmaligen nativen Audio (Sprach)-Verständnisfunktion und einer neuen Datei-API, die die Handhabung von Dateien erleichtert. Wir führen auch neue Funktionen wie System-Anweisungen und JSON-Modus ein, um Entwicklern mehr Kontrolle über die Ausgabe des Modells zu geben. Zu guter Letzt veröffentlichen wir unser Text-Embedding-Modell der nächsten Generation, das vergleichbare Modelle übertrifft. Gehen Sie zu Google AI Studio, um Ihren API-Schlüssel zu erstellen oder darauf zuzugreifen, und beginnen Sie mit dem Entwickeln.

Wir erweitern die Eingabemodalitäten für Gemini 1.5 Pro um das Audio (Sprach)-Verständnis sowohl in der Gemini API als auch in Google AI Studio. Zusätzlich ist Gemini 1.5 Pro nun in der Lage, sowohl Bild (Frames) als auch Audio (Sprache) für in Google AI Studio hochgeladene Videos zu verarbeiten. Wir freuen uns darauf, bald auch die API-Unterstützung dafür hinzuzufügen.

Sie können beispielsweise eine Aufzeichnung einer Vorlesung, wie diese über 117.000 Token umfassende Vorlesung von Jeff Dean, hochladen und Gemini 1.5 Pro kann daraus ein Quiz mit Lösungsschlüssel erstellen.

Google geht dabei auf eine Reihe der am häufigsten geäußerten Entwicklerwünsche ein:

System-Anweisungen: Steuern Sie die Antworten des Modells mit System-Anweisungen, die jetzt in Google AI Studio und der Gemini API verfügbar sind. Definieren Sie Rollen, Formate, Ziele und Regeln, um das Verhalten des Modells für Ihren spezifischen Anwendungsfall zu steuern.
JSON-Modus: Weisen Sie das Modell an, nur JSON-Objekte auszugeben. Dieser Modus ermöglicht die Extraktion strukturierter Daten aus Text oder Bildern. Sie können mit cURL loslegen, die Unterstützung des Python SDK folgt in Kürze.
Verbesserungen beim Funktionsaufruf: Sie können jetzt Modi auswählen, um die Ausgaben des Modells zu begrenzen und so die Zuverlässigkeit zu verbessern. Wählen Sie zwischen Text, Funktionsaufruf oder nur der Funktion selbst.

Ab heute haben Entwickler über die Gemini API Zugriff auf unser Text-Embedding-Modell der nächsten Generation. Das neue Modell, text-embedding-004, (text-embedding-preview-0409 in Vertex AI), erzielt eine stärkere Retrieval-Leistung und übertrifft bestehende Modelle mit vergleichbaren Dimensionen in den MTEB-Benchmarks.

Dies sind nur die ersten von vielen Verbesserungen, die in den nächsten Wochen für die Gemini API und Google AI Studio verfügbar sein werden. Wir arbeiten weiterhin daran, Google AI Studio und die Gemini API zum einfachsten Weg zu machen, mit Gemini zu entwickeln. Beginnen Sie noch heute in Google AI Studio mit Gemini 1.5 Pro, erkunden Sie Codebeispiele und Schnelleinstiege in unserem neuen Gemini API Cookbook und treten Sie unserem Community-Kanal auf Discord bei.

Table of Contents

Fazit Google Gemini 1.5 Pro jetzt in über 180 Ländern verfügbar

Mit der Einführung von Gemini 1.5 Pro in über 180 Ländern und den neuen Funktionen wie nativer Audio-Verarbeitung, System-Anweisungen und JSON-Modus bietet Google Entwicklern leistungsstarke Werkzeuge, um innovative Anwendungen im Bereich der Künstlichen Intelligenz zu entwickeln. Die Erweiterung der Eingabemodalitäten auf Audio und Video eröffnet völlig neue Möglichkeiten, während das verbesserte Text-Embedding-Modell die Retrieval-Leistung auf ein neues Niveau hebt. Google AI Studio und die Gemini API entwickeln sich schnell weiter und bieten Entwicklern eine intuitive Plattform, um das volle Potenzial von Gemini auszuschöpfen.

Quelle: Google-Developer-Blog, GitHub,

#KuenstlicheIntelligenz #artificialintelligence #KI #AI #MachineLearning #DeepLearning #NLP #Sprachverarbeitung

Google Gemini 1.5 Pro jetzt in über 180 Ländern verfügbar – auch in Deutschland

ByOliver Welling

Fazit Google Gemini 1.5 Pro jetzt in über 180 Ländern verfügbar

Die 10 besten Alternativen zu ChatGPT findest Du hier!

KI im Mittelstand – Jetzt künstliche Intelligenz im Unternehmen nutzen

By Oliver Welling

Related Post

KINews24 Update, Freitag, 24.6.2024

Google Gemma 2: Ein Meilenstein in der KI-Entwicklung

Google Translate mit 110 neuen Sprachen

You missed

KINews24 Update, Freitag, 24.6.2024

Google Gemma 2: Ein Meilenstein in der KI-Entwicklung

Google Translate mit 110 neuen Sprachen

TIME und ElevenLabs – Einfacher Zugang zu Audio-Inhalten

ByOliver Welling

Fazit Google Gemini 1.5 Pro jetzt in über 180 Ländern verfügbar

Die 10 besten Alternativen zu ChatGPT findest Du hier!

KI im Mittelstand – Jetzt künstliche Intelligenz im Unternehmen nutzen

Related Posts

By Oliver Welling

Related Post

You missed