ChatGPT kann jetzt Tools benutzenChatGPT kann jetzt Tools benutzen

Was hat sich geändert?

Chat GPT 4, die neueste Version des großen Sprachmodells von OpenAI, hat jetzt eine Fähigkeit, die wir bisher nur von Menschen kannten: es kann Tools nutzen! Kein Scherz, du hast richtig gehört. Chat GPT 4 kann jetzt Tools verwenden, um Aufgaben zu erfüllen, die es vorher nicht konnte​

Wie funktioniert das?

Es ist wie bei einem Kind, das seine Eltern bittet, ihm bei einer Aufgabe zu helfen, die es allein (noch) nicht lösen kann. Chat GPT 4 kann jetzt nach Hilfe fragen, indem es externe Code, Datenbanken oder andere APIs aufruft wenn nötig. Das ist ein riesiger Schritt nach vorn: GPT-4 jetzt “weiß” jetzt, wie es um das bitten kann um eine Lösung zu erzielen!

Die neue Funktion heißt “Funktionsaufruf“. Wenn du Chat GPT 4 eine Frage stellst, kannst du jetzt eine Reihe von Tools mitliefern, die das Modell bei Bedarf verwenden kann. GPT-4 kann dann entscheiden, ob es direkt antwortet oder ein Tool benutzen möchte. Wenn Chat GPT 4 ein Tool benutzen möchte, wird dein Code das Tool aufrufen und die Ergebnisse an Chat GPT 4 zurücksenden, um sie weiter zu verarbeiten.

Warum ist das wichtig?

Chat GPT 4 hatte einige deutliche Einschränkungen: Es war schlecht in Mathe, es hatte keinen Zugang zu privaten Daten, es wusste nichts über Ereignisse nach 2021, und es konnte keine APIs nutzen. Mit der Fähigkeit, Tools zu benutzen, hat OpenAI es geschafft, diese Probleme zu umgehen. Chat GPT 4 kann jetzt selbst entscheiden, wann es ein Tool zur Hilfe nimmt, wenn es mit einer schwierigen Frage konfrontiert wird​.

Die Nutzung von Tools macht GPT-4 deutlich leistungsfähiger und ersetzt einige Funktionen von Open-Source-Bibliotheken, die bisher genau das getan haben. Traditionelle Software (also schon ohne KI) ist sehr mächtig, und wenn man sie gut mit GPT-4 integrieren könnte, wäre das ein großer Gewinn. Das macht Funktionsaufrufe so mächtig.

Was kann Chat GPT 4 jetzt tun?

Stell dir vor, GPT-4 könnte das Wetter checken, einen Aktienkurs abrufen, Daten in deiner Firmendatenbank nachschlagen oder eine E-Mail senden. Es könnte jetzt eine Textnachricht mit Twilio senden oder einen Zap in Zapier initiieren oder die Position von erdnahen Asteroiden über die NASA-API verfolgen. Als Programmierer musst du diese Fähigkeiten nur als Tool für GPT-4 zur Verfügung stellen (was ziemlich einfach ist). GPT-4 wird dann selbst “intelligent” entscheiden, ob diese Funktion hilfreich ist für die Erfüllung der gestellten Aufgabe.

Eine weitere aufregende Möglichkeit ist die Verwendung von “Agenten”. Ein Agent ist ein Sprachmodell, das mit einer Aufgabe – wie etwa “Recherchiere und fasse Nachrichten über UFOs zusammen” – und einem Satz von Tools – wie einem Google-Suche-Tool und einem Twitter-Suche-Tool – ausgestattet wird. Das Sprachmodell läuft dann in einer Schleife, bis es sein Ziel erreicht hat. Erstens plant es eine Reihe von Schritten, und dann nutzt es die Tools, um jede Aufgabe, die es sich selbst gesetzt hat, zu erfüllen. Nein – das ging bisher nicht. Gar nicht. Und das ist wirklich eine (erneute) KI-Revulotion.

Bisher mussten Agenten mit viel individuellem Code zusammengesetzt oder mithilfe einer Open-Source-Bibliothek wie Langchain erstellt werden. Langchain tat einige ausgeklügelte Dinge im Hintergrund, um GPT-4 Tools verwenden zu lassen, aber das war oft sehr langsam und unzuverlässig. Mit der Einführung des Funktionsaufrufs durch OpenAI können jetzt einfachere Agenten erstellt werden, die viel schneller arbeiten und seltener ausfallen. Das bedeutet mehr Leistung für mehr Anwendungsfälle mit weniger Code, was ein großer Gewinn für Entwickler ist.

Was bedeutet das für bestehende Infrastrukturen?

Die Einführung von Funktionsaufrufen in GPT-4 hat auch Auswirkungen auf bestehende Infrastrukturen und Bibliotheken wie Langchain. Vieles von dem Code den sie geschrieben haben, um die Funktionalität von Agenten zu ermöglichen, ist nun direkt in GPT-4 implementiert. Das bedeutet nicht, dass Langchain jetzt überflüssig ist – tatsächlich kann man die Funktionsaufruf-Fähigkeiten bereits in Langchain nutzen, anstatt ihre vorherige Agentenarchitektur zu verwenden. Aber es bedeutet, dass all die Arbeit, die sie in den Aufbau dieser vorherigen Architekturen gesteckt haben, nun zu einem gewissen Grad überflüssig und veraltet ist.

Fazit

Die Fähigkeit von Chat GPT 4, Tools zu nutzen, ist ein großer Schritt nach vorne in der Welt der künstlichen Intelligenz. Es öffnet eine Fülle neuer Möglichkeiten und macht GPT-4 zu einem noch leistungsfähigeren und flexibleren Werkzeug für Entwickler und Anwender. Wir können gespannt sein, was die Zukunft weiteres durch Open AI bringt.

Mehr dazu