Google DeepMinds revolutionäre KI-Technologie Gemini. Eine Kombination aus AlphaGo und ChatGPT, die das KI-Feld neu definiert.Google DeepMinds revolutionäre KI-Technologie Gemini. Eine Kombination aus AlphaGo und ChatGPT, die das KI-Feld neu definiert.

Was ist das Neueste bei Google DeepMind?

Google DeepMind arbeitet an einer definitiven Antwort auf ChatGPT, welche möglicherweise den wichtigsten Durchbruch in der Geschichte der Künstlichen Intelligenz darstellt. In einem kürzlichen Interview mit Wired sprach der CEO von Google DeepMind, Demis Hassabis, über ein Projekt namens Gemini. Er sagte: “Im Großen und Ganzen kann man Gemini als Kombination aus einigen der Stärken von AlphaGo-ähnlichen Systemen und den erstaunlichen Sprachfähigkeiten der großen Modelle [z.B. GPT-4 und ChatGPT] betrachten … Wir haben auch einige neue Innovationen, die ziemlich interessant sein werden.”

Warum ist diese Mischung so mächtig?

Die Modelle der Alpha-Familie von DeepMind und die GPT-Familie von OpenAI haben jeweils eine einzigartige Fähigkeit. Die Alpha-Modelle (AlphaGo, AlphaGo Zero, AlphaZero und sogar MuZero) zeigen, dass KI die menschliche Fähigkeit und das Wissen in begrenzten Umgebungen durch Lern- und Suchtechniken übertreffen kann. Die GPT-Modelle (GPT-2, GPT-3, GPT-3.5, GPT-4 und ChatGPT) zeigen, dass das Training großer Modelle auf riesigen Mengen an Textdaten ohne Aufsicht ihnen die (emergente) Meta-Fähigkeit verleiht, Dinge ohne explizites Training zu lernen.

Stelle dir ein KI-Modell vor, das nicht nur in Sprache, sondern auch in anderen Modalitäten wie Bildern, Videos und Audio sowie möglicherweise sogar im Umgang mit Werkzeugen und in der Robotik versiert ist. Stelle dir vor, es könnte über menschliches Wissen hinausgehen und lernen, alles zu lernen. Das wäre ein allumfassendes, grenzenloses KI-Modell – so etwas wie der Heilige Gral der KI. Das ist es, was ich sehe, wenn ich den Plan von Google DeepMind für Gemini bis ins Unendliche verlängere.

Warum könnte Gemini ein Durchbruch sein?

Normalerweise bin ich zögerlich, Modelle als “Durchbrüche” zu bezeichnen, da heutzutage jeder neue KI-Release diesen Begriff zu tragen scheint. Aber ich habe drei Gründe zu glauben, dass es ein Durchbruch auf dem Niveau von GPT-3/GPT-4 und wahrscheinlich weit darüber hinaus sein wird:

Erstens ist die beeindruckende Forschungs- und Entwicklungsarbeit, die DeepMind und Google Brain in den letzten zehn Jahren geleistet haben, unübertroffen. Nicht einmal OpenAI oder Microsoft können da mithalten.

Zweitens zwingt der Druck, den das Bündnis von OpenAI und Microsoft auf sie ausübt – und gleichzeitig die Last der Verantwortung für Vorsicht und Sicherheit von ihnen nimmt – sie dazu, härter als je zuvor zu arbeiten.

Drittens und am wichtigsten ist, dass die Forscher und Ingenieure von Google DeepMind Meister sowohl im Sprachmodellieren als auch im tiefen und verstärkenden Lernen sind, was der Weg zur Kombination der Erfolge von ChatGPT und AlphaGo ist.

Wir müssen bis Ende 2023 warten, um Gemini zu sehen. Hoffentlich wird es ein Zustrom von beruhigenden Neuigkeiten und das Zeichen einer hellen nahen Zukunft sein, die das Feld verdient.

Google DeepMinds CEO sagt, dass sein nächster Algorithmus ChatGPT übertreffen wird

Im Jahr 2016 schrieb ein KI-Programm namens AlphaGo aus dem KI-Labor von Google’s DeepMind Geschichte, indem es einen Champion im Brettspiel Go besiegte. Jetzt sagt Demis Hassabis, Mitbegründer und CEO von DeepMind, dass seine Ingenieure Techniken aus AlphaGo verwenden, um ein KI-System namens Gemini zu schaffen, das leistungsfähiger sein wird als das hinter OpenAI’s ChatGPT.

Was ist Gemini?

Gemini von DeepMind, das sich noch in der Entwicklung befindet, ist ein großes Sprachmodell, das mit Text arbeitet und in seiner Natur ähnlich wie GPT-4 ist, das ChatGPT antreibt. Hassabis sagt jedoch, dass sein Team diese Technologie mit Techniken aus AlphaGo kombinieren wird, um dem System neue Fähigkeiten wie Planung oder Problemlösung zu verleihen.

Gemini wurde erstmals auf der Entwicklerkonferenz von Google im letzten Monat angeteasert, als das Unternehmen eine Reihe neuer KI-Projekte ankündigte. AlphaGo basierte auf einer Technik, die DeepMind entwickelt hat, dem sogenannten Verstärkungslernen. Bei dieser Methode lernt die Software, schwierige Probleme zu lösen, die eine Auswahl von Aktionen erfordern, wie bei Go oder Videospielen, indem sie wiederholte Versuche unternimmt und Feedback zu ihrer Leistung erhält. Es wurde auch eine Methode namens Baum-Suche verwendet, um mögliche Züge auf dem Brett zu erkunden und zu merken. Der nächste große Sprung für Sprachmodelle könnte darin bestehen, dass sie mehr Aufgaben im Internet und auf Computern übernehmen.

Wer ist auf dem Vormarsch?

Wenn Gemini fertiggestellt ist, könnte es eine wichtige Rolle in Googles Antwort auf die durch ChatGPT und andere generative KI-Technologien entstandene Wettbewerbsbedrohung spielen. Das Suchunternehmen hat viele Techniken entwickelt, die den jüngsten Ansturm neuer KI-Ideen ermöglicht haben, hat sich jedoch dafür entschieden, Produkte auf Basis dieser Techniken vorsichtig zu entwickeln und einzusetzen.

Seit dem Debüt von ChatGPT hat Google seinen eigenen Chatbot, Bard, auf den Markt gebracht und generative KI in seine Suchmaschine und viele andere Produkte eingebaut. Um die KI-Forschung anzukurbeln, hat das Unternehmen im April die Einheit DeepMind von Hassabis mit dem primären KI-Labor von Google, Brain, zu Google DeepMind zusammengelegt. Hassabis sagt, das neue Team werde zwei Schwergewichte zusammenbringen, die für den jüngsten Fortschritt der KI grundlegend waren.

Der Geist hinter DeepMind: Demis Hassabis

Hinter all den Fortschritten, die DeepMind im Laufe der Jahre gemacht hat, steht eine zentrale Figur: Demis Hassabis. Als Mitbegründer und CEO von DeepMind hat Hassabis das Unternehmen in einer Richtung vorangetrieben, die nicht nur spannende Entwicklungen, sondern auch die Frage nach der Ethik und den möglichen Risiken von KI aufwirft.

Mit AlphaGo Geschichte schreiben

Hassabis und sein Team haben bereits in der Vergangenheit mit ihrer Arbeit an AlphaGo Geschichte geschrieben. AlphaGo war ein Meilenstein in der KI-Forschung, weil es als erste KI erfolgreich einen menschlichen Go-Champion besiegen konnte. Go ist ein extrem komplexes Brettspiel, bei dem es mehr mögliche Spielzüge gibt als Atome im Universum. Viele Experten waren davon ausgegangen, dass es noch Jahrzehnte dauern würde, bis eine KI das Spiel meistern könnte, doch DeepMind bewies das Gegenteil.

Neuer Ansatz bei der Modellbildung

Die Schaffung eines großen Sprachmodells wie GPT-4 von OpenAI erfordert das Füttern großer Mengen an kuratiertem Text aus Büchern, Webseiten und anderen Quellen in eine KI. Die KI lernt dann aus den Mustern in diesen Daten, um Vorhersagen zu treffen und Antworten auf Fragen zu generieren. Ein wichtiger zusätzlicher Schritt bei der Erstellung von ChatGPT und ähnlich leistungsfähigen Sprachmodellen besteht darin, dass durch Feedback von Menschen auf die Antworten eines KI-Modells die Leistung verfeinert wird.

Von der physischen Welt lernen

Während Sprachmodelle durch Text über die Welt lernen, könnte die Fähigkeit, direkt aus physischen Erfahrungen der Welt zu lernen, einen wichtigen Schritt zur Verbesserung der KI darstellen. Dieser Ansatz ahmt nach, wie Menschen und Tiere lernen und könnte helfen, einige der bestehenden Grenzen von KI-Systemen zu überwinden.

Eine unsichere Zukunft

Trotz all der Aufregung und des Potenzials, das mit der KI-Entwicklung einhergeht, gibt es auch eine Menge Unsicherheit. Es besteht die Befürchtung, dass die Technologie für böswillige Zwecke verwendet oder schwer zu kontrollieren sein könnte. Einige haben sogar gefordert, dass die Entwicklung leistungsfähigerer Algorithmen pausiert werden sollte, um zu verhindern, dass etwas Gefährliches entsteht.

Hassabis’ Sicht auf die Risiken der KI

Hassabis teilt diese Bedenken, glaubt jedoch, dass die unglaublichen potenziellen Vorteile der KI – etwa für wissenschaftliche Entdeckungen in Bereichen wie Gesundheit oder Klima – es unerlässlich machen, dass die Menschheit die Entwicklung dieser Technologie nicht stoppt. Er ist sich auch bewusst, dass eine gesetzliche Pause schwierig durchzusetzen wäre.

Die Sicherheit der KI im Blick

DeepMind hat sich bereits lange vor der Erscheinung von ChatGPT mit den potenziellen Risiken der KI befasst. Einer der Mitbegründer des Unternehmens, Shane Legg, leitet seit Jahren eine “KI-Sicherheits”-Gruppe innerhalb des Unternehmens. Hassabis hat sich anderen hochrangigen KI-Persönlichkeiten angeschlossen und eine Erklärung unterzeichnet, in der vor den Risiken der KI gewarnt wird.

Die Herausforderungen der Zukunft

Eine der größten Herausforderungen besteht laut Hassabis darin, herauszufinden, welche Risiken mit leistungsfähigeren KI-Modellen verbunden sein könnten. Es bedarf dringend mehr Forschung in diesem Bereich, insbesondere hinsichtlich der Bewertungstests, um zu bestimmen, wie leistungsfähig und kontrollierbar neue KI-Modelle sind.

Die Rolle der Wissenschaft

Hassabis betont die Notwendigkeit, dass Wissenschaftler außerhalb großer Unternehmen Zugang zu diesen Modellen haben. Er ist der Meinung, dass es hilfreich sein könnte, wenn die Wissenschaftlichen Gemeinschaft frühzeitigen Zugang zu diesen Grenzmodellen hätte. Diese Zugänglichkeit könnte dazu beitragen, Bedenken auszuräumen, dass Experten außerhalb großer Unternehmen von der neuesten KI-Forschung ausgeschlossen werden.

Was bringt die Zukunft?

Wie besorgt solltest du sein? Hassabis sagt, dass niemand wirklich sicher weiß, ob KI zu einer großen Gefahr werden wird. Aber er ist sich sicher, dass wenn der Fortschritt in seinem derzeitigen Tempo weitergeht, nicht viel Zeit bleibt, um Sicherheitsmaßnahmen zu entwickeln. Er sieht das Potenzial in dem, was sie gerade in die Gemini-Reihe einbauen, und er hat keinen Grund zu der Annahme, dass es nicht funktionieren wird. Aber nur die Zukunft wird zeigen, ob diese Hoffnungen Wirklichkeit werden.

Quelle: The Algorithmic Bridge