Starten Sie Ihre KI-Reise mit Deutschlands modernster KI-Beratung
Search
Close this search box.
Search
Close this search box.

Google Labs Whisk ermöglicht visuelle Ideenfindung mit KI und Bildern

Von Oliver Welling
KINEWS24.de - Google Labs Whisk

Google Labs hat ein neues Experiment vorgestellt: Whisk, ein innovatives Tool, das Nutzern ermöglicht, Bilder anstelle langer Texteingaben zu verwenden, um visuelle Konzepte zu erstellen und zu remixen. Dieses neue KI-Werkzeug zielt auf schnelle, kreative Prozesse ab und bietet neue Möglichkeiten für Künstler, Designer und Hobby-Nutzer gleichermaßen.

Das musst Du wissen: Google Labs Whisk

  • Was ist Whisk? Ein experimentelles KI-Tool von Google Labs, das Bild-Input anstelle von Text-Prompts nutzt.
  • Funktion: Nutzer laden Bilder hoch – z. B. eines Motivs, eines Hintergrunds und eines Stils – und kombinieren diese zur Erstellung neuer, einzigartiger Visuals.
  • Technologie: Whisk basiert auf der Google-Generativ-KI „Gemini“ und dem Bildgenerierungsmodell „Imagen 3“.
  • Anwendungsbeispiele: Erstellung von digitalen Kunstwerken, Enamel-Pins, Stickern und anderen Illustrationen durch Remix von Bildkomponenten.
  • Verfügbarkeit: Aktuell nur in den USA verfügbar unter labs.google/whisk.
  • Zielgruppe: Kreative Köpfe, die schnell visuelle Ideen entwickeln und erkunden möchten.

Bilder statt Worte: Wie Google Labs Whisk funktioniert

Statt umständlicher textbasierter Prompts legt Whisk den Fokus auf die visuelle Eingabe. Nutzer ziehen Bilder in die Plattform und definieren damit drei zentrale Kategorien:

  1. Subject (Motiv): Das Hauptobjekt der Bildkomposition.
  2. Scene (Szenerie): Die Umgebung oder der Hintergrund des Bildes.
  3. Style (Stil): Der gewünschte visuelle Stil, wie z. B. Anime, Vintage oder Cartoon.

Beispielsweise könnte man ein Bild eines Wals als Motiv, eine Blumenwiese als Szene und ein cartoonartiges Wolkenmuster als Stil wählen, um eine fantasievolle, kreative Illustration zu erzeugen.

Ein Blick hinter die Kulissen Google Labs Whisk:

Whisk nutzt KI-Modelle von Google: Die Gemini-Technologie generiert automatisch Bildbeschreibungen (Captions) für die hochgeladenen Bilder. Diese Beschreibungen werden dann in das Bildgenerierungsmodell Imagen 3 eingespeist. Das Ergebnis ist nicht einfach eine exakte Kopie des Inputs, sondern eine kreative Neuinterpretation.

Whisk ist damit weniger ein Bildbearbeitungstool für pixelgenaue Anpassungen, sondern vielmehr ein Werkzeug für die schnelle visuelle Exploration und Ideenfindung. Nutzer können verschiedene Varianten ausprobieren und die Resultate herunterladen oder verfeinern.

Schnelle und kreative Experimente für Designer

In einem Demo-Video zeigt Google Labs eindrucksvoll die Funktionsweise von Whisk:

  • Ein Nutzer wählt zunächst ein Motiv (z. B. ein stilvoller älterer Mann), dann eine Umgebung (Dschungelszene) und einen Stil („90s Vintage Anime“).
  • Mit zusätzlichen Details wie „Das Motiv fährt ein fliegendes Fahrrad“ werden kreative Eingaben weiter präzisiert.
  • Whisk erzeugt eine erste Version des Bildes, die durch eine Refine-Funktion weiter angepasst werden kann.

Erste Rückmeldungen von Künstlern und Kreativen beschreiben Whisk als völlig neues Tool zur Ideenentwicklung – eine visuelle Spielwiese für innovative Konzepte, die nicht auf Perfektion, sondern auf Exploration ausgerichtet ist.

Grenzen und Möglichkeiten

Da Whisk nur Schlüsselmerkmale der Eingabebilder übernimmt, können die Resultate vom Original abweichen. Dies kann sich beispielsweise in unterschiedlichen Proportionen, Frisuren oder anderen Details des Motivs zeigen. Nutzer haben jedoch die Möglichkeit, die zugrundeliegenden Prompts jederzeit zu bearbeiten.

Fazit: Google Labs Whisk eröffnet neue Möglichkeiten für visuelle Kreativität

Mit Whisk stellt Google Labs ein spannendes Experiment vor, das die Nutzung von KI zur visuellen Ideenfindung auf ein neues Level hebt. Statt detaillierter Text-Prompts ermöglicht Whisk die Verwendung von Bildkomponenten, um kreative, originelle Werke zu generieren. Damit spricht das Tool Designer, Künstler und alle Kreativen an, die in kürzester Zeit innovative Konzepte entwickeln wollen.

Aktuell ist Whisk nur für Nutzer in den USA zugänglich. Wer das Tool ausprobieren möchte, kann dies auf labs.google/whisk tun und Google Labs Feedback geben.


Quelle: Google Blog

Ähnliche Beiträge

Business Science

Meta AI Byte Latent Transformer (BLT): Ein effizientes, tokenizer-freies Modell für die nächste Generation der

Meta AI Byte Latent Transformer (BLT): Ein effizientes, tokenizer-freies Modell für die nächste Generation der Sprachmodelle Tokenizer-freies Modell: BLT verarbeitet.

Business Grafik

MidJourney Moodboards: Revolution für personalisierte KI-Kunst

MidJourney Moodboards: Revolution für personalisierte KI-Kunst Inspirationssammlung: Nutzer können gezielt Bildkollektionen hochladen, die als Grundlage für KI-generierte Kunstwerke dienen. KI-Analyse:.

Folge uns

Beliebte Artikel

About Author

Maßgeschneiderte KI-Lösungen für Ihr Unternehmen

TechNow ist Ihr strategischer Partner für den erfolgreichen Einsatz von Künstlicher Intelligenz.

Beraten lassen

HOT CATEGORIES

de_DEGerman