Stability AI Stable Audio 2.0Stability AI Stable Audio 2.0

Stability AI Stable Audio 2.0: Stability AI hat mit Stable Audio 2.0 einen neuen Standard für KI-generierte Musik gesetzt. Das Modell ermöglicht die Erstellung qualitativ hochwertiger, vollständiger Tracks mit kohärenter musikalischer Struktur in einer Länge von bis zu drei Minuten und einer Auflösung von 44,1 kHz Stereo – und das alles auf Basis einer einzigen Texteingabe in natürlicher Sprache.

Hier geht es direkt zu Stable Audio 2.0, damit Ihr es selbst testen könnt!

Audio-zu-Audio-Generierung eröffnet neue kreative Möglichkeiten

Eine der spannendsten Neuerungen von Stable Audio 2.0 ist die Audio-zu-Audio-Generierung. Nutzer können jetzt eigene Audiosamples hochladen und diese mithilfe von Textbefehlen in eine Vielzahl von Klängen transformieren. Damit eröffnen sich für Künstler und Musiker völlig neue Möglichkeiten, ihre kreativen Ideen umzusetzen.

Auch die Erstellung von Soundeffekten und der Stil-Transfer wurden verbessert. So lassen sich Audioaufnahmen noch einfacher an die Stimmung und Tonalität eines Projekts anpassen. Vom Tippen auf einer Tastatur über das Brüllen einer Menschenmenge bis hin zum Summen einer Großstadt – mit Stable Audio 2.0 können Nutzer Audioinhalte auf vielfältige Weise aufwerten.

Fortschrittliche Architektur ermöglicht komplette Musikstücke

Um vollständige Tracks mit schlüssigen Strukturen zu erzeugen, wurde die Architektur des latenten Diffusionsmodells von Grund auf für längere Zeitskalen optimiert. Ein neuer, hochkomprimierter Autoencoder wandelt die Rohaudio-Wellenformen in wesentlich kürzere Darstellungen um.

Für das Diffusionsmodell kommt ein “Diffusion Transformer” (DiT) zum Einsatz, ähnlich wie bei Stable Diffusion 3. Dieser ist besser darin, Daten über lange Sequenzen hinweg zu verarbeiten als das bisherige U-Net. Durch das Zusammenspiel dieser Komponenten ist das Modell in der Lage, die für hochwertige Kompositionen essentiellen Großstrukturen zu erkennen und zu reproduzieren.

Faire Vergütung und Schutz des Urheberrechts stehen im Fokus

Genau wie der Vorgänger wurde auch Stable Audio 2.0 ausschließlich mit lizenzierten Daten aus der AudioSparx-Musikbibliothek trainiert. Alle dort registrierten Künstler hatten die Möglichkeit, ihre Werke vom Training auszuschließen. Für hochgeladene Audiodateien arbeitet Stability AI mit der Content-Recognition-Technologie von Audible Magic zusammen, um Urheberrechtsverletzungen in Echtzeit zu verhindern.

Stable Audio 2.0: Jetzt kostenlos ausprobieren!

Das neue Modell steht ab sofort kostenlos auf der Stable-Audio-Website zur Verfügung. In Kürze wird es auch über die Stable Audio API zugänglich sein. Musik-Enthusiasten und KI-Interessierte können die Möglichkeiten der AI-Musikgenerierung damit direkt selbst erkunden und eigene Tracks erstellen.

Fazit: Mit Stable Audio 2.0 erreicht die KI-gestützte Musikproduktion ein neues Level. Das Modell vereint Benutzerfreundlichkeit mit hoher Audioqualität und eröffnet Kreativen spannende Möglichkeiten – vom Hobbymusiker bis zum professionellen Produzenten. Dabei legt Stability AI großen Wert auf den Schutz von Urheberrechten und eine faire Vergütung der Künstler, deren Werke zum Training verwendet wurden. Die Zukunft der Musik ist algorithmusgetrieben – und dank Stable Audio 2.0 klingt sie verdammt gut.

Stable Radio: Rund um die Uhr KI-generierte Musik

Wer sich von der Leistungsfähigkeit von Stable Audio 2.0 überzeugen möchte, ohne selbst Hand anzulegen, sollte unbedingt bei Stable Radio vorbeischauen. Der 24/7-Livestream auf dem Stable-Audio-YouTube-Kanal spielt ausschließlich Tracks, die von der KI generiert wurden. Hier bekommt man einen spannenden Eindruck davon, zu welcher musikalischen Vielfalt und Qualität das System fähig ist.

Technische Details in Kürze im Research Paper

Für alle, die tiefer in die technischen Aspekte von Stable Audio 2.0 eintauchen möchten, wird in Kürze ein Research Paper veröffentlicht. Darin werden die Architektur des Modells und die zugrunde liegenden Algorithmen im Detail erläutert. KI-Experten und Entwickler dürfen also gespannt sein, welche Innovationen und Optimierungen unter der Haube stecken, um die beeindruckenden Ergebnisse zu ermöglichen.

Quelle: Stability AI

#KünstlicheIntelligenz #AI #GenerativeAI #MusikKI #Musikproduktion #Sounddesign #Composition #Audiogeneration

Die 10 besten Alternativen zu ChatGPT findest Du hier!
KI im Mittelstand – Jetzt künstliche Intelligenz im Unternehmen nutzen
16 besten KI Meeting Assistenten
Die 22 KI-Supermächte: Ein DeepDive auf die führenden Player 2024
Keymate.ai ist ChatGPT MIT Google Search – Krasse Kombi