Apple trainiert KI-Modelle ohne Zustimmung auf YouTube-Inhalten

Apple hat Berichten zufolge YouTube-Videos genutzt, um KI-Modelle ohne Zustimmung der Ersteller zu trainieren. Betroffen sind dabei unter anderem Inhalte des bekannten Tech-Rezensenten Marquees Brownlee (MKBHD), MrBeast, PewDiePie, Stephen Colbert, John Oliver und Jimmy Kimmel. Das musst Du wissen – Apple trainiert KI-Modelle ohne Zustimmung auf YouTube-Inhalten Apple und andere Tech-Giganten haben YouTube-Videos ohne Zustimmung der Ersteller genutzt, um KI-Modelle zu trainieren. Über 170.000 Videos von mehr als 48.000 Kanälen wurden dafür verwendet. Die Untertitel der Videos dienten als Trainingsdaten. Die Daten wurden von der Non-Profit-Organisation EleutherAI heruntergeladen. Apple nutzte diese Daten unter anderem für das Training des OpenELM-Modells. Eine Untersuchung von Proof News deckte auf, dass einige der wohlhabendsten KI-Unternehmen der Welt Material aus tausenden YouTube-Videos genutzt haben, um ihre KI-Systeme zu trainieren. Dies geschah trotz YouTubes Vorschriften, die das Sammeln von Material ohne Erlaubnis untersagen. Unsere Untersuchung ergab, dass Untertitel von 173.536 YouTube-Videos, die von mehr als 48.000 Kanälen stammen, von Schwergewichten aus dem Silicon Valley wie Anthropic, Nvidia, Apple und Salesforce verwendet wurden“, berichtete Wired. Die Downloads wurden Berichten zufolge von der Non-Profit-Organisation EleutherAI durchgeführt, die Entwicklern helfen soll, KI-Modelle zu trainieren. Das Ziel war anscheinend, Trainingsmaterialien kleinen Entwicklern und Akademikern zur Verfügung zu stellen. Allerdings haben auch große Tech-Konzerne wie Apple dieses Datenset genutzt. Laut einem von EleutherAI veröffentlichten Forschungspapier ist das Datenset Teil einer Zusammenstellung namens „The Pile“. Diese Datensätze sind für jeden zugänglich, der über genügend Speicherplatz und Rechenleistung verfügt. Neben Akademikern haben auch Unternehmen wie Apple, Nvidia und Salesforce das Datenset für ihre eigenen Forschungsarbeiten verwendet. Reaktionen und rechtliche Implikationen Zum Zeitpunkt der Berichterstattung hatte Apple auf eine Anfrage zur Stellungnahme noch nicht reagiert. Das Hauptproblem in dieser Situation ist nicht unbedingt der Datenschutz, sondern die Nutzung urheberrechtlich geschützter Inhalte ohne Zustimmung der Autoren. Der YouTube-Host Marquees Brownlee zum Beispiel verdient durch Werbeeinnahmen an seinen Tech-Reviews. Wenn ein großes Netzwerk seine Videos ohne Erlaubnis kopieren und ausstrahlen würde, ohne ihm die Werbeeinnahmen zu zahlen, wäre das ein klarer Verstoß gegen das Urheberrecht. Die aktuellen Urheberrechtsgesetze basieren auf dem Berner Übereinkommen von 1971 und berücksichtigen nicht die technologischen Fortschritte der letzten Jahrzehnte. Dies führt zu komplexen rechtlichen Herausforderungen, insbesondere im Zusammenhang mit der Nutzung von Inhalten für das Training von KI-Modellen. Apple hat die Daten zwar nicht selbst heruntergeladen, sondern dies wurde von EleutherAI durchgeführt. Dennoch illustriert dieser Fall die rechtlichen Probleme, die beim Scrapen des Internets zur Ausbildung von KI-Systemen entstehen können. Die Gefahr der Verwendung von Material ohne Genehmigung wird durch die Nutzung von Datensätzen, die von Dritten zusammengestellt wurden, nur noch größer. Fazit Apple trainiert KI-Modelle ohne Zustimmung auf YouTube-Inhalten Dieser Fall zeigt deutlich die Herausforderungen und rechtlichen Unsicherheiten auf, die mit der Nutzung von Online-Inhalten zur Ausbildung von KI-Modellen verbunden sind. Während Unternehmen wie Apple vermutlich in gutem Glauben handelten, betont dieser Vorfall die Notwendigkeit klarer Richtlinien und Gesetze, um solche Situationen in Zukunft zu vermeiden. #Apple #KI #YouTube #Urheberrecht #Technologie Quelle

Related Post