Starten Sie Ihre KI-Reise mit Deutschlands modernster KI-Beratung

Meta KI-Training – E-Mails enthüllen brisante Details: „Torrenting vom Firmenlaptop fühlt sich nicht richtig an“

Von Oliver Welling
KINEWS24.de - Meta KI-Training

Meta KI-Training steht schon länger in der Kritik. Neue, entsiegelte E-Mails belasten Meta schwer im Urheberrechtsstreit um das Training von KI-Modellen mit illegal beschafften Büchern. Die Enthüllungen deuten auf ein systematisches Torrenting urheberrechtlich geschützter Werke in enormem Umfang hin und widersprechen früheren Darstellungen des Tech-Giganten. Hat Meta bewusst in großem Stil auf Raubkopien gesetzt, um seine Künstliche Intelligenz voranzutreiben?

Das Geständnis und die erschreckende Dimension des Meta KI-Training Daten-Diebstahls

Letzten Monat räumte Meta ein, für das Training seiner KI-Modelle auf den umstrittenen Datensatz LibGen zurückgegriffen zu haben – eine Sammlung von Millionen illegal kopierter Bücher. Bisher waren die Details des Torrenting-Vorgangs jedoch unklar. Nun veröffentlichte, ungeschwärzte E-Mails von Meta-Mitarbeitern liefern brisante Einblicke. Aus Gerichtsdokumenten der Autoren geht hervor, dass Meta „mindestens 81,7 Terabyte Daten aus verschiedenen Schattenbibliotheken über die Seite Anna’s Archive, darunter mindestens 35,7 Terabyte Daten von Z-Library und LibGen“ per Torrent heruntergeladen hat.

Zuvor soll Meta bereits 80,6 Terabyte Daten von LibGen getorrent haben. Die Kläger werfen Meta ein „erschreckendes Ausmaß“ an illegalem Torrenting vor und betonen, dass bereits „verschwindend geringere Fälle von Datenpiraterie – nur 0,008 Prozent der Menge der von Meta illegal kopierten urheberrechtlich geschützten Werke – dazu geführt haben, dass Richter das Verhalten der US-Staatsanwaltschaft zur strafrechtlichen Untersuchung vorgelegt haben“.

Interne Warnungen ignoriert: „Torrenting vom Firmenlaptop fühlt sich nicht richtig an“

Die Buchautoren drängten Meta auf detailliertere Informationen zum Torrenting, insbesondere im Hinblick auf das sogenannte „Seeding“ – das Weiterverteilen der heruntergeladenen Dateien – was die urheberrechtlichen Bedenken verstärkt. Meta wehrte sich gegen diese Aufklärungsversuche, doch die Autoren sammelten eigenständig Beweismaterial. Ein Schlüsseldokument ist eine E-Mail von Nikolay Bashlykov, einem Meta-Forschungsingenieur.

Bereits im April 2023 äußerte er Bedenken: „Torrenting vom Firmenlaptop fühlt sich nicht richtig an“, schrieb Bashlykov und fügte einen Smiley hinzu. In derselben Nachricht äußerte er seine „Besorgnis über die Verwendung von Meta-IP-Adressen, um ‚Raubkopien‘ per Torrent zu laden“.

Ernsthafte Bedenken und die Reaktion des Managements

Bis September 2023 hatte Bashlykov die Emojis offenbar weggelassen und sich direkt an die Rechtsabteilung gewandt. In einer E-Mail betonte er, dass die Nutzung von Torrents auch das „Seeding“ der Dateien beinhalten würde – „d. h. die Weitergabe der Inhalte nach außen, das könnte rechtlich nicht in Ordnung sein“. Die E-Mails belegen laut den Autoren, dass Meta sich der Illegalität des Vorgehens bewusst war.

Bashlykovs Warnungen scheinen jedoch ungehört verhallt zu sein. Die Autoren argumentieren, dass die Beweislage zeige, dass Meta sich entschieden habe, das Torrenting so gut wie möglich zu verbergen, während es bis April 2024 weiterhin Terabytes an Daten aus verschiedenen Schattenbibliotheken herunterlud und seedete.

Versteckte Machenschaften: „Stealth-Modus“ und minimiertes Seeding?

Um das Seeding zu verschleiern, soll Meta laut einer internen Nachricht des Meta-Forschers Frank Zhang die Datensätze nicht über Facebook-Server heruntergeladen haben, um das „Risiko“ zu vermeiden, dass jemand den „Seeder/Downloader“ auf Facebook-Server zurückverfolgen kann. Die Arbeit sei im „Stealth-Modus“ erfolgt. Zudem habe Meta die Einstellungen so modifiziert, „dass so wenig Seeding wie möglich stattfinden konnte“, wie der für Projektmanagement zuständige Meta-Manager Michael Clark in einer eidesstattlichen Aussage erklärte.

Zuckerberg unter Druck: Widersprüchliche Aussagen und die Eskalation beim Meta KI-Training

Die neuen Erkenntnisse führen dazu, dass die Autoren eine erneute Vernehmung der an der Torrenting-Entscheidung beteiligten Meta-Mitarbeiter fordern, da die Fakten angeblich „früheren eidesstattlichen Aussagen widersprechen“. So habe Mark Zuckerberg beispielsweise behauptet, nicht in die Entscheidung über die Nutzung von LibGen für das KI-Training involviert gewesen zu sein. Ungeschwärzte Nachrichten zeigen jedoch, dass die „Entscheidung zur Nutzung von LibGen“ nach „einer vorherigen Eskalation an MZ“ gefallen sei, so die Behauptung der Autoren.

„Fair Use“ oder Urheberrechtsverletzung im großen Stil? Metas juristische Argumentation bröckelt

Meta reagierte bisher nicht auf Anfragen von Ars Technica und beharrt weiterhin darauf, dass das Meta KI-Training mit Daten aus LibGen unter „Fair Use“ falle. In einem Antrag auf Abweisung der Klage argumentierte Meta, dass die Kläger „keinen einzigen Fall anführen, in dem irgendein Teil eines Buches tatsächlich von einem Dritten über Torrent von Meta heruntergeladen wurde, geschweige denn, dass die Bücher der Kläger in irgendeiner Weise von Meta verbreitet wurden“. Doch die Autoren erweitern ihre Argumentation nun auf das Seeding und argumentieren, dass dieses sehr wohl eine Verbreitung darstellt und somit eine direkte Urheberrechtsverletzung vorliegt.

Während Meta weiterhin auf seine juristische Strategie vertraut, könnte die neue Torrenting-Enthüllung die Position des Unternehmens erheblich schwächen. Die Autoren haben nun die Möglichkeit, ihre Theorie der unerlaubten Verbreitung zu untermauern, die entscheidend für den Vorwurf der direkten Urheberrechtsverletzung ist. Meta will die Vorwürfe des Seedings derzeit nicht weiter anfechten und plant, „die Fakten richtigzustellen und diese unbegründete Behauptung im summarischen Urteilsverfahren zu entkräften“.

Fazit: Droht Meta ein juristisches Nachspiel für das Meta KI-Training Daten Torrenting?

Die neu ans Licht gekommenen E-Mails zeichnen ein düsteres Bild von Metas Umgang mit Urheberrechten im Kontext des Meta KI-Training. Interne Warnungen wurden ignoriert, mögliche Rechtsverstöße offenbar billigend in Kauf genommen und sogar versucht zu verschleiern. Sollten die Autoren mit ihrer Argumentation der Urheberrechtsverletzung durch „Seeding“ Erfolg haben, droht Meta nicht nur eine empfindliche Niederlage im laufenden Rechtsstreit, sondern auch ein erheblicher Imageschaden. Die Debatte um die Rechtmäßigkeit des KI Trainings mit öffentlich zugänglichen, aber urheberrechtlich geschützten Daten, dürfte durch diesen Fall weiter an Brisanz gewinnen.

#AI #KI #ArtificialIntelligence #KuenstlicheIntelligenz #Meta #Torrenting #Urheberrecht #KIDatentraining

Quelle Meta KI-Training

ArsTechnica

Ähnliche Beiträge

AI-Agents Business

Agentic AI Layers: Der Guide zu intelligenten Agenten (2025)

Entdecke die Agentic AI Layers: Der ultimative Guide für intelligente Agenten. Von Governance bis Ethik – meistere die KI-Revolution 2025!

Business

Sam Altman warnt: Werden KI-Vorteile wirklich für alle verteilt?

OpenAI-Chef Sam Altman warnt: Werden KI-Vorteile gerecht verteilt? Er fordert "Compute Budget" und mehr Diskussion über KI-Folgen für Arbeitsmarkt und.

Folge uns

Beliebte Artikel

About Author

Maßgeschneiderte KI-Lösungen für Ihr Unternehmen

TechNow ist Ihr strategischer Partner für den erfolgreichen Einsatz von Künstlicher Intelligenz.

Beraten lassen

HOT CATEGORIES

de_DEGerman