Fraunhofer IAIS und AI SwedenFraunhofer IAIS und AI Sweden

Fraunhofer IAIS und AI Sweden: Das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS und AI Sweden haben bedeutende Rechenkapazitäten am Hochleistungsrechner MareNostrum 5 im Barcelona Supercomputing Center erhalten. Dieser Schritt markiert den Beginn des Projekts EuroLingua-GPT, das große KI-Sprachmodelle für europäische Sprachen entwickeln wird. Mit einer Laufzeit von einem Jahr und einer umfangreichen Nutzung der EuroHPC-Infrastruktur zielt das Projekt darauf ab, die erste Familie multilingualer, Open-Source-KI-Modelle in Europa zu schaffen.

Das musst Du wissen – Fraunhofer IAIS und AI Sweden

  • Wer: Fraunhofer IAIS und AI Sweden
  • Was: Entwicklung großer, multilingualer KI-Sprachmodelle (EuroLingua-GPT)
  • Wann: Start Ende Mai 2024, Projektlaufzeit ein Jahr
  • Wo: Barcelona Supercomputing Center, MareNostrum 5
  • Wie: Nutzung von 8,8 Millionen GPU-Stunden auf H100-Chips
  • Warum: Förderung europäischer Sprachen und Werte in der KI, Stärkung der Wettbewerbsfähigkeit
  • Wozu: Unterstützung von Forschung und Wirtschaft durch leistungsfähige, offene Sprachmodelle

Projektstart und Rechenkapazitäten

Das Projekt EuroLingua-GPT beginnt Ende Mai 2024 und wird eines der größten Kontingente an Rechenkapazitäten nutzen, die je auf der EuroHPC-Infrastruktur vergeben wurden. Mit 8,8 Millionen GPU-Stunden auf H100-Chips bietet der Hochleistungsrechner MareNostrum 5 die notwendige Leistung, um sowohl kleine als auch große Modelle mit bis zu 180 Milliarden Parametern zu trainieren.

Dr. Joachim Köhler, Abteilungsleiter NetMedia am Fraunhofer IAIS, betont: “Die gewonnenen Rechenkapazitäten sind ein Meilenstein für Deutschland und Europa. Die damit trainierten Modelle werden den Einsatz generativer KI in Unternehmen massiv beschleunigen und sowohl Wirtschaft als auch Wissenschaft einen Boost geben – GenAI ‘made in Europe’ wird damit konkret.”

Zielsetzung und Bedeutung

Das Projekt zielt darauf ab, eine Familie großer KI-Sprachmodelle zu entwickeln, die als Open Source veröffentlicht werden. Diese Modelle werden auf einem Trainingsdatensatz basieren, der 45 europäische Sprachen, Dialekte und Codes umfasst, einschließlich der 24 europäischen Amtssprachen. Damit setzen Fraunhofer IAIS und AI Sweden einen starken Fokus auf europäische Sprachen und Werte.

“Das Ziel unserer Zusammenarbeit mit AI Sweden ist es, eine Familie von großen KI-Sprachmodellen von Grund auf zu trainieren, die Open Source veröffentlicht werden sollen,” erklärt Dr. Nicolas Flores-Herr, Teamleiter Conversational AI am Fraunhofer IAIS.

Zusammenarbeit und Expertise

Fraunhofer IAIS und AI Sweden sind zwei der führenden LLM-Labore in Europa und bündeln ihre Expertise für dieses Projekt. Beide Organisationen haben umfangreiche Erfahrung in der Entwicklung von LLMs und arbeiten bereits an weiteren EU-Projekten wie TrustLLM und Deploy AI.

Magnus Sahlgren, Head of Research NLU bei AI Sweden, fügt hinzu: “Sowohl der öffentliche als auch der private Sektor in der EU verlangen nach offenen, leistungsfähigen Sprachmodellen, die für europäische Sprachen trainiert sind. EuroLingua ist eine Möglichkeit, diesen Bedarf zu adressieren.”

Ausblick und Chancen

Die EuroLingua-Modelle sollen als generalistische Basismodelle Forschung und Wissenschaft fördern und gleichzeitig spezialisierte Anwendungen in Unternehmen und öffentlichen Verwaltungen ermöglichen. Die Veröffentlichung erster gemeinsamer Modelle ist für die kommenden Monate geplant.

Fazit Fraunhofer IAIS und AI Sweden

Fraunhofer IAIS und AI Sweden: Das EuroLingua-GPT-Projekt von Fraunhofer IAIS und AI Sweden markiert einen bedeutenden Fortschritt in der europäischen KI-Forschung. Mit umfangreichen Rechenkapazitäten und einem starken Fokus auf europäische Sprachen und Werte schaffen die Partner die Grundlage für leistungsfähige, offene Sprachmodelle, die sowohl Wissenschaft als auch Wirtschaft in Europa voranbringen werden.

Pressemitteilung

#KI #AI #EuroLingua #Sprachmodelle #EuroHPC #FraunhoferIAIS #AISweden #MareNostrum