LMaaS – Optimierte Nutzung großer Sprachmodelle durch Vorhersage der Textlänge
LMaaS Problem: Variierende Generationslängen verursachen ineffiziente Ressourcennutzung. Lösung: Magnus sagt die Generationslänge basierend auf Eingaben und semantischen Merkmalen voraus. Effizienz:…