Ferret-UI: Die mobile Benutzeroberfläche revolutioniert durch multimodale LLMs
Die jüngsten Fortschritte in multimodalen großen Sprachmodellen (MLLMs) sind beeindruckend, doch diese MLLMs für allgemeine Anwendungsbereiche weisen oft Defizite im Verständnis und der