Starten Sie Ihre KI-Reise mit Deutschlands modernster KI-Beratung

NVIDIA HOVER: Der innovative Ansatz zur Steuerung von Humanoiden Robotern

Von Oliver Welling
KINEWS24.de - NVIDIA HOVER

Einleitung

NVIDIA hat mit HOVER (Humanoid Open-vocabulary Visual-language Embodied Reasoning) eine neue, vielseitige AI-Lösung entwickelt, die speziell für die Steuerung von humanoiden Robotern konzipiert ist. Diese Entwicklung könnte die Mensch-Roboter-Interaktion maßgeblich beeinflussen, da sie das Potenzial bietet, die Einsatzfähigkeit von Robotern durch ein vereinheitlichtes Steuerungssystem zu verbessern. Durch die Implementierung von HOVER wird es möglich, eine Vielzahl komplexer Bewegungen und Interaktionen zu kontrollieren und die Limitationen herkömmlicher roboterbasierter Steuerungsansätze zu überwinden.

Hauptfrage: Was macht HOVER einzigartig?

HOVER ist als ein kompakter, dennoch leistungsfähiger Neurales Netzwerkmodell mit 1,5 Millionen Parametern konzipiert, das humanoide Roboter mit vielseitigen Bewegungsfähigkeiten ausstattet. Die geringe Anzahl der Parameter im Vergleich zu traditionellen großen Sprachmodellen ermöglicht eine höhere Effizienz und Flexibilität in der Robotersteuerung. Diese Lösung wird hauptsächlich durch die Vielseitigkeit im Wechsel zwischen verschiedenen Steuerungsmodi ausgezeichnet, ohne dass eine erneute Modelltrainierung erforderlich ist.

Aufbau und Funktionalitäten von HOVER

1. Modulares Steuerungskonzept

HOVER integriert mehr als 15 Steuerungsmodi, die in unterschiedlichen Anwendungen genutzt werden können, darunter:

  • Navigation: Bewegung im Raum durch Geschwindigkeit und Lagekontrolle.
  • Manipulation: Verfolgung präziser Bewegungen für beidhändige Aufgaben.
  • Teleoperation: Steuerung durch Exoskelette oder VR-Interfaces, die menschliche Bewegungen auf den Roboter übertragen.

2. Einheitlicher Steuerungsraum

Der zentrale Vorteil von HOVER liegt in seinem vielseitigen, einheitlichen Steuerungsraum, der mehrere Konfigurationsmodi für die Robotersteuerung unterstützt. Das bedeutet, dass spezifische Steuerungsbefehle unabhängig kombiniert werden können, um ein breites Spektrum an Anwendungen abzudecken.

ModusOberkörpersteuerungUnterkörpersteuerungWurzelsteuerung
ExBody✓ Joint-Winkel✓ Geschwindigkeit✓ Geschwindigkeit
H2O✓ kinematische Positionen
OmniH2O✓ kinematische Positionen
HumanPlus✓ Joint-Winkel✓ Geschwindigkeit✓ Geschwindigkeit
HOVER Kinematik und Joint-Winkel Kinematik und Joint-Winkel Geschwindigkeit

Funktionale Komponenten von HOVER

1. Steuerungsmodi und Masken für Vielseitigkeit

HOVER verwendet eine Maskenstruktur, um die Steuerungsmodi zu differenzieren:

  • Kinematische Positionsverfolgung: Zielpunkte im 3D-Raum werden für Hauptpunkte wie Schultern oder Hüfte definiert.
  • Lokale Gelenkwinkelverfolgung: Gelenkwinkel werden spezifisch für jede Bewegungseinheit des Roboters vorgegeben.
  • Wurzelverfolgung: Geschwindigkeit, Höhe und Orientierung der Wurzel werden kontinuierlich gesteuert.

2. Bewegungsretargeting und -distillation

Zur Erreichung eines menschlichen Bewegungsstils werden große Bewegungsdatenbanken (wie MoCap) genutzt und durch Bewegungsretargeting auf die Roboter übertragen. HOVER lernt durch Distillation-Techniken die Bewegungen von einem sogenannten „Oracle Policy“ Modell und verbessert dabei die Steuerung ohne manuelle Programmierung.

Anwendungsbereiche von HOVER

HOVER kann in folgenden Bereichen bedeutend sein:

  • Industrieautomation: Roboter können präzise, mehrstufige Aufgaben in der Fertigung übernehmen, z.B. durch beidhändige Manipulation.
  • Gesundheitswesen: Unterstützung in Pflegeeinrichtungen, z.B. bei der Hebe- oder Positionierungsunterstützung für Menschen.
  • Telepräsenz und Fernsteuerung: Hochentwickelte Interaktionen in VR- oder AR-Umgebungen, bei denen HOVER eine intuitive Steuerung der humanoiden Roboter ermöglicht.

Vergleich von HOVER mit Spezialisten und anderen Generalisten

Vergleich mit Spezialisten

HOVER wurde getestet und zeigte gegenüber spezialisierten Steuerungsmodellen durchweg bessere Leistungen in verschiedenen Testmetriken, wie z. B.:

  • ExBody-Modus: Verbesserung der Positionierungsgenauigkeit.
  • HumanPlus-Modus: Präzise Steuerung in kinematischen und gelenkspezifischen Aufgaben.
MetrikExBody-SpezialistHOVERHumanPlus-SpezialistHOVER
Kinematische Genauigkeit275 mm185 mm266 mm182 mm
Gelenkwinkelgenauigkeit83.1°63.9°80.1°64.5°
Geschwindigkeit5.75 mm/frame5.49 mm/frame6.16 mm/frame5.91 mm/frame

Vergleich mit anderen Generalisten

Zusätzlich wurde HOVER mit anderen Multi-Mode-Modellen verglichen und zeigte im Durchschnitt eine höhere Genauigkeit bei der Positionsverfolgung und geringere Fehler in allen getesteten Modi. Die Maskierungstechnik ermöglichte es HOVER, in realen Situationen auf unerwartete Anforderungen zu reagieren.

Realweltliche Evaluationen und Leistungsmetriken

  1. Präzision und Fehlerminimierung:
    • Quantitative Tests mit stehenden Bewegungssequenzen zeigten, dass HOVER die Fehlerrate im Vergleich zu Spezialisten um durchschnittlich 11 % verringerte.
  2. Robustheit bei Moduswechseln:
    • Bei abrupten Steuerungswechseln, wie dem Umschalten von ExBody auf H2O während der Bewegung, zeigte HOVER hohe Stabilität und Genauigkeit, was besonders für Anwendungsfälle in dynamischen Umgebungen wichtig ist.
TestbedingungenÜberlebensrateGelenkfehlerLokalisierungsfehler
Simulation (Q̂ Dataset)99,1 %138 mm59,4 mm
Realwelt (Stehende Bewegungen)98,9 %128 mm62,5 mm

Einblicke und zukünftige Entwicklungen

HOVER steht noch am Anfang seiner Entwicklung. In künftigen Versionen könnte die Integration automatisierter Moduswechsel den Einsatz weiter optimieren und die Reaktionsfähigkeit in realen Szenarien verbessern.

Fazit

Mit HOVER hat NVIDIA einen revolutionären Controller für humanoide Roboter geschaffen, der vielseitige Steuerungsmöglichkeiten in einer kompakten und flexiblen Struktur vereint. Die Anwendungen reichen von der Mensch-Roboter-Interaktion über Automatisierung bis hin zur Teleoperation, und die bisherigen Tests zeigen eine klare Überlegenheit gegenüber traditionellen, spezialisierten Steuerungsmodellen. HOVER könnte die Art und Weise, wie humanoide Roboter eingesetzt werden, grundlegend verändern.

Quellenangaben

  1. NVIDIA HOVER Projektseite
  2. HOVER PDF Dokument auf arXiv

Ähnliche Beiträge

Science

XElemNet: Ein Schritt zur Erklärbarkeit Künstlicher Intelligenz in der Materialwissenschaft

XElemNet: Ein Schritt zur Erklärbarkeit Künstlicher Intelligenz in der Materialwissenschaft

Business Language Models

ChatGPT Search: Intelligente, konversationsbasierte Websuche jetzt verfügbar

ChatGPT Search: Intelligente, konversationsbasierte Websuche jetzt verfügbar Die Funktion kombiniert die natürliche Konversation mit ChatGPT und der Möglichkeit, gezielte und.

Folge uns

Beliebte Artikel

About Author

Maßgeschneiderte KI-Lösungen für Ihr Unternehmen

TechNow ist Ihr strategischer Partner für den erfolgreichen Einsatz von Künstlicher Intelligenz.

Beraten lassen

HOT CATEGORIES

de_DEGerman