PIGINet, ein System des MIT, nutzt KI, um die Planungszeit von Haushaltsrobotern um bis zu 80% zu reduzieren und ermöglicht effiziente, anpassungsfähige Aufgabenlösung.PIGINet, ein System des MIT, nutzt KI, um die Planungszeit von Haushaltsrobotern um bis zu 80% zu reduzieren und ermöglicht effiziente, anpassungsfähige Aufgabenlösung.

MIT PIGINet: Maschinelles Lernen für effizientere Roboteraufgaben

Stell dir vor, du bekommst einen brandneuen Haushaltsroboter geliefert und bittest ihn, dir eine Tasse Kaffee zu machen. Obwohl er einige Grundkenntnisse aus vorherigen Übungen in simulierten Küchen hat, gibt es unzählige Aktionen, die er ausführen könnte. Wie soll der Roboter herausfinden welche Schritte in einer neuen Situation sinnvoll sind?

Einführung von MIT PIGINet

Hier kommt PIGINet ins Spiel, ein neues System, das darauf abzielt, die Problemlösungsfähigkeiten von Haushaltsrobotern effizient zu verbessern. Forscher vom Computer Science and Artificial Intelligence Laboratory (CSAIL) des MIT verwenden maschinelles Lernen, um den üblichen iterativen Prozess der Aufgabenplanung, der alle möglichen Aktionen in Betracht zieht, zu vereinfachen. PIGINet beseitigt Aufgabenpläne, die nicht den Anforderungen an kollisionsfreie Bewegungen genügen, und reduziert die Planungszeit um 50-80%, wenn es nur auf 300-500 Problemen trainiert wird.

Verbesserung der Effizienz von Haushaltsrobotern

Normalerweise versuchen Roboter verschiedene Aufgabenpläne und verfeinern ihre Bewegungen iterativ, bis sie eine machbare Lösung finden. Das kann ineffizient und zeitaufwendig sein, besonders wenn bewegliche und gelenkige Hindernisse im Spiel sind. PIGINet ist ein neuronales Netzwerk, das “Pläne, Bilder, Ziele und Anfangsfakten” aufnimmt und dann die Wahrscheinlichkeit vorhersagt, dass ein Aufgabenplan verfeinert werden kann, um machbare Bewegungspläne zu finden.

MIT PIGINet in der Praxis

Das Team hat hunderte von simulierten Umgebungen erstellt, jede mit unterschiedlichen Layouts und spezifischen Aufgaben, die erfordern, dass Objekte zwischen Arbeitsplatten, Kühlschränken, Schränken, Waschbecken und Kochtöpfen umgestellt werden. Durch Messung der für die Problemlösung benötigten Zeit verglichen sie PIGINet mit vorherigen Ansätzen. PIGINet konnte die Planungszeit in einfacheren Szenarien um 80% und in komplexeren Szenarien, die längere Planungssequenzen und weniger Trainingsdaten haben, um 20-50% reduzieren.

Die Vorteile von PIGINet

“Systeme wie PIGINet, die die Kraft datengetriebener Methoden nutzen, um bekannte Fälle effizient zu behandeln, aber immer noch auf “First-Principles” Planungsmethoden zurückgreifen können, um lernbasierte Vorschläge zu überprüfen und neue Probleme zu lösen, bieten das Beste aus beiden Welten und liefern zuverlässige und effiziente Allzwecklösungen für eine Vielzahl von Problemen”, sagt MIT-Professorin und CSAIL-Hauptuntersucherin Leslie Pack Kaelbling.

PIGINet’s Verwendung von multimodalen Einbettungen in der Eingabesequenz ermöglichte eine bessere Darstellung und Verständnis komplexer geometrischer Beziehungen. Durch die Verwendung von Bilddaten konnte das Modell räumliche Anordnungen und Objektkonfigurationen erfassen, ohne die 3D-Meshes der Objekte für genaue Kollisionsprüfungen zu kennen, was eine schnelle Entscheidungsfindung in verschiedenen Umgebungen ermöglichte.

Zukünftige Verbesserungen von MIT PIGINet

“Unser zukünftiges Ziel ist es, PIGINet weiter zu verfeinern, um alternative Aufgabenpläne vorzuschlagen, nachdem unpraktikable Aktionen erkannt wurden. Dies wird die Erstellung machbarer Aufgabenpläne weiter beschleunigen, ohne dass große Datensätze für das Training eines Allzweckplaners von Grund auf benötigt werden. Wir glauben, dass dies die Art und Weise, wie Roboter während der Entwicklung trainiert und dann in jedem Haushalt eingesetzt werden, revolutionieren könnte”, sagt Zhutian Yang, Doktorand am MIT CSAIL und Hauptautor der Arbeit.

“Diese Arbeit adressiert die grundlegende Herausforderung bei der Implementierung eines Allzweckroboters: Wie man aus vergangenen Erfahrungen lernt, um den Entscheidungsprozess in unstrukturierten Umgebungen, die mit einer großen Anzahl von beweglichen und gelenkigen Hindernissen gefüllt sind, zu beschleunigen”, sagt Beomjoon Kim PhD ’20, Assistenzprofessor in der Graduate School of AI an der Korea Advanced Institute of Science and Technology (KAIST).

Quelle: MIT News