Bild: TU Technische Universität Wien
Entdeckt der Mensch etwas Unbekanntes, weiß er sich meist schnell zu helfen. Früher halfen ihm Bücher weiter, heute ist es selbstverständlich, Suchbegriffe bei Google einzugeben. Eine Forschungsgruppe um den Leiter des Labors Vision for Robotics, Markus Vincze, an der TU Wien widmet sich jetzt innerhalb eines dreijährigen, vom Wissenschaftsfonds FWF finanzierten Projekts diesem Problem. Die Fähigkeiten von Robotern sollen so erweitert werden, dass sie in der Lage sind, unbekannte Objekte als unbekannt zu identifizieren und sich alle nötigen Informationen zum Erkennen der Objekte im Internet zu beschaffen.
Roboter nutzt das Internet
Dies soll mit Hilfe von Deep Learning umgesetzt werden. Zusammen mit internationalen Projektpartnern aus Italien, Frankreich und Großbritannien entwickelten die Forscher ein Verfahren mit mehreren Stufen. Zunächst erfolgt die Segmentierung. Hier unterscheidet der Roboter ein Objekt von seiner Umgebung. Im zweiten Schritt erstellt er ein 3D-Modell des Objekts, das mit der internen Datenbank des Roboters abgeglichen wird. Ist dieser Abgleich nicht erfolgreich, greift der Roboter auf das Internet zu. Dafür verwendet er Suchalgorithmen wie ImageNet oder die Google-Bildersuche. Anhand der Begleittexte zu den Bildern identifiziert er die Substantive, die am häufigsten in Zusammenhang mit dem jeweiligen Bild genannt werden. In einem anschließenden Gegencheck gibt der Roboter dann wiederum die gefundenen Substantive ein und vergleicht die daraufhin erscheinenden Bilder mit den zuvor gefundenen Bildern.
Erste Praxistests
Das neu entwickelte Verfahren wird bereits an existierenden Robotermodellen, wie z.B. dem auch an der TU Wien entwickelten Hilfsroboter Hobbit, getestet. In einem Praxistest wurden dem Roboter in einer normalen Büroumgebung zehn typische Utensilien auf einem Schreibtisch präsentiert. Sie fanden sich alle in der Datenbank des Roboters. Anschließend löschten die Forscher eines der Objekte aus der Datenbank des Roboters, der nun herausfinden musste, um welches Objekt es sich handelte. Mit diesem Test sollte sich zeigen, inwiefern der Roboter in der Lage ist, wichtige Kontextinformationen zu verarbeiten.