Ist Ihre Maschine selbstlernend?
In den letzten Jahren haben sich nur wenige Technologien so schnell entwickelt wie die Künstliche Intelligenz, insbesondere die neuronalen Netzwerke. Dieses exponentielle Wachstum wurde hauptsächlich durch zwei Faktoren erreicht:
Neue, zunehmend leistungsfähige Modelle und Algorithmen wurden entwickelt, dank derer neuronale Netzwerke Aufgaben schneller und effizienter lernen können.
Immer höhere Rechenleistung hat es diesen neuronalen Netzwerken ermöglicht, größer zu werden und im Gegenzug eine zunehmende Menge an Informationen aufzunehmen.
Obwohl die heute erreichten Rechenkapazitäten nahezu denen eines Menschen nahekommen, sind diese künstlichen neuronalen Netzwerke noch weit davon entfernt, Aufgaben auszuführen, die für Menschen und sogar die meisten Tiere trivial sind. Es wird zunehmend offensichtlich, dass das Wachstum der Netzwerke allein in Bezug auf die Größe möglicherweise nicht ausreicht, damit KI bestimmte Situationen so verstehen oder vorhersagen kann wie Menschen und die aktuellen Einschränkungen überwinden kann.
Zum Beispiel weiß ein aufmerksamer Fahrer, der einen Fußgänger bemerkt, dass der Fußgänger weiterhin existiert und sich bewegt, auch wenn er durch ein Hindernis verdeckt ist, und kann vernünftigerweise vorhersagen, dass der Fußgänger die Straße möglicherweise überqueren wird. Im Gegensatz dazu kann ein neuronales Netzwerk, das nicht versteht, dass das „Fußgänger“-Objekt, wenn es hinter dem Hindernis verschwindet, weiterhin dahinter existiert, nicht vorhersagen, dass es bald wieder auftauchen und eine Gefahr darstellen könnte. Infolgedessen kann ein autonomes Fahrzeug bis heute noch nicht vollständig zuverlässig garantieren, dass es Gefahr in allen möglichen Fällen erkennen und vermeiden kann.
Es gibt hitzige Debatten unter führenden Persönlichkeiten der KI-Forschung darüber, welcher Ansatz der richtige ist, um diese Einschränkungen zu überwinden.
Einer der vielversprechendsten Ansätze scheint das **Selbstüberwachte Lernen** zu sein, das auch von Yann LeCun, Turing-Preisträger und Chief Scientist des MetaAI-Teams, unterstützt wird. Das Hauptmerkmal dieser Methode ist, dass das Lernen des neuronalen Netzwerks nicht von einem Menschen abhängt, der ihm Tausende von bereits „gelösten“ Beispielen bereitstellt (wie beim weiter verbreiteten „Überwachten Lernen“; mehr über diese und andere Methoden erfahren Sie in unserem Artikel über **Foundation Models**), sondern dass es autonom lernt und sich selbst korrigiert.
Selbstüberwachtes Lernen ermöglicht es dem Netzwerk zudem, eigenständig zusätzliche Informationen zu „erlernen“, die es ihm ermöglichen, Objekte zu identifizieren und deren zukünftiges Verhalten vorherzusagen.
Dieser Lernmechanismus ist noch ähnlicher unserem: Das Netzwerk lernt, indem es Szenen „beobachtet“, die „vor seinen Augen vorbeiziehen“, Bilder derselben Szene zu verschiedenen Zeiten vergleicht, ähnliche Bilder vergleicht und manchmal sogar Aktionen ausführt (denken Sie an Roboter, Simulatoren usw.), um dann die Szene erneut zu beobachten, die durch diese Aktionen verändert wurde.
Einige dieser Methoden gehen so weit, dass sie versuchen, neuronale Netzwerke das Konzept von Objekten und Entitäten (z. B. den „Fußgänger“) lernen zu lassen, damit sie dann ein Modell mit dem Gelernten erstellen und dieses sogar in Situationen anwenden können, die sie noch nicht gesehen haben. Zu diesen Algorithmen gehören die bekanntesten 3DETR, DINO und VICRegL — letzterer wurde erst vor wenigen Wochen veröffentlicht. Besonders DINO gelingt es bereits erstaunlich gut, das potenziell relevante Objekt vom Kontext oder Hintergrund der Szene zu erkennen und zu trennen, ohne dass ein Mensch dieses Training überwacht. Selbst mit anderen besser etablierten KI-Methoden wären diese Ergebnisse nur in sehr begrenzten Kontexten möglich gewesen.
Mit der Weiterentwicklung der Fähigkeit dieser neuen Algorithmen, Objekte zu identifizieren und deren Verhalten vorherzusagen, haben sie bereits einen wichtigen ersten Erfolg erzielt: Das Netzwerk kann nun viel effizienter trainiert werden, indem es mit einem wesentlich kleineren Datensatz gefüttert wird, als es bei „überwachten“ Netzwerken erforderlich gewesen wäre. In der Praxis wird es zunehmend schwieriger, nutzbare Daten für kommerzielle Zwecke zu finden. Daher erweist sich die Fähigkeit, die gewünschten Ergebnisse mit einem deutlich reduzierten Datensatz zu erzielen, bereits als erheblicher Vorteil.
Während der Vorbereitung auf die industrielle Nutzung dieser neuen Methoden hat die Forschung bereits neue Entwicklungen des Konzepts des Selbstüberwachten Lernens (z. B. Energie-basiertes Selbstüberwachtes Lernen) begonnen, die darauf abzielen, die Welt noch komplexer abzubilden. Die Zukunft dieser Forschung scheint dahin zu deuten, Bilder auf probabilistischer Basis zu modellieren, das heißt, die Vielfalt und Unvorhersehbarkeit der Welt, in der wir leben, zu berücksichtigen. Obwohl wir noch weit von diesen Ergebnissen entfernt sind, ist es interessant, über die Möglichkeiten nachzudenken, die sich mit einer Technologie eröffnen, die autonom lernen kann und dann viel mehr Wissen, nicht nur über ein Objekt, sondern auch über den Kontext und potenzielle zukünftige Ergebnisse, zur Entscheidungsfindung nutzen kann.
Inzwischen testen wir bei Artificialy einige dieser innovativen Methoden und wenden sie im Bereich der Computer Vision an. Insbesondere konzentrieren wir uns auf die Fähigkeit dieser Modelle, effiziente neuronale Netzwerke auch unter Bedingungen der Datenknappheit zu trainieren. Wir haben diese Methoden auch in einigen realen Fällen für unsere Kunden angewendet, beispielsweise bei einem komplexen Medtech-Problem und in KI-Anwendungen in städtischen Umgebungen, wo Datenschutzbestimmungen die Datenzugänglichkeit oder Bildnutzung erheblich einschränken.
Artificialy
Artificialy ist ein hochmodernes Kompetenzzentrum, das auf das beste wissenschaftliche Wissen zurückgreift, dank seiner Verbindungen zu renommierten wissenschaftlichen Institutionen im Bereich KI, und zieht die besten Talente im Bereich Data Science an und hält sie. Modernes Fachwissen wird mit den 25 Jahren Erfahrung der Gründer in der Durchführung von Projekten mit großen Unternehmen und der Lieferung messbarer Ergebnisse kombiniert.
Text: Damiano Binaghi, Head of Computer Vision at Artificialy SA