Schematische Darstellung Analyse-Software, Bild: Fraunhofer HHI

Die Analyse-Software des Fraunhofer HHI visualisiert mit Hilfe von Algorithmen komplexe Lernverfahren (schematische Darstellung). Bild: Fraunhofer HHI

Früher war es mühsam, im Computer Fotos zu sortieren. Heute klickt man auf die Gesichtserkennung – und flugs erscheint eine Bildauswahl der Tochter oder des Sohnes. Computer sind inzwischen gut darin, große Datenmengen zu analysieren und nach bestimmten Strukturen wie einem Gesicht auf Bildern zu fahnden. Möglich machen das neuronale Netze, ein inzwischen etabliertes und ausgefeiltes informationstechnisches Analyseverfahren.

Das Problem: Nicht nur Forscher wissen heute nicht genau, wie neuronale Netze Schritt für Schritt arbeiten und wieso sie zu diesem oder jenem Ergebnis kommen. Neuronale Netze sind gewissermaßen Black Boxes, Computerprogramme, in die man Werte einspeist und die zuverlässig Ergebnisse liefern. Will man einem neuronalen Netz etwa beibringen, Katzen zu erkennen, dann lernt man das System an, indem man es mit Tausenden von Katzenbildern füttert. Wie ein kleines Kind, das langsam versteht, Katzen von Hunden zu unterscheiden, lernt auch das neuronale Netz automatisch.

„In vielen Fällen aber interessieren sich Forscher weniger für das Ergebnis, sondern vielmehr dafür, was das neuronale Netz eigentlich tut, wie es zu Entscheidungen kommt“, sagt Dr. Wojciech Samek, Leiter der Forschungsgruppe für Maschinelles Lernen am Fraunhofer Heinrich-Hertz-Institut HHI in Berlin. Samek und seine Kollegen haben deshalb zusammen mit Kollegen von der Technischen Universität Berlin eine Methode entwickelt, mit der man einem neuronalen Netz beim Denken zuschauen kann.

Maßgeschneiderte Krebstherapien mit KI

Das ist beispielsweise für die Erkennung von Krankheiten wichtig. Heute kann man Computer beziehungsweise neuronale Netze bereits mit den Erbgut-Daten von Patienten füttern. Das Netzwerk analysiert dann, mit welcher Wahrscheinlichkeit der Patient eine bestimmte genetische Erkrankung hat. „Viel interessanter wäre es aber, wenn wir genau wüssten, an welchen Merkmalen das Programm seine Entscheidungen fest macht“, sagt Samek. Das könnten bestimmte Gendefekte sein, die bei dem Patienten vorliegen – und die wiederum könnten ein möglicher Angriffspunkt für eine individuell auf den Patienten zugeschnittene Krebstherapie sein.

Mit ihrer Methode können die Forscher die Arbeit der neuronalen Netze rückwärts ablaufen lassen. Sie arbeiten sich damit vom Ergebniswert in umgekehrter Richtung durch das Programm. „Wir können genau sehen, an welcher Stelle eine bestimmte Gruppe von Neuronen eine bestimmte Entscheidung getroffen und wie stark diese zum Ergebnis beigetragen hat“, sagt Wojciech Samek.

Dass das Verfahren funktioniert, konnten die Forscher schon mehrfach auf eindrucksvolle Weise zeigen. So haben sie zwei im Internet öffentlich verfügbare Programme verglichen, die beide in der Lage sind, Pferde auf Bildern zu erkennen. Das Ergebnis war verblüffend. Das erste Programm erkannte tatsächlich den Körper der Pferde. Das zweite aber orientierte sich an den Copyright-Zeichen der Fotos, welche Hinweise auf Foren für Pferdeliebhaber oder Reit- und Zuchtvereine gaben, sodass das Programm eine hohe Trefferquote erreichte, obwohl es gar nicht gelernt hatte, wie Pferde aussehen.

Anwendungsfeld Big Data

"Man sieht also, wie wichtig es ist, genau zu verstehen, wie ein solches Netzwerk arbeitet“, sagt Samek. Das sei vor allem auch für die Industrie interessant. „So ist es denkbar, aus den Betriebsdaten einer komplexen Produktionsanlage herauszulesen, welche Parameter die Qualität eines Produktes beeinflussen oder zu Schwankungen bei derselben führen“, sagt Samek. Auch für viele andere Applikationen, bei denen es um die neuronale Analyse großer oder komplexer Datenmengen geht, sei die Erfindung interessant. „In einem anderen Experiment konnten wir zeigen, anhand welcher Parameter ein Netzwerk entscheidet, ob ein Gesicht alt oder jung erscheint.“

Banken analysieren laut Samek seit geraumer Zeit mithilfe neuronaler Netze sogar die Kreditwürdigkeit von Bankkunden. Dafür werden große Mengen von Kundendaten gesammelt und von einem neuronalen Netz bewertet. „Wenn man wüsste, wie das Netz zu seiner Entscheidung kommt, könnte man von vornherein die Menge der Daten reduzieren, indem man die relevanten Parameter auswählt“, so der Experte. Das sei durchaus auch im Interesse der Kunden.

Während der Messe Cebit in Hannover vom 20. bis 24. März 2017, Halle 6, Stand B36 werden die Forscher um Samek zeigen, wie sie mit ihrer Software die Black Boxes neuronaler Netze analysieren – und wie diese aus Gesichtern das Alter oder Geschlecht der Person herauslesen oder Tiere erkennen. hei