28. Juni 2019 von Prof. Dr. Thomas Franz
These 2: KI findet die Nadel im Heuhaufen. Selbst ohne Nadel und ohne Heuhaufen
Auch wenn es in Abstimmungsmeetings durchaus laut oder emotional werden kann: Softwareentwicklern wird – beruflich – ein Hang zur Sachlichkeit nachgesagt. Das strukturierte Erfassen von Anforderungen, das analytische Vorgehen in der Entwicklung und die Logik von Programmierwerkzeugen sorgen dafür, dass sich eine gewisse Denkweise einschleift. Entsprechend nüchtern gehen Entwickler das Thema Künstliche Intelligenz (KI) an: Für sie sind die Technologien zunächst neue Werkzeuge im Werkzeugkasten der Softwareentwicklung. Mal passen sie, mal nicht. So gesehen erweitern KI-Anwendungen lediglich die Möglichkeiten, die Entwicklern zur Verfügung stehen.
Aber gerade wenn es um Themen wie das Finden von Mustern oder das Erkennen von Zusammenhängen in großen Datenmengen geht, ist dies eine durchaus beachtliche Erweiterung. Ob Kaufwahrscheinlichkeiten oder Prognosen für Maschinenausfälle: Wenn Tausende Faktoren eine Rolle spielen und in Abhängigkeit zueinander stehen, kommen Menschen an ihre Grenzen. KI-Anwendungen fühlen sich in diesem Umfeld wohl. Was dahinter steckt, erläutert dieser Beitrag.
Von Symbolen, Vektoren und Methoden
Grundlegend lässt sich KI auf Basis der Repräsentation des Wissens in sogenannte symbolische und subsymbolische Systeme unterteilen: In einem symbolischen System werden Regeln und Beziehungen, sogenannte KI-Modelle, durch von Menschen verständliche Konzepte abgebildet. Das bedeutet: Menschen können das Modell verstehen und lesen. Subsymbolische Systeme hingegen sind Blackbox-Systeme, deren Inhalte nicht einfach zu verstehen sind. Ein Beispiel illustriert die unterschiedlichen Konzepte: Ziel ist es, in einer Gruppe von Menschen die Mütter zu identifizieren.
In einem symbolischen System stellen Experten die Regel auf, dass das Konzept „Mutter“ eine Spezialisierung des Konzepts „Person“ darstellt; nämlich eine Person, die weiblich ist und die mindestens eine Elternbeziehung zu einer anderen Person (ihrem Kind) hat. Sind solche Regeln hinterlegt, kann das System Suchanfragen nach Müttern beantworten – und zwar selbst dann, wenn in den durchsuchten Daten die Eigenschaft „Mutter“ nicht angegeben ist. Das System erzielt Treffer nur aufgrund der Informationen darüber, welche Beziehungen bestehen und welches Geschlecht Personen haben.
In einem subsymbolischen System hingegen setzen Experten für die gleiche Aufgabe eine sogenannte Support Vector Machine (SVM) ein oder verwenden ein künstliches neuronales Netz (KNN). Beides Verfahren, die Experten häufig und erfolgreich für die automatische Klassifikation (die Einordnung) von Daten zu bestimmten Klassen verwenden. Auch diese Verfahren sind prinzipiell dazu geeignet, Personen in Mütter und Nicht-Mütter zu klassifizieren. Dazu teilt die Support-Vector-Machine einen multidimensionalen Datenraum in Form einer Ebene – einer sogenannten Hyperplane – auf, die die Personengruppen der Mütter und Nicht-Mütter separiert. In einem vereinfachten Beispiel mit zwei Dimensionen bedeutet dies, das Punkte in einem Koordinatensystem die zu bewertenden Daten darstellen und die SVM durch diese Punkte eine Gerade ermittelt, die die Punkte in zwei Klassen (Mutter/Nicht-Mutter) trennt.
Das neuronale Netz löst die Klassifikation „Mutter/Nicht-Mutter“ gänzlich anders, und zwar durch das Ableiten dieser Klassifikationen aus einer Menge vernetzter „Neuronen“. Die Neuronen bilden verschiedene Datentransformationen ab. Die Neuronen sind jeweils zu Ebenen zusammengefasst und Neuronen benachbarter Ebenen sind durch gewichtete Verbindungen miteinander verknüpft. So werden in das Netz eingegebene Daten durch die Neuronen der verschiedenen Ebenen verarbeitet, um schließlich die Klasse „Mutter“ oder „Nicht-Mutter“ zu aktivieren.
Schon diese Erklärungen verdeutlichen: Der Prozess und die Funktionsweise subsymbolischer Systeme sind mit wenigen Worten nur schwer zu vermitteln. Den Prozess zu verstehen, der zum Entstehen von Ebenen in multidimensionalen Räumen beziehungsweise zu Gewichtungen von Beziehung zwischen Neuronen geführt hat, ist hochgradig komplex.
Wer die Wahl hat …
Zur unternehmerischen Praxis: Welches System sich eignet, ist vom Kontext der Anwendung und des Unternehmens abhängig. Wenn die Regularien es verlangen, dass Entscheidungen - beispielsweise über Kreditzusagen oder die Genehmigung von Bauverfahren - nachvollziehbar und transparent sein müssen, scheiden subsymbolische Verfahren für Unternehmen oder Behörden aus. Denn sie erschweren es, solche Erklärungen zu liefern.
Unabhängig von dem gewählten Verfahren kann ein Modell Zusammenhänge erkennen und neue Erkenntnisse liefern. Aus dieser Fähigkeit entsteht ein breites Spektrum an Einsatzmöglichkeiten:
- Frühwarnsysteme im Maschinenbau, bei denen das System lernt, die Mechanismen, die zum Ausfall von Maschinen führen, frühzeitig zu deuten (Predictive Maintenance).
- Die teil- oder vollautomatische Extraktion von Daten wie Namen, Nummern oder auch Begründungen aus Textdokumenten, beispielsweise beim Prozess der Schadenmeldung in Versicherungen.
- Automatische Verfahren zum Entdecken und zur Vorbeugung von Betrugshandlungen in der Finanz- oder Versicherungsbrache, die sogenannte Fraud Detection.
Die Beispiele und Erläuterungen zeigen: Hinter dem „Finden von Nadeln“ stecken eine Vielzahl von unterschiedlichen Methoden, Verfahren und Technologien. Damit eine KI-Anwendung den gewünschten Erfolg erzielt und allen regulatorischen Anforderungen entspricht, müssen die Beteiligten bei der Planung sauber differenzieren. Entscheidend ist es, einzelne Komponenten so auszuwählen, dass sie in Summe den Anforderungen an Transparenz und Nachvollziehbarkeit genügen.
Häufig führt mehr als ein Weg zum Ziel – aber nicht alle Wege stehen einem Unternehmen auch offen.
1. These: Vor der Künstlichen ist die menschliche Intelligenz gefragt
3. These: Nicht Datenmengen oder Speicherplatz oder Bandbreite sind die Treiber von KI. Sondern Kunden.
4. These: AI Summertime and the livin’ is easy
5. These: Das “A” in “AI” bedeutet nicht Abrakadabra, sondern „Arbeit“
6. These: KI fängt mit „D“ wie „Daten“ an