Kathrin Plankensteiner

* 31.08.1984 in Villach, ist Gruppenleiterin von Data Analytics & Intelligence an der Digital Factory der FH Vorarlberg. Zuvor arbeitete sie als Softwareentwicklerin & Data Scientist bei Blum. Die gebürtige Kärntnerin und leidenschaftliche Kitesurferin studierte Technische Mathematik und Datenanalyse und promovierte in Angewandter Statistik. Sie ist Mitbegründerin des Meetups „Business & Industrial Data Analytics (BIDA) Vorarlberg“.

Digitalisierung erfordert Fehlerkultur

Juli 2019

Kathrin Plankensteiner, Gruppenleiterin Data Analytics & Intelligence an der Digital Factory der FH Vorarlberg, über die Macht der Algorithmen und das Rebranding etablierter Methoden.

Viele Industriebetriebe haben die Intention, ein Machine Learning Projekt umzusetzen, und gehen davon aus, dass sie dann innerhalb kürzester Zeit ein System haben, das die richtigen Entscheidungen trifft. Das ist in den seltensten Fällen so, denn die Daten sind oft nicht auf Anhieb geeignet, um daraus zu lernen. Die Erwartungen im Bereich Künstliche Intelligenz sind aktuell viel zu hoch gesteckt. Menschen, die solche Systeme entwickeln, um datengetriebene Entscheidungen zu treffen, müssen genau wissen, welche Daten verwendet wurden und welche Informationen dahinterstecken, welche Modelle und Algorithmen anwendbar sind und welche nicht. Die Methodik ist sehr stark abhängig von den jeweiligen Datencharakteristiken, und diese kann von Datensatz zu Datensatz unterschiedlich sein. Das benötigt sehr viel statistisches Know-How, daher brauchen die Spezialisten zumindest Basiskenntnisse in Statistik und Wahrscheinlichkeitstheorie. Sie müssen Probleme und Herausforderungen kennenlernen. Dafür braucht es Awareness. Diese Sensibilisierung verhindert das Hineinstolpern in Fehler.

Etablierte Methodik – neu verpackt

Viele der Methoden und Algorithmen sind bereits seit Jahrzehnten bekannt – jetzt aber neu verpackt. Die ersten künstlichen neuronalen Netze – Kern von Deep Learning – gab es bereits in den 50er-Jahren. Dasselbe Rebranding erfolgt im Bereich Supervised Learning, das während meiner Studienzeit unter Klassifikation und Regression bekannt war. Reinforcement Learning ist sehr eng mit stochastischen Prozessen und klassischer Entscheidungstheorie verwandt – das klingt aber wenig attraktiv. 
Das neue Wording tut dem Bereich einerseits gut, andererseits birgt es aber auch Gefahren, da viele bereits bestehende Erkenntnisse aus der traditionellen Statistik einfach ignoriert werden.

Neue Tools 

Den derzeitigen Hype um Machine Learning und Künstliche Intelligenz sehe ich kritisch. Die Methoden können viel und sind sehr mächtig. Wenn die angewendete Methodik unpassend ist oder nicht repräsentative Daten verwendet werden, besteht die Gefahr, daraus falsche Schlüsse abzuleiten und das kann fatale Folgen haben, zum Beispiel in der Produktion oder in der Logistik. Heute haben wir sehr viele Tools, bei denen die Anwender nur noch „Klicks“ machen müssen. Somit kann Machine Learning leicht an die Allgemeinheit gebracht werden. Es birgt aber die Gefahr, dass durch fehlendes, fachliches Know-How die Tools falsch eingesetzt werden. Früher mussten die Data Scientists Codes selbst schreiben und sich dadurch tiefer mit der Materie auseinandersetzen. Heute reicht ein Klick und voilà, ein Modell für die Vorhersage, zum Beispiel wann meine Maschine ausfallen wird, ist fertig. 
Da die Verwendung der Tools und die Entwicklung intelligenter Systeme, wie zum Beispiel Vorhersagemodelle, nun vermeintlich so einfach ist, steigt durch die fehlende Fachkompetenz die Gefahr grober Fehlentscheidungen und Missinterpretationen. Die explorative Analyse der Daten, welche bei jedem Projekt ein fixer Bestandteil sein sollte, wird oft übergangen. Es werden methodische Voraussetzungen an die Datencharakteristiken nicht gecheckt und/oder falsche Modelle für die Generalisierung verwendet. Wie sollen dann die richtigen Schlüsse gezogen werden?

Falsche Vorstellung

Die Modelle und Algorithmen anzuwenden ist keine Herausforderung mehr, da dies oft automatisiert ist. Für Nicht-Statistiker ist es einfacher geworden, hier einzusteigen, dennoch haben viele eine falsche Vorstellung vom Beruf des Data Scientist. Rund 80 Prozent der Zeit läuft in die Datenbereinigung und -aufbereitung, das Verstehen vom Business und vom Prozess. Das ist viel mühselige und teilweise sehr unspektakuläre Arbeit, die nur marginal standardisierbar und automatisierbar ist.

Fehlerkultur etablieren

In der Entwicklung von intelligenten Systemen gibt es sehr selten schnelle Lösungen. Im Allgemeinen benötigt es mehrere Lernschleifen aus „fehlgeschlagenen“ Projekten. Die Fehlerkultur spielt hier eine bedeutende Rolle. Wir dürfen nicht annehmen, dass ein vielversprechendes Projekt auf Anhieb alle Erwartungen erfüllt. Meistens ergibt sich ein Lerneffekt, und man geht es das nächste Mal besser an. Aber: In unserer Kultur ist jedes Scheitern negativ behaftet, doch wenn ich immer alles gleich perfekt mache, ist der Lerneffekt gleich null. Um Innovationen zu verwirklichen, muss ein Umdenken stattfinden und sich eine andere Fehlerkultur etablieren. In der realen Welt kann es mit echten Daten nicht auf Anhieb perfekt laufen. Ich bekomme diese nicht in der Form, in der ich sie benötige und auch meistens nicht in der Qualität und mit dem Informationsgehalt, den ich gerne hätte. Dies muss ich bei der Auswahl meiner Methodik, bei der Evaluation und vor allem bei der Interpretation der Ergebnisse und den Schlussfolgerungen berücksichtigen.

Digital Factory Vorarlberg

Zahlreiche Firmen haben großes Interesse an der Thematik, und die Digital Factory Vorarlberg bietet verschiedene Möglichkeiten der Kooperation. Wir begleiten vorwiegend Firmen aus dem Vorarlberger Raum bei Projekten in der Digitalisierung, der Datenanalyse sowie in den Bereichen Machine Learning oder Künstliche Intelligenz. Gemeinsam schauen wir uns die Problemstellung an und definieren die Fragestellung. Hier ist die Kommunikation enorm wichtig. Die Prozesse im Unternehmen müssen bekannt sein, erst dann können wir die Lösung entwickeln. Die Verknüpfung ist erfolgsentscheidend, wir begleiten Unternehmen von Anfang an. Es erfolgt ein gegenseitiger Erfahrungsaustausch, denn auch wir lernen von den Firmen. Deshalb abschließend ein wichtiges Statement: Digitalisierung erfolgt nicht von heute auf morgen. Es ist ein langwieriger Prozess mit vielen Schleifen.

Kommentare

To prevent automated spam submissions leave this field empty.