„Wir müssen aus Daten Informationen machen“ / Machine Learning und Monte Carlo Simulation


Veröffenticht am 30.09.2022 von Horst
Avatar

„Wir müssen aus Daten Informationen machen“

Machine Learning und Monte Carlo Simulation

 

In der Praxis werden die Begriffe Machine Learning, Deep Learning oder auch Künstliche Intelligenz inflationär und nicht immer richtig verwendet. Hinzu kommen aus der Geschäftswelt, der Controlling-Abteilung oder dem Data Science-Umfeld weitere Begriffe wie Business Intelligence, Supervised und Unsupervised Learning, Data Mining hinzu. Während wir mit den genannten Verfahren auf vorhandenen Daten aufsetzen, müssen wir in anderen Situationen diese Daten erst generieren. Möglich wird das mit der Monte Carlo Simulation.

 

Es ist ohne Zweifel, dass Daten zunehmend unser Leben und die Geschäftswelt bestimmen. Mit der Einführung der automatisierten Datenverarbeitung und im Besonderen der internetbasierten Anwendungen werden heute jährliche Datenzuwächse im 2-stelligen Zettabyte-Bereich erreicht. Das sind Zahlen mit 21 Nullen, die wegen der exponentiellen Entwicklungen in den kommenden 5 Jahren vermutlich weitere 3 Stellen hinzugefügt werden können (Yottabyte). Viele Daten – und hier durch die Brille des Business betrachtet – sind Fluch und Segen zugleich: Fluch deshalb, weil die Komplexität und Unschärfe steigen, Segen, weil wir beispielsweise viel individueller und präziser unsere Kunden identifizieren und Produkte und Services punktgenauer anbieten können. Zu unserem bereits erwähnten Begriffs-Potpourri kommt nun auch noch das Akronym „VUKA“ (engl. „VUCA“) hinzu, weil neben der Komplexität und Unschärfe (Ambiguität) für Unternehmen die Volatilität (z. B. Marktschwankungen, politisch-wirtschaftliche Veränderungen usw.) und damit letztendlich die Unsicherheit hinzukommen.

 

Ein Segen sind die Daten zum Beispiel auch für das autonome Fahren. Hier haben wir es mit recht stabilen „Eingangsdaten“ und konkreten „Ergebnissen“ (was passiert, wenn…) zu tun. Systeme werden mit durchgezogenen Linien, Hindernissen oder roten Ampeln trainiert und die Ergebnisse sind klar und zweifelsfrei: ein Auto darf nicht über eine durchgezogene Linie fahren, Hindernissen muss ausgewichen werden und an der roten Ampel wird das Fahrzeug angehalten. Wir benötigen für diese Art von Training viele Daten, die uns aber durch Kameras und Sensorik in umfangreichendem Maße vorliegen, und wir können mit ihnen KI-Systeme „supervised“ trainieren, denn wir kennen zu den Eingangsdaten die Ergebnisse.

 

Wenn wir Datenbestände besitzen, aus denen wir maschinell erst Informationen generieren müssen, dann handelt es sich oft um eine „unsupervised“-Fragestellung: wer sind meine Kunden, wie kann ich diese gruppieren („Personas“) und wie könnte ich in weiteren Schritten Korrelationen zwischen den Personas und beispielsweise Produkten aufdecken. Das heißt, wenn früher Marketingabteilungen sich „bauch- und erfahrungsgesteuert“ auf bestimmte Personas verständigt hatten, setzen diese zunehmend auf Methoden und Verfahren des Data Mining bzw. Datenmustererkennungen, weil diese mittlerweile leistungsfähiger und genauer sind.

 

Es zeigt sich also sehr deutlich, dass Daten als Rohstoff sehr wichtig sind, aber verglichen mit dem schwarzen Gold erst raffiniert werden müssen. Wir müssen also aus Daten Informationen machen und nennen dies im Unternehmenskontext Business Intelligence. Zu den Verfahren der Business Intelligence gehören zum Beispiel Cluster-Analysen (unsupervised learning, Personas, s. o.), Klassifikationen (gute/schlechte Bonität, potentieller Kunde/uninteressant) oder auch Assoziationsanalysen („Kunden, diesen Artikel gekauft haben, kauften auch…“). Die Verfahren nutzen sowohl Algorithmen der KI (Machine/Deep Learning) als auch statistische Verfahren.

 

Was machen aber Unternehmen, die eine große Planungsunsicherheit haben, und denen verlässliche Daten für Prognosen, Szenarien und Planwerte fehlen? Hier bietet sich ein Verfahren an, dass in Theorie und Praxis immer interessanter wird, die Monte Carlo Simulation (MCS). Bei der MCS werden viele verschiedene Daten mit Hilfe von Zufallszahlen generiert. Unter Einsatz von modernen Rechenverfahren (z. B. Vektorrechnungen) lassen sich 1.000, 10.000 oder auch viel mehr Szenarien erzeugen, die dann wiederum ihren Niederschlag in einer Unternehmensrechnung (Erfolg, Bilanz, Cashflow) finden.

 

Wenn Sie Interesse an diesem Verfahren haben, sprechen Sie uns gerne an. Wenn Sie selbst einmal eine G+V mit Umsätzen, Kosten und Risiken simulieren möchten, warten Sie noch einige Tage und nutzen Sie dann unseren Prototypen…

 


Kontakt aufnehmen

Sie wünschen mehr Informationen oder haben eine Frage? Schreiben Sie uns:

Datenschutzerklärung
captcha