Zum Inhalt
mundo

Statistik: Schlüssel zur Künstlichen Intelligenz

-
in
  • Künstliche Intelligenz
  • mundo
Eine nächtliche Stadt-Skyline, die von blau, flirrenden Linien durchzogen ist. © Who is Danny​/​stock.adobe.com

Die Mathematikerin Prof. Nadja Klein forscht an der Schnittstelle von Statistik und Maschinellem Lernen. Für Forscher*innen auf der ganzen Welt entwickelt sie Modelle, mit denen zum Beispiel der australische Energiemarkt, der internationale Waffenhandel oder die Baumvielfalt in Singapur besser verstanden werden können.

Neue Methoden an der Schnittstelle von Statistik und Maschinellem Lernen sind das Arbeitsfeld von Prof. Nadja Klein: „Mein Ziel ist es, reale Phänomene mit Hilfe von Daten besser zu verstehen“, sagt sie. Was ihre Forschung ausmacht, ist, dass sie dazu die sogenannte „Bayesianische Statistik“ nutzt. Diese ist nach dem englischen Wissenschaftler Thomas Bayes benannt, der bereits im 18. Jahrhundert zur Wahrscheinlichkeitstheorie forschte. Durch die Verfügbarkeit von Hochleistungsrechnern hat die Bayesianische Statistik in jüngster Zeit sprunghaft an Bedeutung gewonnen und ergänzt zunehmend etablierte Algorithmen des Maschinellen Lernens.

„Durch die Kombination herkömmlicher statistischer Verfahren und Algorithmen von intelligenten Systemen mit eben dieser Bayesianischen Statistik können wir nicht nur aus Daten lernen, sondern auch Vorwissen in unsere Modelle einbringen und damit beispielsweise verlässlichere Risikoabschätzungen machen“, erklärt Nadja Klein. Auf diese Weise können etwa die Daten aus Zulassungsstudien für neue Medikamente mit wichtigen Erkenntnissen aus Vorstudien in einem Modell kombiniert werden – um, vereinfacht gesagt, Krankheiten besser zu behandeln. Ein weiterer Vorteil ihres Ansatzes: Mit Bayesianischer Statistik können Unsicherheiten quantifiziert werden. Klassische Algorithmen des Maschinellen Lernens liefern zum Beispiel beim autonomen Fahren nur „Punktprognosen“ – also etwa, dass ein Auto in den nächsten zwei Sekunden seine Fahrtrichtung um 15 Grad ändern wird. „Dabei ist es aber noch wichtiger zu wissen, wie wahrscheinlich es ist, dass dieses Ereignis auch wirklich eintritt, um beispielsweise Unfälle zu vermeiden. Und das können wir mit unseren Modellen quantifizieren“, sagt die Forscherin.

Australien: Strompreise vorhersagen

Mehrere Autos und einige Fußgänger in einer futuristisch wirkenden Straßenverkehrssituation. Auf der Straße deuten Kreise die Sensor-Technik eines intelligent fahrenden Autos an. © Atchariya63​/​stock.adobe.com
Gerade beim autonomen Fahren ist es wichtig, zu wissen, wie wahrscheinlich es ist, dass ein bestimmtes Manöver auch wirklich gefahren wird. Mit Bayesianischer Statistik können Forscher*innen solche Unsicherheiten nun quantifizieren.

Das diverse Team aus talentierten Nach­wuchs­wissen­schaftler*innen um Prof. Nadja Klein entwickelt nicht nur neue Methoden, sondern bringt diese auch in die Anwendung. Dabei arbeiten sie mit Expert*innen auf der ganzen Welt zusammen – an den unterschiedlichsten Themen. Diese Interdisziplinarität ist Chance und Herausforderung zugleich. „Ich lerne bei jedem neuen Projekt extrem viel, nicht nur auf der Methodenseite, sondern auch auf der angewandten Seite“, betont die Professorin. Als sie mit einem Kollegen an der Melbourne Business School zur Vorhersage von Strompreisen arbeitete, musste sie zunächst die komplexe Marktdynamik verstehen. „Wenn wir Methoden entwickeln wollen, die in der Praxis auch wirklich relevant sind, müssen wir tief in die Problemstellung und Ziele einsteigen und ganz genau verstehen, was da eigentlich passiert. Nur so können wir entscheiden, welche Methode geeignet ist, welche Limitationen zu berücksichtigen sind und was wir weiterentwickeln müssen“, erklärt sie.

Ein Mann tippt mit seinem Finger auf ein Hegaxon mit den Worten "Machine Learning". Vor ihm in der Luft schweben weitere Technologie-Icons. © fotogestoeber​/​stock.adobe.com
Wenn neu entwickelte statistische Modelle in die Anwendung kommen sollen, treffen Maschinelles Lernen, Bayesianische Statistik und zum Beispiel Wirtschaftswissenschaften, Medizin oder Ökologie aufeinander.

So unterliegen Strompreise zum Beispiel extremen Schwankungen und es kommt darauf an, ob es Tag oder Nacht ist, Wochenende oder Wochentag, Sommer oder Winter. Hinzu kommen auch immer wieder beobachtete Ausreißer von Extrempreisen. „Mein australischer Kollege arbeitet mit Zeitreihen, die sehr hoch aufgelöst die tatsächliche Preisentwicklung abbilden“, berichtet Nadja Klein. „Um die Preise aber auch möglichst gut vorhersagen zu können, mussten wir diese Daten mit dem Wissen um die saisonalen Schwankungen kombinieren und auch die Unsicherheit durch die Ausreißer methodisch in den Griff bekommen. Das ist sehr komplex und mit klassischen Verfahren kaum abzubilden.“ Ihr Team setzte daher auf eine Kombination aus statistischen Verfahren und Maschinellem Lernen.

Gerade zu Beginn solcher Kooperationen investiert das Team um Nadja Klein viel Zeit: Oft werden die gleichen Begriffe in anderen Zusammenhängen verwendet, manchmal müssen auch die Partner ihre Daten noch einmal neu aufbereiten, um sie überhaupt nutzbar zu machen. Auf der anderen Seite müssen Nadja Klein und ihr Team ihre Methoden so erklären, dass auch die fachfremden Gegenüber sie verstehen. Erst dann können sie gemeinsam echte Daten und komplizierte Zusammenhänge in die abstrakte Welt eines Modells übertragen, bei dem am Ende mehrere Formeln herauskommen, mit denen man zum Beispiel Strompreise vorhersagen kann. „Wenn es dann klappt, die Resultate erklärbar wieder in die reale Welt zu übertragen, sind wir umso zufriedener. Ein ‚i-Tüpfelchen‘ ist dann noch, wenn wir den Nutzen der neu gewonnenen Erkenntnisse in der Praxis verfolgen können“, sagt die Professorin.

Ihre Kooperationen mit der Universität Melbourne und der Melbourne Business School haben lange Tradition: Kurz nach der Promotion an der Universität Göttingen im Jahr 2015 traf Nadja Klein kurz vor Weihnachten bei einer Konferenz auf Prof. Michael Smith. Der Statistiker und Ökonometriker inspirierte die junge Wissenschaftlerin mit seiner Forschung. „Wir knüpften Kontakt und arbeiteten recht schnell gemeinsam an meiner Bewerbung um ein Feodor-Lynen-Fellowship der Alexander von Humboldt-Stiftung bei ihm“, berichtet sie. Erst beim Einreichen der finalen Unterlagen habe sie festgestellt, dass ihr potenzieller Gastgeber in Melbourne sitzt – am anderen Ende der Welt. „Ich war vorher noch nie weiter weg als Spanien“, erinnert sie sich. Als die Zusage kam, zögerte sie nicht lange und entschied, für einen zweijährigen Forschungsaufenthalt nach Melbourne zu gehen. „Das war eine Zeit, die mich sowohl fachlich als auch persönlich sehr weitergebracht hat und die ich sehr wertgeschätzt habe“, blickt die Wissenschaftlerin zurück. Seitdem hat sich ihr Netzwerk von Forscher*innen, mit denen Sie regelmäßig im Austausch ist, stark erweitert – nicht nur in Melbourne, sondern beispielsweise auch an verschiedenen Einrichtungen in Sydney, Brisbane oder Adelaide. Auch 2023 steht noch einmal ein Forschungsaufenthalt in Australien auf ihrem Programm.

Singapur: Baumvielfalt erhalten

Von Nadja Kleins internationalen Kontakten profitieren auch ihre wissenschaftlichen Mitarbeiter*innen: So war ihr Doktorand Lucas Kock bereits zweimal für je vier Wochen in Singapur, um ein methodisches Projekt voranzutreiben. In einem der Projekte von Nadja Klein mit der National University of Singapore geht es um das Thema Baumvielfalt. „Wir dürfen dabei mit Daten arbeiten, die bislang noch niemand genutzt hat“, sagt sie. Ziel ist es, mit Hilfe neuer Modelle und Methoden Schwankungen in dort heimischen, tropischen Baumarten besser zu verstehen. Einfach gesagt, könnte man die Erkenntnisse aus dem Projekt für die Beantwortung aktueller Fragen nutzen. Etwa: Wie kann man den Wald gezielt gesund erhalten und bepflanzen oder Waldsterben verhindern? Wie können Städte mit Hilfe von Bäumen klimaresilienter werden? Aktuell steckt das Team mitten in der Methodenentwicklung. Dabei profitieren die Forscher*innen auch von ihren Vorgängerprojekten zum Thema Artenvielfalt.

Vier begrünte Hochhäuser mit Glasfassaden und die begrünten Dächer niedrigerer Gebäude vor einer Skyline. © Kien​/​stock.adobe.com
Wie können Städte klimaresilienter werden? Dank der Modelle von Prof. Nadja Klein und ihrem Team können Forscher*innen zum Beispiel aus den Daten zur Baumvielfalt in Großstädten neue Erkenntnisse gewinnen.
Ein Mader steht zwischen großen Steinen und trägt eine tote Ratte im Maul. © Heiko Zahn​/​stock.adobe.com
Wer frisst wen und in welchem Umfang? Die Artenentwicklung über die Zeit zu beobachten, Zusammenhänge zu erkennen und daraus Prognosen abzuleiten, ist extrem kompliziert. Hierbei helfen neue statistische Modelle, die auch unbekannte Parameter schätzen und einbeziehen können.

Gemeinsam mit Kolleg*innen aus der Ökologie hat Nadja Klein zum Beispiel sogenannte „prey-predator models“ weiterentwickelt, die das Räuber-Beute-Verhältnis – wie das von Wieseln und Wühlmäusen – beschreiben. Ihre Modelle können einen Beitrag zu Antworten auf Fragen liefern wie: Wer frisst wen in welchem Umfang und welchen Einfluss hat das auf die Artenentwicklung über die Zeit? Wie verhält sich die Artenvielfalt grundsätzlich? Wie verändert sie sich? Welchen Einfluss haben äußere Faktoren? Die Zusammenhänge seien so komplex, dass herkömmliche Methoden sie nicht abbilden könnten, sagt Nadja Klein: „Wir haben es mit beinahe chaotischen Systemen und komplizierten Differentialgleichungen zu tun. Mit Hilfe der Bayesianischen Statistik können wir die vielen unbekannten Parameter in diesem System aber relativ gut – und überhaupt erst – miteinbeziehen und schätzen.“

Europa und Deutschland: Waffenhandel und autonomes Fahren

Zum Erfahrungsschatz der Mathematikerin gehören auch komplexe Analysen politischer oder sozialer Netzwerke. Am Beispiel Waffenhandel wird deutlich, wie komplex Netzwerke werden können: Welche Länder handeln Waffen mit welchem Land? Wer exportiert wohin und wer importiert von wo? „Man möchte nicht nur die Zusammenhänge besser verstehen“, erklärt Nadja Klein das Ziel von Netzwerkanalysen. Mit Bayesianischer Statistik kann ihr Team auch die herkömmliche Netzwerkstatistik bereichern, denn: je größer und komplexer das Netzwerk, desto schlechter sind klassische Verfahren anwendbar. „Approximative Verfahren der Bayesianischen Statistik sorgen in diesem Fall für die notwendige Skalierbarkeit“, sagt die Wissenschaftlerin. „Außerdem kann sie zusätzlich zu den Daten der Netzwerkstatistik – also etwa die Knoten im Netzwerk – auch weitere exogene Variablen aufnehmen und dadurch unbeobachtete Heterogenität erklärbar machen.“ In dem Projekt zum Waffenhandel forscht Nadja Klein gemeinsam mit Partnern der Ludwig-Maximilians-Universität München.

Partner für ihre Anwendungsprojekte findet die Forscherin auch in der Wirtschaft. Im Rahmen seiner Dissertation entwickelt ihr Doktorand Christian Schlauch gemeinsam mit dem Technologieunternehmen Continental in dem vom Bundesministerium für Wirtschaft und Klimaschutz geförderten Projekt „KI Wissen“ Verfahren des Maschinellen Lernens, die verschiedene Wissensquellen integrieren können – zum Beispiel Welt- oder Expertenwissen. Dazu nutzt er kontinuierliche bzw. lebenslange Lernverfahren und probabilistische Modelle. Der Vorteil: „Diese Herangehensweise ermöglicht Zuverlässigkeitsaussagen, die beim autonomen Fahren besonders wichtig sind, um Sicherheitsanforderungen erfüllen zu können“, erklärt Nadja Klein.

 

„Die Frage, wie gewiss oder ungewiss etwas ist,  ist wichtig für das Vertrauen in intelligente Systeme.“

Prof. Nadja Klein

 

Ihre Forschung in diesem Spannungsfeld von Herausforderungen und Möglichkeiten möchte die Mathematikerin auch an ihrer neuen Dienststätte weiter vorantreiben: Zum 1. April hat sie ihre Professur „Uncertainty Quantification and Statistical Learning“ am Research Center Trustworthy Data Science and Security der Universitätsallianz Ruhr, das sich derzeit im Aufbau befindet, und an der Fakultät Statistik der TU Dortmund angetreten. „Ich möchte meine Professur zu einer Brückenprofessur zwischen den Fakultäten Statistik, Mathematik und Informatik sowie den empirischen Fachbereichen ausbauen und dabei auch Synergien zu meinem internationalen Netzwerk schaffen“, sagt Nadja Klein. „Die Frage, wie gewiss oder ungewiss etwas ist, ist wichtig für das Vertrauen in intelligente Systeme. Hier kann und möchte ich mit meinem Team einen sichtbaren Beitrag leisten.“

Text: Lena Reil


Zur Person:

Prof. Dr. Nadja Klein hat am 1. April 2023 die Professur „Uncertainty Quantification and Statistical Learning“ angetreten. Die Stelle ist am neuen Research Center Trustworthy Data Science and Security der Universitätsallianz Ruhr und an der Fakultät Statistik der TU Dortmund verortet. Nadja Klein promovierte 2015 im Fach Mathematik an der Georg-August-Universität Göttingen. Anschließend forschte sie als Stipendiatin der Alexander-von-Humboldt-Stiftung rund zwei Jahre an der University of Melbourne, Australien, zu Bayesianischen Lernverfahren. Als Juniorprofessorin an der Humboldt-Universität zu Berlin warb sie 2019 bei der Deutschen Forschungsgemeinschaft Fördermittel für eine Emmy Noether-Gruppe ein und wurde 2020 in die Junge Akademie aufgenommen, an der sie die AG Künstliche Intelligenz leitet. Von 2021 an war sie W3-Professorin für Statistik und Data Science an der Humboldt-Universität zu Berlin, bevor sie schließlich an die TU Dortmund wechselte.

Portrait einer brünetten Frau in einer dunkelblauen Kordjacke. © Peter Himsel

Dies ist ein Beitrag aus der mundo, dem Forschungsmagazin der TU Dortmund.

Alle Beiträge der aktuellen Ausgabe