Vorhersagemodelle im Sport 2.0
Kommt es im Herbst zu einer erneuten COVID-19-Welle? Wie wird sich die Bevölkerungsstruktur langfristig ändern und welche wirtschaftlichen Auswirkungen hat dies? Wie verändert sich die CO2-Konzentration in der Atmosphäre in den nächsten Jahrzehnten? Der Drang, zukünftige Ereignisse präzise vorherzusagen, scheint nicht nur tief in unserer menschlichen Natur verwurzelt zu sein, sondern ist schlicht notwendig, um aktuelle Entscheidungen zu optimieren. Vorhersagemodelle spielen daher in nahezu allen Bereichen der Gesellschaft eine Rolle: in der Politik und Wirtschaft, aber auch bei Wetter, Klima, Kriminalität, Energieversorgung, Demographie und Sport.
Univ.-Prof. Dr. Daniel Memmert und Dr. Fabian Wunderlich vom Institut für Trainingswissenschaft und Sportinformatik der Deutschen Sporthochschule Köln haben im Jahr 2019, auf der Basis einer ersten Sachbeihilfe der Deutschen Forschungsgemeinschaft (DFG; ME 2378/29 1 [https://gepris.dfg.de/gepris/projekt/432919559]), ein Simulations-Framework implementiert, mit dessen Hilfe künstliche Daten erzeugt werden, die von der Netzwerkgenerierung bis hin zur Erstellung von prädiktiven Ratings und daraus abgeleiteten prozentualen Vorhersagen einen vollständigen Vorhersageprozess im Sportbereich nachbilden. Der Vorteil der künstlichen Daten liegt darin, dass im Gegensatz zu Realdaten [https://gepris.dfg.de/gepris/projekt/405976247] alle zugrundeliegenden Prozesse gezielt gesteuert und variiert und damit Vorhersagemodelle besser validiert werden können.
Das Institut für Trainingswissenschaft und Sportinformatik hat nun eine weitere Förderung der DFG eingeworben. Für das Sportinformatik-Projekt (ME 2678/29 2) erhalten die Wissenschaftler über einen zweijährigen Projektzeitraum mehr als 280.000 Euro. Das Forschungsvorhaben knüpft inhaltlich direkt an das im ersten DFG-Projekt entwickelte theoretische Simulations-Framework auf Netzwerken an. „Während in unserem abgeschlossenen DFG-Projekt bereits klassische statistische Modelle erfolgreich validiert wurden, fokussiert der Folgeantrag nun auf die theoretische Validierung und Weiterentwicklung von auf Machine Learning-Verfahren basierenden Vorhersagemodellen“, erklärt Univ.-Prof. Dr. Daniel Memmert. Als Anwendungsbeispiel dienen erneut Daten aus dem Sport, wobei aufgrund der Verfügbarkeit von komplexen Datensätzen die Sportarten Fußball und Tennis betrachtet werden.
Die Wissenschaftler konzentrieren sich dabei auf Methoden des „supervised learning“, die in das bestehende Simulations-Framework integriert und auf Funktionalität getestet werden. „Vorgesehen sind dabei vier Modellklassen: zwei reine Machine Learning Modellklassen, basierend auf Random Forest bzw. Graph Neural Networks sowie zwei hybride Modellklassen, die Machine Learning-Methoden und klassische statistische Komponenten verbinden“, erklärt Dr. Fabian Wunderlich. Durch die Analyse der Modellqualität und die Identifikation von Stärken und Schwächen der Modelle ermöglichen sich zudem Rückschlüsse auf Weiterentwicklungspotenzial bei den Machine Learning-basierten Verfahren.
Die Wissenschaftler interessiert vor allem, in welchen Situationen Machine Learning, hybride oder klassische Modelle überlegen sind. Diese Fragestellung fußt u.a. auf der Erkenntnis, dass im Gegensatz zu Bereichen wie Bilderkennung oder Sprachmodellen Machine Learning-Modelle bei Vorhersageprozessen (z.B. in der Ökonomie) traditionellen Verfahren oft noch nicht überlegen zu sein scheinen.
Kontakt für weitere Infos
Institut für Trainingswissenschaft und Sportinformatik
Univ.-Prof. Dr. Daniel Memmert
memmert@dshs-koeln.de
Tel.: +49 221 4982-4330
Dr. Fabian Wunderlich
f.wunderlich@dshs-koeln.de
Tel.: +49 221 4982-4845