Offizielle Spieldaten im Journal „Scientific Data“

Bislang haben viele Wissenschaftler*innen und Trainer*innen für ihre Spielanalysen im Profifußball auf Videomaterial zurückgreifen müssen, um Leistungen zu bewerten und Gegner*innen zu studieren. Diese Lücke konnten jetzt Mitarbeiter des Instituts für Trainingswissenschaft und Sportinformatik der Deutschen Sporthochschule Köln in Zusammenarbeit mit der DFL Deutsche Fußball Liga teilweise schließen, indem sie Daten aus ausgewählten Spielen bereitstellen.
Die offiziellen Spieldaten werden in dem Journal Scientific Data (Impakt Faktor 2023: 9.8; 2024: 5.8) Mitte Februar unter dem Titel „An integrated dataset of spatiotemporal and event data in elite soccer“ publiziert. „Die datengesteuerte Spielanalyse im Fußball ist eine wachsende Disziplin sowohl in der Forschung als auch in der Praxis. Es liegen jedoch kaum öffentliche Daten vor, was die Hürde für den Einstieg in dieses Gebiet erhöht und die Reproduzierbarkeit von Methoden und Ergebnissen verringert“, beschreibt Prof. Dr. Daniel Memmert, Leiter des Instituts für Trainingswissenschaft und Sportinformatik der Deutschen Sporthochschule Köln, die Ausgangssituation. Memmert und seine Kollegen Manuel Bassek, Robert Rein und Hendrik Weber freuen sich daher umso mehr, in einem renommierten Journal einen Datensatz mit offiziellen Spielinformationen, Ereignis- und Positionsdaten veröffentlichen zu können. Es handelt sich um zwei Spiele der Bundesliga und fünf Spiele der 2. Bundesliga in der Saison 2022/23.
Die Spielinformationen enthalten Metadaten zu den Spielen und ihren Teilnehmern. Die Ereignisdaten beinhalten Zeitstempel sowie Beschreibungen einzelner Ereignisse wie Pässe, Schüsse oder Fouls. Die Positionsdaten schließen die x/y-Koordinaten jedes Spielers und des Balls ein; damit sind die Laufwege der Spieler und die Bewegung des Balles exakt nachvollziehbar. Durch die Integration mehrerer Datenmodalitäten – das heißt Ereignisprotokolle mit Zeitstempeln und x/y-Koordinaten der Spieler- und Ballpositionen – bietet der Datensatz eine mehrdimensionale Ansicht der Spieldynamik.
Dieser Datensatz soll helfen, vorhandene Analysetechniken zu prüfen und neue Methoden für die Sportanalyse zu entwickeln. „Wir stellen die Daten unter der Creative Commons-Lizenz CC-BY 4.0 zur Verfügung. Damit möchten wir Innovation, Reproduzierbarkeit und Open Science in der Spielanalyseforschung fördern“, sagt Dr. Hendrik Weber aus der Direktion „Sport-Technologie & Innovation“ der DFL. Damit gelinge auch die Anknüpfung an ein aktuelles Forschungsprojekt der Arbeitsgruppe um Prof. Daniel Memmert, welches vom Bundesministerium für Bildung und Forschung (BMBF) sowie der Deutschen Forschungsgemeinschaft (DFG) gefördert wurde und wird: Die neue Plattform zur Sportdatenanalyse „floodlight“ beinhaltet Prozesse der Datenverarbeitung zur Vereinfachung und Standardisierung von Leistungsindikatoren und wurde ebenfalls als frei zugängliches Paket konzipiert.
Quelle:
Bassek, M., Rein, R., Weber, H., & Memmert, D. (2025). An integrated dataset of spatiotemporal and event data in elite soccer. Scientific Data, 12(1), 195.