NORDAKADEMIE Fußballforschung: die spannensten Spiele

Die Idee für das Forschungsprojekt hatten die Informatikdozenten Prof. Dr. Michael Schulz (links) und Uwe Neuhaus (rechts) in ihrer Vorlesung „Analytische Informationssysteme“; um den Studierenden abstrakte Analysemethoden an einem Beispiel aus dem Alltag näherzubringen, wählten sie den Volkssport Fußball

Die Fußball-WM 2018 in Russland ist in vollem Gange. Fußballbegeisterte müssen sich entscheiden, welche Partie am Bildschirm oder im Radio verfolgt wird. Das neue Verfahren, das von Prof. Dr. Michael Schulz und Uwe Neuhaus aus dem Fachbereich Informatik der NORDAKADEMIE entwickelt wurde, kann hier den nötigen Input geben.

Live-Kommentare als Grundlage der Fußballforschung

Das Verfahren basiert auf den Live-Spielkommentaren von Sportjournalisten im Fernsehen oder im Radio. Zusätzlich werden Live-Fußballticker von Medienwebseiten hinzugezogen.
Die beiden NORDAKADEMIE-Wissenschaftler haben ihren Ansatz auf Basis der Daten des FIFA Confed Cups, der 2017 in Russland stattgefunden hat, entwickelt. Sie nutzten die Fernsehkommentare des deutschen und österreichischen Fernsehens sowie fünf Fußball-Live-Ticker von unterschiedlichen Webseiten.   

So bestimmt das Verfahren die Spielerleistung

Eine Software wandelt die gesprochenen Kommentare in Text um. Zusammen mit den Kommentaren aus den Live-Tickern werden die Texte in eine Folge von Wörtern zerlegt. Zusätzlich wird festgehalten, in welcher Spielminute diese Wortreihe gefallen ist. Die Wörter müssen anschließend noch vorverarbeitet werden (Beseitigung von Rechtschreibfehlern, Vereinheitlichung der Schreibweise usw.). Nun ist es möglich, Spielernamen zu identifizieren und Wörter oder Wortkombinationen zu suchen, die positive bzw. negative Emotionen vermitteln. Beispiele dafür sind "geschickt" (wie in "ein geschickter Pass") oder "einen Schritt zu spät". Für diesen Arbeitsschritt entwickelten die Forscher ein spezielles Wörterbuch, das neben allgemeinen positiven und negativen Begriffen auch spezielles Fußballvokabular enthält, z. B. "Schwalbe", "Sahnepass" oder "Blutgrätsche".


Für alle Spieler wird buchgeführt: Wer wurde wann und wie oft positiv bzw. negativ erwähnt? So können Aussagen über die Leistung der einzelnen Spieler über den Spielverlauf hinweg ermittelt werden. Da die Mannschaftsaufstellung des Spiels bekannt ist, verdeutlicht die Analyse ob Tor, Abwehr, Mittelfeld und Sturm gerade gute oder schlechte Leistung bringen. Werden die so erhobenen aktuellen Daten aller Spieler zusammengefasst, können die Wissenschaftler zusätzlich Kennzahlen errechnen, die das augenblickliche Emotionsniveau des Spiels widerspiegeln. Das gesamte Verfahren kann automatisiert durchgeführt werden.

Alles live: Was das neue Verfahren besser kann als traditionelle Methoden

Gegenüber der traditionellen Analyse gibt es mehrere Vorteile: Die Daten liegen bereits während des Spiels vor. Momentan aktualisiert das Forscherteam sie in einem Spiel alle fünf Minuten. „Der Zuschauer kann sich also in Echtzeit informieren, welcher Spieler gerade eine besonders starke Leistung bringt, auch wenn er das Spiel nicht am Bildschirm verfolgt“, erklärt Prof. Dr. Michael Schulz. „Ebenso erfährt er auf einen Blick, bei welchem Spiel es gerade besonders emotionsgeladen läuft. Wenn es zur gleichen Zeit mehrere Spiele gibt, wie es z. B. in der Bundesliga der Fall ist, kann er sich so für das spannendste Spiel entscheiden“, ergänzt Uwe Neuhaus. Das Forscherteam stützt sich bei der Analyse auf mehrere Berichterstattungen. Dadurch erhöht sich die Objektivität der ermittelten Ergebnisse.

Aktuelle Fußball-Nachrichten und Digitalisierung

Auch beim Sport kommen immer ausgefeiltere Analysemethoden zum Einsatz. Die zunehmende Digitalisierung stellt immer vielfältigere und detailliertere Daten zur Verfügung. Einer der Vorreiter im Bereich Sports Analytics sind die USA. Dort ist dieser Ansatz bereits stark verbreitet und auch von hoher kommerzieller Bedeutung. Die beiden Forscher haben ihr Projekt gerade auf der Great Lakes Analytics in Sports Conference an der University of Wisconsin vorgestellt. Der neue Forschungsansatz wurde von den Konferenzteilnehmern mit großem Interesse aufgenommen.
Eine ähnliche Entwicklung im Bereich Sports Analytics ist mittelfristig auch für Deutschland zu erwarten. Uwe Neuhaus und Michael Schulz sind sich allerdings sicher: „Selbst die fortschrittlichsten Analysen machen die sportlichen Wettkämpfe nicht vollständig berechenbar. Die Spannung im Sport bleibt also auch im digitalen Zeitalter erhalten.“

Vom Fußball zur Wirtschaft: Einsatzmöglichkeiten der automatischen Textanalyse in Unternehmen

Das hier beschriebene Anwendungsbeispiel wurde ursprünglich entwickelt, um Studierende und Domänenexperten in Unternehmen für die Nutzung moderner Analyseverfahren zu begeistern. Der Einsatzbereich der verwendeten Methoden geht dabei weit über die Welt des Fußballs hinaus. Denkbare Anwendungen in der Wirtschaft sind etwa:

  • die automatische Auswertung von textuellen Produktbewertungen in Online-Shops (Welches Produkt wird gelobt, kritisiert oder weist Mängel auf?),
  • die Identifizierung von Trends in sozialen Medien (Welches Thema wird gerade heiß diskutiert?) oder
  • die Klassifikation von Kundenanfragen (Welche Abteilung kann die Anfrage am besten beantworten?).

Grundlage ist jeweils die Erschließung der Information in geschriebenen oder gesprochenen Texten, das sogenannte Text-Analytics. Experten schätzen, dass bis zu 80 % des weltweiten Wissens in Form von Texten abgelegt ist. Durch die fortschreitende Digitalisierung stehen immer mehr dieser Texte auch einer computergestützten Auswertung offen. Die größte Herausforderung besteht dabei darin, die von Menschen und für Menschen geschaffenen Sprachstrukturen auch für Computer verständlich zu machen. Dazu bedarf es fortgeschrittener Verfahren der Datenanalyse, der Computerlinguistik und der künstlichen Intelligenz.


Alle Nachrichten im Überblick