Fussball Ergebnis Vorhersagen mittels Data Mining
Mit ein wenig Stolz möchten wir vorausschicken, dass wir unsere Vorhersagen vollkommen unabhängig von den Vorhersagen Dritter erstellen. Insbesondere verwenden wir für die einzelnen Spiele keine Wett-Quoten von Wettbüros oder vergleichbaren Anbietern. Wir verwenden ausschließlich öffentlich zugängliche Informationen für unsere statistischen Analysen mittels Data-Mining.
Wir haben dazu viele historische Informationen zu relevanten Fussball-Spielen gesammelt und aufbereitet. Diese Daten werden von uns mit der Data-Mining Software [Data.Mining.Fox (DMF) von Easy.Data.Mining] analysiert. Dabei wird in einem 1.Schritt auf Basis der historischen Daten ein sogenanntes Modell statistisch berechnet. In diesem Modell bildet die Data-Mining Software alle erkennbaren, multi-faktoriellen Zusammenhänge der historischen Daten ab. Und mit diesem Modell werden dann in einem 2.Schritt die Ergebnisse für zukünftige Fussball-Spiele errechnet.
Wir führen dabei für alle Spiele drei Vorhersage-Zyklen durch. Jeder Zyklus besteht – wie im vorherigen Absatz erläutert – in der Erstellung eines Modells sowie in der Anwendung dieses Modells.
Im 1.Zyklus beantworten wir immer zunächst die Frage, ob ein Spiel unentschieden endet oder ob die Heim- oder Gastmannschaft gewinnt. Im 2. und 3. Zyklus errechnen wir dann wie viele Tore die Heim- und die Gastmannschaft erzielen. Aus allen drei Zyklen ergibt sich dann das vorhergesagte Spielergebnis.
Zu beachten ist natürlich, dass statistisch nicht vorhersagbare oder auch kurzfristig eintretende Umstände und Einflussfaktoren nicht in unseren Berechnungen reflektiert werden können – z.B. Fehlentscheidungen von Schiedsrichtern, außergewöhnliche Platzverhältnisse, Verletzungen oder Erkrankungen von Spielern, Licht- und Wetterverhältnisse, die Sperren von wichtigen Spielern, Effekte durch Trainerwechsel oder Vereins-Streitigkeiten, finanzielle Probleme des Vereins, ungeklärte Vertragsverhandlungen, Unterbrechungen durch Fan-Ausschreitungen, Mehrfachbelastungen von Nationalspielern, usw. Und von Spiel-Manipulationen wollen wir natürlich gar nicht erst sprechen ;-)
Unser DMSC (Data.Mining.Soccer-Confidence) ist ein Prozentsatz für statistische Konfidenz, der Aufschluss über die statistische Validität unserer Vorhersage gibt. Dieser Prozentsatz ist eine künstliche Hybrid-Quote, welche sich aus mehreren Komponenten zusammensetzt wie z.B.: die statistische Konfidenz, mit der die Data-Mining Software die Ergebnis-Klasse des Spielausgangs berechnet; dem historischen Erwartungswert für Heimsieg, Unentschieden, Gastsieg; dem Mittelwert aus den Erfolgsquoten, die wir hinsichtlich der Vorhersage für beide Mannschaften bis dato erzielen konnten; eine von uns manuell errechnete Quote welche Faktoren für Heim-Sieg, Unentschieden und Auswärts-Sieg berücksichtigt.
Zu guter letzt möchten wir auf unsere Transparenz aufmerksam machen. Alle Vorhersagen sind vor den jeweiligen Spielen auf dieser Webseite einsehbar. Unsere Vorhersagen bleiben im direkten Vergleich mit den Realergebnissen auch dann noch transparent für jeden einsehbar, wenn unsere Vorhersagen einmal sehr schlecht waren (das machen andere Webseiten gerne mal anders ;-)). Außerdem bieten wir für alle Vorhersage-Kategorien eine zusammenfassende Übersicht über die durchschnittliche Validität unserer Vorhersagen hinsichtlich einer Kategorie (idR. eine Spiel-Saison eines Wettbewerbs wie z.B. der Bundesliga).