Résultats de Football: Pronostics utilisant Data Mining
Avec un peu de fierté que nous aimerions commencer par dire que nous créons nos prédictions totalement indépendant des prédictions des autres. En particulier, nous n’utilisons pas de cotes des bureaux de paris ou des prestataires similaires pour des matches individuels. Nous n’utilisons que des informations publiquement disponibles pour notre analyse statistique en utilisant le data mining.
Nous avons collecté et modifié un grand nombre d’informations historiques pertinentes pour les matches de football. Ces données sont analysées par nous avec le logiciel de data mining [Data.Mining.Fox (DMF) de Easy.Data.Mining]. Nous le faisons en deux étapes. Etape 1 génère un soi-disant modèle qui est statistiquement calculée sur la base des données historiques. Dans ce modèle, le logiciel data mining extrait toutes les relations multi-factorielles détectables dans les données historiques. Et à l’étape 2, nous appliquons ce modèle afin de prédire les résultats des matches de football à venir.
Nous effectuons cela pour tous les matches en trois cycles de prévision. Chaque cycle se compose – comme expliqué dans le paragraphe précédent – à la création d’un modèle, d’une part, et l’application de ce modèle à l’autre.
Dans le 1er cycle, nous repondons toujours d’abord à la question de savoir si un match est un match nul ou si l’équipe qui reçoit ou celle des visiteurs gagne. Dans le 2e et 3e cycle, nous calculons ensuite combien de buts sont marqués par l’équipe qui reçoit et celle des visiteurs. Ainsi, de tous les trois cycles nous composons le résultat du match.
Remarque, bien sûr, qu’il n’est pas possible de considerer dans nos calculs des circonstances statistiquement imprévisibles ou des facteurs changés à court terme – par exemple des mauvaises décisions des arbitres, les conditions exceptionnelles du terrain de jeu, d’une blessure ou d’une maladie des joueurs, des conditions météorologiques et de la lumière, des sanctionnement par carte rouge des principaux acteurs, des effets de changement d’un entraîneurs, des litiges du club, des problèmes financiers de l’association, des négociations contractuelles non réglées, des excès des supporteurs, la charge supplémentaire des joueurs de l’équipe nationale, etc, et des manipulations nous ne voulons même pas parler ;-)
Notre DMSC (Data.Mining.Soccer-Confidence) est un pourcentage de confiance statistique qui donne un aperçu sur la validité statistique d’une prédiction. Ce pourcentage est un rapport hybride artificiel qui est composé de différents éléments: le niveau de confiance statistique calculée par le logiciel de data mining concernant la classe de résultat du match; l’espérance mathématique pour une victoire à domicile, un match nul, et une victoire à l’extérieur; la moyenne des taux de réussite que nous pourrions réaliser pour les deux équipes en termes des prédictions à ce jour; un quota calculé par nous manuellement en ce qui concerne la victoire de l’équipe qui reçoit, de celle des visiteurs, ou match nul.
Pour finir, nous aimerions attirer l’attention sur notre transparence. Toutes les prévisions sont mises à disposition avant chaque match sur ce site. Nos prévisions restent transparentes en comparaison directe avec les résultats réels, même si nos prédictions étaient peut-être très pauvres une journée (pas toujours le cas sur d’autres sites ;-) ). Nous fournissons également des résumés statistiques concernant notre validité de prédiction pour une catégorie donnée (c’est à dire en générale pour une saison d’un concours spécifique comme p.e. la Ligue 1).