Crédit :Pixabay/CC0 Domaine public
Alors que les fans de cricket australiens célèbrent le triomphe de leur équipe à la Coupe du monde masculine T20 ICC 2021, les résultats du tournoi ont déclenché un débat sur la question de savoir si l'équipe qui bat en deuxième a un avantage potentiellement gagnant avant même qu'une balle ne soit lancée.
Sur les 45 matchs disputés lors du tournoi, 29 (environ 64%) ont été remportés par l'équipe à la deuxième frappe. Autrement dit, les équipes battant en deuxième ont remporté presque deux fois plus de matchs que les équipes battant en premier.
Le deuxième frappeur a remporté tous les matchs à Dubaï lors du #T20WC et 15 des 16 derniers dans toutes les compétitions. Cela rend le tirage au sort décisif, ce qui signifie que l'Australie va gagner. Quelle situation ridicule. Une finale où la capacité est toujours éclipsée par la chance et dans un stade vide à 90 %.
– Lord of the Pies (@jamesclossick) 14 novembre 2021
Certains critiques sont allés jusqu'à suggérer que les équipes peuvent "gagner au tirage au sort" lorsqu'elles décident quel camp frappera en premier.
Il existe une gamme d'avantages suggérés au bâton en second, en particulier dans les formes plus courtes de cricket. Peut-être que le principal d'entre eux est de savoir exactement quel score gagnera le match et d'être capable de planifier les manches en conséquence. Au fur et à mesure que l'après-midi ou la soirée avance, de la rosée peut également se former sur le sol, ce qui rend plus difficile pour les quilleurs de saisir la balle et pour les joueurs de champ de la récupérer, et plus facile pour les frappeurs de frapper des balles qui "dérapent sur la batte" plutôt que de changer de direction.
Mais que disent réellement les statistiques ? Le tirage au sort confère-t-il vraiment un avantage crucial ? Regardons les chiffres.
C'est l'heure des statistiques
La première question à se poser est de savoir si le modèle de résultats observé lors de la coupe du monde pourrait avoir surgi purement par hasard. Pour ce faire, nous utilisons des tests statistiques pour calculer la "valeur p", qui nous indique la probabilité d'obtenir au moins 29 "deuxièmes au bâton" sur 45 matchs si la véritable chance de gagner était de 50-50.
Dans ce cas, nous arrivons à une « p-value » d'environ 0,04, soit 4 %. Cette probabilité est raisonnablement faible, ce qui suggère qu'il existe en effet des preuves que le fait d'être deuxième au bâton a été bénéfique lors de cette coupe du monde et que le modèle de résultats n'est peut-être pas dû au hasard.
Mais étant donné que notre ensemble de données ne contient que 45 correspondances, notre test n'a pas beaucoup de puissance statistique, ce qui signifie que cette preuve est loin d'être écrasante.
En d'autres termes, il y a une probabilité non négligeable (4 %) que ce modèle de résultats soit le fruit du hasard, et que le fait d'être deuxième au bâton ne confère finalement pas un avantage crucial.
Quels autres facteurs sont en jeu ?
De plus, regarder les résultats globaux de cette manière ne tient pas compte d'autres facteurs susceptibles d'influencer le résultat, tels que le terrain spécifique, l'heure de la journée à laquelle le match a été joué et la force relative des équipes.
Pour examiner cela plus en détail, j'ai créé un modèle statistique pour examiner comment ces différents facteurs affectaient la probabilité de gagner lors de la deuxième frappe au bâton dans ces 45 matchs.
Les matchs de la coupe du monde 2021 se sont déroulés sur quatre sites différents et à deux moments différents de la journée (après-midi et soir). J'ai également pris en compte le classement ICC T20 des équipes, comme mesure de la différence de qualité globale entre les deux équipes dans un match donné.
Mon analyse a révélé que le moment du match n'influençait pas statistiquement la probabilité de victoire de l'équipe battant en deuxième position. En d'autres termes, l'avantage d'être premier ou deuxième à la batte ne dépendait pas du fait que le match se déroulait l'après-midi ou le soir.
Cela laisse deux variables qui pourraient éventuellement influencer la situation :le lieu qui accueille le match et si l'équipe battant en deuxième position a un classement supérieur ou inférieur à celui de son adversaire. Cela donne huit combinaisons possibles (quatre lieux multipliés par deux possibilités d'ordre des frappeurs) pour lesquelles le modèle statistique peut générer des résultats.
Étant donné qu'il n'y a qu'une poignée de correspondances dans chaque catégorie, nous pouvons renforcer notre analyse statistique à l'aide d'un concept appelé "intervalle de confiance à 95 %". Plutôt que de générer une seule estimation de probabilité, nous pouvons également calculer une limite supérieure et inférieure à notre estimation, entre lesquelles nous pouvons être sûrs à 95 % que la vraie probabilité est trouvée.
Que disent les résultats ?
Les résultats sont montrés plus bas. Le résultat le plus frappant est la probabilité estimée très élevée de gagner en battant deuxième à Dubaï (où l'Australie a triomphé lors de la finale du tournoi). Même lorsque l'équipe deuxième au bâton était classée plus bas que son adversaire, il y avait toujours une probabilité de victoire estimée élevée.
Le terrain de cricket de Dubaï semble avoir offert le plus fort coup de pouce aux équipes battant deuxième. Crédit :Christopher Drovandi, auteur fourni
Mais notez qu'il y a beaucoup d'incertitude dans cette estimation, avec un intervalle de 95 % qui inclut toujours 0,5 (qui représente le hasard). Pour en revenir aux données brutes, sur 11 matchs à Dubaï, l'équipe deuxième à la batte en a remporté 10. La finale et l'une des demi-finales se sont déroulées à Dubaï, où l'équipe deuxième à la batte a remporté les deux fois.
Les trois autres lancers ont produit des résultats plus proches de ce à quoi on pourrait s'attendre :les équipes étaient plus susceptibles de gagner la deuxième frappe si elles étaient l'équipe la mieux classée, et plus susceptibles de perdre la deuxième frappe si elles étaient l'équipe la moins bien classée.
Alors que le terrain d'Abou Dhabi semblait également favoriser légèrement les équipes battant deuxième, mon analyse révèle que ce sont les résultats de Dubaï qui ont faussé les résultats globaux.
Cela suggère que les conditions spécifiques à Dubaï pourraient être mieux adaptées à la deuxième frappe. Mais il est également possible que les résultats de Dubaï ne soient qu'une anomalie statistique.
L'analyse a révélé des preuves qu'il était avantageux de battre deuxième dans cette coupe du monde, mais cela dépendra probablement grandement des conditions. Si nous supposons qu'un match est joué sur un terrain sélectionné au hasard parmi les quatre sites utilisés, et qu'il y a 50 % de chances que l'équipe la mieux classée bat en deuxième, mon modèle estime la probabilité de gagner lorsque le deuxième bat est d'environ 0,6, avec un 95 intervalle de confiance en % de 0,48 à 0,71.
Il y a donc un avantage probable à frapper en deuxième, mais c'est loin d'être gagné d'avance.
Mon analyse n'incluait que les données de la Coupe du monde 2021, mais le cricket T20 se joue dans toutes sortes de conditions partout dans le monde. Une analyse plus rigoureuse inclurait les données de nombreux tournois et prendrait en compte plus d'informations telles que la marge de victoire, la taille de la différence entre les classements des équipes, leur forme récente, les conditions météorologiques et l'étape du tournoi.
Les facteurs et les permutations possibles sont presque infinis, ce qui est l'une des raisons pour lesquelles les gens aiment le cricket. Bien sûr, cela ne fait pas de mal si leur équipe gagne aussi.