L’analyse du football évolue vers un recrutement plus intelligent et une plus grande accessibilité des données.

14/3/2022


Traduction d'un article dédié à la DATA dans le football sur la version anglaise du magazine Forbes. Ou quand les Fantasy League et les paris sportifs permettent au football de se mettre à la page...

Le football s’est tardivement mis à la collecte des statistiques sportives. Les données sont progressivement devenues une part prépondérante de l’analyse des matchs, jusqu’à devenir une véritable tendance grâce aux ligues fantasy et aux paris sportifs. Dans le même temps, les données Opta ont été mises à disposition gratuitement sur un certain nombre de plateformes en ligne, permettant l’émergence d’analyses statistiques sur divers médias tenus par des blogueurs et analystes amateurs. Nombre d’entre eux ont fini par transformer ce passe-temps en job à plein temps. Dès l’instant où les prédictions ont pu être réalisées à partir des données, nombreux sont ceux qui ont commencé à les analyser et la popularité a explosé au point que les clubs de football décident d’engager des personnes totalement étrangères au jeu mais expertes dans l’analyse des données qui en découlent. Les statistiques en football ont évolué depuis les simples buts et passes décisives, jusqu’à l’anticipation de buts et la création d’algorithmes capables d’analyser les données pour créer de l’information utile et souvent très précieuse. Les recruteurs, amateurs comme professionnels, peuvent ainsi parcourir les données publiques disponibles et collecter les informations qui les intéressent sur les différents joueurs et clubs.

"Quand je conseillais des clubs, je commandais en privé des dossiers sur la personnalité des joueurs en plus de fournir mes analyses avancées.

C’est une chose d’avoir des données, c’en est une autre de savoir les exploiter à son avantage : comment appliquer des chiffres bruts à des joueurs de foot, leurs caractéristiques et leurs personnalités. Penser que les chiffres sont à même de remplacer les méthodes de recrutement traditionnelles serait une grosse erreur, autant que le fait de ne pas les utiliser du tout. "Les méthodes de recrutement traditionnelles restent nécessaires", estime Dan Altman, fondateur de North Yard Analytics et la plateforme associée smarterscout.com. "Quand je conseillais des clubs, je commandais en privé des dossiers sur la personnalité des joueurs en plus de fournir mes analyses avancées. Les dossiers étaient une véritable plus-values, en particulier pour les joueurs inconnus des réseaux des coachs et des recruteurs. À ce jour, j’estime que les formes de recrutement traditionnelles sont souvent une réponse aux questions issues des données - par exemple, pourquoi la performance d’un joueur s’est-elle dégradée ou améliorée d’une saison à une autre. Mais parfois, parvenir à un consensus sur le récit d’un joueur s’avère plus compliqué, et c’est à ce moment-là qu’une signature comporte le plus de risques."

Étant donné la quantité de données accessibles au public, une bonne analyse footballistique peut être réalisée par n’importe qui, pourvu qu’il soit doté d’une grande patience et d’une capacité à détecter les bonnes informations parmi l’infinité de sites et d’application qui diffusent des données. Ces données sont toujours affichées de manière différente, et parcourir les définitions peut être aussi chronophage que de décrypter les chiffres eux-mêmes, mais grâce à un mélange de statistiques et de stratégie, et une présentation dans un format compréhensible, on peut parvenir à tirer des conclusions. La manière dont elles sont présentées est souvent la clé de la compréhension des données. "C’est toujours un défi", ajoute Altman quand on l’interroge sur le sujet. "Vous pouvez être très bon en mathématiques et statistiques, avec une excellente compréhension du jeu - mais si vous ne savez pas rendre vos chiffres agréables à regarder, vous n’irez nulle part. Heureusement, comme les médias sont de plus en plus intéressés par l’analyse footballistique, ils mettent en oeuvre leurs compétences visuelles, et les personnes en charge de créer de nouvelles métriques accordent également plus d’importance à leur présentation."

"On ne peut tirer des conclusions pertinentes à propos des joueurs que lorsque les données sont mises en application dans un contexte plus large."

Pour les amateurs de football, cet aspect du jeu peut sembler ésotérique et ils ont parfois le sentiment que ce type d’information est volontairement rendu inaccessible. Dans le même temps, il est facile pour les médias ayant une plus grande portée de balancer ce qu’ils pensent être des chiffres plus faciles à comprendre, en ajoutant la mention "inclut des statistiques". Les chiffres sont tellement hors contexte qu’ils deviennent inutiles et peu compréhensibles. Les statistiques telles que le nombre de buts qu’un gardien a arrêtés ou le nombre de passes qu’un milieu de terrain a réalisées lors de son dernier match ne sont pas une fin en soi, mais d’autres chiffres, ceux qui reflètent la place d’un joueur au sein de son équipe et du monde du foot en général, ont davantage de valeur et sont plus facile à comprendre. Altman précise que la clé est de trouver un équilibre et cet équilibre qu’il cherche à atteindre grâce à Smarterscout. La plateforme est disponible en accès gratuit avec des options payantes disponibles pour les professionnels, ainsi que des formules d’abonnement pour les amateurs, moins chères que celles proposées par Netflix.

"Nous proposons au public 45 ligues et nous en avons une douzaine d’autres pour nos clients privés, mais nous utilisons des métriques similaires pour chacune de nos ligues, et elles sont toutes expliquées dans notre FAQ", ajoute Altman.  "Donc les gens peuvent en théorie essayer de reconstituer nos métriques, mais ils trouveront sûrement plus pratique d’utiliser notre site. Je pense que nous sommes le premier site à proposer des explications pour une telle quantité de métriques, et c’est intentionnel. J’espère que le fait de savoir à quoi nos métriques font référence pourra inspirer confiance et encourager l’utilisation du site, même parmi les gens sans bagage technique. Je veux que Smarterscout soit l’opposé d’une boite noire. On ne peut tirer des conclusions pertinentes à propos des joueurs que lorsque les données sont mises en application dans un contexte plus large et c’est le but des modèles et algorithmes Smarterscout, au-delà des chiffres."

"Tu n’as pas besoin de t’engager dans une tonne d’explications techniques si les gens connaissent déjà la signification des métriques."

Dans un sport tel que le football qui comprend tant de variables, il a fallu un certain temps avant que les données générées par un joueur puissent être mises en application correctement, mais avec des modèles comme l’anticipation de buts (xG) - qui détermine la probabilité qu’un tir se convertisse en but en se basant sur un certain nombre de facteurs incluant l’emplacement sur le terrain, le joueur et la situation - il est possible de faire des déductions plus pertinentes. Du modèle xG découle le modèle xA permettant la prédiction des passes décisives, ainsi que d’autres modèles qui utilisent des données similaires, comme xGBuildup et xGChain qui visent à mesurer la contribution de chaque membre de l’équipe lors d’un but, même s’il ne s’agit pas de ceux qui marquent ou font une passe décisive. Ils peuvent aussi être appliqués aux gardiens - un poste particulièrement difficile à évaluer - pour essayer d’estimer leur capacité à arrêter des tirs par rapport à d’autres gardiens, notamment en utilisant le xG post-tir.

Comme toutes les statistiques, elles sont inutilisables individuellement mais xG et ses cousins, ainsi que d’autres modèles utilisant d’autres types de données, deviennent peu à peu plus accessibles. Il a cependant fallu un certain temps pour dépasser le sentiment de complexité et d’exclusivité qui mène à un rejet immédiat de tels concepts. "C’est une route à double sens", déclare Altman.  "Tu n’as pas besoin de t’engager dans une tonne d’explications techniques si les gens connaissent déjà la signification des métriques. La manière la plus simple de prédire les buts - le modèle xG création de tir chez Smarterscout - a réussi à franchir cet obstacle. D’autres métriques nécessitent toujours un grand nombre d’explication, et c’est l’une des compétences que leurs producteurs doivent avoir. Et effectivement, en particulier pour ceux qui possèdent des compétences techniques, il peut être tentant de mettre en avant l’élégance mathématique des formules, mais cela ferait un bide auprès des professionnels du sports. Le niveau de la ligue, le niveau des co-équipiers, le style de jeu de l’équipe et de leurs adversaires, sont des facteurs qui doivent tous être pris en compte."

La clé semble être une association de données, de recrutement traditionnel et d’analyse tactique, particulièrement lorsque cela s’accompagne d’une réelle visualisation de ces trois facteurs. L’un ne suffit pas sans les deux autres, mais grâce au travail de sites comme Smartscout, ils sont à la disposition de tous. N’oubliez pas pour autant de regarder les matchs.

Nos derniers articles