Pourquoi les classements officiels sont-ils peu pertinents pour prévoir l'issue d'un match ?



Tout système de classement a ses défauts et il n'est pas question de faire le procès des systèmes actuels de classement de l'ATP et de la WTA (ils suivent la même logique et toute remarque concernant l'un est applicable à l'autre).
Pour autant, ils présentent de nombreux défauts, aussi bien quand on cherche à pronostiquer le résultat d'un match que quand on tente des comparaisons de niveau à un instant t, d'état de forme ou de carrière.


Rappelons d'abord la logique des classements actuels.


Les joueurs se voient attribuer des points en fonction de leur résultat dans un tournoi (on n'examine ici que les tournois à élimination directe).. Ces points dépendent de plusieurs facteurs :
- le nombre de tours passés dans le tournoi. Evidemment, au plus il va loin dans un tournoi, au plus le joueur reçoit de points. La logique est « presque » logarithmique : en très gros, un tour passé en plus rapporte presque 2 fois plus de points.
- la catégorie du tournoi. Les deux organisations (ATP et WTA) classent les tournois en catégories et au plus le tournoi est dans une catégorie élevée, au plus le joueur reçoit de points pour un nombre de tours passés donné. Là encore la logique est logarithmique : d'une catégorie à la supérieure, le nombre de points est doublé (c'est un peu moins rigoureux chez les femmes).
- le nombre de tournois qui rapportent des points est limité : sans entrer dans les détails, le système ne retient que les 6 meilleurs résultats des petits tournois.
- les points gagnés dans un tournoi sont perdus 52 semaines plus tard et remplacés par les points gagnés au tournoi qui a lieu 52 semaines plus tard. C'est donc un classement purement annuel sur 12 mois glissants.
- les joueurs participant au tournoi de fin d'année rassemblant les meilleurs joueurs de l'année civile récoltent aussi des points, en fonction de leur résultat dans ce tournoi.
- les victoires aux Jeux Olympiques ou en Coupe Davis / Fed Cup ne rapportent en 2017 aucun point ATP (ou WTA). Cela n'a pas toujours été le cas.
- des pénalités (souvent théoriques) s'appliquent pour les top players qui ne participent pas à un certain nombre de petits tournois sans justificatif médical.
- On ne parle sur ce blog que des tableaux principaux du circuit principal, mais les victoires en qualification et sur les tournois Challenger rapportent également des points.




Quels sont les défauts du système ?



- le système a un aspect essentiellement quantitatif 
il pénalise énormément les joueurs qui ont peu joué dans les 12 dernier mois (par exemple après une blessure). Il induit donc en erreur dans la mesure où un joueur intrinsèquement plus fort est plus mal classé qu'un autre, moins fort mais qui a joué tout le temps. Si l'interruption a duré plus de 12 mois, le joueur n'est même plus classé.


Exemples : ils sont très nombreux. Quand Serena Williams a repris sérieusement la compétition en 2011, elle était classée 172 ème au moment du tirage au sort de Stanford. Il est rapidement apparu qu'elle surclassait toutes ses rivales, mais n'était encore classée que 11ème 6 mois plus tard, alors qu'elle avait remporté 23 de ses 27 matches joués dans l'intervalle et gagné contre les joueuses les mieux classées de l'époque.
Autre exemple : en 2017, Federer décide de ne pas participer à Roland-Garros. Il marquera donc 0 points pour ce tournoi, ce qui le pénalise par rapport à ses concurrents, sans que cela ait un quelconque rapport avec son niveau.


- le système récompense trop longtemps une performance exceptionnelle d'un joueur (et pénalise trop longtemps une contre-performance exceptionnelle).
On sait qu'il est courant qu'un joueur soit en état de grâce dans un tournoi (voire tout simplement chanceux), et obtienne un résultat bien supérieur à son niveau habituel (l'inverse est vrai aussi). Or, le système de rotation des points fait que les points gagnés restent 52 semaines dans l'escarcelle du joueur. Cela fausse ainsi l'estimation de la force d'un joueur.
Exemple :
en 2016, Florian Mayer est 226 ème au moment du tirage au sort du tableau de Halle, tournoi généralement d'un bon niveau. Il est d'ailleurs 27è dans l'ordre des classements sur … 28 joueurs engagés. Il gagne le tournoi et empoche 500 points ATP qui suffisent à le positionner toute l'année autour de la 120 ème place. Mais sur les 11 autres tournois auquel il participe dans l'année, il ne gagne que 5 matches en tout !


Pire : un joueur qui a un pépin physique sans gravité mais qui est obligé d'abandonner peut perdre des centaines de points, alors même que son niveau n'est pas remis en cause .


- les points sont attribués pour une catégorie de tournois sans tenir compte du niveau des joueurs engagés.
C'est sans importance pour les tournois du Grand Chelem qui sont d'un niveau sensiblement identique, mais c'est problématique pour les petits tournois.
Exemple :
En WTA, gagner Hobart ou Florianopolis rapporte le même nombre de points. Mais le premier rassemble 24 joueuses du Top 100 et le second seulement 8. On se doute que cela n'a pas la même valeur de gagner l'un ou l'autre.


- le niveau d'un joueur n'est pas homogène d'une surface à l'autre
Des joueurs ont fréquemment des faiblesses ou des talents particuliers sur un type de surface. Or le classement est unique et multi-surfaces. Ce classement est donc un très mauvais indicateur pour certaines surfaces.
Exemple :
J. Konta qui affiche un classement flatteur en 2017 a de très mauvais résultats sur terre battue, et en tout cas tout à fait incohérents avec son classement.


Nota : ce critère est une bonne illustration du fait que ce sont les buts recherchés qui font qu'un système de classement est de qualité ou non. On peut imaginer que l'ATP et la WTA considèrent qu'un bon joueur de tennis doit savoir jouer sur toutes les surfaces. Dans cette logique, il n'y a en effet aucune raison de traiter séparément les différentes surfaces de compétition. Par contre, ne pas le faire rend le système de classement inopérant :
- d'une part pour déterminer si le résultat d'un match constitue une surprise ou non - erreur fréquemment commise par les commentateurs.
- d'autre part pour pronostiquer correctement l'issue d'un match


- le choix de la surface des tournois proposés dans le calendrier a une influence sur le classement.
Exemple : sur le circuit féminin, en 2017, il y a 14 tournois sur terre battue contre 37 sur surface dure (soit un rapport de 2,6) ; en 2012, c'était 17 contre 34 (soit un rapport de 2). Au fur à mesure des années, on avantage ainsi les joueuses plus fortes sur surface dure.
Plus insidieux, baisser la catégorie des tournois sur un type de surface alors qu'on promeut des tournois sur une autre surface a la même influence sur le classement.
Enfin, de façon plus individuelle, la systématisation du Masters de fin d'année en indoor désavantage des joueurs comme Ferrer ou Nadal dont c'est la surface la plus faible.


- l'attribution des points ne tient aucun compte de la force de l'adversaire
Cela na pas toujours été le cas, mais aujourd'hui obtenir une victoire au 1er tour de Roland-Garros sur le 800ème mondial ou sur le 1er apporte le même nombre de points, alors que la valeur de la performance est clairement différente.


- l'attribution de points ne tient aucun compte de la domination plus ou moins importante d'un joueur sur un autre au cours du match.
Il paraît évident qu'en face de joueurs de force équivalente, gagner 6-0 6-0 ou bien gagner 6-4 1-6 7-6 n'est pas la même chose. Or, le système attribue le même nombre de points aux deux vainqueurs.
Dans le pire des cas, un vainqueur par forfait se voit attribuer le même nombre de points qu'un vainqueur au terme d'un long match accroché, alors que les mérites sont un peu différents … On notera que c'est d'autant plus pervers que ce sont les meilleurs joueurs qui bénéficient du plus de forfaits de leurs adversaires (un article de ce blog le montrera).


- A performance égale, la récompense en points dépend du tour (« round ») au sein du tournoi.
En clair, cela veut dire que battre Federer ou S. Williams au premier tour d'un tournoi rapporte énormément moins que les battre au 3 ème tour et a fortiori en finale.
Exemple 1 : A Wimbledon en 2012, Rosol bat Nadal au 2ème tour. Cela lui permet d'engranger 45 points de plus. S'il l'avait battu par exemple en 1/4 de finale, il aurait bénéficié de 360 points supplémentaires.
Exemple 2 : A Wimbledon de nouveau, en 2014, Cornet bat S. Williams au 3ème tour. Cela lui permet d'engranger 190 points de plus. Si elle l'avait battue par exemple en finale, elle aurait bénéficié de 700 points supplémentaires.
Je pense que dans les 2 cas, vous conviendrez que le joueur le mieux classé était pourtant motivé pour continuer … La performance du joueur le moins bien classé n'a donc aucune raison d'être dévalorisée sous prétexte qu'elle a eu lieu tôt dans le tournoi.
C'est de mon point de vue un des vices cachés des classements actuels le plus importants.


- le système laisse la part trop belle au hasard du tirage au sort.
Le résultat d'un joueur dans un tournoi est très dépendant du tirage au sort, particulièrement pour les joueurs dans la moyenne des engagés.
Exemple : en 2017 à Roland-Garros, Paire rencontre Nadal dès le 1er tour. Bien sûr, il perd le match et est donc sorti du tournoi dès le premier tour ; or son niveau sur terre battue devrait raisonnablement lui permettre de battre à peu près 2 joueurs sur 3 parmi les engagés du tournoi.
Il y a donc distorsion de la perception du niveau du fait d'un tirage défavorable.
Statistiquement, on peut supposer qu'à l'échelle d'une carrière, les joueurs ont à peu près le même pourcentage de tirages favorables ou défavorables, mais sur une année, cela peut avoir un impact fort sur leur classement sans que leur valeur soit mise en cause. Or c'est un effet particulièrement pervers de cercle vicieux, parce que cet impact peut par exemple les empêcher d'être tête de série au tournoi suivant, et donc d'avoir à affronter potentiellement une tête de série, ce qui rend leur premier tour plus difficile, etc ...


- les règles et pratiques de participation aux tournois ne sont pas les mêmes pour tous.
Les joueurs les mieux classés sont pénalisés quand ils ne participent pas aux plus grands tournois et aussi à un certain nombre de petits tournois, de plus avec des contraintes de calendrier. On comprend les raisons de ces règles, mais elles faussent l'évaluation de la force d'un joueur.
Dans le même ordre d'idée, les joueurs des pays qui organisent des tournois sont avantagés par rapport aux autres parce qu'ils bénéficient de wild cards préférentiellement attribuées aux joueurs locaux. Sont particulièrement avantagés ceux de pays organisant les levées du Grand Chelem


- le nombre de tournois et donc de points potentiels est limité pour les très jeunes joueurs.
On comprend bien la raison d'instituer ce type de règles et il faut certainement la maintenir pour protéger les joueurs. Il reste que cela fausse l'évaluation du niveau de ces joueurs.


- le système ne permet aucune comparaison pluri-annuelle :
Le nombre de points attribués pour un tournoi change selon les années. Exemple : une victoire à Roland-Garros rapportait 1000 points en 2008 et 2000 points en 2009. Une comparaison historique pour un même joueur est donc illusoire, et ne permet absolument pas de juger de l'évolution du niveau d'un joueur. S'ajoute évidemment à cela qu'un joueur ne joue pas toujours le même nombre de tournois d'année en année.


- le système ne permet aucune comparaison de carrière.
Il n'est certainement pas fait pour cela, il ne faut donc pas lui en vouloir. Mais c'est tentant de comparer soit deux carrières, soit un moment culminant dans deux carrières. Par exemple, Le Djokovic de 2011 a t-il été plus performant qie le Federer de 2006 ? Je prétends que des systèmes d'évaluation bien choisis peuvent permettre de répondre pertinemment à cette question.




Que serait un bon classement ?


Il est forcément le reflet d'une orientation politique, c'est-à-dire de l'importance qu 'on attache à tel ou tel critère. Il est donc par nature éminemment discutable. Je me lance quand même :


- le classement devrait permettre d'évaluer à chaque instant la force réelle d'un joueur ; c'est le point fondamental et à partir de cette ligne, on parlera de système d'évaluation plutôt que de classement.


-Le système d'évaluation doit gommer dans la mesure du possible les résultats anormaux (sur-performance, contre-performance, abandons, …)
- il doit être principalement qualitatif pour le classement immédiat (et donc ne pas désavantager les joueurs qui jouent peu). Il sera certainement opportun d'ajouter une composante quantitative pour un éventuel classement de carrière, en partant du postulat qu'un grand joueur a remporté beaucoup de matches et beaucoup de titres et en particulier dans les grands tournois.
- il doit tenir compte du « mérite », c'est-à-dire la façon dont un résultat est obtenu, et ne pas se contenter du résultat.
- il doit être indépendant du moment où les matches se déroulent et ne tenir compte que de la force de l'adversaire à ce moment-là.
- l'évaluation du niveau doit tenir compte de la surface – rien n'empêche de calculer un niveau composite multi-surfaces par la suite. On n'accorde pas une prépondérance particulière à une surface par rapport aux autres.
- il doit permettre les comparaisons dans le temps (entre les années pour un même joueur et entre 2 joueurs d'époques différentes, avec les précautions nécessaires).
- pour se faire plaisir intellectuellement, il utilise les mêmes règles pour les hommes et pour les femmes, ouvrant ainsi la porte à de hasardeuses comparaisons inter-sexe.


Voici donc les éléments essentiels du cahier des charges de mon système d'évaluation. Dans les différents articles de ce blog, vous découvrirez les concepts qui tentent d'y répondre et les résultats qu'ils produisent.

Je continue à évaluer de nouveaux indicateurs pour sélectionner les plus pertinents.

Commentaires