Pourquoi les classements officiels sont-ils peu pertinents pour prévoir l'issue d'un match ?
Tout
système de classement a ses défauts et il n'est pas question de
faire le procès des systèmes actuels de classement de l'ATP et de
la WTA (ils suivent la même logique et toute remarque concernant
l'un est applicable à l'autre).
Pour
autant, ils présentent de nombreux défauts, aussi bien quand on
cherche à pronostiquer le résultat d'un match que quand on tente
des comparaisons de niveau à un instant t, d'état de forme ou de
carrière.
Rappelons
d'abord la logique des classements actuels.
Les
joueurs se voient attribuer des points en fonction de leur résultat
dans un tournoi (on n'examine ici que les tournois à élimination
directe).. Ces points dépendent de plusieurs facteurs :
-
le nombre de tours passés dans le tournoi. Evidemment, au plus il va
loin dans un tournoi, au plus le joueur reçoit de points. La logique
est « presque » logarithmique : en très gros, un
tour passé en plus rapporte presque 2 fois plus de points.
-
la catégorie du tournoi. Les deux organisations (ATP et WTA)
classent les tournois en catégories et au plus le tournoi est dans
une catégorie élevée, au plus le joueur reçoit de points pour un
nombre de tours passés donné. Là encore la logique est
logarithmique : d'une catégorie à la supérieure, le nombre de
points est doublé (c'est un peu moins rigoureux chez les femmes).
-
le nombre de tournois qui rapportent des points est limité :
sans entrer dans les détails, le système ne retient que les 6
meilleurs résultats des petits tournois.
-
les points gagnés dans un tournoi sont perdus 52 semaines plus tard
et remplacés par les points gagnés au tournoi qui a lieu 52
semaines plus tard. C'est donc un classement purement annuel sur 12
mois glissants.
-
les joueurs participant au tournoi de fin d'année rassemblant les
meilleurs joueurs de l'année civile récoltent aussi des points, en
fonction de leur résultat dans ce tournoi.
-
les victoires aux Jeux Olympiques ou en Coupe Davis / Fed Cup ne
rapportent en 2017 aucun point ATP (ou WTA). Cela n'a pas toujours
été le cas.
-
des pénalités (souvent théoriques) s'appliquent pour les top
players qui ne participent pas à un certain nombre de petits
tournois sans justificatif médical.
-
On ne parle sur ce blog que des tableaux principaux du circuit
principal, mais les victoires en qualification et sur les tournois
Challenger rapportent également des points.
Quels sont les défauts du système ?
-
le
système a un aspect essentiellement quantitatif
il
pénalise énormément les joueurs qui ont peu joué dans les 12
dernier mois (par exemple après une blessure). Il induit donc en
erreur dans la mesure où un joueur intrinsèquement plus fort est
plus mal classé qu'un autre, moins fort mais qui a joué tout le
temps. Si l'interruption a duré plus de 12 mois, le joueur n'est
même plus classé.
Exemples :
ils sont très nombreux. Quand Serena Williams a repris sérieusement
la compétition en 2011, elle était classée 172 ème au moment du
tirage au sort de Stanford. Il est rapidement apparu qu'elle
surclassait toutes ses rivales, mais n'était encore classée que
11ème 6 mois plus tard, alors qu'elle avait remporté 23 de ses 27
matches joués dans l'intervalle et gagné contre les joueuses les
mieux classées de l'époque.
Autre
exemple : en 2017, Federer décide de ne pas participer à
Roland-Garros. Il marquera donc 0 points pour ce tournoi, ce qui le
pénalise par rapport à ses concurrents, sans que cela ait un
quelconque rapport avec son niveau.
-
le
système récompense trop longtemps une performance exceptionnelle
d'un joueur (et
pénalise trop longtemps une contre-performance exceptionnelle).
On
sait qu'il est courant qu'un joueur soit en état de grâce dans un
tournoi (voire tout simplement chanceux), et obtienne un résultat
bien supérieur à son niveau habituel (l'inverse est vrai aussi).
Or, le système de rotation des points fait que les points gagnés
restent 52 semaines dans l'escarcelle du joueur. Cela fausse ainsi
l'estimation de la force d'un joueur.
Exemple :
en
2016, Florian Mayer est 226 ème au moment du tirage au sort du
tableau de Halle, tournoi généralement d'un bon niveau. Il est
d'ailleurs 27è dans l'ordre des classements sur … 28 joueurs
engagés. Il gagne le tournoi et empoche 500 points ATP qui suffisent
à le positionner toute l'année autour de la 120 ème place. Mais
sur les 11 autres tournois auquel il participe dans l'année, il ne
gagne que 5 matches en tout !
Pire :
un joueur qui a un pépin physique sans gravité mais qui est obligé
d'abandonner peut perdre des centaines de points, alors même que son
niveau n'est pas remis en cause .
-
les points sont attribués pour une catégorie de tournois sans tenir
compte du niveau des joueurs engagés.
C'est
sans importance pour les tournois du Grand Chelem qui sont d'un
niveau sensiblement identique, mais c'est problématique pour les
petits tournois.
Exemple :
En
WTA, gagner Hobart ou Florianopolis rapporte le même nombre de
points. Mais le premier rassemble 24 joueuses du Top 100 et le second
seulement 8. On se doute que cela n'a pas la même valeur de gagner
l'un ou l'autre.
-
le niveau d'un joueur n'est pas homogène d'une surface à l'autre
Des
joueurs ont fréquemment des faiblesses ou des talents particuliers
sur un type de surface. Or le classement est unique et
multi-surfaces. Ce classement est donc un très mauvais indicateur
pour certaines surfaces.
Exemple :
J.
Konta qui affiche un classement flatteur en 2017 a de très mauvais
résultats sur terre battue, et en tout cas tout à fait incohérents
avec son classement.
Nota :
ce critère est une bonne illustration du fait que ce sont les buts
recherchés qui font qu'un système de classement est de qualité ou
non. On peut imaginer que l'ATP et la WTA considèrent qu'un bon
joueur de tennis doit savoir jouer sur toutes les surfaces. Dans
cette logique, il n'y a en effet aucune raison de traiter séparément
les différentes surfaces de compétition. Par contre, ne pas le
faire rend le système de classement inopérant :
-
d'une part pour déterminer si le résultat d'un match constitue une
surprise ou non - erreur fréquemment commise par les commentateurs.
-
d'autre part pour pronostiquer correctement l'issue d'un match
-
le choix de la surface des tournois proposés dans le calendrier a
une influence sur le classement.
Exemple :
sur le circuit féminin, en 2017, il y a 14 tournois sur terre battue
contre 37 sur surface dure (soit un rapport de 2,6) ; en 2012,
c'était 17 contre 34 (soit un rapport de 2). Au fur à mesure des
années, on avantage ainsi les joueuses plus fortes sur surface dure.
Plus
insidieux, baisser la catégorie des tournois sur un type de surface
alors qu'on promeut des tournois sur une autre surface a la même
influence sur le classement.
Enfin,
de façon plus individuelle, la systématisation du Masters de fin
d'année en indoor désavantage des joueurs comme Ferrer ou Nadal
dont c'est la surface la plus faible.
-
l'attribution des points ne tient aucun compte de la force de
l'adversaire
Cela
na pas toujours été le cas, mais aujourd'hui obtenir une victoire
au 1er
tour de Roland-Garros sur le 800ème mondial ou sur le 1er
apporte le même nombre de points, alors que la valeur de la
performance est clairement différente.
-
l'attribution de points ne tient aucun compte de la domination plus
ou moins importante d'un joueur sur un autre au cours du match.
Il
paraît évident qu'en face de joueurs de force équivalente, gagner
6-0 6-0 ou bien gagner 6-4 1-6 7-6 n'est pas la même chose. Or, le
système attribue le même nombre de points aux deux vainqueurs.
Dans
le pire des cas, un vainqueur par forfait se voit attribuer le même
nombre de points qu'un vainqueur au terme d'un long match accroché,
alors que les mérites sont un peu différents … On notera que
c'est d'autant plus pervers que ce sont les meilleurs joueurs qui
bénéficient du plus de forfaits de leurs adversaires (un article de
ce blog le montrera).
-
A performance égale, la récompense en points dépend du tour
(« round ») au sein du tournoi.
En
clair, cela veut dire que battre Federer ou S. Williams au premier
tour d'un tournoi rapporte énormément moins que les battre au 3 ème
tour et a fortiori en finale.
Exemple
1 : A Wimbledon en 2012, Rosol bat Nadal au 2ème tour. Cela lui
permet d'engranger 45 points de plus. S'il l'avait battu par exemple
en 1/4 de finale, il aurait bénéficié de 360 points
supplémentaires.
Exemple
2 : A Wimbledon de nouveau, en 2014, Cornet bat S. Williams au
3ème tour. Cela lui permet d'engranger 190 points de plus. Si elle
l'avait battue par exemple en finale, elle aurait bénéficié de 700
points supplémentaires.
Je
pense que dans les 2 cas, vous conviendrez que le joueur le mieux
classé était pourtant motivé pour continuer … La performance du
joueur le moins bien classé n'a donc aucune raison d'être
dévalorisée sous prétexte qu'elle a eu lieu tôt dans le tournoi.
C'est
de mon point de vue un des vices cachés des classements actuels le
plus importants.
-
le système laisse la part trop belle au hasard du tirage au sort.
Le
résultat d'un joueur dans un tournoi est très dépendant du tirage
au sort, particulièrement pour les joueurs dans la moyenne des
engagés.
Exemple :
en 2017 à Roland-Garros, Paire rencontre Nadal dès le 1er
tour. Bien sûr, il perd le match et est donc sorti du tournoi dès
le premier tour ; or son niveau sur terre battue devrait
raisonnablement lui permettre de battre à peu près 2 joueurs sur 3
parmi les engagés du tournoi.
Il
y a donc distorsion de la perception du niveau du fait d'un tirage
défavorable.
Statistiquement,
on peut supposer qu'à l'échelle d'une carrière, les joueurs ont à
peu près le même pourcentage de tirages favorables ou défavorables,
mais sur une année, cela peut avoir un impact fort sur leur
classement sans que leur valeur soit mise en cause. Or c'est un effet
particulièrement pervers de cercle vicieux, parce que cet impact
peut par exemple les empêcher d'être tête de série au tournoi
suivant, et donc d'avoir à affronter potentiellement une tête de
série, ce qui rend leur premier tour plus difficile, etc ...
-
les règles et pratiques de participation aux tournois ne sont pas
les mêmes pour tous.
Les
joueurs les mieux classés sont pénalisés quand ils ne participent
pas aux plus grands tournois et aussi à un certain nombre de petits
tournois, de plus avec des contraintes de calendrier. On comprend les
raisons de ces règles, mais elles faussent l'évaluation de la force
d'un joueur.
Dans
le même ordre d'idée, les joueurs des pays qui organisent des
tournois sont avantagés par rapport aux autres parce qu'ils
bénéficient de wild cards préférentiellement attribuées aux
joueurs locaux. Sont particulièrement avantagés ceux de pays
organisant les levées du Grand Chelem
-
le nombre de tournois et donc de points potentiels est limité pour
les très jeunes joueurs.
On
comprend bien la raison d'instituer ce type de règles et il faut
certainement la maintenir pour protéger les joueurs. Il reste que
cela fausse l'évaluation du niveau de ces joueurs.
-
le
système ne permet aucune comparaison pluri-annuelle :
Le
nombre de points attribués pour un tournoi change selon les années.
Exemple : une victoire à Roland-Garros rapportait 1000 points
en 2008 et 2000 points en 2009. Une comparaison historique pour un
même joueur est donc illusoire, et ne permet absolument pas de juger
de l'évolution du niveau d'un joueur. S'ajoute évidemment à cela
qu'un joueur ne joue pas toujours le même nombre de tournois d'année
en année.
-
le système ne permet aucune comparaison de carrière.
Il
n'est certainement pas fait pour cela, il ne faut donc pas lui en
vouloir. Mais c'est tentant de comparer soit deux carrières, soit un
moment culminant dans deux carrières. Par exemple, Le Djokovic de
2011 a t-il été plus performant qie le Federer de 2006 ? Je
prétends que des systèmes d'évaluation bien choisis peuvent
permettre de répondre pertinemment à cette question.
Que
serait un bon classement ?
Il
est forcément le reflet d'une orientation politique, c'est-à-dire
de l'importance qu 'on attache à tel ou tel critère. Il est
donc par nature éminemment discutable. Je me lance quand même :
-
le classement devrait permettre d'évaluer à chaque instant la force
réelle d'un joueur ; c'est le point fondamental et à partir de
cette ligne, on parlera de système d'évaluation plutôt que de
classement.
-Le
système d'évaluation doit gommer dans la mesure du possible les
résultats anormaux (sur-performance, contre-performance, abandons,
…)
-
il doit être principalement qualitatif pour le classement immédiat
(et donc ne pas désavantager les joueurs qui jouent peu). Il sera
certainement opportun d'ajouter une composante quantitative pour un
éventuel classement de carrière, en partant du postulat qu'un grand
joueur a remporté beaucoup de matches et beaucoup de titres et en
particulier dans les grands tournois.
-
il doit tenir compte du « mérite », c'est-à-dire la
façon dont un résultat est obtenu, et ne pas se contenter du
résultat.
-
il doit être indépendant du moment où les matches se déroulent et
ne tenir compte que de la force de l'adversaire à ce moment-là.
-
l'évaluation du niveau doit tenir compte de la surface – rien
n'empêche de calculer un niveau composite multi-surfaces par la
suite. On n'accorde pas une prépondérance particulière à une
surface par rapport aux autres.
-
il doit permettre les comparaisons dans le temps (entre les années
pour un même joueur et entre 2 joueurs d'époques différentes, avec
les précautions nécessaires).
-
pour se faire plaisir intellectuellement, il utilise les mêmes
règles pour les hommes et pour les femmes, ouvrant ainsi la porte à
de hasardeuses comparaisons inter-sexe.
Voici
donc les éléments essentiels du cahier des charges de mon système
d'évaluation. Dans les différents articles de ce blog, vous
découvrirez les concepts qui tentent d'y répondre et les résultats
qu'ils produisent.
Je
continue à évaluer de nouveaux indicateurs pour sélectionner les
plus pertinents.
Commentaires
Enregistrer un commentaire
Vous pouvez laisser un commentaire sur cet article. Attention, tous les commentaires sont modérés ; les contenus légalement répréhensibles et ceux dénigrant les personnes, en particulier les joueurs et joueuses, sont systématiquement supprimés.