Analyse informatique du talent des champions du monde

Par Paul Kohler
15/05/2021 – Nous avons publié récemment la traduction d'un article qui traitait d'un programme d'ordinateur supposé évaluer qui est le meilleur joueur d'échecs parmi les quatorze premiers champions du monde. À l'époque, l'article original en anglais a suscité de vives réactions. La méthode utilisée par les informaticiens a-t-elle un sens, est-elle solide sur le plan méthodologique? Non, répond de façon catégorique un expert d'Oxford. Ci-dessous, la traduction de sa prise de position, suivi d'un addendum des auteurs du premiers articles, et les réactions des lecteurs à l'époque. N'hésitez pas à relancer le débat avec vos commentaires!

ChessBase 17 - Mega package - Edition 2024 ChessBase 17 - Mega package - Edition 2024

It is the program of choice for anyone who loves the game and wants to know more about it. Start your personal success story with ChessBase and enjoy the game even more.

Plus…

Examen de "Computer Analysis of World Chess Champions"

par Matej Guid et Ivan Bratko, publié dans l'ICGA Journal, Vol 29, N°2, Juin 2006, pages 65-73, republié par ChessBase.com.

par Dr. Søren Riis, Oxford, UK

Dans cet article, les auteurs présentent une méthode qui est censée identifier le meilleur joueur d'échecs de tous les temps. L'idée de base est de comparer les coups joués par les champions du monde avec l'évaluation de ces coups donnée par un programme d'échecs informatique puissant.

Si l'on en croit les auteurs, il est possible de déterminer la force d'un joueur en faisant juger la qualité des coups des champions par une version de Crafty (celle qui ne va pas au-delà de douze demi-coups). La qualité d'un coup est calculée par le nombre de pions (calculé par le programme) que le coup choisi par le joueur est inférieur au coup que le programme juge être le meilleur.

Tout d'abord, permettez-moi de noter que si nous essayions de décider quel programme d'échecs contemporain est le plus fort, en nous basant sur la méthode des auteurs, nous obtiendrions très certainement des résultats assez absurdes !

Il existe différentes versions de Crafty, mais aucune d'entre elles n'a un classement supérieur à 2700 sur les dernières listes de classement. La version utilisée par les auteurs est une version modifiée de Crafty ("amputée") qui pour chaque coup recherche un nombre fixe de coups (6 coups et 6½ en fin de partie) avant d'évaluer la qualité de chaque coup disponible dans la position. La force du programme devient assez peu fiable car l'effet d'horizon s'installe. Quoi qu'il en soit, supposons (pour les besoins de l'argument) que cette version amputée de Crafty joue à peu près au même niveau que la version standard de Crafty. Il en résulte deux conséquences absurdes:

  • en haut de la liste, nous aurions (par définition!) la version "amputée" de Crafty elle-même (utilisée par les auteurs);
  • nous nous attendrions à ce que la version standard de Crafty soit également en tête de liste.

D'un autre côté, certains programmes de pointe (surtout lorsqu'ils sont exécutés sur des machines rapides à 4 CPU) sont beaucoup plus puissants que Crafty, et mettraient presque littéralement Crafty en pièces. Pourtant, plus un programme est puissant, moins il est susceptible de se comporter comme Crafty.

Ainsi, pour simplifier un peu, Crafty aurait tendance à classer tous les moteurs supérieurs à 2700 dans l'ordre inverse, avec les plus faibles en haut de la liste et les moteurs les plus forts plus bas.

Mais, peut-être la méthode a-t-elle un sens lorsqu'on teste d'anciens champions du monde? La réponse est non! Ce que les auteurs testent, est simplement lequel des champions du monde a joué aux échecs le plus dans le style de la version "amputée" de Crafty. Capablanca a joué des échecs assez simples où la manière de progresser est apparemment à la portée de Crafty. D'un autre côté Kasparov a joué de nombreuses parties qui sont bien au-dessus de la portée de Crafty. Il est intéressant de noter qu'assez fréquemment, les moteurs du niveau de Crafty (mais aussi des moteurs beaucoup plus puissants) évaluent très mal les positions et les coups. La plupart des groupes de discussion sur les échecs par ordinateur sont remplis de tels exemples. La fréquence à laquelle les ordinateurs évaluent mal les coups et les positions varie selon le type de position, etc. Cependant, il n'y a aucun doute que certains joueurs jouent des échecs qui sont simplement trop profonds pour être pleinement appréciés par un moteur du niveau de Crafty.

En fait, beaucoup de coups assez standards sont complètement manqués par Crafty à la profondeur de recherche 12. Crafty pénalise ♖xh5! de Fischer contre Larsen (joué à Portoroz) de 0.41 pions. Crafty à la profondeur 12 pense que ♗xg7 est le meilleur coup, alors qu'en fait seul le coup de Fischer mène à une victoire claire. Le coup ♗h6! de Kasparov contre Short à Zurich en 2001 est écrasant, et pourrait être le seul coup gagnant. Pourtant, la recherche de Crafty à la profondeur 12 pénalise le concept brillant de Kasparov avec plus de deux pions. En fait, Crafty n'a pas ♗h6 parmi les 20 meilleurs coups! Il n'est pas improbable que Kasparov ait basé une partie de son attaque sur la possibilité de ♗h6, et ait vu ce coup même plus tôt dans la partie. C'est tout à fait au-delà de ce que Crafty peut gérer.

En fait, ma conclusion est (basée sur d'autres exemples) qu'en général Crafty échoue complètement à comprendre la profondeur du jeu de Kasparov. Capablanca joue des échecs que Crafty trouve apparemment plus faciles à apprécier, même si Crafty punit parfois Capablanca injustement (bien que je n'aie pas trouvé d'exemples où Crafty ne comprenait pas du tout un coup de Capablanca).

Supposons maintenant que nous fassions le même test avec des moteurs nettement plus puissants. La méthode proposée aurait-elle alors un sens? Je crains que cela ne donne pas de très bons résultats non plus. Tout d'abord, cela favoriserait les joueurs positionnels sûrs par rapport aux joueurs offensifs sauvages - je suppose que Capablanca serait toujours bien meilleur que Tal. En fait, Tal pourrait ressembler à une "cloche" sans espoir qui a eu la chance de jouer contre d'autres joueurs encore plus cloches que lui.

Mais, supposons que nous voulions vraiment être "objectifs" sans aucun préjugé et que nous demandions simplement lequel des champions du monde joue les échecs les plus parfaits. Qu'y a-t-il de si mal à prendre les programmes les plus forts - en supposant qu'ils soient significativement meilleurs que Crafty - et à leur demander leur avis? Pour mettre le doigt sur le problème, je vais examiner la question d'un point de vue quelque peu théorique.

Objectivement, chaque position aux échecs est soit gagnée par les Blancs, soit nulle, soit gagnée par les Noirs. Pour les positions gagnées, la qualité d'un coup peut être jugée en fonction de la distance qui sépare la position du mat. Le meilleur résultat possible est +1 (c'est-à-dire un coup de plus). Dans cette perspective abstraite, un coup de moins 10 est une "erreur" dans le sens où il change la position en une position où il y a 10 coups de plus vers le mat. J'appellerai de telles erreurs des erreurs "inoffensives". Un type d'erreur beaucoup plus grave se produit si le joueur fait un coup qui convertit une position gagnée en une position nulle ou perdue. De ce point de vue très abstrait, appelons un coup qui transforme une position gagnée (position nulle) en position nulle (position perdue) une "erreur grave", et un coup qui transforme une position gagnée en position perdue une "double erreur grave".

Existe-t-il un moyen de mesurer la qualité des coups dans des positions qui sont objectivement dessinées? Non, pas du tout! C'est là que la psychologie et la connaissance de l'adversaire entrent en jeu. Un coup qui est le meilleur contre un adversaire (c'est-à-dire le plus susceptible à long terme de conduire l'adversaire à faire une "erreur" et à produire une position perdue), peut être différent de ce qui est le meilleur contre un autre adversaire. D'un point de vue purement théorique (et logique), il n'existe aucune mesure objective expliquant pourquoi un coup est meilleur qu'un autre, tant que la position reste équilibrée (c'est-à-dire qu'elle est objectivement nulle). Tous les coups garantissant un match nul sont également bons contre un jeu parfait. Mais, dans une partie réelle, l'adversaire n'est pas parfait. La tâche consiste à produire des coups qui maximisent la probabilité que l'adversaire fasse, à un moment donné, une erreur grave conduisant à une position perdue. Mais la meilleure façon d'y parvenir dépend dans une certaine mesure de l'adversaire, de ses forces et de ses faiblesses. Peut-être que la façon de jouer de Capablanca était suffisamment bonne pour obtenir des résultats convaincants en 1920. Cependant, la manière de Capablanca de jouer des positions équilibrées n'aurait peut-être pas fonctionné très bien contre les maîtres contemporains. Aux échecs modernes, certains joueurs trouvent qu'il est plus important de créer des positions difficiles complexes, plutôt que des positions avec un avantage cosmétique qui ne sont pas susceptibles de causer de grandes difficultés à l'adversaire.

Il existe, bien sûr, quelques principes généraux sur la meilleure façon de mettre la pression sur l'adversaire. Les échecs sont un jeu d'adresse avec des critères relativement clairs pour un bon jeu, ainsi les grands maîtres ont souvent des façons assez similaires de juger les positions. Il est cependant important de réaliser que l'évaluation de positions d'échecs équilibrées est, dans une certaine mesure, un art, et que les plus grands joueurs (comme Kasparov), dans une certaine mesure, prennent également en compte les facteurs psychologiques et les forces et faiblesses de l'adversaire lorsqu'ils jouent.

À l'avenir, les moteurs d'échecs pourraient jouer à un niveau si élevé que toutes les parties se solderaient par un match nul, et ce même si l'un des moteurs dispose de beaucoup moins de temps que l'autre ! Des moteurs encore différents (bien qu'ils jouent en quelque sorte parfaitement) pourraient encore évaluer des positions équilibrées quelque peu différemment. Ainsi, même les futurs moteurs (presque) parfaits pourraient ne pas être d'accord sur qui des champions était le meilleur.

Laisser Crafty juger qui était le plus grand champion du monde d'échecs est une insulte. C'est comme si un sourd jugeait qui était le plus grand compositeur.

Søren Riis est informaticien à l'université Queen Mary de Londres. Il est titulaire d'un doctorat en mathématiques pures de l'université d'Oxford. Il est danois mais vit actuellement près d'Oxford. Il jouait aux échecs en compétition il y a environ 20 ans (Elo 2300). Riis a été brièvement impliqué dans la programmation des échecs, et son intérêt inclut les aspects théoriques des échecs sur ordinateur.

La lettre suivante nous a été envoyée indépendamment de l'article de Soren Riis. Elle était en réaction à certaines des lettres qui suivent, et à des messages qui ont été postés sur différents forums informatiques.

Analyse informatique des champions du monde d'échecs - Réponse d'Ivan Bratko et Matej Guid à quelques commentaires 

Nous voudrions remercier les lecteurs pour leur intérêt pour notre article sur l'analyse informatique des champions d'échecs (ChessBase, 30 octobre 2006).

Nous aimerions répondre à un commentaire fréquent des lecteurs. Le commentaire est le suivant: "Une étude très intéressante, mais elle a un défaut dans le fait que le programme Crafty, coté à seulement environ 2620 Elo, a été utilisé pour analyser les performances de joueurs plus forts que lui. Pour cette raison, les résultats ne peuvent pas être utiles". Certains lecteurs spéculent en outre que le programme donnera un meilleur classement aux joueurs qui ont un classement similaire à celui du programme lui-même.

Ces réserves sont peut-être fondées sur une intuition simple selon laquelle le programme utilisé doit être nécessairement plus fort que les joueurs analysés. Cependant, les choses ne sont pas si simples et l'intuition semble être erronée dans ce cas. Un simple calcul montre, de manière peut-être surprenante, que:

(a) Pour obtenir un classement raisonnable des joueurs, il n'est pas nécessaire d'utiliser un ordinateur qui soit plus fort que les joueurs eux-mêmes. Il y a de bonnes chances d'obtenir un classement raisonnable même en utilisant un ordinateur qui est plus faible que les joueurs.

(b) L'ordinateur (faillible) ne montrera pas de préférence pour les joueurs de force similaire à la sienne.

Ces points peuvent être illustrés par un exemple simple. Supposons qu'il y ait trois joueurs et que l'on s'accorde sur le meilleur coup à jouer dans chaque position. Le joueur 1 joue le meilleur coup dans 90% des positions, le joueur 2 dans 80% et le joueur 3 dans 70%. Supposons que nous ne connaissions pas ces pourcentages, nous utilisons donc un programme informatique pour estimer la performance des joueurs. Le programme disponible pour l'analyse ne joue le meilleur coup que dans 70 % des positions. En plus du meilleur coup dans chaque position, il y a 10 autres coups qui sont inférieurs au meilleur coup, mais les joueurs font occasionnellement des erreurs et jouent un de ces coups au lieu du meilleur. Pour simplifier, nous considérons que chacun de ces coups a la même probabilité d'être choisi par erreur par un joueur. Ainsi, le joueur 1, qui joue le meilleur coup dans 90% des cas, répartira les 10% restants de manière égale entre ces 10 coups, en donnant 1% de chance à chacun d'entre eux. De même, le joueur 2 choisira l'un des coups inférieurs dans 2% des cas, etc. Nous supposons également que les erreurs commises par tous les joueurs, y compris l'ordinateur, sont indépendantes sur le plan probabiliste.

Dans quelles situations l'ordinateur, dans son jugement imparfait, créditera-t-il un joueur pour le "meilleur" coup? Il y a deux possibilités:

  1. Le joueur joue le meilleur coup, et l'ordinateur pense également que c'est le meilleur coup.
  2. Le joueur joue un coup inférieur, et l'ordinateur confond ce même coup inférieur avec le meilleur.

Par un simple raisonnement probabiliste, nous pouvons maintenant calculer les approximations de l'ordinateur sur les performances des joueurs en nous basant sur l'analyse par l'ordinateur d'un grand nombre de positions. En utilisant la formule donnée ci-dessous, l'ordinateur indiquera les pourcentages estimés de coups corrects comme suit: joueur 1 = 63,3%, joueur 2 = 56,6%, et joueur 3 = 49,9%. Ces valeurs sont assez éloignées des pourcentages réels, mais elles préservent néanmoins le classement correct des joueurs. L'exemple montre également que l'ordinateur n'a pas particulièrement favorisé le joueur 3, bien que ce joueur soit de force similaire à celle de l'ordinateur.

L'exemple simple ci-dessus ne correspond pas exactement à notre méthode qui prend également en compte le coût des erreurs. Mais il devrait aider à faire comprendre que pour une analyse sensée, nous n'avons pas nécessairement besoin d'ordinateurs plus forts que les joueurs humains. Cela ne veut bien sûr pas dire qu'un programme plus puissant, s'il est disponible, ne serait pas plus souhaitable. Il convient également de noter que notre méthode repose sur d'autres hypothèses, plus subtiles. Nos résultats doivent donc être interprétés à la lumière de ces hypothèses.

 

P.S. Formule pour calculer les estimations de l'ordinateur:

p’ = p * pc + (1 – p) * (1 – pc) / n

où:

p = probabilité que le joueur effectue le meilleur coup
pc = probabilité que l'ordinateur exécute le meilleur coup
p' = estimation par l'ordinateur de la précision du joueur p
n = nombre de coups inférieurs dans une position.

Commentaires de lecteurs

Peter Ballard, Adélaide, Australie

Voici ce que je ne comprends pas: l'auteur n'a analysé que les matches de championnat du monde. Capa a écrasé un Lasker vieillissant dans un match de 14 parties, mais a ensuite été surclassé par Alekhine dans un marathon de plus de 30 parties. Cela équivaut donc à un bilan relativement médiocre dans les matches de championnat du monde. J'aimerais voir les résultats des matchs individuels. Dans combien de matches le perdant a-t-il obtenu un meilleur indice de "qualité de jeu" que le gagnant? Si Capa a obtenu un meilleur indice de "qualité de jeu" qu'Alekhine dans le match de 1927, qu'est-ce que cela dit de leur méthodologie?

Albert Silver, Rio de Janeiro, Brésil

Lorsque les auteurs écrivent "Le critère de base pour l'évaluation des champions du monde était la différence moyenne entre les coups joués et les meilleurs coups évalués par l'analyse informatique", ils affirment en gros que les coups des champions du monde aux contrôles de temps de tournoi sont moins susceptibles d'être corrects que Crafty à 15-30 secondes par coup (le temps approximatif pris pour atteindre la profondeur choisie par les auteurs). Après tout, au lieu de voir si l'ordinateur peut trouver les coups des champions, comme c'est souvent le cas des suites de tests, ici les champions ont la charge peu enviable de devoir jouer comme Crafty. Alors, à qui faites-vous le plus confiance en moyenne? Kasparov (ou Karpov, Kramnik, etc.) à 3 minutes par coup, ou Crafty à 15-30 secondes?

L'histogramme de l'erreur moyenne implique également que c'est l'avantage que Crafty aurait sur ledit champion du monde. Donc si Kasparov a un taux d'erreur moyen sur tous ses coups de 0,1292, cela signifie que dans un match où Crafty a une limite de 12 demi-coups, Kasparov, avec toutes ses capacités et son jugement positionnel, devrait perdre 5-4 même avec 6 fois plus de temps de réflexion. Capablanca étant beaucoup plus fort ne perdrait que 6-5... Si l'avantage est en pions et non en points, alors cela signifie que pour chaque 8 coups en moyenne, Crafty s'attend à gagner un avantage d'un pion supplémentaire sur Kasparov. Ont-ils la moindre idée de l'absurdité de cette affirmation?

Julian Wan, Ann Arbor, USA

Merci pour cet article très intéressant. Il fait ressortir plusieurs points :

  1. Il montre que l'analyse brute de la fréquence à laquelle un joueur reproduit le choix de coup d'un programme informatique n'est pas nécessairement une "preuve" de l'assistance de l'ordinateur - dans des situations et des positions plus simples, cela peut en fait refléter le grand sens et le jugement de ce joueur.
  2. Cela peut ouvrir de nouvelles voies de recherche - notez que les parties utilisées ne sont que celles des matches - si l'on devait soumettre des parties sur une période donnée, cela pourrait montrer objectivement un changement de style.
  3. Elle montre à quel point le style de jeu est une question complexe - non pas que Kasparov, connu pour son style agressif, soit en fait assez proche de Karpov, souvent considéré comme ayant un style différent, plus positionnel.

Mohamed Nisthar, Riyad, Arabie Saoudite

Capablanca a été désigné comme le meilleur des champions. Mais si je ne me trompe pas, il a été complètement battu dans un match contre un joueur du sous-continent indien, Sultan Khan!!! Veuillez vérifier ce point et il serait utile de faire une analyse de ces parties.

Note de la rédaction: Sultan Khan était l'un des rares joueurs à avoir un bilan positif contre Capablanca (ainsi que contre Frank Marshall et Savielly Tartakower). Mais nous ne connaissons qu'une seule partie entre les deux joueurs: il s'agit de la victoire avec les Blancs de Sultan Khan contre Capablanca au tournoi de Hastings en 1930:

 

Benoît Chamuleau, Istamboul, Turquie

Tout d'abord, merci à ChessBase pour les nouvelles très diversifiées que vous offrez sur le monde des échecs - depuis trois ans environ, je le consulte presque quotidiennement! Étant fasciné par les études qui tentent de comparer les joueurs d'échecs les plus forts du monde, j'ai le sentiment qu'une dimension est continuellement négligée: le fait que la théorie des échecs n'était pas aussi avancée qu'aujourd'hui. Si, par exemple, on évalue le nombre de fois que le meilleur coup est joué, s'agit-il des meilleurs coups tels qu'ils sont connus aujourd'hui ou des meilleurs coups tels qu'ils étaient théoriquement connus à l'époque de la partie? Dans tous les cas, la comparaison est "injuste": les joueurs qui ont joué avec brio dans le passé peuvent être faibles dans la compétition d'aujourd'hui en raison, par exemple, de la complexité beaucoup plus grande (en termes de nombre de "bons" coups) des parties d'aujourd'hui.

En effet, les gens ont un certain plafond dans leur capacité, qui n'apparaissait pas aussi rapidement dans le passé - en raison du niveau relativement plus bas, ou du jeu plus simple - qu'aujourd'hui. Je pense donc qu'il peut être intéressant que des études comme celle qui est maintenant publiée sur ChessBase, prennent en compte les connaissances théoriques connues à l'époque de la partie, et évaluent les joueurs en conséquence. Il faut toujours noter que les capacités des joueurs de différentes époques ne peuvent pas être objectivement comparées: peut-être que Steinitz n'aurait pas été mauvais du tout contre Kramnik, s'il avait connu la théorie d'aujourd'hui. D'un autre côté, peut-être même que vous ou moi pourrions être champion du monde à l'époque de Steinitz!

Tobias Nordquist, Sandviken, Suède

Cette histoire d'ordinateur pourrait même être un nouveau terrain pour un nouveau système de classement. ChessBase devrait développer un algorithme ou un programme qui fonctionne comme l'"Analyse de jeu" dans Fritz, la différence étant que le programme devrait sortir un numéro de classement. Par exemple, l'erreur de Kramnik dans la partie 2 ne devrait pas être punie autant parce que l'adversaire n'a pas vu l'erreur. Mais l'erreur de Topalov dans la partie 9 devrait être punie. Pourquoi? Parce que son adversaire l'a vue. Pourquoi est-ce si important? Parce que l'ordinateur ne peut pas comprendre les choses non objectives aux échecs. L'homme appelle cela des choses subjectives et tant que cela n'est pas puni, ce n'est pas aussi mauvais que l'ordinateur le dit. J'espère que vous avez compris !

Pavel Dimnik, Toronto, Canada

Une des raisons pour lesquelles j'aime les échecs est sa profondeur, son étonnante capacité à surprendre et à intriguer régulièrement. Sur cette note, je pense que je dois commenter une facette importante des échecs que cette étude n'aborde pas vraiment. Pour être juste, en ce qui concerne ce type d'analyse mathématique, il est peut-être impossible de le faire. La facette qui n'a pas été abordée est la capacité des grands joueurs à créer le type de positions qu'ils souhaitent. Kramnik a contrecarré Kasparov, Tal a toujours trouvé une explosion dans la position, et Capablanca s'est toujours trouvé dans un jeu logique et positionnel (pour n'en citer que quelques-uns). Je ne pense pas qu'une analyse quantitative puisse rendre pleinement compte de cette capacité, sauf pour servir de comparaison entre deux joueurs, mais même dans ce cas, elle favoriserait le joueur qui pourrait le plus forcer le jeu dans la forme qui bénéficierait à son propre style.

J'applaudis l'effort entrepris, mais pour moi cette étude sert à souligner et à me rappeler le fait que l'analyse quantitative ne peut jamais apprécier la beauté des échecs, ou le vrai génie de ses champions. Elle fournit un outil utile bien sûr, et les programmes d'échecs sont pratiquement plus forts que jamais, mais sans le "deus ex machina" humain pour superviser et apprécier ce qui se passe sur l'échiquier, il n'y aurait pas d'échecs.

Paul Muljadi, USA

Merci d'avoir partagé l'article de Bratko-Guid. Bien qu'il s'agisse d'une tentative scientifique et valable d'identifier le meilleur joueur d'échecs de tous les temps, je pense que l'étude et l'article doivent être améliorés avant que nous puissions nous rapprocher de la vérité. Tout d'abord, le fait que Capablanca soit le meilleur joueur d'échecs de tous les temps ne me surprend pas du tout. J'ai toujours conclu la même chose car je pense qu'il est le meilleur joueur de fin de partie de tous les temps. Je pense qu'il y a une forte corrélation positive entre être le meilleur joueur de finales et le meilleur joueur d'échecs. L'article doit aborder les différentes phases du jeu et leurs meilleurs joueurs. Deuxièmement, nous devons inclure d'autres grands joueurs d'échecs qui n'ont pas été reconnus officiellement comme champions du monde, tels que Philidor, Morphy, Keres, etc. Les titres échiquéens sont importants, mais certains des grands joueurs n'ont jamais eu la chance d'obtenir le titre de champion du monde. Enfin, l'article doit également aborder les aspects psychologiques, physiques et autres aspects externes de la compétition échiquéenne. Lasker et Botvinnik ont apporté des contributions significatives dans ces domaines.

Frank Dixon, Kingston, Canada

Dans l'ensemble, il s'agit d'un travail remarquable. Je tiens à remercier les deux scientifiques qui l'ont réalisé, ainsi que ChessBase pour l'avoir rendu disponible. Je voudrais ajouter mon opinion supplémentaire que le GM Vladimir Kramnik, qui a gagné le match de réunification contre le GM Topalov il y a quelques jours, pourrait être le premier champion du monde formé par ordinateur dans l'histoire des échecs. Il est arrivé à un moment où les ordinateurs ont commencé à atteindre les niveaux de force de jeu des GM, et où les bêtes de silicium ont commencé à être utilisées intensivement pour l'entraînement réel des joueurs de haut niveau. Ceci devrait être pris en compte lorsque l'on commente le très faible pourcentage d'erreurs de Kramnik. Les deux auteurs ne se sont pas étendus sur ce point important. Le jeu de haut niveau de Kramnik, qui a débuté en 1991, à l'âge de 16 ans, était hautement tactique tout en restant stratégiquement solide, la plupart du temps. Au fur et à mesure qu'il a mûri, la nature tactique a fortement diminué au profit d'un style de jeu stratégique, preuve évidente de l'impact de l'entraînement par ordinateur sur son talent. Les joueurs qui l'ont précédé, comme Fischer, n'ont pas eu l'occasion de s'entraîner avec des ordinateurs. Tout au long de sa carrière (jusqu'en 1972 inclus), Fischer a fait preuve de prouesses tactiques exceptionnelles dans des positions complexes, qu'il a tempérées par une plus grande perspicacité stratégique à mesure qu'il gagnait en maturité et en force.

Gary Furness MD, Santa Rosa, Californie, USA

Merci pour cet article très intéressant. Je n'aurais jamais pensé qu'il y aurait autant de façons de mesurer les champions au sein de leur propre groupe de pairs.

David Korn, Seattle, USA

Tout d'abord, un grand merci à Matej Guid et Ivan Bratko pour leur excellent article qui tente de quantifier objectivement les forces relatives des quatorze champions du monde d'échecs. J'ai trouvé cela fascinant et j'ai lu chaque ligne plusieurs fois attentivement. J'ai été totalement enchanté par leur application directe de mesures simples mais bien conçues aux performances des champions d'échecs.

Je me demande, puisque M. Sonas a déjà si bien tracé les ELO historiques de ces mêmes joueurs - et d'autres aussi, sur son site ChessMetrics.com - ainsi que dans d'autres articles comparant les plus grandes performances au fil du temps et mettant en évidence à la fois Karpov et Kasparov sur de nombreuses années pour leur force cumulée dans les tournois majeurs, quelles perspectives M. Guid et Bratko ont-ils en ce qui concerne les performances des champions d'échecs. Guid et Bratko ont-ils des idées pour réconcilier la perception générale de Garry Kasparov comme étant peut-être le plus grand joueur d'échecs de tous les temps, et parfois Karpov, qui ont tous deux gagné de nombreuses parties, dans des tournois super forts, pendant de longues périodes?

Laissez-moi m'empresser de répéter qu'en aucun cas je ne souhaite soustraire quoi que ce soit, si ce n'est des applaudissements nourris et chaleureux à leur travail et à ce merveilleux article. Nous avons souvent entendu parler de la profondeur du jeu de Capablanca, et de la façon dont il semblait tout simplement "connaître" les bons coups; de même, cela confirme ce que nous entendons tous à propos de Kramnik, à savoir qu'il a la compréhension la plus profonde des échecs. Certains disent qu'elle est plus profonde que celle de Kasparov.

Maintenant, voici le problème: si, comme le dit cet article, Capablanca et Kramnik sont les leaders en termes de précision et de taux d'erreurs dans des positions plus complexes combinées, alors que dans le même temps, d'autres analyses désignent solidement Kasparov et Karpov, alors ne pouvons-nous pas dire que ces deux-là n'ont peut-être pas eu à 100% le jeu le plus précis, mais qu'en termes de volonté, de ruse, de détermination, de combativité, de ténacité, de volonté de gagner, etc., ils ont mené le monde pendant si longtemps en raison de facteurs externes, ou pas seulement de la précision, si vous suivez? Je ne veux pas couper les cheveux en quatre.

Mais Kramnik ne doit pas avoir joué autant de parties que les deux autres K, Karpov et Kasparov. De même, Capablanca a effectivement perdu peu de parties, mais il n'a pas non plus joué autant de parties, tout comme Fischer, dans un sens relatif aux autres champions d'échecs mondiaux?

Donc tout le monde est d'accord comme le suggèrent M. Guid et Bratko; mais aussi Kasparov et Karpov ont gagné pendant si longtemps que leurs résultats indiquent une suprématie pour des raisons incluant mais non limitées à la précision et à la réduction des bévues. De plus, il y a quelque chose à dire sur le fait de savoir quand jouer les meilleurs coups absolus, ou quand faire les calculs les plus profonds.

Cela semble relier cette discussion non seulement au calcul brut, mais aussi à l'endurance

physiologique et à un sens de l'économie émotionnelle, tout en faisant parfois allusion à la volonté de gagner, qui est encore une fois la résolution émotionnelle ou physique d'essayer de gagner chaque partie, par opposition à la précision seule, ce qui évoque encore une fois la maîtrise et le désir bien connus de Garry Kasparov et de Robert J. Fischer de gagner chaque partie.

Matt, Goddard, Atlanta, USA

Il est agréable de voir une évaluation de la force historique des joueurs basée sur un moteur, mais l'étude a fait au moins un mouvement douteux et au moins une erreur. Du côté douteux, nous avons le mécanisme d'ajustement des forces basé sur un sous-ensemble de positions compliquées, pour tenir compte du style de jeu, alors qu'en réalité le style de jeu lui-même peut être le facteur le plus important dans la force d'un joueur. Il est compréhensible que nous voulions mesurer la capacité d'un joueur à gérer les complications, d'autant plus que ce sont des choses que nous pouvons évaluer avec plus de précision grâce à un moteur, mais il n'existe aucune mesure corrélative de la capacité d'un joueur à éviter (ou à créer) des complications.

L'erreur est que l'étude ne prend pas en compte la théorie des ouvertures. Aujourd'hui, Kramnik joue beaucoup plus de coups préparés par la théorie et confirmés par les moteurs informatiques; l'évaluation de ses parties va montrer un pourcentage plus élevé de coups "parfaits" dans l'ouverture qu'une évaluation des parties de Steinitz, et par conséquent, les scores des joueurs seront gonflés au fil du temps. On pourrait argumenter que la connaissance de la théorie des ouvertures fait partie intégrante de la force d'un joueur, mais cela irait à l'encontre de l'intention de comparer les joueurs à travers les périodes historiques en premier lieu. Il semblerait plutôt que l'étude doive trouver une ligne de démarcation dans les parties, entre la théorie des ouvertures et le jeu sur l'échiquier. Se contenter de regarder les parties à partir, disons, du 20e coup est problématique, car la profondeur de la théorie des ouvertures (précise) a augmenté avec le temps, et aussi parce qu'une telle couverture fournirait un plus grand échantillon pour les joueurs positionnels, qui ont tendance à avoir des parties plus longues. L'idée de baser la démarcation sur le premier coup douteux aurait également des problèmes inhérents: toutes les théories du Gambit du Roi seraient échantillonnées, par exemple, et il pourrait également y avoir un déséquilibre imposé lorsque la force de jeu est mesurée après qu'un côté soit déjà désavantagé. L'utilisation des livres d'ouvertures de l'ordinateur comme démarcation ne fonctionne pas non plus: la théorie pour un joueur moderne peut très bien être du jeu sur l'échiquier pour un joueur historique; de plus, l'intégralité de la préparation d'un Kramnik n'est pas contenue dans les fichiers. Ce n'est donc pas un problème facile à surmonter.

Liens


Après plus de vingt ans passés dans l'organisation du Festival international d'échecs de Bienne (Suisse), Paul Kohler en est maintenant le secrétaire général et le directeur du tournoi fermé des Grands Maîtres (GMT). Depuis septembre 2016, vous pouviez lire ses posts quotidiens et ses tweets pour ChessBase dans la langue de Molière. Dorénavant, c'est sur le portail francophone que vous pouvez lire ses articles.

Commenter

Règles pour les commentaires

 
 

Pas encore enregistré? S'inscrire