Les femmes jouent-elles des échecs plus beaux? – Une réponse aux critiques

Par Paul Kohler
10/06/2021 – "J'écris pour ChessBase parce que, comme une sorte de "service à la communauté", on attend de nous, universitaires, que nous transmettions nos recherches au public sous des formes plus acceptables et plus répandues que les simples articles techniques", écrit le Dr Azlan Iqbal. Malheureusement, certains lecteurs ont interprété son dernier article comme étant misogyne, avec un "contenu sexiste gratuit". L'auteur répond à ses détracteurs et décrit l'application de la méthode scientifique à un domaine aussi nébuleux que l'esthétique aux échecs.

ChessBase 16 - Mega Paquet Edition 2021 ChessBase 16 - Mega Paquet Edition 2021

Votre clef pour des idées neuves, des analyses précises et un entraînement ciblé. ChessBase 16 + MEGA 2021 + abonnement CBM (6 numéros) + compte ChessBase Premium (1 an) + 250 Ducats

Plus…

Les femmes jouent-elles des échecs plus beaux? – Une réponse aux critiques

Par Azlan Iqbal, Ph.D.

En réponse à l'article original, j'ai reçu beaucoup de commentaires, la plupart négatifs et le reste neutre. Ce n'était pas totalement inattendu compte tenu du sujet traité. Néanmoins, tous les commentaires (y compris les attaques personnelles) ne semblaient pas provenir de féministes militantes et d'hommes qui avaient l'impression que je venais d'insulter leur petite amie ou leur épouse. Les premières peuvent penser que nous risquons toujours de régresser à une époque où les rôles des hommes et des femmes dans la société étaient plus clairement définis, tandis que les seconds succombent probablement à ce que certains pourraient appeler des instincts évolutifs de protection ou de défense (par exemple, la mère pour les enfants, les hommes pour les femmes "sans défense"). La valeur ou la crédibilité que l'on peut accorder aux commentateurs anonymes sur Internet est limitée. Sont-ils vraiment ceux qu'ils prétendent être? On peut également se demander s'ils auraient réagi de la même manière, ou s'ils auraient fait l'éloge de l'étude de manière tout à fait opposée, si j'avais découvert que les femmes jouaient de plus beaux échecs (même si ce n'est que dans le cadre des séquences "mat en 3").

En outre, quiconque prend des phrases isolées totalement hors contexte et en tire des conclusions sur l'ensemble du travail ou écrit une longue "réfutation" sur un ton furieux le lendemain (surtout avec, il est vrai, peu ou pas de connaissances en intelligence artificielle ou en informatique) ne fournit pas d'argument convaincant, pas plus que de critique constructive. Pour mémoire, et pour apaiser toute inquiétude, je n'ai pas falsifié les résultats expérimentaux et ChessBase n'a pas conclu une sorte de marché faustien avec moi pour exploiter les femmes afin d'obtenir quelques clics de souris supplémentaires. Notre relation remonte à plusieurs années et n'a pratiquement rien à voir avec les femmes ou l'argent. En tant qu'universitaires, nous sommes en fait habitués aux réactions négatives, surtout lorsqu'il s'agit de proposer des idées nouvelles ou controversées. Je me souviens qu'à l'université de Cambridge, en 2008, lorsque je l'ai rencontré pour la première fois, Lotfi Zadeh (qui a introduit le concept d'ensembles flous) a déclaré que lorsqu'il a proposé certaines de ses idées pour la première fois, certains de ses pairs ont dit qu'il "devrait être lynché" pour avoir essayé de promouvoir un "manque de précision" en informatique. Heureusement, à ma connaissance, aucun de mes pairs n'a ce sentiment à l'égard de mon travail.

Quoi qu'il en soit, certains des commentaires que j'ai reçus étaient en fait des questions et des préoccupations authentiques (notamment sur mes références et ma crédibilité) auxquelles j'ai estimé devoir répondre dans l'intérêt de la science, d'où cet article de suivi. Je ne vais pas énumérer les questions individuellement car beaucoup d'entre elles se recoupent. Au lieu de cela, je vais simplement commencer à répondre en me basant sur mon interprétation de ce qu'ils essayaient d'obtenir. Laissez-moi commencer par dire que le modèle d'esthétique aux échecs que j'ai développé pour mon doctorat est considéré comme une pièce maîtresse dans des eaux jusqu'alors inexplorées. Par conséquent, il fallait fixer un objectif réaliste et réalisable, c'est-à-dire des séquences de mat en trois coups. C'est d'ailleurs comme cela que l'on procède pour un doctorat: il ne faut pas prendre plus de risques que l'on ne peut en prendre, sinon on n'arrivera jamais à obtenir le diplôme. L'"esthétique" a également été définie comme un terrain d'entente entre les domaines de la composition de problèmes d'échecs et des parties réelles, puisque les deux ne sont pas sans beauté. Les expériences nécessaires ont été réalisées et les résultats ont montré que l'ordinateur pouvait effectivement appliquer le modèle pour reconnaître l'esthétique dans le jeu (limité ici aux mats en trois) d'une manière qui correspondait positivement et bien à l'évaluation humaine compétente dans le domaine. Cela n'avait jamais été démontré auparavant et constituait une contribution importante à l'ensemble des connaissances en matière d'intelligence artificielle. Elle a également eu des applications pratiques, notamment en permettant l'analyse esthétique de milliers de problèmes d'échecs et de séquences de coups gagnants dans des parties qui seraient beaucoup trop difficiles à réaliser de manière fiable pour les humains.

Au cours de mes études, j'ai également travaillé avec de nombreux experts en échecs. Afin de comprendre tout cela de manière satisfaisante, vous devrez probablement lire ma thèse dans son intégralité. Il n'y a pas de raccourcis, tout comme il n'y en a pas eu pour moi dans sa préparation. Même si nous avons tendance à ne plus lire autant qu'avant (nous voyons maintenant davantage d'images et de vidéos), nous ne sommes pas encore au stade où nous pouvons dépendre d'un ordinateur pour comprendre des textes écrits complexes et répondre intelligemment à des questions intelligentes. J'ai obtenu mon doctorat à l'université de Malaya, la meilleure université de Malaisie à l'époque. La politique de l'université prévoyait qu'en plus de mon propre superviseur, il y aurait un examinateur interne et deux examinateurs externes, qui devaient tous être des professeurs titulaires ayant une expertise dans le domaine. Les examinateurs externes doivent également venir de l'étranger, et dans mon cas, il s'agissait d'universités renommées du Royaume-Uni et d'Australie. Ma thèse leur a été confiée pendant sept mois.

En outre, contrairement à certaines institutions, les quatre professeurs (y compris mon directeur de thèse) doivent s'accorder à l'unanimité pour que le doctorat soit décerné.  Il n'est pas inhabituel ou impoli pour une personne qui a obtenu son doctorat de mettre le titre "Ph.D." à la fin de son nom dans les rapports ou articles scientifiques, tout comme les médecins mettent "M.D." à la fin de leur nom. Les Grands Maîtres d'échecs sont également connus pour mettre le titre "GM" avant leur nom dans les articles et il est ironique et hypocrite que l'un d'entre eux pense qu'agir de la sorte est un signe d'arrogance ou d'orgueil. Compte tenu de tout cela, si quelqu'un suggère que le modèle esthétique développé manque de crédibilité, il déclare son ignorance ou ses idées préconçues sur moi et sur la région dont je suis originaire. Si j'ai apprécié de visiter l'Ouest à de nombreuses reprises, que ce soit pour des raisons professionnelles ou pour le plaisir, je n'ai jamais eu l'intention d'y travailler ou d'y rester. À aucun moment de ma formation ou de ma carrière, je n'ai même demandé à le faire. Je suis très heureux de vivre dans mon propre pays et de le servir. De toute façon, grâce à l'essor d'Internet, nous vivons dans un monde pratiquement sans frontières.

Le modèle d'esthétique du mat en trois que j'ai développé et testé a en outre été étendu dans notre article IEEE de 2012, également avec l'aide d'experts en échecs (qui se trouvent aussi être titulaires d'un doctorat), pour inclure non seulement les mats en trois mais aussi les études (et logiquement, les mats plus longs). L'article, bien sûr, a été soigneusement examiné par des pairs et a dû être révisé avant d'être accepté pour publication, de sorte que le modèle étendu est également "validé expérimentalement". Il est vrai qu'en validant le modèle, la moyenne de trois cycles d'évaluation par Chesthetica (par opposition à un seul cycle) pour chaque séquence de coups a été testée, mais l'utilisation d'un seul cycle dans les expériences futures est également valable car, comme un juge humain de l'esthétique, Chesthetica peut ou non fournir exactement la même évaluation chaque fois qu'il regarde la même séquence (vous devrez lire attentivement l'article de l'IEEE pour apprendre pourquoi cela fonctionne bien). Ce phénomène est peu préoccupant car la cohérence et la fiabilité du programme "dans le temps" ont déjà été démontrées en prenant la moyenne de ses évaluations sur plusieurs cycles. Cela n'implique pas que des cycles multiples devraient toujours être utilisés à l'avenir et que seules des valeurs esthétiques nettes et immuables sont acceptables pour chaque séquence. La possibilité de légères variations dans une évaluation esthétique rend le modèle plus dynamique tout en restant, en moyenne, cohérent et fiable (un peu comme un juge humain). Quant à la réplication des résultats expérimentaux, elle dépend de l'hypothèse. Si l'hypothèse initiale stipulait l'utilisation d'un seul cycle d'évaluation, alors la réplication de l'expérience devrait également utiliser un seul cycle et le résultat devrait être accepté, quel qu'il soit. De même, la valeur p pour la signification statistique doit également être déterminée à l'avance et ne pas être réinitialisée après l'expérience pour mieux s'adapter aux résultats (par exemple en la faisant passer de 0,01 à 0,05).

Bien que j'aie écrit de nombreux articles, si ma mémoire est bonne, je ne m'auto-publie pas du tout, même s'il est vrai que certaines de mes publications sont certainement meilleures ou plus prestigieuses que d'autres (comme tout universitaire). Par exemple, lorsque Britannica m'a invité à écrire l'entrée pour "l'esthétique informatique" (mon domaine d'étude de doctorat) dans leur encyclopédie ou la publication récente par Springer de notre livre sur l'approche DSNS que mon logiciel Chesthetica utilise pour créer des problèmes d'échecs originaux. Sans parler des nombreux articles publiés dans l'ICGA Journal, une revue réputée dans le domaine des jeux vidéo, dont le niveau de publication est élevé. Ken Thompson y a également publié. J'ai également publié des articles dans des conférences de haut niveau sur l'IA, comme l'AAAI et l'IJCAI. D'ordinaire, je n'aime pas attirer l'attention sur ces choses, mais lorsqu'on m'interroge, je suppose que je dois rétablir la vérité. Par ailleurs, ce n'est probablement pas une bonne idée de préparer des diapositives de conférence à la dernière minute, car des fautes de frappe peuvent apparaître et vous ne pouvez pas vraiment savoir à quel point certaines personnes peuvent prendre ce genre de choses au sérieux et s'en servir pour tirer des conclusions sur vous.

En ce qui concerne le "facteur d'impact", les universitaires sont bien conscients de ses limites et les lecteurs intéressés peuvent également s'y intéresser, comme expliqué ici. En bref, il ne s'agit pas nécessairement d'un bon indicateur de la qualité d'un travail de recherche particulier. Par exemple, un article nous rappelant une fois de plus les dangers de consommer trop de hamburgers, de frites ou de sodas pourrait avoir un facteur d'impact élevé, principalement parce qu'il est publié dans une revue médicale populaire, parce que la science médicale a tendance à obtenir le plus de fonds de recherche et parce que beaucoup d'entre eux ont tendance à étudier nos habitudes alimentaires (beaucoup plus de gens que ceux qui étudient, par exemple, l'aspect esthétique computationnel des échecs). D'autre part, j'écris pour ChessBase (sans facteur d'impact) parce que c'est une sorte de "service à la communauté". En tant qu'universitaires, nous sommes censés transmettre nos recherches au public sous des formes plus agréables et plus répandues que les simples articles techniques.

En ce qui concerne mon expertise en matière de jeu d'échecs, je n'ai jamais pris la peine d'obtenir un classement officiel, même si je joue de manière occasionnelle depuis 30 ans et que j'ai remporté plusieurs médailles dans des tournois locaux. En fait, je suis assez confiant que je pourrais tenir au moins 20 coups même contre Magnus Carlsen dans des conditions de tournoi. Si j'avais un classement Elo officiel, ma probabilité de gagner ce match (ou mon "score attendu") pourrait être calculée et serait probablement si faible qu'on pourrait penser que je perdrais plus vite que Bill Gates. Je pourrais probablement le battre aussi, d'ailleurs. Donc, oui, je peux dire que je "sais jouer", mais je ne me considère pas comme un "maître officiel" du jeu. La vérité est que, étant donné mon travail, je n'ai tout simplement pas besoin d'être un maître d'échecs, car il y a de nombreux maîtres d'échecs officiels qui ne sont que trop heureux de m'aider et de travailler avec moi sur des projets. Je suis franchement étonné de voir à quel point certains d'entre eux sont ouverts d'esprit et tournés vers l'avenir.

On peut dire la même chose des scientifiques qui étudient, par exemple, le culturisme. Ils ne sont pas et ne doivent pas nécessairement être eux-mêmes des culturistes renommés (bien qu'ils travaillent probablement avec quelques-uns d'entre eux). Cela dit, je ne pense pas être plus intelligent ou "plus intelligent que les autres". Ce n'est pas comme si mon QI était de l'ordre de 180 ou quelque chose comme ça. J'ai passé un test scientifiquement précis en 2003 et mon QI n'était que de 131, avec la "distinction inhabituelle d'être aussi bon en mathématiques qu'en expression orale". Il est regrettable que certaines personnes aient interprété l'article original ici sur ChessBase comme étant misogyne, ayant un "contenu sexiste gratuit" et prétendant que je ne connaissais peut-être même pas de femmes. On m'a également "menacé" de porter atteinte à ma réputation et à ma crédibilité universitaires et de me demander de réfléchir à mon avenir dans le monde universitaire. C'est faux sur toute la ligne, je dirais. J'ai connu beaucoup de femmes à mon époque. Aux dernières nouvelles, 52 femmes de 23 pays différents, en fait; et la plupart d'entre elles n'auraient que de bonnes choses à dire sur moi, j'en suis sûr.

En ce qui concerne le statut académique, je suis plus préoccupé par la vérité scientifique que par les effets que sa révélation pourrait avoir sur ma carrière. Il est certain que le fait de ne pas la révéler (l'effet tiroir) ou d'essayer de l'enterrer sans raison valable aurait un effet plus important sur la société (moi y compris). En outre, tous les universitaires ne sont pas à la recherche désespérée de la titularisation ou de son équivalent et sont prêts à "faire ou à dissimuler n'importe quoi" pour l'obtenir. Certains d'entre nous (bien que je ne prétende pas nécessairement faire partie de ce groupe) - et sans doute tout comme certains grands maîtres - peuvent également disposer d'une fortune indépendante et pourraient prendre leur retraite demain si cela leur plaisait, sans jamais avoir à travailler un autre jour de leur vie. Donc maintenant, après avoir, je l'espère, remis les pendules à l'heure sur ces questions, examinons certaines des autres préoccupations concernant les expériences de mon article qui suggèrent que les hommes jouent de plus beaux échecs que les femmes.

La première chose que l'on doit réaliser lorsqu'on lit un article scientifique est qu'il y a probablement toujours une portée spécifiée (par exemple, les séquences de mat en trois coups). C'est normal. Les scientifiques ne prétendent pas tout savoir et le champ d'application sert d'indicateur de la mesure dans laquelle ce qui a été testé l'a été réellement ou pourrait l'être. Cela ne signifie pas que rien d'utile ne peut être dit sur le sujet. Par exemple, il se peut que nous ne sachions comment certaines parties du cerveau fonctionnent par rapport à certains aspects de l'activité humaine, mais cela ne signifie pas que ces résultats sont inutiles tant que les neuroscientifiques ne savent pas comment le cerveau entier fonctionne par rapport à l'ensemble de l'activité humaine. La science est un processus cumulatif et autocorrectif.

Certains "experts" peuvent penser que leurs intuitions personnelles ou collectives sur certaines choses l'emportent sur la validation expérimentale. Cependant, d'un point de vue scientifique, ils ont tort. Ce dont vous avez besoin pour battre la validation expérimentale, c'est d'une validation expérimentale plus importante ou meilleure. Le "bon sens" n'est pas un argument scientifique et il est connu pour être erroné ou trompeur. Tout comme on pourrait être enclin à penser qu'une boule de bowling toucherait le sol plus rapidement qu'une plume lâchée de la même hauteur dans une chambre à vide. Ainsi, si quelqu'un souhaite analyser des séquences d'échecs plus longues ou de types différents en utilisant, disons, une autre méthode, il devra d'abord développer et valider expérimentalement son propre modèle esthétique pour ces types de séquences, sinon tout ce que vous avez est essentiellement constitué d'intuitions personnelles (et très probablement biaisées). Le fait d'être un maître joueur ne vous aide pas scientifiquement dans ce domaine.

Passons à la question parfaitement valable de savoir s'il existe une corrélation entre la force de jeu et l'esthétique. En d'autres termes, les joueurs les plus forts jouent-ils de manière plus esthétique? Dans l'étude originale, cela n'a pas été pris en compte, mais l'étude compare l'esthétique du jeu entre deux moteurs, c'est-à-dire Rybka 3 contre Fritz 8 (10+10) et Rybka 3 contre Fritz 8 (1+1) avec des scores moyens de 1,979 et 1,992, respectivement. La différence n'est pas statistiquement significative. Cela suggère donc que la force de jeu n'est pas nécessairement pertinente pour la beauté. Cependant, il se trouve que j'avais avec moi deux anciennes bases de données contenant 1 000 parties sélectionnées au hasard qui se sont terminées par un match nul entre des joueurs ayant un classement Elo supérieur à 2500 et entre des joueurs ayant un classement Elo inférieur à 1500. Les parties proviennent de la Big Database 2011 et le sexe n'a pas été pris en compte, même si la plupart des parties étaient probablement des parties entre hommes, surtout dans le cas de la première série (le résultat ne s'applique donc peut-être même pas aux parties entre femmes). Les scores esthétiques moyens (en utilisant les mêmes approches statistiques que celles décrites dans l'article original) étaient respectivement de 1,815 et 1,693, et la différence était effectivement statistiquement significative. Cela suggère donc que la force de jeu joue un rôle dans l'esthétique des séquences d'accouplement en trois mouvements qui résultent du jeu entre humains.

Quelles sont les implications de ce constat ? La force de jeu aurait-elle dû être prise en compte dans l'étude originale, de sorte que seules les parties entre femmes se situant dans la même fourchette Elo que les parties entre hommes aient été utilisées ? Peut-être, mais malheureusement, cela n'était pas possible sans altérer le processus de sélection qui est censé être aléatoire parce qu'il n'y a pas de moyen automatique (et impartial) de rechercher des joueurs en fonction de leur sexe et qu'il n'y avait tout simplement pas assez de parties entre des femmes dans la base de données se terminant par "exclusivité" (lisez l'article original pour savoir ce que cela signifie) et des hommes qui se trouvaient également dans une fourchette d'Élo particulière. Bien sûr, la plupart des parties entre joueurs forts ne se terminent même pas par un mat (ils ont tendance à se résigner), mais là encore, l'esthétique de ce genre de parties ne peut pas être testée scientifiquement. En outre, en comparant des échantillons du même type (c'est-à-dire des séquences de mat en trois coups) tirés d'une population normale (c'est-à-dire ce qui a été obtenu au hasard dans la base de données), les différences entre les hommes et les femmes sont toujours valables (dans ce cadre, évidemment).

L'étude originale a minimisé l'introduction de tout type de biais dans les échantillons (d'hommes et de femmes) en supposant que la base de données de plus de 6 millions de parties utilisée était une représentation impartiale des parties jouées dans le monde entier par les hommes et les femmes. S'il s'avère qu'il y avait un plus grand nombre de joueurs masculins forts que de joueurs féminins dans cette base de données et que, par conséquent, les échantillons de chacun d'entre eux reflétaient également cette situation et que les jeux entre femmes obtiendraient nécessairement une note esthétique plus faible... eh bien, cela soulève la question suivante : pourquoi, dans une population normale, y a-t-il plus de jeux joués par des joueurs masculins forts pour commencer ? Ce n'est pas quelque chose qui peut être "ajusté" sans introduire un biais dans les échantillons. Si je devais sélectionner uniquement des joueuses fortes et spécifiques pour les comparer à des joueurs masculins forts et spécifiques... cela introduirait tellement de biais que je devrais justifier comment et pourquoi chacun de ces joueurs a été choisi. Cela ne reflète pas ce que l'on trouve généralement dans la population de joueurs du monde réel et ce qui peut être sélectionné de manière réaliste au hasard dans cette population. Imaginez maintenant les biais supplémentaires introduits si des filtres arbitraires et "manuels" basés sur l'âge étaient également appliqués.

De même, si je devais tester un mélange de mats plus longs et de finales de type étude (que Chesthetica peut aussi analyser esthétiquement maintenant) avec des mats en trois coups, on pourrait argumenter qu'un échantillon avait plus d'un type d'accouplement ou de fin que l'autre échantillon et que cela a affecté le résultat parce que les expériences montrent aussi que les études obtiennent, en moyenne, un meilleur score esthétique en utilisant le modèle. Sans parler de la question de savoir jusqu'où il faut remonter à partir de la fin d'une partie pour déterminer où commence l'"étude" et comment cette décision a été prise pour chaque partie (ce qui introduit un biais!). C'est pourquoi il est primordial d'avoir un champ d'application réalisable et testable et une cohérence dans l'expérimentation. Sinon, les conclusions et les implications de la recherche n'en sont que plus ténues. En résumé, l'étude originale partait du principe que la base de données utilisée présentait une distribution "aussi équitable que possible sans introduire de biais" des jeux entre les hommes et les femmes et compensait les biais en utilisant le score esthétique moyen.

Les deux parties présentées dans l'article original de ChessBase, par exemple, ne doivent donc pas être considérées comme une comparaison entre des pommes et des oranges, mais plutôt comme ce que le modèle esthétique pense des séquences elles-mêmes, indépendamment de l'identité des joueurs ou des conditions dans lesquelles ces coups ont été joués (ce que les humains pourraient avoir du mal à ignorer). De plus, en elles-mêmes, ces deux séquences ne sont pas une "preuve" de quoi que ce soit et n'ont jamais été destinées à l'être. Les échantillons de 1069 parties chacun qui ont été utilisés contenaient certainement aussi des parties entre femmes de meilleure qualité que certaines parties entre hommes. C'est la beauté de la sélection aléatoire et de la courbe en cloche. D'où la nécessité de ne comparer que des moyennes et de ne pas tirer de grandes conclusions à partir de parties ou de séquences individuelles. Je suppose que l'on aurait pu utiliser davantage de parties (par exemple en inversant artificiellement les couleurs lorsque les Noirs font mat et en traitant la position comme si les Blancs faisaient mat dans des parties qui ne se sont jamais produites sous cette forme), mais là encore, cela aurait introduit un biais, surtout si le fait de jouer avec les pièces blanches ou noires influence la façon dont les gens jouent. Ainsi, puisque les deux échantillons ne comportaient que des victoires blanches (comme la norme pour la plupart des problèmes d'échecs), les comparaisons entre eux sont techniquement toujours valables. En outre, les 1'069 parties sélectionnées au hasard dans chaque échantillon ont été considérées comme un nombre suffisant à des fins expérimentales.

Qu'en est-il, alors, des parties entre hommes et femmes ou des parties entre joueurs mieux classés et moins bien classés? Comment l'analyse esthétique en tient-elle compte? Dans l'étude originale, les parties entre hommes et femmes étaient encore plus rares et pratiquement impossibles à obtenir automatiquement et aléatoirement, c'est pourquoi elles n'ont pas été utilisées. Comme on me l'a fait remarquer, il existe aussi des tournois "réservés aux femmes" mais pas de tournois "réservés aux hommes". Un double standard étrange (peut-être même sexiste) qui exclut automatiquement les hommes (même ceux à faible Elo) de certains tournois mais n'exclut les femmes d'aucun. Cela expliquerait donc la rareté mentionnée plus haut. En ce qui concerne les joueurs les mieux classés par rapport aux joueurs les moins bien classés, il a été considéré que cela introduisait plus de variabilité (lire "manque de cohérence") dans les échantillons par rapport à l'utilisation de joueurs ayant à peu près le même classement. Par exemple, si le match est le résultat de la victoire d'un joueur de 2500 Elo sur un joueur de 1600 Elo (je suppose que de tels matchs ont rarement lieu), l'écart plus important en termes de points de classement (c'est-à-dire 900) introduirait intrinsèquement plus d'éléments à prendre en compte que si la différence n'était que de 150 points Elo, par exemple.

Il n'y a pas non plus de preuve qu'un grand écart Elo permette nécessairement au joueur le plus fort de jouer de plus beaux échecs, mais c'est certainement quelque chose que je pourrais tester dans de futures expériences si les données sont suffisantes. Je ne sais pas s'il y avait nécessairement plus de parties de ce type dans l'échantillon féminin utilisé dans l'étude originale, mais essayer de le découvrir et ensuite décider arbitrairement lesquelles inclure et lesquelles rejeter (et ensuite faire la même chose pour l'échantillon masculin) introduirait, une fois de plus, plus de biais que la base de données source elle-même ne donne automatiquement et sans intervention de ma part. Que dire de l'argument selon lequel les séquences de mat en trois coups "forcées" nuisent à la créativité et à l'esthétique ? Eh bien, dans des travaux de recherche précédents (Aesthetics in Mate-in-3 Combinations : Part II : Normality, ICGA Journal, décembre 2010), j'ai montré que les mats forcés, en moyenne, ne sont pas différents esthétiquement, selon le modèle validé expérimentalement et dans le cas de parties entre joueurs humains, de ceux qui ne sont pas forcés.

Cependant, un joueur ou un compositeur humain peut être influencé à penser un peu moins d'une séquence qui n'est pas forcée en faisant une analyse plus profonde de la position. C'est pourquoi les séquences forcées sont généralement considérées comme plus belles et préférées dans les expériences, car les humains finiront par les percevoir. Encore une fois, tant que les deux échantillons sont similaires en ce sens qu'ils sont des compagnons forcés (ou non), les comparaisons entre eux sont plus crédibles que, disons, si un échantillon était forcé et l'autre non. Maintenant, ne vous méprenez pas. Dans l'ensemble, il existe probablement plusieurs douzaines, voire des centaines de variations ou de permutations différentes de l'étude originale qui auraient également pu être réalisées en filtrant ceci et en compensant cela afin de tester spécifiquement ceci par rapport à cela, mais il s'agit précisément d'autres expériences avec des champs d'application différents et des ensembles de contraintes et de limitations différents. J'espère vraiment qu'il y a des gens qui peuvent trouver le financement et le temps de les faire toutes, y compris les commentateurs en fauteuil. Je serais certainement intéressé de lire les résultats et heureux qu'ils aient contribué à la littérature sur le sujet, aussi modeste soit-elle.

Enfin, les conclusions de l'étude originale sont en fait soutenues par le fait que dans le monde de la composition de problèmes d'échecs (qui ont typiquement les scores esthétiques les plus élevés, même selon mon modèle), les meilleures compositions (si ce n'est la quasi-totalité d'entre elles) sont faites par des hommes. Il se pourrait que le "patriarcat" masculin du monde de la composition rejette secrètement certaines des compositions les plus fantastiques jamais composées simplement parce qu'elles sont soumises par des femmes, ou il se pourrait aussi que les femmes, en général, soient moins intéressées par l'esthétique des échecs pour des raisons qui pourraient intéresser les neuroscientifiques (en supposant qu'en apprendre plus sur les différences physiologiques entre les cerveaux masculins et féminins et leurs implications ne soit pas encore considéré comme une recherche interdite). Je laisse aux lecteurs le soin de décider par eux-mêmes quelle explication est la plus probable. Je n'ai aucun intérêt direct dans le résultat et je suis plus intéressé par la vérité. Je doute que les femmes soient si faibles d'esprit et manquent de confiance au point d'être découragées des échecs par des résultats tels que celui-ci et, même s'ils s'avèrent vrais, ce n'est pas nécessairement quelque chose qui ne peut pas être compensé avec la bonne tutelle d'un homme (ou d'une femme) plus compétent. J'espère que l'étude originale motivera encore plus de femmes à jouer au jeu et à entrer dans le monde de la composition des problèmes d'échecs pour prouver qu'elles sont effectivement égales ou même supérieures aux hommes à cet égard également.

Pour conclure, permettez-moi également de féliciter DeepMind de Google pour la victoire d'AlphaGo sur le champion de go de l'humanité, Lee Sedol. Je ne doutais absolument pas que cela arriverait et je ne peux que me demander pourquoi il a fallu si longtemps pour y parvenir. Au fait, Google, s'il vous arrive d'avoir un de vos ordinateurs quantiques qui traîne sans rien faire, j'aimerais bien y brancher Chesthetica pendant un certain temps pour un traitement DSNS de créativité computationnelle sérieuse, si les deux sont compatibles. Je plaisante (enfin, pas vraiment). Quoi qu'il en soit, bon spectacle et respect à tous les grands de l'industrie qui innovent et prennent l'IA des jeux de société au sérieux.

Cet article a été téléchargé pour la première fois sur ResearchGate et vous pouvez contacter le Dr Azlan Iqbal par courrier électronique pour toute question ou préoccupation que vous pourriez avoir, à son adresse électronique officielle avec une c.c. à son adresse privée. Oui, il répond au mieux de ses capacités.


Après plus de vingt ans passés dans l'organisation du Festival international d'échecs de Bienne (Suisse), Paul Kohler en est maintenant le secrétaire général et le directeur du tournoi fermé des Grands Maîtres (GMT). Depuis septembre 2016, vous pouviez lire ses posts quotidiens et ses tweets pour ChessBase dans la langue de Molière. Dorénavant, c'est sur le portail francophone que vous pouvez lire ses articles.

Commenter

Règles pour les commentaires

 
 

Pas encore enregistré? S'inscrire