L'aventure de la programmation dans les échecs (3e partie)

Par Paul Kohler
12/03/2021 – Dans les deux premières partoes de cette série, publiées à l'origine dans "Der Spiegel", le plus grand (et le plus influent) portail d'information de langue allemande, Frédéric Friedel a décrit son implication de plusieurs décennies dans les échecs informatiques. Dans cette troisième et dernière partie, il explique sa rencontre avec le dernier rebondissement dans ce domaine de recherche: l'intelligence artificielle et les machines apprenant par elles-mêmes jouant désormais au plus haut niveau. Où allons-nous et que nous apportera l'avenir?

ChessBase 17 - Mega package - Edition 2024 ChessBase 17 - Mega package - Edition 2024

It is the program of choice for anyone who loves the game and wants to know more about it. Start your personal success story with ChessBase and enjoy the game even more.

Plus…

Cet article est reproduit avec la permission de Spiegel Online où il apparut pour la première fois. Il a été demandé à l'auteur de décrire le développement de la programmation dans les échecs à partir de son vécu. Il ne s'agit donc pas ici d'un traité académique, mais d'un récit personnel, qui pourra servir de guide dans l'une des plus grandes entreprises scientifiques de notre époque.

L'aventure de la programmation dans les échecs - 3e partie:

The Woosh: aux origines de Fat Fritz

Par Frederic Friedel

C'était au milieu des années 1990. J'étais à Londres, accompagnant le champion du monde d'échecs Garry Kasparov, comme c'est souvent arrivé, lors d'une de ses apparitions. Cette fois-ci, c'était à Home House, une belle villa géorgienne à Marylebone. Ce soir-là, nous avons été rejoints au dîner par un ancien enfant prodige aux échecs. Il avait atteint le niveau de maître (Elo 2300+) à l'âge de 13 ans et était capitaine d'un certain nombre d'équipes d'échecs juniors anglaises. Il était également un joueur de classe mondiale de jeux informatiques. Ce fut une rencontre intéressante, le garçon décrivant avec enthousiasme un jeu informatique qu'il était en train de développer. Après son départ, j'ai dit à Garry "C'est un jeune homme arrogant!"; "Mais très intelligent", m'a répondu Garry. Et nous en sommes restés là.

Vingt ans plus tard, j'ai lu dans les journaux que Google avait acheté une société appelée DeepMind Technologies, pour 400 millions de livres sterling. DeepMind était une entreprise britannique d'intelligence artificielle qui avait créé un logiciel reposant sur un réseau neuronal qui a appris à jouer seul à des jeux vidéo de la première heure comme Pong et Space Invaders. Le logiciel n'avait pas été programmée à la main pour cela, mais utilisait des méthodes qui ressemblaient beaucoup à celles d'un joueur humain acquérant des compétences dans le jeu. L'objectif, selon DeepMind, était de "créer une IA polyvalente qui puisse être utile et efficace pour presque tout". L'un des fondateurs de la société était Demis Hassabis.

Demis? Ça me dit quelque chose... N'était-ce pas le garçon que j'avais rencontré à Home House? Pendant un an, j'ai observé les progrès de l'entreprise en tant que membre de la famille Google, et j'ai été particulièrement fasciné de voir comment ils ont résolu un problème qui avait nécessité l'intervention d'experts en informatique pendant des décennies: DeepMind a créé un programme, AlphaGo, qui a appris à jouer au vénérable jeu de Go, le menant jusqu'au niveau de maître puis de champion du monde. Les règles du Go sont d'une simplicité trompeuse, mais le facteur de ramification rend le calcul très difficile pour les ordinateurs. Dans le deuxième article de cette série, j'ai décrit comment, dans une partie d'échecs de 40 coups, il y avait 10^128 séquences de coups possibles, soit beaucoup plus que le nombre d'atomes dans l'univers. Eh bien, au Go, il y a 10^170 configurations possibles de l'échiquier, ce qui rend le nombre de parties d'échecs insignifiant.

Le site d'actualité de ChessBase a suivi de près les progrès d'AlphaGo Ce programme développé par DeepMind utilise des réseaux de neurones pour étudier un très grand nombre de parties, développant ainsi sa propre compréhension de ce à quoi ressemble le jeu humain. Il a ensuite perfectionné ses compétences en jouant contre lui-même à partir de différentes versions, tout en apprenant de ses erreurs. Ce processus, connu sous le nom d'apprentissage par renforcement, a produit un logiciel de jeu de Go de niveau maître.

Plus de vingt ans après leur première rencontre, Garry Kasparov discute d'intelligence artificielle avec Demis Hassabis dans ce Google Talk très instructif de 40 minutes.

À ce stade, j'ai contacté Demis, qui se souvenait de notre rencontre à Home House et m'a invité à visiter DeepMind à Londres. J'invitai en retour son équipe à venir à Hambourg pour voir les atouts dont nous disposions pour les échecs. ChessBase détient une base de données avec plus de huit millions de parties de haut niveau, dont 100 000 annotées par des joueurs très forts. Nous avons aussi 200 millions de positions dans le cloud évaluées par les ordinateurs les plus puissants du monde, ainsi que la plus grande et la plus récente encyclopédie des ouvertures tenue constamment à jour. Nous avons proposé à DeepMind d'utiliser ces ressources pour entraîner un réseau de neurones aux échecs - plus précisément: faire en sorte que le réseau de neurones s'entraîne par lui-même.

Demis était ouvert à l'idée et a promis de l'examiner. Ce qu'il ne m'a pas dit à l'époque, c'est que son équipe était déjà en train de développer un moteur d'échecs qui ne ressemblait à rien de ce qu'on avait pu voir jusqu'à présent. Les moteurs traditionnels ont leur connaissance du jeu d'échecs programmée en eux, méticuleusement, un facteur à la fois. Le réseau neuronal DeepMind a pris un chemin radicalement différent: on lui a expliqué les règles du jeu, comment les pièces se déplacent et le but ultime du jeu: donner échec et mat. Rien d'autre. Utilisant des techniques de pointe en intelligence artificielle, le programme, AlphaZero, a joué contre lui-même, des millions et des millions de fois, en identifiant des schémas de son propre chef et en ajustant les valeurs comme il le jugeait bon. En d'autres termes, il a produit ses propres concepts et connaissances, en utilisant la reconnaissance des formes comme le font les humains, et en s'améliorant au fur et à mesure de son apprentissage. Et il a fait cela sans avoir besoin de toutes les données de ChessBase que je lui proposais...

Comment cela a-t-il été possible? Au départ, le système a joué des parties absurdes, où un camp perd trois pièces pour rien, et l'autre camp ne peut pas gagner parce qu'il en a perdu quatre. Mais à chaque itération, à chaque 10 000 pas d'apprentissage environ, il est devenu plus fort. Tournant sur du matériel dernier cri - pour les amateurs de technologie: 5'000 TPU de première génération et 64 TPU de deuxième génération -, le programme a joué 44 millions de parties contre lui-même et s'est hissé, ce faisant, au niveau d'une force de classe mondiale aux échecs. Personne n'avait rien "dit" à AlphaZero en matière de stratégie, personne n'avait expliqué que le matériel était important, que les ♕♛ avaient plus de valeur que les ♗♝, que la mobilité était importante. AlphaZero s'est réglé tout seul, en tirant ses propres conclusions - des conclusions, d'ailleurs, qu'aucun être humain ne pourra jamais comprendre.

À la fin du processus d'apprentissage, AlphaZero a joué un match d'essai contre un moteur open source nommé Stockfish, l'un des trois ou quatre meilleurs moteurs de force brute au monde. Ces programmes tournent tous autour de 3500 points Elo, ce qui est au moins 700 points de plus que n'importe quel joueur humain! Le processeur de Stockfish fonctionnait sur 64 threads et calculait 70 millions de positions par seconde; AlphaZero fonctionnait sur une machine à quatre TPU, calculant seulement 80 000 positions par seconde. L'Intelligence artificielle compense cela en ne sélectionnant que les variantes les plus prometteuses - des coups qui, dans sa manière propre de jouer, s'étaient révélés efficaces dans des positions similaires.

Sur les 100 parties jouées contre Stockfish, AlphaZero en a gagné 25 avec les Blancs, trois avec les Noirs, et a fait match nul dans les 72 parties restantes. Toutes les parties ont été jouées sans recours à une encyclopédie des ouvertures. Ensuite, une série de douze matchs de 100 parties a été jouée, chacune commençant à tour de rôle par une des douze ouvertures humaines les plus populaires. AlphaZero a gagné 290 parties, a fait 886 matchs nuls, pour seulement 24 défaites. Certains membres de la communauté traditionnelle des échecs par ordinateur ont qualifié les conditions de matchs d'"injustes", à cause de l'absence d'encyclopédie des ouvertures. J'en conclus nonobstant qu'AlphaZero est à n'en pas douter l'entité la plus forte qui ait jamais joué aux échecs. Et il y est parvenu après avoir étudié le jeu de zéro, tout seul, sans aucun conseil extérieur, pendant environ neuf heures au total!

Google et DeepMind se sont montrés très détendus à propos du projet et ont révélé à tous les méthodes qu'ils ont utilisées. L'un des responsables du projet est même venu visiter ChessBase à Hambourg et a donné une conférence devant une demi-douzaine de nos jeunes programmeurs talentueux. Ceux-ci en sont sortis inspirés, déterminés à en apprendre davantage sur ce type d'intelligence informatique.

The Woosh

Bien sûr, je n'ai pas pu résister moi-même. À la mi-novembre, j'ai demandé à mon fils Tommy et à mon neveu Noah de me construire une puissante machine informatique. Ils ont acheté les différents éléments, l'ensemble étant composé d'un processeur 12 cœurs et de deux cartes graphiques de pointe qui venaient de sortir. Ces cartes comportent des milliers de processeurs graphiques et de processeurs à cœur tenseur (GPU et TPU), destinés à l'origine à alimenter l'affichage vidéo 3D dans les jeux. Mais il s'avère que les processeurs sont éminemment adaptés au calcul par réseau neuronal.

J'ai donc maintenant une machine IA très puissante qui bourdonne dans le bureau de mon domicile. Bourdonnement? En fait, il s'agit d'un ronronnement assez fort de plusieurs ventilateurs qui dissipent la chaleur des 600 watts d'énergie consommés par l'ordinateur. Cela chauffe en fait la pièce à une température très confortable de 23°C, le chauffage central étant éteint. À force, on s'habitue au bruit régulier de la machine. Il y a une chose intéressante à considérer: si j'avais eu cette machine vers l'an 2000, elle aurait été l'ordinateur le plus puissant du monde!

Que faisons-nous de la super-machine? Un ami expert en échecs par ordinateur a téléchargé tous les outils nécessaires pour construire un réseau neuronal pour les échecs, et la machine s'est mise au travail en jouant en moyenne 95'000 parties par jour contre elle-même, en apprenant d'elles et d'autres parties. Dans quelques mois, nous espérons qu'elle atteindra le niveau de jeu d'AlphaZero et peut-être même qu'elle ira plus loin. Elle est déjà capable de résister aux meilleurs programmes de force brute, certains fonctionnant sur un matériel massif permettant de calculer 1,6 milliard de positions par seconde. [NDT - Rappel: l'article original a été publié au début 2019.]

Tout cela est délicieusement excitant, et pas seulement parce que notre programme d'IA pourrait atteindre de nouveaux niveaux surhumains aux échecs. Le plus important est qu'il le fait d'une manière totalement nouvelle, non pas avec des tactiques de force brute, mais avec les idées de position qu'il a trouvées après avoir étudié des millions de parties. Tout seul, sans aucune intervention humaine.

Et ce n'est pas le fin mot de l'histoire. En effet, les techniques utilisées par DeepMind ne sont pas seulement applicables aux échecs. On peut utiliser les réseaux neuronaux pour apprendre toutes sortes de choses: reconnaître des images, des visages, des écritures, traiter le langage naturel, calculer des mouvements (par exemple pour les jeux informatiques avancés ou les robots), comprendre l'économie et les marchés boursiers, faire de meilleures prévisions que les experts humains, et bien d'autres choses encore qui vont se produire dans la prochaine décennie. Ces jeunes programmeurs veulent comprendre comment leur domaine est transformé par le passage du codage manuel explicite à l'apprentissage non supervisé par des ordinateurs qui, dans de nombreux domaines, ont déjà des meilleures performances que les humains.

AlphaZero n'est qu'un exemple précoce d'ordinateurs qui résolvent des problèmes complexes sans intervention humaine. Il a démontré de manière frappante que cela est possible - et pas seulement pour le Go et les échecs. Nous allons voir le même processus se dérouler dans de nombreux autres domaines de l'activité humaine. C'est l'avenir de l'humanité, et nous ferions bien d'y être préparés.

Liens

ChessBase Account Abonnement Premium annuel

Pour ne rien manquer des événements échiquéens et profiter des multiples applications développées par ChessBase, ouvrez un compte Premium annuel! Non seulement vous ne payez que dix mois au lieu de douze, mais vous recevez encore un treizième mois gratuit!

Plus...


Après plus de vingt ans passés dans l'organisation du Festival international d'échecs de Bienne (Suisse), Paul Kohler en est maintenant le secrétaire général et le directeur du tournoi fermé des Grands Maîtres (GMT). Depuis septembre 2016, vous pouviez lire ses posts quotidiens et ses tweets pour ChessBase dans la langue de Molière. Dorénavant, c'est sur le portail francophone que vous pouvez lire ses articles.

Commenter

Règles pour les commentaires

 
 

Pas encore enregistré? S'inscrire