Jeu de go, poker, bridge... Dans le futur, les ordinateurs battront-ils les êtres humains à tous les coups ?
C'est une première. Une intelligence artificielle développée par Google a gagné contre un joueur professionnel de go. Mais la machine n'est pourtant pas prête de dominer l'homme.
Un roman culte à réécrire. En 1954, l'écrivain japonais Yasunari Kawabata publiait Le Maître ou le tournoi de go, dans lequel l'affrontement entre un champion sexagénaire et un virtuose trentenaire servait de métaphore au combat entre tradition et modernité. Le disciple est aujourd'hui une machine, baptisée AlphaGo. Ce système d’intelligence artificielle créé par une filiale de Google a battu, en octobre 2015, par cinq victoires à zéro, Fan Hui, un professionnel de 35 ans, considéré comme le meilleur joueur de go d'Europe. La revue Nature (en anglais) rapportait, mercredi 27 janvier, ce succès scruté de près par les spécialistes d'intelligence artificielle.
Le nombre de coups possibles au jeu de go est vertigineux
Faut-il considérer qu'un ordinateur a mis fin au règne de l'être humain sur le jeu de go, comme DeepBlue l'avait fait aux échecs en écrasant le champion du monde russe Garry Kasparov il y a vingt ans ? L'homme a perdu une bataille, pas la guerre. "Si le programme de Google a battu un joueur professionnel, il n'a pas battu le champion du monde", nuance Tristan Cazenave, professeur à l’université Paris-Dauphine et spécialiste de la programmation des jeux, contacté par francetv info.
Pourquoi ce jeu chinois millénaire est-il encore considéré comme un énorme casse-tête pour l'intelligence artificielle ? Dans le go, où il s'agit de se partager un plateau de 19 lignes sur 19 avec des pierres noires et blanches posées tour à tour et de bloquer l'adversaire, "tous les pions sont pareils, il n'y a pas de pièces supérieures auxquelles on puisse attribuer plus de valeur comme aux échecs, explique le spécialiste. Il y a infiniment plus de possibilités et des parties bien plus longues". D'où un nombre vertigineux de coups possibles. Le jeu "est très difficile à simuler, tellement le nombre de combinaisons à explorer est grand, estimé à 10170 (un suivi de 170 zéro), note Le Monde. Contre 10120 environ aux échecs".
Des milliers de parties analysées pour apprendre à jouer
Ne pouvant tout calculer, les concepteurs d'AlphaGo ont choisi de combiner plusieurs méthodes. D'une part, explique Tristan Cazenave, "ils ont créé un réseau de neurones qui pratique le 'deep learning', en apprenant le jeu et les meilleurs coups avec des joueurs professionnels, mais aussi en jouant contre lui-même". D'autre part, développe Bruno Bouzy, maître de conférences à Paris Descartes, et spécialiste des programmes des jeux de réflexion et d'intelligence artificielle, "ils emploient la méthode de simulation de Monte-Carlo : AlphaGo teste des coups, en particulier les meilleurs coups appris des joueurs professionnels. Il évalue une position en lançant à partir de là des milliers de parties aléatoires, puis il en tire des statistiques. Il verra, par exemple, que telle position a débouché sur une victoire dans 70% des cas, et en tire les enseignements nécessaires".
Au mois de mars, le match prévu à Séoul (Corée du Sud), entre Lee Sedol, considéré comme le meilleur joueur au monde, et la créature de Google aura valeur de test. Faites vos jeux ! "Le suspens reste entier pour moi; mais il est clair qu'AlphaGo a clairement creusé l'écart par rapport aux autres joueurs artificiels existants", estime Olivier Teytaud, spécialiste en intelligence artificielle à l’Institut national de recherche dédié au numérique (Inria), joint par francetv info. Il souligne toutefois que "Fan Hui est un joueur professionnel, très fort, mais il n'est tout de même qu'entre le 600e et 700e mondial". Bruno Bouzy, lui, parie sur un succès rapide d'AlphaGo sur tout être humain : "Si ce n'est pas en 2016, ce sera en 2017. En tout cas avant 2020", prédit-il.
Au poker, la machine ne sait pas limiter ses mises
Si les spécialistes de l'intelligence artificielle se passionnent surtout pour le go, ils étudient aussi d'autres jeux, comme le poker. "Pour un Hold’em [une variante du jeu de cartes] à deux joueurs avec mises limitées, les ordinateurs sont plutôt bons. En 2008, un programme baptisé Polaris a affronté une équipe de joueurs professionnels avec comme résultats deux parties gagnées, une perdue et une ex-aequo", rappelait Slate dès 2011. Tristan Cazenave confirme qu'il existe désormais des "programmes capables de battre deux joueurs avec des mises limitées. Il s'agit maintenant de battre plusieurs joueurs, avec des mises libres". Car le poker pose à l'ordinateur d'autres difficultés que le go.
Premier problème : "C'est un jeu d'informations incomplètes, où tout n'est pas sur la table, remarque Tristan Cazenave. Les programmes vont donc essayer de trouver les probabilités à partir des mains de départ." Second problème, soulevé par Bruno Bouzy : "L'argent qu'on peut miser : l'algorithme ne sait pas gérer le 'no limit', c'est-à-dire l'absence de plafond pour les joueurs, qui peuvent surenchérir sans fin". Parce que l'ordinateur part dans des calculs sans fin là où l'être humain va bien se limiter un moment dans la mise.
De la difficulté de jouer collectif pour un ordinateur
Troisième et dernier problème : l'ordinateur ne sait pas jouer contre plusieurs joueurs. Slate explique ainsi qu'à partir de trois joueurs, "le concept du 'bon coup' adapté à chaque situation est relégué aux oubliettes et le fragile équilibre stratégique est rompu. Les stratégies des trois joueurs deviennent interdépendantes et reposent désormais autant sur des considérations statistiques que psychologiques".
Le même problème, note Bruno Bouzy, se pose au bridge, de façon subtilement différente : "C'est un jeu d'équipe. Or, l'ordinateur ne sait pas jouer collectif." Un cran plus loin, Olivier Teytaud assure que "si l'on met à une table une machine, la machine va perdre. Car tous les humains vont se liguer contre elle". Faut-il y voir une discrimination ?
Commentaires
Connectez-vous à votre compte franceinfo pour participer à la conversation.