AlphaGo 0.0

L’article de Ludologie intitulé AlphaGo 2 – Ke Jie 0 demandait s’il allait y avoir un tournoi entre les deux IA qui ont battu les humains et le commentaire de l’un nos lecteurs s’interrogeait sur  la notion du plaisir de jouer et sur l’intégration des ordinateurs dans les tournois. DeepMind a pris tout le monde de court en lançant AlphaGo Zero.

AlphaGo Zero, l’IA qui apprend par elle-même

AlphaGo a été présenté en janvier 2016 dans la revue Nature par l’équipe de DeepMind. Après avoir battu le champion européen puis les meilleurs joueurs du monde, que ce soit lors de matchs officieux sur l’Internet ou lors de compétitions officiels, le logiciel a été déclaré meilleur que les humains au jeu de Go en mai 2017. DeepMind annonce alors le retrait du supercalculateur de toute compétition officielle mais l’histoire ne s’arrête pas là. En ce mois d’octobre 2017, la société anglaise dévoile AlphaGo Zero, une nouvelle version du logiciel beaucoup plus puissante et capable d’apprendre sans l’implémentation de données humaines. Comme l’indique l’article, le nouvel algorithme apprend Tabula rasa, c’est-à-dire par la seule expérience en s’appuyant sur des conditions initiales très précises, une révolution dans le domaine de l’intelligence artificielle et un challenge pour les philosophes défenseurs de l’innéisme (ex. réflexes archaïques, grammaire universelle).

Tonicité du cou, réflexe archaïques ou interaction avec l’environnement ?

Après l’utilisation d’algorithme Min-Max, du Deep Learning et de la méthode de Nash (voir Calculer n’est pas jouer !), c’est donc un algorithme basé sur l’apprentissage par renforcement, sans base de donnée, qui vient de terrasser les autres méthodes d’apprentissage appliquées au jeu de Go. Une nouvelle fois, comme dans le film WarGames (1983), l’algorithme joue des millions de parties contre lui-même pour sélectionner les suites les plus efficientes permettant de conquérir le plus grand nombre de case du Goban virtuel. En trois jours, le programme avait trouvé les séquences classiques du jeu et même des séquences efficientes inconnues des plus grands maîtres. Le programme a terrassé AlphaGo cent fois d’affilé sur des parties limitées à deux heures de calcul, les concepteurs ne précisant pas si AlphaGo aurait pu gagner sur des parties limitées à 48 heures de calculs.

Quelques parties jouées entre AlphaGo Zero et AlphaGo Master
Quelques parties jouées entre AlphaGo Zero et AlphaGo Master

Le nouveau défi de DeepMind : Starcraft 2

Contrairement aux jeux de plateau dans lesquels la seule contrainte d’ordre physique est une contrainte de type spatiale, dans les jeux vidéo en temps réel, la contrainte du joueur est de type spatio-temporelle. Ces jeux qui implique une gestion temporelle de l’espace géographique très mal supporté par les intelligences artificielles actuelles. Le nouveau défi de Deepmind est aujourd’hui de battre les meilleurs joueurs du monde au jeu vidéo Starcraft 2 avec une gestion quasi-instantanée de l’espace et du temps. Il est probable que leur but sera atteint après avoir décrypté les cartes et le calibrage du jeu sacrant « AlphaSC2 » meilleur que le champion du monde de ce jeu au travers du relai des médias généralistes friands de ce genre de prouesses. Peut-être même que dans un avenir proche, en mémoire du canard de Vaucanson, un logiciel nommé AlphaGoose aura l’honneur de battre un enfant au jeu de l’oie… Une fois sur deux…

Le jeu abstrait Tac-Tic-Toc

Ces recherches appliquées me rappelle un jeu que nous avions édité en 2013 sur Windows mobile : Tac-Tic-Toc, un jeu à informations incomplètes impliquant un changement volontaire des règles du jeu en cours de partie. Le développeur avait utilisé un algorithme de gestion d’emploi du temps pour gérer cette contrainte, le programme restant vulnérable aux changements de règles en cours de partie. En effet, tous ces algorithmes sont très sensibles aux changements de conditions initiales. D’ailleurs,  je lance le challenge à Deepmind et aux autres équipes de développeurs de proposer un unique algorithme qui battrait un humain à trois jeux traditionnels : l’awélé, les échecs et le go.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *