L’intelligence artificielle, toujours plus proche de l’homme 1/2

Vous souvenez-vous qu’il y a peu, on vous racontait comment AlphaGo, l’algorithme de Google, avait réussi à vaincre le champion européen du jeu de go ? Eh bien l’engin a remis ça, mais cette fois contre le numéro trois mondial de jeu de go, Lee Sedol. En tant qu’agence de création de sites Internet curieuse des nouvelles technologies, Ria Création revient sur cet exploit daté du 15 mars.

Les faits

Score final : 4 à 1 pour AlphaGo. Le Sud-coréen, classé 9e dan (plus haut niveau), a tout de même remporté une partie après plusieurs heures de bataille. Mais AlphaGo s’est vu décerner le titre de Grand Maître du go et s’est classé devant Lee Sedol au ranking mondial. Tout cela grâce aux techniques hautement sophistiquées du « deep learning » et du « Monte-Carlo ».

Jeu de go.

https://www.flickr.com/photos/julienr2/

La technique

« Deep learning » signifie apprentissage profond. C’est une technique qui permet d’entraîner des réseaux de neurones comprenant de nombreuses couches cachées. Ces réseaux sont des modèles de calculs schématiquement inspirés du fonctionnement des neurones biologiques, avec différentes couches correspondant aux divers degrés d’abstraction de l’information.

Lesdits réseaux parviennent à créer leur propre représentation des caractéristiques d’un problème, pour arriver à des taux de réussites supérieurs à ceux d’autres techniques d’intelligence artificielle. Pour cela, le temps d’apprentissage d’un gros réseau peut prendre des jours, voire des semaines.

Une leçon en plusieurs chapitres

AlphaGo utilise l’apprentissage profond en plusieurs phases. D’abord, il s’entraîne à retrouver les coups d’excellents joueurs à partir de dizaines de milliers de parties. À ce stade de sa leçon, il obtient un taux de reconnaissance de 57 %. Il joue ensuite des millions de partie contre différentes versions de lui-même afin d’améliorer ce premier réseau.
À ce moment-là, il est en mesure de générer de nouvelles données qu’il utilise pour apprendre à un second réseaux à évaluer des positions de jeu. Il rencontre alors une difficulté : combiner ces deux réseaux ainsi que la technique Monte-Carlo, afin de guider le jeu de l’ordinateur.

Vous voulez connaître la suite de la leçon d’AlphaGo ? Abonnez-vous à notre page Facebook !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *