DeepMind a révélé fin décembre MuZero, un algorithme capable de maîtriser les échecs ou le jeu de Go sans avoir pris connaissance des règles du jeu.
Rachetée en 2014 par Google, la société DeepMind s’est spécialisée dans le développement des intelligences artificielles avancées. Cette startup londonienne a dévoilé le 23 décembre dernier un nouvel algorithme baptisé MuZero. Il succède à AlphaGo, le premier programme informatique à avoir battu un champion humain au jeu de Go.
MuZero est capable de maîtriser ce jeu, mais il a également appris à jouer aux échecs, au Shogi ainsi qu’à différents jeux vidéo développés par Atari. La grande nouveauté de cet algorithme, c’est qu’il ne s’appuie sur aucune donnée humaine et n’a pas eu connaissance des règles avant de commencer à jouer.
La méthode de la “recherche par anticipation”
DeepMind s’est basé sur une approche appelée “recherche par anticipation”. L’algorithme est doté de capacités d’anticipation et d’adaptation. Il étudie la position dans laquelle il se trouve, réfléchit à la meilleure action et examine ensuite le résultat de sa précédente action.
Pour Demis Hassabis, PDG et fondateur de DeepMind, MuZero rapproche les chercheurs “de la mise au point d’algorithmes capables de traiter le désordre et la complexité du monde réel”. Cette avancée pourrait être utile à un certain nombre de produits de Google, notamment l’amélioration de son moteur de recherche ou encore l’optimisation de la compression des vidéos YouTube. MuZero montre aussi une véritable avancée dans l’apprentissage par renforcement et le développement d’algorithmes. Cette capacité de l’algorithme à développer un modèle depuis son environnement pourrait avoir des débouchés dans la robotique ou encore les systèmes d’automatisation industrielle.
Partagez cet article