Articles

20 Ans après Deep Blue: Comment l’IA a progressé Depuis La Conquête des échecs

Il y a vingt ans, l’ordinateur Deep Blue d’IBM a stupéfié le monde en devenant la première machine à battre un champion du monde d’échecs en titre dans un match de six parties. Le succès du supercalculateur contre un Garry Kasparov incrédule a suscité une controverse sur la façon dont une machine avait réussi à déjouer un grand maître, et a incité Kasparov et d’autres à accuser l’entreprise d’avoir triché sur son chemin vers la victoire. La réalité de ce qui s’est passé dans les mois et les années qui ont précédé ce match fatidique en mai 1997, cependant, était en fait plus évolutive que révolutionnaire — une ascension rocailleuse de type Balboa remplie de combats intellectuels, de progrès laborieux et d’une défaite à Philadelphie qui a finalement préparé le terrain pour une revanche triomphale.

Les informaticiens considéraient depuis des décennies les échecs comme un bâton de mesure pour l’intelligence artificielle. Les calculatrices de jeu d’échecs ont émergé à la fin des années 1970, mais il faudra encore une décennie avant qu’une équipe d’étudiants diplômés de l’Université Carnegie Mellon ne construise le premier ordinateur – appelé Deep Thought — pour battre un grand maître dans un match de tournoi régulier. Ce succès a été de courte durée – plus tard cette même année, 1989, Kasparov a battu Deep Thought haut la main dans les deux jeux. IBM a été suffisamment impressionné par la technologie de l’équipe C.M.U. pour amener ses chercheurs à développer une première version du successeur de Deep Blue – Deep Thought. L’équipe de Deep Blue a de nouveau perdu contre Kasparov en 1996 lors d’un tournoi à Philadelphie, mais a réussi à gagner un match sur six contre le champion du monde.

Cette victoire apparemment minime  » était très importante pour nous pour montrer que nous étions sur la bonne voie ”, explique Murray Campbell, expert en IA de Deep Blue, aujourd’hui membre éminent du personnel de recherche du groupe AI Foundations au sein de l’organisation Informatique cognitive du Centre de recherche IBM T. J. Watson. « Au moment de notre dernier match en 1997, nous avions apporté suffisamment d’améliorations au système en fonction de notre expérience pour pouvoir gagner. »Scientific American a parlé avec Campbell de la longue obsession des informaticiens pour les échecs, de la façon dont IBM a pu renverser la vapeur sur le champion d’échecs en titre et des défis qui attendent l’IA.

Comment vous êtes-vous impliqué pour la première fois dans le projet Deep Blue ?
Je faisais partie d’un groupe d’étudiants diplômés de l’Université Carnegie Mellon qu’IBM a approchés. J’avais eu un intérêt de longue date pour les échecs informatiques et j’avais même écrit un programme d’échecs en tant que premier cycle. Au C.M.U. Je travaillais sur l’intelligence artificielle plus généralement et pas exactement sur la construction d’un ordinateur d’échecs performant capable de jouer contre un champion du monde. Mais en tant que projet parallèle, un certain nombre d’entre nous ont développé la machine qui est devenue connue sous le nom de Deep Thought, qui est devenue le premier programme à vaincre un grand maître, un joueur de niveau professionnel dans un tournoi.

IBM a remarqué les succès que nous avions en construisant cette machine avec un budget restreint et a pensé qu’il serait intéressant qu’un groupe d’entre nous rejoigne IBM Research pour développer la prochaine génération de cette machine, appelée Deep Blue. Ils voulaient savoir s’il y avait quelque chose de spécial chez les meilleurs joueurs d’échecs du monde qui allait au-delà de ce dont les ordinateurs étaient capables dans un avenir prévisible. Notre sentiment était que c’était dans quelques années, bien que d’autres chercheurs pensaient que c’était encore dans des décennies.

Qu’est-ce qui fait des échecs un problème particulièrement intéressant pour un informaticien?
Des centaines de millions de personnes dans le monde jouent aux échecs. C’est connu comme un jeu qui nécessite de la stratégie, de la prévoyance, de la logique — toutes sortes de qualités qui composent l’intelligence humaine. Il est donc logique d’utiliser les échecs comme un bâton de mesure pour le développement de l’intelligence artificielle.

Quand nous regardons un jeu comme les échecs, nous disons: « Eh bien, oui, bien sûr, les ordinateurs fonctionnent bien parce que c’est un jeu bien défini – les règles, les mouvements, les objectifs. »Et c’est un problème contraint où vous connaissez toutes les informations. Pourtant, malgré toutes ces simplifications, on pourrait dire que les échecs sont un jeu extrêmement complexe, et c’est pourquoi il nous a fallu, en tant que domaine, 50 ans de développement pour enfin battre le champion du monde.

Quel était votre rôle au sein de l’équipe Deep Blue ?
J’étais l’expert en IA. L’IA était très différente en 1989 et au début des années 1990. La partie dominante à cette époque était ce que nous appelions maintenant une bonne IA à l’ancienne, ou une IA symbolique, qui reposait moins sur l’apprentissage automatique. Certes, l’apprentissage automatique était un domaine sérieux à cette époque, mais rien de tel que ce qu’il est aujourd’hui, où nous avons des ensembles de données massifs et de gros ordinateurs et des algorithmes très avancés pour parcourir les données et proposer des modèles capables de faire des choses incroyables. Quand j’ai commencé avec IBM, les méthodes d’apprentissage automatique pour les programmes de jeu étaient assez primitives et ne pouvaient pas beaucoup nous aider à construire Deep Blue. Nous avons travaillé sur des algorithmes de recherche et d’évaluation efficaces des continuations possibles, dont nous savions que Deep Blue aurait besoin pour être compétitif.

Quelles étaient les limites les plus importantes de l’IA à l’époque ?
Le matériel ne supportait pas vraiment la construction des types de grands réseaux qui se sont révélés utiles aujourd’hui pour créer des modèles de big Data. Et les données elles-mêmes n’étaient pas nécessairement là dans la mesure où nous en avions besoin à ce moment-là. Chaque fois que vous revenez en arrière et regardez les systèmes informatiques les plus populaires d’il y a 20 ou 25 ans, vous êtes choqué de voir comment vous pourriez faire quelque chose sur un système comme celui-là. Mais bien sûr, nous l’avons fait — nous ne savions pas ce qui nous manquait, je suppose, parce que nous ne l’avions jamais vécu.

En ce qui concerne les données, je ne pense pas que personne n’avait une idée claire à l’époque qu’il y avait un gros avantage. Il n’aurait pas été payant de construire un très grand ensemble de données car en partie la puissance de traitement n’aurait pas été suffisante pour l’utiliser de toute façon. Nous nous sommes donc contentés d’ensembles de données beaucoup plus petits.

Quelle a été l’utilité de votre propre expertise des échecs dans la construction de Deep Blue ?
Pas aussi utile que vous pourriez le penser. J’ai pu, dans les premiers stades, identifier les problèmes avec le système et suggérer des approches qui, selon moi, seraient en mesure de résoudre un problème sans créer une foule d’autres problèmes. C’était probablement assez bon pour nous amener à un certain point. Finalement, cependant, si vous allez jouer à des compétitions, il y a une foule de connaissances vraiment spécifiques au jeu que vous devez avoir. Lorsque nous nous sommes rapprochés du point où nous allions jouer contre un champion du monde, nous avons fait venir des grands maîtres — Joel Benjamin, en particulier — pour nous aider.

Comment les grands maîtres ont-ils contribué à élever le jeu de Deep Blue ?
Il y avait deux parties à la façon dont ils ont aidé. L’un, en particulier, était d’aider à l’ouverture de la bibliothèque, que chaque programme d’échecs utilise afin de gagner du temps et de s’assurer qu’il se trouve dans des positions raisonnables. Les humains étudient les ouvertures d’échecs depuis des siècles et ont développé leur propre favori. Les grands maîtres nous ont aidés à choisir un groupe de ceux à programmer en Bleu profond.

Ils étaient aussi, on pourrait dire, des sparring-partners pour Deep Blue. Ils joueraient contre l’ordinateur et tenteraient de repérer les faiblesses du système. Et ensuite, nous nous asseyions avec eux et avec le reste de l’équipe de Deep Blue et essayions d’articuler ce qu’était réellement cette faiblesse et s’il y avait un moyen de la résoudre. Parfois, compte tenu des limitations que nous avions — nous programmions une partie des instructions de l’ordinateur directement sur un morceau de matériel appelé puce d’accélérateur d’échecs plutôt que d’écrire un logiciel —, il y avait des problèmes que nous ne pouvions pas résoudre facilement. Mais il y avait souvent un moyen d’améliorer sa capacité à faire face à un problème que nous avions identifié.

Comment Deep Blue a-t-il décidé des mouvements à effectuer?
Le bleu profond était un hybride. Il avait des processeurs de supercalculateurs à usage général combinés à ces puces d’accélérateur d’échecs. Nous avions un logiciel qui fonctionnait sur le supercalculateur pour effectuer une partie d’un calcul d’échecs, puis transférer les parties les plus complexes d’un mouvement à l’accélérateur, qui calculait ensuite. Le supercalculateur prendrait ces valeurs et déciderait éventuellement de la route à suivre.

Comment Deep Blue a-t-il progressé de 1996 à 1997 pour battre Kasparov ?
Nous avons fait quelques choses. Nous avons plus ou moins doublé la vitesse du système en créant une nouvelle génération de matériel. Et puis nous avons augmenté la connaissance des échecs du système en ajoutant des fonctionnalités à la puce d’échecs qui lui ont permis de reconnaître différentes positions et de mieux connaître les concepts d’échecs. Ces puces pourraient alors rechercher dans un arbre de possibilités pour déterminer le meilleur mouvement dans une position. Une partie de l’amélioration entre ‘96 et ‘97 est que nous avons détecté plus de motifs dans une position d’échecs et que nous pourrions y mettre des valeurs et donc évaluer les positions d’échecs plus précisément. La version de 1997 de Deep Blue recherchait entre 100 et 200 millions de positions par seconde, selon le type de position. Le système pourrait rechercher à une profondeur comprise entre six et huit paires de mouvements — un blanc, un noir — jusqu’à un maximum de 20 paires ou même plus dans certaines situations. Pourtant, alors que nous étions convaincus que le Deep Blue de 1997 était bien meilleur que la version de 1996, dans mon esprit, l’issue la plus probable du match était un match nul. Même en entrant dans le dernier match du match, je m’attendais à un match nul et à une probable revanche.

Pourquoi IBM n’a-t-il pas accédé à la demande de Kasparov pour un match revanche après la compétition de 1997 ?
Nous avons estimé que nous avions atteint notre objectif, démontrer qu’un ordinateur pouvait vaincre le champion du monde d’échecs dans un match et qu’il était temps de passer à d’autres domaines de recherche importants.

Comment l’IA a-t-elle changé au cours des deux décennies qui ont suivi ce match ?
Bien sûr, les machines ont amélioré la vitesse de traitement et la mémoire, etc. Les gens ont également commencé à collecter — dans le cadre de leur activité — beaucoup plus de données qui ont fourni du fourrage aux algorithmes d’apprentissage automatique de l’époque. Finalement, nous avons commencé à réaliser que la combinaison de toutes ces choses pourrait produire des résultats remarquables. Le système IBM Watson qui a joué à Jeopardy! utilisé un système basé sur l’apprentissage automatique qui prenait beaucoup de données qui existaient dans le monde – des choses comme Wikipedia, etc. – et utilisé ces données pour apprendre à répondre à des questions sur le monde réel. Depuis lors, nous avons appris à effectuer certains types de tâches perceptives telles que la reconnaissance vocale et la vision industrielle. Cela a conduit Watson à effectuer davantage de tâches liées à l’entreprise, telles que l’analyse d’images radiologiques et le partage de ces informations avec les médecins.

Comment votre expérience de travail sur Deep Blue a-t-elle influencé votre travail sur l’IA à l’avenir ?
Une chose en particulier que nous avons apprise est qu’il y a plus d’une façon de regarder un problème complexe. Par exemple, aux échecs, il y a la voie humaine, qui est très basée sur la reconnaissance de formes et l’intuition, et puis il y a la voie machine, qui est très intensive en recherche et examine des millions ou des milliards de possibilités. Souvent, ces approches sont complémentaires. C’est certainement vrai aux échecs, mais aussi dans de nombreux problèmes du monde réel – que les ordinateurs et les humains ensemble sont meilleurs que l’un ou l’autre seul. Nous ne voudrions pas, par exemple, que les ordinateurs prennent eux-mêmes en charge le diagnostic et le traitement des patients, car il y a beaucoup d’intangibles dans le diagnostic d’un patient qui sont difficiles à saisir dans les données. Mais en termes de recommandations sur les options à considérer — peut—être celles qui proviennent de documents techniques très récents ou d’essais cliniques dont le médecin n’est peut-être pas au courant – un système comme celui-ci peut être très précieux.

Une partie importante de ce que nous faisons en ce moment consiste à prendre des systèmes basés sur des réseaux de neurones artificiels très avancés qui ont tendance à être très boîte noire – ils ne sont pas particulièrement doués pour expliquer pourquoi ils recommandent ce qu’ils recommandent — et leur donner la capacité de s’expliquer. Comment pouvez-vous vraiment faire confiance à une recommandation sortant du système si elle ne peut pas l’expliquer? Ces systèmes de réseaux neuronaux à boîte noire sont extrêmement complexes, avec des millions de paramètres. Une partie du dépassement peut aller dans le sens de la formation d’un système en lui donnant des exemples de bonnes explications. Cela est particulièrement évident dans le domaine de la santé lorsqu’un ordinateur établit un diagnostic ou recommande un traitement. S’il y a une explication raisonnable, alors nous pourrions probablement lui donner le poids qu’il mérite pour aider un médecin à prendre une décision finale.