Articles

20 Años después de Deep Blue: Cómo Ha Avanzado la IA Desde la Conquista del Ajedrez

Hace veinte años, la computadora Deep Blue de IBM sorprendió al mundo al convertirse en la primera máquina en vencer a un vigente campeón mundial de ajedrez en un partido de seis partidas. El éxito de la supercomputadora contra un incrédulo Garry Kasparov provocó controversia sobre cómo una máquina había logrado superar a un gran maestro, e incitó acusaciones—por Kasparov y otros—de que la compañía había engañado su camino a la victoria. Sin embargo, la realidad de lo que ocurrió en los meses y años previos a ese fatídico combate en mayo de 1997 fue en realidad más evolutiva que revolucionaria: un ascenso rocoso como el de Balboa lleno de luchas intelectuales, progreso minucioso y una derrota en Filadelfia que finalmente preparó el escenario para una revancha triunfal.

Los científicos de la computación habían visto el ajedrez durante décadas como un palo de medidor para la inteligencia artificial. Las calculadoras de ajedrez surgieron a finales de la década de 1970, pero pasaría otra década antes de que un equipo de estudiantes graduados de la Universidad Carnegie Mellon construyera la primera computadora, llamada Pensamiento Profundo, para vencer a un gran maestro en un juego de torneo regular. Este éxito fue de corta duración, más tarde ese mismo año, 1989, Kasparov venció a Deep Thought en los dos juegos. IBM quedó lo suficientemente impresionado con la tecnología del equipo de C. M. U. como para traer a sus investigadores a bordo para desarrollar una versión temprana del sucesor de Deep Blue—Deep Thought. El equipo Deep Blue perdió de nuevo ante Kasparov en 1996 en un torneo en Filadelfia, pero logró ganar un juego de seis contra el campeón mundial.

Esa aparentemente pequeña victoria «fue muy importante para nosotros para demostrar que estábamos en el camino correcto», dice el experto en IA de Deep Blue Murray Campbell, ahora un distinguido miembro del personal de investigación del grupo AI Foundations dentro de la organización de Computación Cognitiva del IBM T. J. Watson Research Center. «Para el momento de nuestro partido final en 1997, habíamos hecho suficientes mejoras en el sistema basadas en nuestra experiencia que pudimos ganar.»Scientific American habló con Campbell sobre la larga obsesión de los científicos de la computación con el ajedrez, cómo IBM fue capaz de darle la vuelta a la mesa al campeón de ajedrez reinante y los desafíos que le esperan a la IA.

¿Cómo se involucró por primera vez en el proyecto Deep Blue?Formé parte de un grupo de estudiantes de posgrado de la Universidad Carnegie Mellon al que IBM se acercó. Había tenido un largo interés en el ajedrez de computadora e incluso había escrito un programa de ajedrez como estudiante. En C. M. U. Estaba trabajando en inteligencia artificial de manera más general y no exactamente en la construcción de una computadora de ajedrez de alto rendimiento que pudiera jugar contra un campeón del mundo. Pero como proyecto paralelo, varios de nosotros desarrollamos la máquina que se conoció como Pensamiento Profundo, que se convirtió en el primer programa en derrotar a un gran maestro, un jugador de nivel profesional en un torneo.

IBM se dio cuenta de los éxitos que estábamos teniendo en la construcción de esta máquina con un presupuesto reducido y pensó que sería interesante que un grupo de nosotros se uniera a IBM Research para desarrollar la próxima generación de esta máquina, llamada Deep Blue. Querían saber si había algo especial en los mejores jugadores de ajedrez del mundo que estaba más allá de lo que las computadoras eran capaces de hacer en el futuro previsible. Nuestra sensación era que estaba a pocos años de haberse hecho, aunque otros investigadores pensaron que todavía estaba a décadas de distancia.

¿Qué es el ajedrez que hace un problema especialmente interesante para un científico de la computación? Cientos de millones de personas en todo el mundo juegan al ajedrez. Es conocido como un juego que requiere estrategia, previsión, lógica, todo tipo de cualidades que conforman la inteligencia humana. Así que tiene sentido usar el ajedrez como una vara de medir para el desarrollo de la inteligencia artificial.

Cuando miramos un juego como el ajedrez, decimos: «Bueno, sí, por supuesto, las computadoras lo hacen bien porque es un juego bien definido: las reglas, los movimientos, los goles.»Y es un problema limitado en el que se conoce toda la información. Aún así, a pesar de todas esas simplificaciones, se podría decir que el ajedrez es un juego enormemente complejo, y es por eso que nos tomó, como campo, 50 años de desarrollo para finalmente vencer al campeón del mundo.

¿Cuál fue tu papel específicamente en el equipo de Deep Blue?Yo era el experto en IA. La IA era bastante diferente en 1989 y principios de 1990. La parte dominante en aquellos días era lo que ahora llamábamos la IA a la antigua, o IA simbólica, que se basaba menos en el aprendizaje automático. Ciertamente, el aprendizaje automático era un campo serio en aquellos días, pero nada como lo que es hoy, donde tenemos conjuntos de datos masivos y computadoras grandes y algoritmos muy avanzados para navegar a través de los datos y crear modelos que pueden hacer cosas increíbles. Cuando empecé con IBM, los métodos de aprendizaje automático para programas de juego eran bastante primitivos y no podían ayudarnos mucho a construir Deep Blue. Trabajamos en algoritmos para una búsqueda y evaluación eficientes de las posibles continuaciones, que sabíamos que Deep Blue necesitaría para competir.

¿Cuáles eran las limitaciones más significativas de la IA en ese entonces?
El hardware realmente no soportaba la construcción de los tipos de redes grandes que han demostrado ser útiles hoy en día en la fabricación de modelos de big data. Y los datos en sí no estaban necesariamente allí en la medida en que los necesitábamos en ese momento. Cada vez que retrocedes y miras los sistemas informáticos más populares de hace 20 o 25 años, te sorprendes de cómo puedes hacer algo en un sistema como ese. Pero, por supuesto, no sabíamos lo que nos estábamos perdiendo, supongo, porque nunca lo habíamos experimentado.

En cuanto a los datos, no creo que nadie tuviera una idea clara en ese entonces de que había un gran beneficio. No habría pagado construir un conjunto de datos realmente grande porque, en parte, la potencia de procesamiento no habría sido suficiente para usarlo de todos modos. Por lo tanto, nos conformamos con conjuntos de datos mucho más pequeños.

¿Cuán útil fue su propia experiencia en ajedrez para construir Deep Blue?No es tan útil como podrías pensar. En las primeras etapas, pude identificar problemas con el sistema y sugerir enfoques que, en mi opinión, podrían solucionar un problema sin crear una serie de otros problemas. Eso probablemente fue lo suficientemente bueno para llevarnos a un cierto punto. Sin embargo, eventualmente, si vas a jugar competiciones, hay una gran cantidad de conocimientos realmente específicos del juego que necesitas tener. Cuando nos acercamos al punto en el que realmente estaríamos jugando contra un campeón del mundo, trajimos a grandes maestros, Joel Benjamin, en particular, para que nos ayudaran.

¿Cómo ayudaron los grandes maestros a mejorar el juego de Deep Blue?Hubo dos partes en cómo ayudaron. Una, en particular, era ayudar con la biblioteca de apertura, que cada programa de ajedrez usa para ahorrar tiempo y asegurarse de que se encuentre en posiciones razonables. Los humanos han estado estudiando aperturas de ajedrez durante siglos y han desarrollado su propio favorito . Los grandes maestros nos ayudaron a elegir un grupo de ellos para programar en Deep Blue.

También fueron, se podría decir, compañeros de entrenamiento para Deep Blue. Jugaban contra la computadora e intentaban identificar las debilidades del sistema. Y luego nos sentábamos con ellos y con el resto del equipo de Deep Blue y tratábamos de articular cuál era esa debilidad en realidad y si había una manera de abordarla. A veces, dadas las limitaciones que teníamos—estábamos programando parte de las instrucciones de la computadora directamente en una pieza de hardware llamada chip acelerador de ajedrez en lugar de escribir software—había algunos problemas que no podíamos solucionar fácilmente. Pero a menudo había alguna forma de mejorar su capacidad para lidiar con un problema que habíamos identificado.

¿Cómo decidió Deep Blue qué movimientos hacer?Deep Blue era un híbrido. Tenía procesadores de supercomputadoras de uso general combinados con estos chips de acelerador de ajedrez. Teníamos un software que se ejecutaba en la supercomputadora para llevar a cabo parte de un cálculo de ajedrez y luego entregar las partes más complejas de un movimiento al acelerador, que luego calculaba . La supercomputadora tomaría esos valores y eventualmente decidiría qué ruta tomar.

¿Cómo avanzó Deep Blue de 1996 a 1997 para vencer a Kasparov?Hicimos un par de cosas. Más o menos duplicamos la velocidad del sistema creando una nueva generación de hardware. Y luego aumentamos el conocimiento de ajedrez del sistema agregando características al chip de ajedrez que le permitieron reconocer diferentes posiciones y lo hicieron más consciente de los conceptos de ajedrez. Esas fichas podrían entonces buscar a través de un árbol de posibilidades para averiguar el mejor movimiento en una posición. Parte de la mejora entre el 96 y el 97 es que detectamos más patrones en una posición de ajedrez y pudimos poner valores en ellos y, por lo tanto, evaluar las posiciones de ajedrez con mayor precisión. La versión de 1997 de Deep Blue buscó entre 100 y 200 millones de posiciones por segundo, dependiendo del tipo de posición. El sistema podía buscar a una profundidad de entre seis y ocho pares de movimientos, uno blanco y otro negro, hasta un máximo de 20 pares o incluso más en algunas situaciones. Aún así, aunque estábamos seguros de que el Deep Blue de 1997 era mucho mejor que la versión de 1996, en mi mente el resultado más probable del partido fue un empate. Incluso al entrar en la última partida del partido, esperaba un empate y una probable revancha.

¿Por qué IBM no concedió la solicitud de Kasparov para una revancha después de la competición de 1997?Sentimos que habíamos logrado nuestro objetivo, demostrar que una computadora podía derrotar al campeón mundial de ajedrez en un partido y que era hora de pasar a otras áreas de investigación importantes.

¿Cómo ha cambiado la IA en las dos décadas posteriores a ese partido?Por supuesto, las máquinas han mejorado en velocidad de procesamiento y memoria, etc. La gente también comenzó a recopilar, como parte de su negocio, muchos más datos que proporcionaron alimento para los algoritmos de aprendizaje automático del día. Con el tiempo empezamos a darnos cuenta de que la combinación de todas estas cosas podría producir algunos resultados notables. ¡El sistema IBM Watson que jugó Jeopardy! utilizó un sistema basado en el aprendizaje automático que tomó una gran cantidad de datos que existían en el mundo, cosas como Wikipedia, etc., y usó esos datos para aprender a responder preguntas sobre el mundo real. Desde entonces, hemos pasado a aprender a hacer ciertos tipos de tareas perceptivas, como el reconocimiento de voz y la visión artificial. Esto ha llevado a Watson a realizar más tareas relacionadas con el negocio, como analizar imágenes radiológicas y compartir esa información con los médicos.

¿Cómo influyó tu experiencia trabajando en Deep Blue en tu trabajo sobre IA en el futuro?Una cosa en particular que aprendimos es que hay más de una manera de ver un problema complejo. Por ejemplo, en el ajedrez está el modo humano, que está muy basado en el reconocimiento de patrones y en la intuición, y luego está el modo máquina, que es muy intensivo en búsquedas y mira a través de millones o miles de millones de posibilidades. A menudo, estos enfoques son complementarios. Eso es definitivamente cierto en el ajedrez, pero también en muchos problemas del mundo real: que las computadoras y los humanos juntos son mejores que cualquiera de los dos solos. No queremos, por ejemplo, que las computadoras se hagan cargo del diagnóstico y el tratamiento de los pacientes por sí solas, porque hay muchos intangibles en el diagnóstico de un paciente que son difíciles de capturar en los datos. Pero en términos de hacer recomendaciones sobre las opciones a considerar, tal vez las que provienen de documentos técnicos o ensayos clínicos muy recientes de los que tal vez el médico no tenga conocimiento, un sistema como ese puede ser muy valioso.

Una parte importante de lo que estamos haciendo en este momento es tomar sistemas basados en redes neuronales artificiales muy avanzados que tienden a ser de caja negra (no son particularmente buenos para explicar por qué recomiendan lo que recomiendan) y darles la capacidad de explicarse a sí mismos. ¿Cómo puedes confiar realmente en una recomendación que sale del sistema si no puede explicarlo? Estos sistemas de redes neuronales de caja negra son enormemente complejos, con millones de parámetros en ellos. Parte de superar eso puede ser en la línea de entrenar un sistema dándole ejemplos de buenas explicaciones. Esto es particularmente obvio en el ámbito de la atención médica cuando una computadora hace un diagnóstico o recomienda un tratamiento. Si hay una explicación razonable, entonces probablemente podríamos darle el peso que merece para ayudar a un médico a tomar una decisión final.