Articles

20 Years after Deep Blue: How AI Has Advanced Since Conquering Chess

Vor zwanzig Jahren verblüffte IBMs Deep Blue Computer die Welt, als er als erste Maschine einen amtierenden Schachweltmeister in einem Match mit sechs Spielen besiegte. Der Erfolg des Supercomputers gegen einen ungläubigen Garry Kasparov löste Kontroversen darüber aus, wie es einer Maschine gelungen war, einen Großmeister zu überlisten, und erregte Vorwürfe — von Kasparov und anderen —, dass das Unternehmen seinen Weg zum Sieg betrogen hatte. Die Realität dessen, was sich in den Monaten und Jahren vor diesem schicksalhaften Match im Mai 1997 abspielte, war jedoch eher evolutionär als revolutionär — ein Rocky Balboa–ähnlicher Aufstieg voller intellektueller Sparring-Matches, mühsamer Fortschritte und einer Niederlage in Philadelphia, die letztendlich die Bühne für einen triumphalen Rückkampf bereitete.Informatiker hatten Schach jahrzehntelang als Meterstab für künstliche Intelligenz angesehen. Schach-Rechner entstanden in den späten 1970er Jahren, aber es würde ein weiteres Jahrzehnt dauern, bis ein Team von Studenten der Carnegie Mellon University den ersten Computer namens Deep Thought baute, um einen Großmeister in einem regulären Turnierspiel zu schlagen. Dieser Erfolg war nur von kurzer Dauer-später im selben Jahr, 1989, Kasparov schlug Deep Thought handlich in den beiden Spielen. IBM war beeindruckt genug von der Technologie des C.M.U. —Teams, um seine Forscher an Bord zu bringen, um eine frühe Version von Deep Blue – Deep Thoughts Nachfolger – zu entwickeln. Das Deep Blue-Team verlor 1996 bei einem Turnier in Philadelphia erneut gegen Kasparov, konnte jedoch ein von sechs Spielen gegen den Weltmeister gewinnen.Dieser scheinbar kleine Sieg „war für uns sehr wichtig, um zu zeigen, dass wir auf dem richtigen Weg sind“, sagt Deep Blue-KI-Experte Murray Campbell, heute Distinguished Research Staff Member in der AI Foundations Group innerhalb der Cognitive Computing-Organisation des IBM T. J. Watson Research Center. „Bis zu unserem letzten Spiel im Jahr 1997 hatten wir aufgrund unserer Erfahrung genug Verbesserungen am System vorgenommen, um gewinnen zu können.“ Scientific American sprach mit Campbell über die lange Obsession der Informatiker mit Schach, wie IBM den Spieß umdrehen konnte und welche Herausforderungen für die KI vor uns liegen.

Wie bist du zum Deep Blue Projekt gekommen?
Ich war Teil einer Gruppe von Studenten an der Carnegie Mellon University, die IBM näherte. Ich hatte ein langes Interesse an Computerschach und hatte sogar ein Schachprogramm als Student geschrieben. Bei C.M.U. Ich habe allgemein an künstlicher Intelligenz gearbeitet und nicht gerade daran, einen Hochleistungs-Schachcomputer zu bauen, der gegen einen Weltmeister spielen kann. Aber als Nebenprojekt haben einige von uns die Maschine entwickelt, die als Deep Thought bekannt wurde und das erste Programm war, das einen Großmeister, einen professionellen Spieler, in einem Turnier besiegte.IBM bemerkte die Erfolge, die wir beim Bau dieser Maschine mit einem knappen Budget hatten, und dachte, es wäre interessant, eine Gruppe von uns bei IBM Research zu haben, um die nächste Generation dieser Maschine namens Deep Blue zu entwickeln. Sie wollten wissen, ob es etwas Besonderes an den besten Schachspielern der Welt gibt, das auf absehbare Zeit über das hinausgeht, wozu Computer in der Lage sind. Unser Gefühl war, dass es innerhalb weniger Jahre fertig war, obwohl andere Forscher dachten, es sei noch Jahrzehnte entfernt.

Was macht Schach für einen Informatiker besonders interessant?
Hunderte Millionen Menschen auf der ganzen Welt spielen Schach. Es ist bekannt als ein Spiel, das Strategie, Weitsicht, Logik erfordert — alle möglichen Qualitäten, die die menschliche Intelligenz ausmachen. Es ist also sinnvoll, Schach als Messstab für die Entwicklung künstlicher Intelligenz zu verwenden.

Wenn wir uns ein Spiel wie Schach ansehen, sagen wir: „Nun, ja, natürlich tun Computer gut, weil es ein genau definiertes Spiel ist – die Regeln, die Züge, die Ziele.“ Und es ist ein eingeschränktes Problem, bei dem Sie alle Informationen kennen. Trotz all dieser Vereinfachungen könnte man sagen, Schach ist ein enorm komplexes Spiel, und deshalb haben wir als Feld 50 Jahre Entwicklung gebraucht, um endlich den Weltmeister zu schlagen.

Was war deine besondere Rolle im Deep Blue Team?
Ich war der KI-Experte. Das war 1989 und Anfang 1990 ganz anders. Der dominierende Teil in jenen Tagen war das, was wir jetzt gute altmodische KI oder symbolische KI nannten, die weniger auf maschinellem Lernen basierte. Sicherlich war maschinelles Lernen damals ein ernstes Feld, aber nichts Vergleichbares wie heute, wo wir riesige Datensätze und große Computer und sehr fortschrittliche Algorithmen haben, um die Daten zu durchsuchen und Modelle zu entwickeln, die einige erstaunliche Dinge tun können. Als ich mit IBM anfing, waren die Methoden des maschinellen Lernens für Spielprogramme ziemlich primitiv und konnten uns beim Aufbau von Deep Blue nicht viel helfen. Wir arbeiteten an Algorithmen zur effizienten Suche und Auswertung der möglichen Fortsetzungen, von denen wir wussten, dass Deep Blue sie benötigen würde, um im Wettbewerb bestehen zu können.

Was waren damals die größten Einschränkungen der KI?Die Hardware unterstützte nicht wirklich den Aufbau großer Netzwerke, die sich heute bei der Erstellung von Big-Data-Modellen als nützlich erwiesen haben. Und die Daten selbst waren nicht unbedingt in dem Maße vorhanden, wie wir sie zu diesem Zeitpunkt brauchten. Jedes Mal, wenn Sie zurückgehen und sich die beliebtesten Computersysteme von vor 20 oder 25 Jahren ansehen, sind Sie schockiert, wie Sie mit einem solchen System etwas erreichen können. Aber natürlich haben wir es getan — wir wussten nicht, was uns fehlte, weil wir es noch nie erlebt hatten.

Was die Daten angeht, glaube ich nicht, dass irgendjemand damals eine klare Vorstellung davon hatte, dass es einen großen Vorteil gab. Es hätte sich nicht gelohnt, einen wirklich großen Datensatz zu erstellen, da zum Teil die Rechenleistung nicht ausgereicht hätte, um ihn trotzdem zu verwenden. Wir haben uns also mit viel kleineren Datensätzen begnügt.

Wie nützlich war Ihre eigene Schachexpertise beim Aufbau von Deep Blue?
Nicht so nützlich, wie Sie vielleicht denken. Ich war in der Lage, in den frühen Stadien Probleme mit dem System zu identifizieren und Ansätze vorzuschlagen, die meiner Meinung nach in der Lage wären, ein Problem zu beheben, ohne eine Vielzahl anderer Probleme zu verursachen. Das war wahrscheinlich gut genug, um uns an einen bestimmten Punkt zu bringen. Wenn Sie jedoch Wettbewerbe spielen möchten, müssen Sie über eine Vielzahl von wirklich spielspezifischen Kenntnissen verfügen. Als wir uns dem Punkt näherten, an dem wir tatsächlich gegen einen Weltmeister spielen würden, holten wir uns Großmeister — insbesondere Joel Benjamin —, um uns zu helfen.

Wie haben die Großmeister dazu beigetragen, das Spiel von Deep Blue zu verbessern?
Es gab zwei Teile, wie sie geholfen haben. Eine bestand insbesondere darin, bei der Eröffnungsbibliothek zu helfen, die jedes Schachprogramm verwendet, um Zeit zu sparen und sicherzustellen, dass es in vernünftige Positionen gelangt. Die Menschen haben seit Jahrhunderten Schacheröffnungen studiert und ihren eigenen Favoriten entwickelt . Die Großmeister halfen uns, ein paar davon auszuwählen, um sie in Deep Blue zu programmieren.

Sie waren auch, könnte man sagen, Sparringspartner für Deep Blue. Sie würden gegen den Computer spielen und versuchen, Schwachstellen des Systems zu lokalisieren. Und dann saßen wir mit ihnen und dem Rest des Deep Blue-Teams zusammen und versuchten zu artikulieren, was diese Schwäche tatsächlich war und ob es einen Weg gab, sie anzugehen. Manchmal gab es angesichts der Einschränkungen, die wir hatten — wir programmierten einen Teil der Anweisungen des Computers direkt auf eine Hardware, die als Schachbeschleuniger—Chip bezeichnet wurde, anstatt Software zu schreiben – einige Probleme, die wir nicht leicht beheben konnten. Aber oft gab es eine Möglichkeit, seine Fähigkeit zu verbessern, mit einem Problem umzugehen, das wir identifiziert hatten.

Wie hat Deep Blue entschieden, welche Züge er machen sollte?
Deep Blue war ein Hybrid. Es hatte Allzweck-Supercomputerprozessoren in Kombination mit diesen Schachbeschleunigerchips. Wir hatten Software, die auf dem Supercomputer lief, um einen Teil einer Schachberechnung durchzuführen und dann die komplexeren Teile einer Bewegung an den Beschleuniger zu übergeben, der dann berechnen würde . Der Supercomputer würde diese Werte nehmen und schließlich entscheiden, welchen Weg er nehmen sollte.

Wie kam Deep Blue von 1996 auf 1997, um Kasparov zu schlagen?
Wir haben ein paar Sachen gemacht. Wir haben die Geschwindigkeit des Systems mehr oder weniger verdoppelt, indem wir eine neue Hardware-Generation entwickelt haben. Und dann erweiterten wir das Schachwissen des Systems, indem wir dem Schachchip Funktionen hinzufügten, die es ihm ermöglichten, verschiedene Positionen zu erkennen und ihm Schachkonzepte bewusster zu machen. Diese Chips könnten dann einen Baum von Möglichkeiten durchsuchen, um den besten Zug in einer Position herauszufinden. Ein Teil der Verbesserung zwischen ‘96 und ‘97 besteht darin, dass wir mehr Muster in einer Schachposition erkannt und Werte darauf setzen und somit Schachpositionen genauer bewerten können. Die Version von Deep Blue aus dem Jahr 1997 suchte je nach Art der Position zwischen 100 und 200 Millionen Positionen pro Sekunde. Das System könnte bis zu einer Tiefe von sechs bis acht Zugpaaren — einem weißen, einem schwarzen — bis zu maximal 20 oder in einigen Situationen sogar mehr Paaren suchen. Obwohl wir zuversichtlich waren, dass das Deep Blue von 1997 viel besser war als die Version von 1996, war das wahrscheinlichste Ergebnis des Spiels in meinen Augen ein Unentschieden. Sogar im letzten Spiel des Spiels erwartete ich ein Unentschieden und einen wahrscheinlichen Rückkampf.

Warum hat IBM Kasparovs Bitte um einen Rückkampf nach dem Wettbewerb von 1997 nicht stattgegeben?
Wir hatten das Gefühl, dass wir unser Ziel erreicht hatten, zu zeigen, dass ein Computer den Schachweltmeister in einem Match besiegen kann und dass es Zeit war, zu anderen wichtigen Forschungsbereichen überzugehen.

Wie hat sich die KI in den zwei Jahrzehnten seit diesem Match verändert?
Natürlich haben Maschinen in der Verarbeitungsgeschwindigkeit und Speicher verbessert und so weiter. Die Leute fingen auch an, — nur als Teil ihres Geschäfts — viel mehr Daten zu sammeln, die Futter für die maschinellen Lernalgorithmen des Tages lieferten. Schließlich wurde uns klar, dass die Kombination all dieser Dinge zu bemerkenswerten Ergebnissen führen kann. Das IBM Watson-System, das Jeopardy gespielt hat! verwendete ein maschinelles lernbasiertes System, das eine Menge Daten aufnahm, die in der Welt existierten — Dinge wie Wikipedia und so weiter — und diese Daten verwendete, um zu lernen, wie man Fragen über die reale Welt beantwortet. Seitdem haben wir gelernt, wie man bestimmte Arten von Wahrnehmungsaufgaben wie Spracherkennung und maschinelles Sehen erledigt. Dies hat dazu geführt, dass Watson mehr geschäftsbezogene Aufgaben ausführt, z. B. die Analyse radiologischer Bilder und den Austausch dieser Informationen mit Ärzten.

Wie haben Ihre Erfahrungen mit Deep Blue dazu beigetragen, Ihre Arbeit an KI in Zukunft zu beeinflussen?
Eine Sache, die wir besonders gelernt haben, ist, dass es mehr als einen Weg gibt, ein komplexes Problem zu betrachten. Zum Beispiel gibt es im Schach den menschlichen Weg, der sehr auf Mustererkennung und Intuition basiert, und dann gibt es den maschinellen Weg, der sehr suchintensiv ist und Millionen oder Milliarden von Möglichkeiten durchschaut. Oft ergänzen sich diese Ansätze. Das ist definitiv wahr im Schach, aber auch in vielen realen Problemen — dass Computer und Menschen zusammen besser sind als einer allein. Wir würden zum Beispiel nicht wollen, dass Computer die Diagnose und Behandlung von Patienten selbst übernehmen, weil es viele immaterielle Werte bei der Diagnose eines Patienten gibt, die schwer in den Daten zu erfassen sind. Aber in Bezug auf Empfehlungen zu Optionen, die in Betracht gezogen werden sollten — vielleicht solche, die aus sehr aktuellen technischen Papieren oder klinischen Studien stammen, die dem Arzt vielleicht nicht bekannt sind — kann ein solches System sehr wertvoll sein.Ein wichtiger Teil dessen, was wir gerade tun, ist, sehr fortschrittliche künstliche neuronale netzwerkbasierte Systeme zu nehmen, die dazu neigen, sehr Black Box zu sein – sie sind nicht besonders gut darin zu erklären, warum sie empfehlen, was sie empfehlen — und ihnen die Fähigkeit zu geben, sich selbst zu erklären. Wie kann man einer Empfehlung, die aus dem System kommt, wirklich vertrauen, wenn Sie sie nicht erklären kann? Diese neuronalen Blackbox-Netzwerksysteme sind enorm komplex und enthalten Millionen von Parametern. Ein Teil der Überwindung kann darin bestehen, ein System zu trainieren, indem ihm Beispiele für gute Erklärungen gegeben werden. Dies wird besonders im Gesundheitswesen deutlich, wenn ein Computer eine Diagnose stellt oder eine Behandlung empfiehlt. Wenn es eine vernünftige Erklärung gibt, könnten wir ihr wahrscheinlich angemessener das Gewicht geben, das sie verdient, um einem Arzt zu helfen, eine endgültige Entscheidung zu treffen.