Articles

20 Years after Deep Blue: How AI Has Advanced Since Conquesting Chess

kaksikymmentä vuotta sitten IBM: n Deep Blue computer löi maailman ensimmäisenä koneena hallitsevan shakin maailmanmestarin kuuden pelin ottelussa. Supertietokoneen menestys epäuskoista Garry Kasparovia vastaan herätti kiistaa siitä, miten kone oli onnistunut päihittämään suurmestarin, ja lietsoi—Kasparovin ja muiden—syytöksiä siitä, että yhtiö oli huijannut tiensä voittoon. Toukokuussa 1997 käytyä kohtalokasta ottelua edeltäneiden kuukausien ja vuosien todellisuus oli kuitenkin pikemminkin evolutiivista kuin vallankumouksellista—Rocky Balboan kaltainen nousu täynnä älyllisiä sparrausotteluita, vaivalloista edistystä ja Philadelphiassa koettu tappio, joka lopulta loi pohjan voitokkaalle uusintaottelulle.

tietotekniikan tutkijat olivat vuosikymmeniä pitäneet shakkia tekoälyn mittatikkuna. Shakkia pelaavat laskijat syntyivät 1970—luvun lopulla, mutta kuluisi vielä vuosikymmen ennen kuin Carnegie Mellon—yliopiston jatko-opiskelijoiden ryhmä rakensi ensimmäisen tietokoneen-niin sanotun Deep Thought-joka päihitti suurmestarin tavallisessa turnauspelissä. Menestys jäi lyhytaikaiseksi-myöhemmin samana vuonna, 1989, Kasparov voitti Deep Thoughtin näppärästi kahdessa ottelussa. IBM oli niin vaikuttunut C. M. U.-tiimin teknologiasta, että se toi tutkijansa mukaan kehittämään varhaisen version Deep Blue—Deep Thoughtin seuraajasta. Deep Blue-joukkue hävisi jälleen Kasparoville vuonna 1996 Philadelphiassa pelatussa turnauksessa, mutta onnistui voittamaan maailmanmestaruutta vastaan yhden ottelun kuudesta.

tämä näennäisen pieni voitto ”oli meille hyvin tärkeää osoittaa, että olimme oikealla tiellä”, sanoo Deep Blue TEKOÄLYASIANTUNTIJA Murray Campbell, joka on nykyään arvostettu tutkimushenkilöstön jäsen IBM T. J. Watson Research Centerin kognitiivisen tietojenkäsittelyn organisaatioon kuuluvassa AI Foundations Groupissa. ”Vuoden 1997 viimeiseen otteluun mennessä olimme tehneet järjestelmään niin paljon parannuksia, että pystyimme voittamaan.”Scientific American puhui Campbellin kanssa tietokonetutkijoiden pitkästä pakkomielteestä shakkiin, kuinka IBM pystyi kääntämään pöydät hallitsevaa shakkimestaria vastaan ja AI: n edessä olevista haasteista.

miten pääsit ensimmäisen kerran mukaan Deep Blue-projektiin?
olin osa Carnegie Mellon-yliopiston jatko-opiskelijoiden ryhmää, jota IBM lähestyi. Olin ollut pitkään kiinnostunut tietokoneshakista ja olin jopa kirjoittanut shakkiohjelman ylioppilaaksi. CMU: Ssa. Kehittelin tekoälyä yleisemmin enkä varsinaisesti rakentanut huipputehokasta shakkitietokonetta, jolla voisi pelata maailmanmestaria vastaan. Mutta sivuprojektina monet meistä kehittivät koneen, joka tuli tunnetuksi nimellä Deep Thought, josta tuli ensimmäinen ohjelma, joka päihitti suurmestarin, ammattilaistason pelaajan turnauksessa.

IBM huomasi onnistumiset, että rakensimme tämän koneen kengänkiillotusbudjetilla, ja ajatteli, että olisi mielenkiintoista saada joukko meistä liittymään IBM Researchiin kehittämään seuraavan sukupolven tätä konetta, nimeltään Deep Blue. He halusivat tietää, oliko maailman parhaissa shakinpelaajissa jotain erityistä, joka ylitti sen, mihin tietokoneet pystyivät lähitulevaisuudessa. Käsityksemme oli, että se oli tehty muutaman vuoden kuluttua, vaikka muut tutkijat ajattelivat sen olevan vielä vuosikymmenten päässä.

mikä shakissa tekee tietojenkäsittelytieteilijälle erityisen mielenkiintoisen ongelman?
sadat miljoonat ihmiset ympäri maailmaa pelaavat shakkia. Se tunnetaan peli, joka vaatii strategiaa, ennakointi, logiikka – kaikenlaisia ominaisuuksia, jotka muodostavat ihmisen älykkyyttä. On siis järkevää käyttää shakkia mittatikkuna tekoälyn kehittämisessä.

kun katsomme shakin kaltaista peliä, sanomme: ”no, kyllä, totta kai tietokoneet pärjäävät hyvin, koska se on hyvin määritelty peli-säännöt, siirrot, tavoitteet.”Ja se on rajoitettu ongelma, jossa tiedät kaiken tiedon. Yksinkertaistuksista huolimatta shakki on valtavan monimutkainen peli.siksi meiltä vei 50 vuoden kehitystyö, ennen kuin voitimme maailmanmestarin.

mikä oli roolisi nimenomaan Deep Bluen joukkueessa?
olin TEKOÄLYASIANTUNTIJA. Tekoäly oli aivan erilainen vuonna 1989 ja 1990-luvun alussa. Hallitseva osa noihin aikoihin oli niin sanottu vanha kunnon tekoäly eli symbolinen tekoäly, joka perustui vähemmän koneoppimiseen. Koneoppiminen oli varmasti vakavasti otettava ala siihen aikaan, mutta ei mitään sellaista kuin se on tänä päivänä, jossa meillä on massiivisia tietokokonaisuuksia ja suuria tietokoneita ja hyvin kehittyneitä algoritmeja jotka suoltavat dataa ja keksivät malleja jotka voivat tehdä uskomattomia asioita. Kun aloitin IBM: llä, peliohjelmien koneoppimismenetelmät olivat melko alkeellisia, eikä niistä ollut paljon apua Deep Bluen rakentamisessa. Kehitimme algoritmeja mahdollisten jatkumojen tehokkaaseen etsimiseen ja arviointiin, joita tiesimme Deep Bluen tarvitsevan voidakseen kilpailla.

mitkä olivat tekoälyn merkittävimmät rajoitukset silloin?
laitteisto ei oikeastaan tukenut sellaisten suurten verkkojen rakentamista, jotka ovat osoittautuneet hyödyllisiksi nykyään big data-mallien tekemisessä. Itse dataa ei välttämättä ollut siinä määrin, että tarvitsimme sitä siinä vaiheessa. Joka kerta kun katsoo 20 tai 25 vuoden takaisia suosituimpia tietokonejärjestelmiä, on järkyttynyt siitä, miten tuollaisella järjestelmällä voisi tehdä mitään. Mutta totta kai me tiesimme—emme tienneet, mistä jäimme paitsi, koska emme olleet koskaan kokeneet sitä.

datan osalta en usko, että kenelläkään oli silloin selkeää käsitystä siitä, että siitä olisi suurta hyötyä. Ei olisi kannattanut rakentaa todella suurta datasarjaa, koska osin käsittelyteho ei olisi riittänyt sen käyttämiseen muutenkaan. Pärjäsimme pienemmillä datajoukoilla.

kuinka hyödyllistä oli oma shakkiosaamisesi Deep Bluen rakentamisessa?
ei niin hyödyllinen kuin voisi luulla. Pystyin alkuvaiheessa tunnistamaan järjestelmän ongelmat ja ehdottamaan lähestymistapoja, joiden uskoin pystyvän korjaamaan yhden ongelman luomatta lukuisia muita ongelmia. Se oli luultavasti tarpeeksi hyvä, jotta pääsimme tiettyyn pisteeseen. Lopulta kuitenkin, jos aiot pelata kilpailuja, siellä on paljon todella pelikohtaista tietoa sinun täytyy olla. Kun pääsimme lähemmäs sitä, että oikeasti pelaisimme maailmanmestaria vastaan, toimme suurmestarit—erityisesti Joel Benjaminin—avuksemme.

miten suurmestarit auttoivat nostamaan Deep Bluen peliä?
siinä oli kaksi osaa, miten he auttoivat. Yksi oli erityisesti auttaa avauskirjastossa, jota jokainen shakkiohjelma käyttää säästääkseen aikaa ja varmistaakseen, että se pääsee järkeviin asemiin. Ihmiset ovat tutkineet shakkiavauksia vuosisatoja ja kehittäneet oman suosikkinsa . Suurmestarit auttoivat meitä valitsemaan Deep Blueksi ohjelmoitavia.

he olivat myös, voisi sanoa, Deep Bluen sparraajia. He pelaisivat tietokonetta vastaan ja yrittäisivät paikantaa järjestelmän heikkoudet. Sitten istuimme heidän ja muun Deep Bluen tiimin kanssa-ja yritimme kertoa, mikä se heikkous oli-ja olisiko siihen mahdollista puuttua. Joskus, ottaen huomioon rajoituksemme-ohjelmoimme osan tietokoneen ohjeista suoraan shakkikiihdyttimen siruksi kutsuttuun laitteistoon sen sijaan, että kirjoittaisimme ohjelmistoja—oli joitakin ongelmia, joita emme voineet helposti korjata. Mutta usein pystyimme jollakin tavalla parantamaan sen kykyä käsitellä havaitsemaamme ongelmaa.

miten Deep Blue päätti, mitkä siirrot tehdään?
Deep Blue oli hybridi. Siinä oli Yleiskäyttöiset supertietokoneprosessorit yhdistettynä näihin shakkikiihdytinsiruihin. Meillä oli supertietokoneella toimiva ohjelmisto, joka suoritti osan shakkilaskennasta ja luovutti sitten monimutkaisemmat siirrot kiihdyttimelle ,joka sitten laskisi. Supertietokone ottaisi nämä arvot ja päättäisi lopulta, mitä reittiä käyttää.

miten Deep Blue eteni vuosina 1996-1997 voittaakseen Kasparovin?
teimme pari asiaa. Me enemmän tai vähemmän kaksinkertaistimme järjestelmän nopeuden luomalla uuden sukupolven laitteiston. Ja sitten lisäsimme järjestelmän shakkitietämystä lisäämällä shakkipiiriin ominaisuuksia, joiden avulla se pystyi tunnistamaan eri asentoja ja teki siitä tietoisemman shakkikäsitteistä. Nuo sirut voisivat sitten etsiä puun läpi mahdollisuuksia selvittää paras liikkua asennossa. Osa parannusta vuosien 1996 ja 1997 välillä on se, että havaitsimme shakkiasennossa enemmän kuvioita ja pystyimme asettamaan niille arvoja ja siten arvioimaan shakkiasennot tarkemmin. Deep Bluen vuoden 1997 versiossa etsittiin 100-200 miljoonaa asentoa sekunnissa riippuen asennon tyypistä. Järjestelmä voisi etsiä syvyydeltään kuudesta kahdeksaan paria siirtoja – yksi valkoinen, yksi musta-enintään 20 tai jopa enemmän paria joissakin tilanteissa. Vaikka olimme varmoja, että vuoden 1997 Deep Blue oli paljon parempi kuin vuoden 1996 versio, mielestäni ottelun todennäköisin lopputulos oli tasapeli. Jo ottelun viimeiseen otteluun lähdettäessä odotin tasapeliä ja todennäköistä uusintaottelua.

miksi IBM ei suostunut Kasparovin pyyntöön uusintaottelusta vuoden 1997 kilpailun jälkeen?
meistä tuntui, että olimme saavuttaneet tavoitteemme, osoittaa, että tietokone voi voittaa shakin maailmanmestarin ottelussa ja että oli aika siirtyä muille tärkeille tutkimusalueille.

miten tekoäly on muuttunut kahden vuosikymmenen aikana tuon ottelun jälkeen?
Toki koneet ovat parantaneet prosessointinopeutta ja muistia ja niin edelleen. Ihmiset alkoivat myös kerätä-aivan osana liiketoimintaansa-paljon enemmän tietoa, joka tarjosi rehua aikansa koneoppimisalgoritmeille. Lopulta aloimme tajuta, että näiden asioiden yhdistäminen voisi tuottaa huomattavia tuloksia. IBM Watson-järjestelmä, joka pelasi Jeopardya! käytti koneoppimiseen perustuvaa järjestelmää, joka otti paljon maailmassa ollutta dataa—asioita, kuten Wikipediaa ja niin edelleen—ja käytti tätä dataa oppiakseen vastaamaan reaalimaailmaa koskeviin kysymyksiin. Sen jälkeen olemme siirtyneet opettelemaan tietynlaisia havaintotehtäviä, kuten puheentunnistusta ja konenäköä. Tämä on johtanut siihen, että Watson on tehnyt enemmän liiketoimintaan liittyviä tehtäviä, kuten analysoinut radiologisia kuvia ja jakanut näitä tietoja lääkäreille.

miten kokemuksesi Deep Bluen parissa työskentelystä auttoi vaikuttamaan työhösi tekoälyn eteenpäin viemisessä?
Yksi asia erityisesti opimme on, että on olemassa enemmän kuin yksi tapa tarkastella monimutkaista ongelmaa. Esimerkiksi shakissa on ihmisen tapa, joka on hyvin hahmontunnistukseen ja intuitioon perustuva, ja sitten on koneen tapa, joka on hyvin hakuintensiivinen ja käy läpi miljoonia tai miljardeja mahdollisuuksia. Usein nämä lähestymistavat täydentävät toisiaan. Se on varmasti totta shakissa, mutta myös monissa reaalimaailman ongelmissa-että tietokoneet ja ihmiset yhdessä ovat parempia kuin kumpikaan yksin. Emme haluaisi, että esimerkiksi tietokoneet ottaisivat potilaiden diagnosoinnin ja hoidon omakseen, koska potilaan diagnosoinnissa on paljon aineettomia tekijöitä, joita on vaikea taltioida dataan. Mutta mitä tehdä suosituksia vaihtoehtoja harkita-ehkä ne, jotka ovat hyvin viime teknisiä papereita tai kliinisiä tutkimuksia, että ehkä lääkäri ei ole tietoinen—järjestelmä, joka voi olla hyvin arvokas.

tärkeä osa sitä, mitä teemme juuri nyt, on ottaa hyvin kehittyneitä keinotekoisia neuroverkkopohjaisia järjestelmiä, jotka ovat yleensä hyvin mustia laatikoita–he eivät ole erityisen hyviä selittämään miksi he suosittelevat mitä he suosittelevat—ja antamaan heille kyvyn selittää itseään. Miten voit luottaa suositukseen, joka tulee ulos järjestelmästä, jos se ei osaa selittää sitä? Nämä mustan laatikon neuroverkkojärjestelmät ovat valtavan monimutkaisia ja niissä on miljoonia parametreja. Sen voittamiseen voi kuulua jonkin järjestelmän valmentaminen antamalla sille esimerkkejä hyvistä selityksistä. Tämä on erityisen selvää terveydenhuollon tilassa, kun tietokone tekee diagnoosin tai suosittelee hoitoa. Jos siihen on järkevä selitys, voisimme ehkä sopivammin antaa sille sen painoarvon, jonka se ansaitsee, jotta lääkäri voisi tehdä lopullisen päätöksen.