Deepmind-yhtiön ohjelma Muzero pääsee lähes tyhjästä pitkälle. Sovelluksia on ensiksi luvassa verkon videoiden pakkaamisessa.

Tekoälyjä kehittävistä yhtiöistä Deepmind on koko ajan aallon harjalla.

Joulun kynnyksellä tiedelehti Nature julkaisi artikkelin, jossa DeepMindin tutkijat kertovat, kuinka sen uusin oppiva tekoäly Muzero on taas lähellä tekoälyn huippua.

Muzeroa on edeltänyt joukko Deepmindin eri ohjelmia, kuten Alphago, Alphazero ja Alphastar. Ne kohosivat 2010-luvulla maailman kärkeen eri peleissä.

Länsimaissa suosittu lautapeli shakki ja Korean niemimaalla suosittu ja shakkia vaativampi lautapeli go jäivät Alpha-ohjelmien jyrän alle. Samoin kävi japanilaisella lautapelille shogille. Alpha on niissä paras.

Joissakin videopeleissä tekoäly on päässyt jo parhaimpien pelaajien rinnalle.

Deepmindin tekoälyjen tie oli aiemmin hyvin pedattu. Niille oli sentään opetettu pelin perusteita, ainakin säännöt. Muzero poikkeaa linjasta. Se ei tarvitse edes perustavia sääntöjä.

Muzero seurasi maailmalla pelattuja pelejä ja päätteli ihan itse, mitkä ovat pelin säännöt. Sitten tutkijat peluuttivat sillä miljoonia harjoituspelejä omia ohjelmiaan vastaan.

Lopputulos: Muzero pelasi lautapelejä vielä paremmin kuin edeltäjänsä, esimerkiksi Alphazero.

Tekoälyn tutkijat uskovat, että Muzero itsenäiselle taidolle voi löytyä sovelluksia arkielämästä. Tutkijat etsivät niitä. Yksi on jo ehdolla.

Muzero tiivistää You Tuben videoiden pakkaamista. Juuri You Tuben siksi, että hakujätti Google omistaa sekä Deepmindin että You Tuben.

Tiedostojen pakkaus säästää videoiden jakelijan kuluja. Katsoja näkisi tämän edistysaskeleen ehkä siinä, että videon saa haettua entistä nopeammin.

”Internetin datansiirrosta suurin osa on nykyään videoita. Jos pystyt pakkaamaan niitä tehokkaasti, saat aikaan valtavia säästöjä”, kuvailee MuZeron tehtävää Deepmindin johtava tutkija David Silver BBC:lle.

Tutkija Silver uskoo, että Muzero auttaa ainakin robotiikassa ja tosielämän ympäristöissä, joissa on mutkikkuutta. Sellaisissa, joissa kaikesta ympärillä ei tarkalleen tiedetä.

David Silver­

”Ensi kertaa kertaa meillä on ohjelma tai järjestelmä, joka rakentaa itse käsityksensä siitä, miten maailma toimii. Se käyttää tätä ymmärrystä suunnitteluun”, kuvailee Silver Muzeron taitoja.

”Tekoäly voi aloittaa tyhjästä. Se löytää maailmasta sääntöjä kokeilun ja virheiden avulla ja suunnittelee sen avulla”, sanoo Silver Wired-lehdessä.

Tekoälyn päättely syntyy tietokoneen verkoissa, jotka muistuttavat karkeasti ihmisen aivoja. Niitä sanotaan syväoppiviksi hermoverkoiksi.

Verkkoja on viritetty tekoälyissä eri kerroksiin. Kerrokset ovat usein niin mutkikkaita, että edes ohjelman laatineet eivät osaa ennustaa, kuinka hyvin tekoäly toimii ja mihin se pystyy. Vasta kokeet näyttävät sen voiman.

”Neuroverkko päättelee saamansa palautteen avulla, kuinka toteuttaa se strategia, jossa se voittaa”, sanoo Silver Wired-lehdessä.

Hän vertaa ohjelman ponnisteluja ihmisen elämään.

”Tosimaailma ja tosielämä ovat sotkuisia ja mutkikkaita. Kukaan ei ole tehnyt meille sääntökirjaa siitä, miten maailma toimii”, Silver sanoo.

”Silti me pystymme laatimaan suunnitelmia siitä, mitä teemme elämässä seuraavaksi.”

Muzeron tekoälyn perustava idea on yksinkertainen.

Ohjelma laitetaan saavuttamaan päämäärä. Siihen pyrkiessään se saavuttaa ominaisuuksia, joita ihmisen arkielämässä pidetään ainakin nokkelina, jollei jopa älykkäinä.

Muzero käyttää menetelmää, jonka tieteellinen nimi on Monte Carlon puuhaku. Se on hakualgoritmi eli laskentaohjelma, jota on käytetty jo pitkään tietokoneissa.

Muzero etenee siinä muita ohjelmia paremmin. Ohjelma perustuu oppivaan mallin, joka seuraa kuin puun oksistossa vaihtoehtojen määrää. Se oppii oksiston antamasta palautteesta.

Silver sanoo BBC:lle rohkeasti, että Muzeron kaltainen oppiva tekoäly voisi saavuttaa myös yli-inhimillisiä kykyjä.

Atarin videopelejä Muzero harjoitteli vain 12 tuntia. Siinä ajassa Muzero ehti käydä miljoona oppimiskierrosta. Samalla se oppi varmaankin miljoona peliin liittyvää asiaa.

Marraskuun lopulla Deepmind kertoi, että sen ohjelma auttoi ratkaisevasti yhden biologian ison ongelman ratkaisussa.

Tekoäly Alphafold päättelee, miten ihmisen elimistön kymmenet tuhannet proteiinit laskostuvat soluissa ja elimistössä.

Proteiinit pitävät meitä elossa. Jos niiden rakenteen tuntee, auttaa se ratkaisevasti lääkkeiden kehittelyä.

Muzeron vastaavia sovelluksia voisivat olla virtuaalisten apulaisten kehittely. Älykännykkä esimerkiksi jo on meidän apulaisemme.

Myös personoitujen lääkkeiden kehittely ja eri pelastustekniikat voisivat hyötyä Muzerosta.

Deepmindin ohjelmoijat esittelivät jo marraskuussa 2019 Muzeron periaatteita Arxiv-verkkopalvelussa. Alaa seuraaville Muzero on jo siis melko tuttu. Sitä on toki päivitetty vuonna 2020.

Jouluaaton aaton artikkeli vertaisarvioidussa Naturessa avasi kuitenkin taas keskustelun tekoälyjen vaaroista.

”Algoritmeja yritetään jatkuvasti soveltaa yhteiskunnan hyödyksi. Mutta onko ajateltu myös tahattomia seurauksia”, muistuttaa BBC:lle tietojenkäsittelytieteen professori Wendy Hall Southamptonin yliopistosta.

Hän on Britannian hallituksen asettamassa ryhmässä, joka seuraa tekoälyä.

”Meidän on löydettävä oikea tasapaino tekoälyn kehitystyössä.”

Hall vertaa: ”En usko, että suihkumoottorin keksijät ajattelivat sitä suunnitellessaan, että sen käyttö voi saastuttaa maailmaa.”

Silver ei vastaa suoraan Hallille. Hän kuitenkin kertoo Wired-lehden haastattelussa, että tietenkin hän vastustaa tekoälyn käyttöä esimerkiksi aseistuksessa.

Silverin mukaan Deepmind tiedostaa, mitä ongelmia tekoäly tuo mukanaan. Yhtiö ajaa esimerkiksi itsenäisesti toimivien aseiden täyskieltoa.