Tekoäly voi mullistaa pian verkon haku­koneet

Microsoft suunnittelee 10 miljardin dollarin sijoittamista Chat GPT:tä kehittävään Open AI -yritykseen. Suomalaistutkijan mukaan tekoälyn keskittyminen suurten teknologiayhtiöiden käsiin on ongelma.

Microsoft kertoi tämän viikon alussa Azure Open AI -palvelun tulevan yleisesti saataville.

19.1. 9:27 | Päivitetty 19.1. 13:26

Tekoälysovellukset, jotka kykenevät luomaan ihmisen tekemiltä vaikuttavia tekstejä ja kuvia, ovat herättäneet viime aikoina huomiota. Viimeisin suuri tapaus oli joulukuussa julkaistu Chat GPT, joka kykenee tuottamaan sujuvaa tekstiä pyydetyistä aiheista eri kielillä.

Tekoäly herätti ihmetystä esimerkiksi keksimällä vitsejä, neuvomalla ohjelmoijia koodin kanssa ja kirjoittamalla vaikkapa päteviä kouluaineita.

Nyt teknologiajätti Microsoft on lähdössä mukaan tekoälybisnekseen isommalla panostuksella. Yhtiö suunnittelee 10 miljardin dollarin sijoittamista Chat GPT:tä kehittävään Open AI -yritykseen, kertovat muun muassa amerikkalaislehti The New York Times ja britannialainen talouslehti Financial Times. Summa vastaa noin 9,3:a miljardia euroa.

Financial Times kuvaa suunniteltua sijoitusta uuden tekoälyn aikakauden määritteleväksi sopimukseksi.

Microsoftin tekoälyalustatoiminnan johtaja Eric Boyd sanoo lehdelle, että tekoälymallit tulevat muuttamaan sen, kuinka ihmiset ovat vuorovaikutuksessa tietokoneiden kanssa.

Microsoft kertoi vastikään, että Chat GPT on tulossa pian saataville Azure Open AI -palveluun. Yhtiö kertoi myös Azure Open AI -palvelun tulevan yleisesti saataville.

Palvelu sisältää useita tunnettuja tekoälymalleja, kuten GPT-3.5:n, Codexin ja Dall-e 2:n.

Suomalainen tekoälytutkija, Aalto-yliopiston tietotekniikan laitoksen professori Jaakko Lehtinen, näkee Microsoftin suuren tekoälypanostuksen taustalla erityisesti hakukonekilpailun Googlen kanssa.

Microsoftilla on oma hakukone Bing, mutta sen osuus internetin tiedonhauista on ollut vaatimattomat noin kolme prosenttia. Googlen vastaava osuus on ollut 90 prosenttia.

Microsoft yrittää tiettävästi integroida Chat GPT -teknologian Bing-hakukoneeseen.

Hakukone antaisi tekoälyn avulla valmiin vastauksen käyttäjän kysymykseen sen sijaan, että tietoa pitäisi etsiä eri verkkosivuilta hakutulosten perusteella.

”On nähtävissä, että Googlen hakutulokset huononevat ja huononevat”, Lehtinen vertaa.

Hän viittaa muun muassa yritysten harjoittamaan hakukoneoptimointiin. Sen sijaan, että hakukone kykenisi tarjoamaan relevanteinta ja parasta tietoa haetusta aiheesta, Googlen hakutuloksiin nousee yhä enemmän sivuja, jotka joku on optimoinut nousemaan korkealle Googlen hakutuloksissa.

Lehtisen mukaan tekoälyllä voidaan pyrkiä korvaamaan työ, jonka ihminen tekee etsiessään hakutulosten joukosta oikeaa vastausta ja tehdessään mahdollisesti uusia tarkentavia hakuja.

Hän mainitsee esimerkkinä käyttäneensä Chat GPT:tä apurina koodin kirjoittamisessa.

Lehtinen kertoo tutkimustyössä tarvinneensa yksinkertaisen koodipätkän, jonka tekeminen tyypillisesti vaatisi useita hakuja ja tulosten huolellista yhdistelyä. Lehtinen pyysi kokeeksi Chat GPT:tä kirjoittamaan koodinpätkän ja antoi sille ohjeet, mitä ohjelman pitäisi tehdä.

”Sain ihan täydellisen tuloksen. Hienosäädin sitä vielä pyytämällä muutoksia, jotka Chat GPT toteutti.”

Tekoälyssä on hänen mukaansa potentiaalia siihen, että tulossa on paradigman muutos hakukoneissa.

Tekoäly on vastikään alkanut tarjota sovelluksia, joiden suoritukset esimerkiksi luonnollisen kielen tuottamisessa tai kuvien luomisessa ovat suorastaan häkellyttäviä.

Tekoälymallit ovat päässeet tasolle, joka on herättänyt suuren yleisön kiinnostuksen. Siinä mielessä alalla voidaan Lehtisen mukaan puhua käänteestä.

Kehitys on ollut Lehtisen mukaan nähtävissä. Tekoälybuumi on ollut kasvamassa jo kymmenen vuoden ajan.

”Pitkään kestänyt jatkuvien parannusten ketju on johtanut epäjatkuvaan hyppyyn käyttökelpoisuudessa”, Lehtinen muotoilee.

Tekoälyn kyvyt ovat vain tulleet tasolle, joka on kenen tahansa nähtävissä.

Microsoftilla on oltu kiinnostuneita tekstiä tuottavasta tekoälystä jo vuosia. Teknologiajätti sijoitti Open AI:hin miljardi dollaria vuonna 2019. New York Timesin mukaan se on sittemmin sijoittanut tekoäly-yhtiöön vielä kaksi miljardia lisää.

Yhteensä Open AI:hin on siis laitettu 3 miljardia dollaria, mikä nykykurssilla vastaa noin 2,8:aa miljardia euroa. Ja nyt suunnitteilla on siis massiivinen 10 miljardin dollarin sijoitus.

Myös Microsoftin kilpailijoilla on tekoälyyn liittyviä yhteistöitä. Amazonin pilvipalveluyksiköllä on sopimus Stability AI:n kanssa ja Google tekee yhteistyötä Cohere AI -nimisen startupin kanssa, Financial Times kertoo.

Teknologiajäteillä on myös omaa mittavaa tekoälytoimintaa.

Lehtinen nostaa esiin Googlen Brain-osaston ja Deep Mind -osaston sekä Metan Fairin eli Facebook AI Research -osaston.

Suuret teknologiayhtiöt kykenevät resursseillaan hankkimaan paljon valtaa kehittymässä olevalla tekoälyalalla.

”Onhan se ongelma”, toteaa professori Jaakko Lehtinen.

Tekoälyn ”kouluttaminen” on valtavan raskasta ja vaatii paljon laskentatehoa.

Siksi yliopistomaailmalla ei ole mahdollisuutta kehittää tekoälyä samalla tavalla kuin teknologiajäteillä.

Tekoälymallit myös koulutetaan yhtiöiden dataseteillä, jotka eivät ole julkisesti saatavilla.

Tekstiä tuottavalle tekoälylle siis syötetään valtava määrä tekstejä, joiden pohjalta se ”oppii” tuottamaan uusia tekstejä. Sitä, mitä tekstejä dataseteissä on, voivat ulkopuoliset vain arvailla.

Käynnissä on Lehtisen mukaan jo oikeusjuttukin siitä, onko muiden tekstejä laillista käyttää ilman lupaa tekoälyn kouluttamiseen.

”Tekoälymallit on koulutettu aivan valtavalla määrällä dataa. On mahdotonta ajatella, että mukana ei olisi myös tekijänoikeussuojattua materiaalia.”

”Tämä on mielenkiintoinen ja vaikea kysymys.”

Tekstiä tuottavan tekoälyn kehittäjillä on selätettävänään vielä yksi suuri ongelma: tekoäly ei tiedä, milloin se ei tiedä jotain asiaa.

Tekoälyn tarjoaman tiedon luotettavuuden kanssa ei olla vielä maalissa, eikä Lehtisen mukaan kovin lähelläkään.

Chat GPT:n esittämät vastaukset ovat usein ällistyttävän hyviä mutta toisinaan taas täysin perättömiä.

Hakukonetyyppisessä käytössä tähän sisältyy riskejä.

Lehtinen nostaa esiin, että monet googlaavat esimerkiksi oman sairautensa hoitoa.

Tekoälymalli, joka ei ymmärrä omaa ymmärtämättömyyttään, olisi tällaisessa käytössä vaarallinen.

”Se voi kertoa syvällä rintaäänellä asioita, joissa ei ole mitään rotia”, Lehtinen sanoo.

”Siinä on kehitys- ja tutkimustyötä, miten tekoälymalli pystyisi arvioimaan oman vastauksensa luotettavuutta.”