Tekoäly ratkaisi yhden biologian suurimmista haasteista – ”Tämä mullistaa lääketieteen, tutkimuksen ja biotekniikan” - Tiede | HS.fi

Tekoäly ratkaisi yhden biologian suurimmista haasteista – ”Tämä mullistaa lääketieteen, tutkimuksen ja biotekniikan”

Proteiinien rakenteen ennustaminen vauhdittaa lääkkeiden kehittämistä eri sairauksiin.

Proteiinit laskostuvat kolmiulotteiseen muotoon.­

2.12.2020 15:30

Tekoäly on onnistunut ratkaisemaan yhden maailman suurimmista biologisista haasteista. Deepmind-yhtiön kehittämä tekoäly pystyy ennustamaan, miten proteiinit laskostuvat kolmiulotteiseen muotoonsa.

Proteiinit toimivat solujen rakennusaineena ja määrittävät virusten, bakteerien, ihmiskehon ja kaiken elollisen toimintaa. Ne koostuvat aminohapoista, jotka yhdistyvät ketjuiksi ja järjestyvät sitten kullekin proteiinille ominaiseen kolmiulotteiseen muotoon. Tätä järjestymistä kutsutaan laskostumiseksi.

Proteiinin muoto määrittää niiden tehtävän. Muodon määritteleminen on tärkeää muun muassa lääkekehityksessä ja sairauksien ymmärtämisessä.

Tutkijat ovat etsineet ratkaisua proteiinin rakenteen määrittämiseksi jo 50 vuoden ajan. Vuonna 1972 yhdysvaltalainen kemisti Christian Anfinsen sai Nobelin kemianpalkinnon osoittamalla, että proteiinien kolmiulotteinen rakenne oli mahdollista määritellä aminohappoketjun perusteella.

Ongelmana on, että yksi proteiini koostuu sadoista tai tuhansista aminohapoista, jotka voivat kytkeytyä toisiinsa lukuisilla tavoilla. Mahdollisia laskostumistapoja on niin paljon, että niiden kaikkien laskeminen on tietokoneella mahdotonta.

Sen vuoksi proteiinirakenteita on mitattu laboratoriossa muun muassa röntgenkristallografian, NMR-spektroskopian ja kryoelektronimikroskopian avulla. Tällaiset menetelmät ovat kuitenkin kalliita, ja niiden avulla yhden proteiinirakenteen määrittelemiseen kuluu kuukausia, vuosia tai jopa vuosikymmeniä.

Pelkästään ihmisissä erilaisia proteiineja on kymmeniätuhansia ja kaikissa elollisissa olennoissa miljardeja. Tutkijat ovat onnistuneet määrittelemään vain 170 000 proteiinin rakenteen, kun kaikkiaan proteiineja on tunnistettu yli 200 miljoonaa.

 Proteiinirakenteen ennustamisesta on hyötyä erilaisten sairauksien kuten syöpien ja dementian ymmärtämisessä.

Vuonna 1994 joukko tutkijoita ryhtyi etsimään ongelmaan ratkaisua kansainvälisen kilpailun avulla. Casp on kahden vuoden välein järjestettävä kilpailu, johon osallistuvat tutkijaryhmät yrittävät ennustaa proteiinien rakennetta tietojenkäsittelytieteen menetelmillä.

Kilpailijoille annetaan tarkasteltavaksi useiden eri proteiinien aminohappoketjuja, joiden pohjalta he yrittävät ennustaa sen kolmiulotteisen muodon. Tietokoneella tehtyjä ennustuksia verrataan laboratoriomittauksiin.

Menneinä vuosina kilpailun tulokset eivät ole olleet kummoisia. Moni alan tutkija ajatteli, että läpimurtoa jouduttaisiin odottamaan vielä vuosikymmeniä.

Sitten tulivat Deepmind ja sen kehittämä Alphafold. Deepmind on Googlen omistama tutkimusyhtiö, joka tunnetaan useista läpimurtoja tehneistä tekoälyohjelmistaan.

Neljä vuotta sitten yhtiö teki historiaa, kun sen Alphago-ohjelma päihitti maailman monimutkaisimmassa lautapelissä gossa lajin suurmestarin Lee Sedolin.

Kolme vuotta sitten Deepmindin kehittämä Alphazero-ohjelma voitti maailman parhaan shakkiohjelman, ja viime vuonna Alphastar päihitti useita ammattipelaajia suositussa Starcraft-strategiapelissä.

Yhtiön kehittämä tekoäly perustuu neuroverkoksi kutsuttuun matemaattisen laskennan malliin, joka jäljittelee ihmisaivojen mekanismeja. Neuroverkkoja opetetaan suoriutumaan erilaisista tehtävistä suuren datamäärän avulla. Ne oppivat tunnistamaan esimerkiksi kuvien seasta tiettyjä kohteita kuten kasvoja tai eläimiä, kääntämään kieliä ja tunnistamaan puhetta.

Samaan periaatteeseen nojaa myös proteiinirakenteen ennustamiseen kehitetty Alphafold. Se sai analysoitavakseen tuhansia laboratoriossa mitattuja proteiineja ja niiden rakenteita, minkä ansiosta se oppi ennustamaan proteiinien laskostumista myös sille annetun datan ulkopuolelta.

”En olisi ikinä uskonut, että näen tämän tapahtuvan elinaikanani”, Marylandin yliopiston professori John Moult sanoo Science-lehdelle.

Moult on yksi Casp-kilpailun perustajista, ja hän oli myös mukana arvioimassa tämän vuoden osallistujia. Kilpailussa Alphafold päihitti ihmisten tekemät mittaukset sekä nopeudessa että luotettavuudessa. Tehtävät, joihin tutkijoilta kului laboratoriossa vuosia, sujuivat tekoälyltä muutamassa tunnissa, jopa minuuteissa.

Kun ohjelmalle antoi tarkasteltavaksi aminohapoista koostuvan ketjun, se pystyi ennustamaan proteiinin kolmiulotteisen muodon täsmällisesti kahdessa kolmesta tapauksesta. Sen tekemät virheet olivat suurimmaksi osaksi hyvin pieniä, alle atomin kokoluokkaa.

Lopulta Alphafold onnistui tehtävässä, jota tutkijat olivat yrittäneet ratkaista jo useita vuosikymmeniä. Se ennusti yksisoluisessa mikro-organismissa, arkeonissa, sijaitsevan proteiinin kolmiulotteisen rakenteen. Kyseistä rakennetta on erityisen vaikea määritellä, sillä se sijaitsee puoliksi solun sisällä ja puoliksi sen ulkopuolella.

Tekoäly selvisi tehtävästä puolessa tunnissa.

 ”Työsarkaa vielä riittää.”

”Kyllähän tämä on ainakin viimeiseen kymmeneen vuoteen merkittävin askel kohti pitkäaikaisen ongelman ratkaisua”, sanoo Aalto-yliopiston professori Juho Rousu.

Hän haluaa kuitenkin muistuttaa, että tekoäly teki edelleen paljon virheitä.

”Työsarkaa vielä riittää. En usko, että tekoäly pystyy syrjäyttämään kokeellista laboratoriotyötä täysin.”

Rousun mukaan laboratoriokokeiden rooli muuttuu tulevaisuudessa ensisijaisesta mittausvälineestä varmistavaksi. Tekoäly siis ennustaisi proteiinien rakenteita, ja kiinnostavat löydökset varmistettaisiin laboratoriossa.

”Aikaisemmin tietokoneen tekemät ennustukset saattoivat olla niin pahasti pielessä, ettei niiden pohjalta ollut kannattavaa tehdä jatkotutkimusta. Nyt asia on toisin.”

Tekoälykehityksen näkökulmasta kyse ei ole Rousun mukaan mistään mullistavasta teknologiasta. Sen sijaan Deepmind on käyttänyt jo olemassa olevaa teknologiaa uudella, nerokkaalla tavalla. Alphafold ennusti aluksi kahden vierekkäisen aminohapon etäisyyttä. Sitten tavoitteena oli ennustaa kaikkien parittaisten aminohappojen etäisyydet.

”Se oli hyvä idea, sillä parittaisten aminohappojen etäisyydet määräävät kolmiulotteisen rakenteen täysin. Eli jos ajatellaan vaikkapa kolmiota, sen sivujen pituus määrittää myös muodon. Sama pätee proteiineihin”, Rousu selventää.

 ”Tämä mullistaa lääketieteen, tutkimuksen ja biotekniikan.”

Lääketieteessä Deepmindin teknologia mahdollistaa monenlaisia mullistuksia. Proteiinirakenteen ennustamisesta on hyötyä muun muassa erilaisten sairauksien kuten syöpien ja dementian ymmärtämisessä. Lisäksi se vauhdittaa uusien lääkkeiden ja rokotteiden kehitystä.

Jos tutkijat tuntevat proteiinin kolmiulotteisen muodon, he pystyvät määrittelemään, miten muut molekyylit voivat niihin sitoutua. Tämä on yksi tapa kehittää lääkkeitä: ne sitoutuvat haluttuihin proteiineihin ja vaikuttavat niiden toimintaan.

”Esimerkiksi geneettiset sairaudet johtuvat mutaation aiheuttamissa muutoksissa proteiinissa. Kolmiulotteisesta rakenteessa pystymme näkemään paremmin, mikä osa proteiinista on muuttunut ja millä tavalla se voitaisiin korjata”, Rousu sanoo.

Max Planck -instituutin kehitysbiologi Andrei Lupas puolestaan uskoo, että Alphafoldin kaltainen tekoäly voi auttaa taistelemaan koronaviruksen kaltaisia pandemioita vastaan.

”Tekoälyn avulla voitaisiin määritellä, millaisilla jo olemassa olevilla lääkkeitä uusia viruksia on mahdollista hoitaa”, Alphafoldia kehittämässä ollut Lupas kertoo The New York Timesille.

Lisäksi proteiinirakenteen ennustamisesta on apua synteettisten proteiinien kehityksessä. Niitä voisi käyttää esimerkiksi biopolttoaineiden ja muovijätettä hävittävien entsyymien valmistuksessa.

”Tämä mullistaa lääketieteen, tutkimuksen ja biotekniikan. Tämä mullistaa kaiken”, Lupas kiteyttää Naturessa.

Osaston uusimmat

Luitko jo nämä?

Osaston luetuimmat