Ulkomaat

Yhdysvalloissa rakennettiin tekoälyllä toimiva tekstigeneraattori, joka voi olla liian vaarallinen julkaistavaksi, ohjelman kehittäjät sanovat

Uskottavaa uutiskieltä ja kaunokirjallista tekstiä suoltavaa tekstigeneraattoria olisi erittäin helppo käyttää esimerkiksi valeuutisten luomiseen ja identiteettivarkauksien tekemiseen, tutkijat uskovat.

Vallankumoukselliseksi kutsuttu tekoälyllä toimiva tekstigeneraattori osaa kirjoittaa ja täydentää uutispätkiä ja kaunokirjallisuutta niin uskottavasti, että sen kehittäjät ovat päättäneet lykätä tutkimuksensa julkaisemista kokonaisuudessaan.

He nimittäin pelkäävät, että generaattoria käytettäisiin vääriin tarkoituksiin, kertoo Guardian.

Keksijä-yrittäjä Elon Muskin tukema, voittoa tavoittelematon tutkimusryhmä Open AI on kehittänyt niin hyvän tekoälyjärjestelmän, että riskit sen väärinkäytöksistä ovat erittäin korkeat, tekijät arvioivat. Siksi he ovat julkaisseet tutkimuksestaan vain pienen maistiaisen. Ryhmä haluaa ensin rauhassa tutkia, mitä mahdollisia kääntöpuolia uraauurtavan ohjelman julkaisulla voisi olla.

Tekoälyjärjestelmän nimi on GPT2. Se on tekstigeneraattori, jolle syötetään ensin pätkä tekstiä aina muutamasta sanasta kokonaiseen sivuun. Sen jälkeen generaattori ennustaa, kuinka tekstin pitäisi jatkua. Järjestelmä on sekä laadultaan että mahdollisten käyttötarkoitusten puolesta ennennäkemätön, Guardian kertoo.

GPT2 kykenee tuottamaan täysin mahdollisia ja järkeviä lauseita, jotka istuvat syötetyn alkutekstin tyylilajiin ja aiheeseen. Se tekee harvoin virheitä, joita muut tekoälyjärjestelmät tekevät. Esimerkiksi lauserakenteen oikeaoppisuus on ollut pitkissä lauseissa ongelma monille tekstigeneraattoreille.

Open AI:n sivuilla on esitelty esimerkkejä generaattorille syötetyistä tekstinpätkistä ja niistä jatketuista artikkeleista. Se pystyy esimerkiksi kirjoittamaan journalistista kieltä muistuttavaa tekstiä ja luomaan sitaatteja ”haastateltavien” suuhun, jos alkuteksti muistuttaa uutista.

Eräs generaattoriin syötetty lause kertoo ydinjätettä kuljettavan junan ryöstöstä. Generaattorin jatkamassa artikkelissa siteerataan Yhdysvaltain viranomaista, jonka mukaan ryöstöllä on ”merkittäviä negatiivisia seuraamuksia yleiselle ja ympäristön terveydelle, työvoimalle ja valtiontaloudelle.”

Eräässä esimerkissä generaattoriin on syötetty tekstinpätkä, jonka mukaan ”Miley Cyrus jäi kiinni myymälävarkaudesta Abercrombie and Fitchin liikkeestä Hollywood Boulevardilla.”

Generaattori jatkoi tekstiä kirjoittamalla, että ”19-vuotias laulaja tallentui kameroihin, kun turvamiehet saattoivat häntä ulos kaupasta. Laulajalla oli päällään musta huppari, jonka edessä luki ’Blurred Lines’ ja selässä ’Muotipoliisi’. Skrollaa alas nähdäksesi videon.”

Täysin tarkka generaattori ei ilmeisesti ole, sillä Miley Cyrus on 26-vuotias.

Toisaalta ohjelmalla on vielä hieman vaikeuksia erittäin teknisten, esoteeristen tai fantasiaelementtejä sisältävien tekstien jatkamisessa.

Toisessa esimerkissä alkulause kertoo tutkijasta, joka löysi täydellistä englantia puhuvan yksisarvislauman Andien vuoriston tutkimattomasta laaksosta. Generaattori jatkaa tekstiä kokonaisen tiedejournalismia muistuttavan artikkelin verran, jossa ”tohtori Jorge Pérez” pääsee satumaisessa laaksossa niin lähelle yksisarvisia, että ”olisi voinut koskettaa niiden sarvia”.

Generaattorin tekstissä Pérez epäilee yksisarvisten olevan Argentiinasta lähtöisin olevan kadonneen ihmislajin jälkeläisiä. Ainoa keino selvittää eläinten alkuperä on kuitenkin DNA-tutkimuksen avulla, generaattori suoltaa Pérezin suulla.

Tutkimusnäkökulmasta GPT2 on ihmeellinen siksi, että se on paljon isompi kuin mikään aikaisempi vastaava tekoälyjärjestelmä. GPT2:n syötettiin noin 8 miljoonan nettisivun sisältö Redditiin ladattujen linkkien perusteella. Tekstiä oli noin 40 gigatavun verran, mikä vastaa noin 35 000 Moby Dickiä.

Valtava datamäärä ja aineiston monipuolisuus tekee GPT2:n ennustustyöstä helppoa ja tarkkaa. Se pystyy myös vastaamaan kysymyksiin, tekemään käännöksiä ja tiivistelmiä, ja harjoittamaan luetunymmärtämistä.

Siksi Open AI myös pidättäytyy julkaisemasta koko tutkimusta.

”Meidän täytyy tutkia, mihin se pystyy ja mihin se ei pysty”, tutkimusryhmän ohjelmavastaava Jack Clark kertoo Guardianille. ”Jos emme pysty ennakoimaan kaikkia ohjelman kykyjä, meidän täytyy tyrkkiä sitä näyttämään, mitä se osaa. Tuolla on paljon meitä parempia ihmisiä keksimään, mitä pahaa ohjelmalla voisi tehdä.”

Ohjelmalla voisi esimerkiksi tuottaa loputtomasti positiivisia tai negatiivisia arvioita tuotteista nettikaupoissa. Roskaposti ja valeuutiset ovat myös todennäköisiä väärinkäyttökohteita. Ohjelmaa olisi myös helppo käyttää syrjivän tai muuten epäilyttävän materiaalin jakamiseen sosiaalisessa mediassa. Se voi myös tehdä identiteettivarkauksia ja esiintyä toisina ihmisinä verkossa.

Tutkimusryhmä on kuitenkin varma siitä, että ohjelman kyvyt ovat yleisessä käytössä jo vuoden, parin päästä.

Clarkin mukaan teknologia muuttuu jatkuvasti halvemmaksi valmistaa ja halvemmaksi ostaa. Seurauksena teknologian hallitsemisesta tulee yhä hankalampaa, ja siksi teknologian kehittäjillä on vastuu miettiä myös keksintöjensä kääntöpuolia.

Julkaisemisen lykkäämisellä ryhmä haluaa asettaa esimerkin myös muille tutkimusryhmille, ja nostaa keskustelua tekoälytutkimuksen vastuullisuudesta.

”Yritämme rakentaa tietä samalla kun matkaamme sitä pitkin”, Clark sanoo.

Kommentit

    Ei vielä kommentteja. Kirjoita ensimmäinen.

    Näytä lisää
    Luetuimmat
    • Juuri nyt
    • Päivä
    • Viikko
    1. 1

      Näin saksalaiset ratkaisisivat turvapaikan­hakijoiden palautukset

    2. 2

      Sami Hedberg nauraa sketsisarjassaan homoille, venäläisille ja saamelaisille, Sami Hedbergille eivät naura edes lapset

    3. 3

      Monia suomalaisia odottaa eläkkeellä ikävä yllätys – Katso HS:n laskurista, millainen eläke sinulle on tulossa

      Tilaajille
    4. 4

      Liian palelemisen syy voi löytyä suolistobakteereista, tutkijat arvelevat

    5. 5

      Päättäjät väistelevät karua totuutta: Suomen eläke­järjestelmä on kriisissä

    6. 6

      Mies raiskasi 15-vuotiaan tytön Helsingissä ja käytti kahta muuta seksuaalisesti hyväkseen – Käräjäoikeus tuomitsi vajaan neljän vuoden vankeuteen

    7. 7

      Anna-Maja Henrikssonin esiintymisessä Ylen tentissä oli niin vähän konkretiaa, että edes faktoja on vaikea tarkistaa – tässä parhaat palat giffeinä

    8. 8

      Uudet mittaukset kertovat, millä tele­operaattorilla on paras verkko: Kartta näyttää tulokset kunnittain ja posti­numeroittain

      Tilaajille
    9. 9

      Maailman tunnetuimpiin pop-tähtiin lukeutuva Sam Smith kertoi viimein, ettei ole mies eikä nainen vaan muunsukupuolinen

    10. 10

      HS-analyysi: Uudet arviot antavat yllättävän kuvan Venäjän sotilaallisesta voimasta ja osoittavat, kuinka maan mahtia on paisuteltu

      Tilaajille
    11. Näytä lisää
    1. 1

      Sami Hedberg nauraa sketsisarjassaan homoille, venäläisille ja saamelaisille, Sami Hedbergille eivät naura edes lapset

    2. 2

      Uudet mittaukset kertovat, millä tele­operaattorilla on paras verkko: Kartta näyttää tulokset kunnittain ja posti­numeroittain

      Tilaajille
    3. 3

      Suolistosyöpään kuolee vuosittain yli tuhat suomalaista: Sairaus on kavala ja oireet epämääräisiä

    4. 4

      Yhdestä huoneesta tuli sote-kaaoksen julma taistelu­tanner, ja nyt HS kertoo, mitä oven takana tapahtui – ”En ole koskaan nähnyt niin huonoa käytöstä”

      Tilaajille
    5. 5

      Uusi liikunta­trendi parantaa terveyttä nopeasti, ja kenellä tahansa on siihen aikaa

      Tilaajille
    6. 6

      Vessahädän kourissa kipristelevät turistilaumat piinaavat Helsingin kaupungintalolla: Kaupunki sanoo kahdeksalla kielellä ei

    7. 7

      ”Katsoin kuvaa ja ajattelin, että se oli oikeastaan aika hyvä ruutu”, sanoo rippileiriltä vuoden lehtikuvan ottanut Joonas Brandt – katso kaikki vuoden 2018 parhaat lehtikuvat

    8. 8

      Teuvo Hakkarainen teippasi auton kylkeen ”Matu, mistä tulet? Sinne menet” ja selitteli tarkoittaneensa maaseudun tulevaisuutta ja muitakin asioita – soitimme

    9. 9

      Toimittaja Jorma Elovaara on kuollut

    10. 10

      Helsingin seudun kouluissa leviää nyt villitys, joka saa lapset liikkumaan jopa kilometrejä tunnin aikana

    11. Näytä lisää
    1. 1

      Moni käyttää astian­pesu­konetta väärin, ja välin­pitämättömyys voi aiheuttaa isot kulut: toimi näin, niin vältyt ikäviltä yllätyksiltä

      Tilaajille
    2. 2

      Kuvilleni saa nauraa, sanoo Iiu Susiraja, mutta hiljenee kun katselee lukioaikaista valokuvaa itsestään

    3. 3

      Lars Kihlström halusi uskoa hyvää isästä, mutta lopulta hän itki – Suomalaisen SS-miehen päiväkirjasta löytyi lause, joka kyseenalaistaa historian­kirjoituksen

      Tilaajille
    4. 4

      Uuden-Seelannin terrori-iskusta epäilty sai murhasyytteen, ainakin 50 ihmistä kuollut

    5. 5

      Kenellä on vastuu, jos joku perheen­jäsenistämme sairastuu takkat­ulien polton takia Espoossa?

    6. 6

      Kun Siskonpedistä tuttu Niina Lahtinen vei yksivuotiaansa päiväkotiin, vanhempainiltaan kutsuttiin psykologi paikalle: ”Vastuu ja syyllistäminen lankeavat lähinnä naisille”

      Tilaajille
    7. 7

      Nuoret miehet eivät sitoudu, kun tinderöitynyt seurustelu­kulttuuri tarjoaa aina uuden vaihto­ehdon – Jaakko kertoo, miksi erosi, kun tyttöystävä alkoi vaatia lapsia

      Tilaajille
    8. 8

      Missä on nainen, joka hyppäsi takaisin autoonsa ja hylkäsi pyöräilijän kuolemaan suojatielle? Vantaan poliisilta on loppumassa keinot poikkeuksellisen yliajotragedian selvittämisessä

      Tilaajille
    9. 9

      Jussi Halla-aho ei ole muuttunut, mutta hän on oivaltanut jotain

    10. 10

      Sami Hedberg nauraa sketsisarjassaan homoille, venäläisille ja saamelaisille, Sami Hedbergille eivät naura edes lapset

    11. Näytä lisää