Tekoäly voi ennustaa, kuka levittää valeuutisia englanniksi Twitterissä - Tiede | HS.fi

Tekoäly voi ennustaa, kuka levittää valeuutisia englanniksi Twitterissä

Epäluotettavissa twiiteissä toistuu englanniksi tiettyjä sanoja, kuten liberaali, hallitus ja media. Niissä on myös epäkohteliasta kielenkäyttöä.

Twitteristä on tullut yleinen uutisten, valeuutisten ja omien kommenttien jakokanava.­

17.12.2020 9:23

Tekoälyn ja ison data-aineiston avulla voi ennustaa, kuka viestipalvelu Twitterin käyttäjistä levittää valeuutisia ja valheellista informaatiota. Tekoälyn kehittäjät sanovat, että levittäjän luottavuuden voi ennustaa etukäteen.

Jos törmäät englanniksi twiitteihin, joissa toistuu tiettyjä sanoja, kuten liberaali, hallitus ja media, ollaan totuuden suhteen vaarallisella vyöhykkeellä, sanovat tutkijat.

Twiittien seurantaan kehitettiin algoritmi Sheffieldin yliopistossa. Sen tietojenkäsittelytieteen laitoksen tutkijat laativat tämän laskentamenetelmän. Työtä johtivat tutkijat Yida Mu ja tohtori Niklaos Aletras.

Suuraineiston perustana oli yli miljoona twiittiä, joita noin 6 200 Twitterin käyttäjää olivat lähettäneet.

He tutkivat viestien sisältöä menetelmin, jotka selvittävät tavallista englannin kielenkäyttöä. Ne ovat apuna valtavien kielten datapankkien käsittelyssä ja ymmärtämisessä.

Saadun datan avulla tutkijat kouluttivat oppivaa tekoälyä.

Aineisto koostui twiiteistä, jotka olivat julkisesti kaikkien nähtävissä sosiaalisessa mediassa. Käyttäjät jakautuivat kahtia. Osa jakoi epäluotettavia uutislähteitä, toiset vain luotettavien uutislähteiden tarinoita.

Tekoälyn algoritmi pystyi lopulta ennustamaan lähes 80-prosenttisen varmasti, jakaako twiittaaja epäluotettavien lähteiden sisältöjä.

Epäluotettavia lähteitä twittaava käytti ensinäkin enemmän epäkohteliasta englantia. Hänen jakamansa twiitit käsittelivät muita enemmän politiikkaa tai uskontoa.

Twiiteissä vilahti englanniksi sellaisia sanoja kuin ”liberaali”, ”hallitus” ja ”media”. Twiitit liittyivät usein Lähi-itään ja islamiin. Twiiteissä mainittiin esimerkiksi usein sana ”Israel”.

Jos twiittaaja puolestaan jakoi tekstejä englanniksi luotettavista uutislähteistä, hän kertoi enemmän myös omasta elämästään. Hän kertoi tunteistaan ja omista ja ystäviensä tekemisistä.

Näissä twiiteissä toistui usein sanoja kuten ”aion”, ”minä”, ”innoissani”, ”syntymäpäivä” ja ”mieliala”.

Tutkijat pohtivat nyt, miten tätä tekoälyä voisi hyödyntää.

Sosiaalisen median yhtiöt, kuten Twitter ja Facebook, voisivat tällaisen nopean tekoälyn avulla torjua väärän tiedon levittämistä alustoillaan.

Tekoäly voisi auttaa myös yhteiskuntatieteellistä ja psykologista tutkimusta.

Tekoälyä suunnitellut Nikos Aletras Sheffieldin yliopistosta sanoo, että epäkohteliaan englannin ja epäluotettavan tiedon leviämisen välillä oli tutkimuksessa selvä vastaavuus eli korrelaatio.

Tutkimuksen julkaisi tiedelehti Peer, joka kertoo biologisin ja lääketieteen tutkimuksista. Twiittien tulkinnasta kertoi myös verkkosivu Techxplore.

Osaston uusimmat

Luitko jo nämä?

Osaston luetuimmat