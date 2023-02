Näin vaalikone vertaa ehdokkaiden ja käyttäjien vastauksia.

Helsingin Sanomien vaalikone julkaistiin 15. helmikuuta. Se sisältää noin 1 900 ehdokkaan vastaukset.

Kevään eduskuntavaaleja varten vaalikoneeseen suunniteltiin uusi algoritmi, eli tapa, jolla vaalikoneen tulos lasketaan. Sitä voi ajatella kaavana tai ohjeena.

Tämä juttu kertoo, miten algoritmi toimii. Lisäksi koodia voi tarkastella täällä.

Tiivistetysti uusi vaalikone yrittää tilastollisilla menetelmillä löytää ehdokkaan, joka sijoittuu muutamalla tärkeällä arvojen ulottuvuudella lähimmäksi lukijan vastauksia.

Miksi uusi algoritmi tehtiin?

Pohjimmiltaan kyse on siitä, miten äänestäjä parhaiten löytää ehdokkaan. Tapahtuuko se niin, että äänestäjä on mahdollisimman samaa mieltä vaalikoneen 30 kysymyksestä? Vai niin, että äänestäjä löytää ehdokkaan, jonka arvot ovat samankaltaiset?

Perinteinen algoritmi toimii ensin mainitulla tavalla, kun taas uuden algoritmin idea on toimia jälkimmäisellä tavalla. Uusi malli pyrkii huomioimaan aiempaa paremmin sen, että vaalikoneen kysymykset ovat harvoin toisistaan riippumattomia, erillisiä asioita. Käytännössä iso osa vaalikoneen kysymyksistä mittaa tapoja suhtautua asioihin eli ideologisia ulottuvuuksia. Tärkeimmät näistä ulottuvuuksista ovat vasemmisto–oikeisto-akseli ja gal–tan eli liberaalivihreä–kansalliskonservatiivi-akseli.

HS:n vaalikoneen 30 kysymyksestä 9 mittaa akselia vasemmisto–oikeisto, 14 kysymystä mittaa akselia gal–tan ja 2 kysymystä maaseutu–kaupunki-akselia. Loputkin 5 kysymystä vaikuttavat laskentaan.

HS:n vaalikoneen algoritmi laskee jokaiselle ehdokkaalle ja käyttäjälle sijainnin näillä ulottuvuuksilla ja vertaa niitä. Taustalla on tilastollinen analyysi, joka on tehty kaikkien ehdokkaiden vastauksille.

Vaalikoneen kysymykset eivät voi ennakoida kaikkia tilanteita, joita kansanedustajat kohtaavat. Siksi ajatuksena on, että ideologisten ulottuvuuksien avulla äänestäjä löytäisi ehdokkaita, joiden arvot ja ajattelu ovat samansuuntaisia: ehdokas jakaa saman arvopohjan äänestäjän kanssa, ja äänestäjä voi odottaa, että edustaja toimii arvojen ohjaamana erilaisissa tilanteissa.

Algoritmin keskeinen ero aiempaan on se, että kun aiemmin laskettiin vain etäisyyttä jokaiseen kysymykseen erikseen, uusi malli laskee läheisyyttä ehdokkaan arvojen kanssa. Uudessa mallissa ei siis lasketa vain etäisyyttä käyttäjän ja ehdokkaan vastausten välillä, vaan ehdokkaille ja käyttäjille lasketaan kysymysten perusteella sijainnit arvoulottuvuuksilla ja verrataan niitä.

Mihin uudistus pohjautuu?

Uudistusta varten vaalikoneen tekijät ovat koonneet laajalti tietoa tieteellisen tutkimuksen ja kyselyiden avulla.

Politiikan tutkimuksesta tunnetaan Suomen politiikassa vallitsevia jakolinjoja eli aiemmin mainittuja ideologisia ulottuvuuksia. Lisäksi erilaisista kyselytutkimuksista tiedetään, millaisilla kysymyksillä näitä ulottuvuuksia voidaan mitata. HS:n vaalikoneen valmistelussa on hyödynnetty aiempaa tieteellistä tutkimusta, HS:n teettämää väestölle suunnattua kyselyä sekä lukuisia HS:n lukijoille tehtyjä kyselyitä.

Mistä pääsen tutkimaan itse algoritmia?

HS julkaisee algoritmin avoimesti kaikkien tutustuttavaksi. Pääset näkemään sen tästä.

Miten algoritmi siis käytännössä toimii?

HS:n vaalikone sisältää noin 1 900 ehdokkaan vastaukset vaalikoneen kysymyksiin. Se on kaiken pohja.

Lisäksi algoritmin taustalla on malli siitä, mitä asiaa kukin kysymys mittaa. Tämä on tehty aiempien kyselytutkimuksien sekä ehdokkaiden vastausten perusteella.

Mallin avulla aineistolle suoritetaan konfirmatorinen faktorianalyysi, jolla muodostetaan ehdokkaiden vastauksista arvoulottuvuudet. Konfirmatorinen faktorianalyysi on tapa saada tilastollista vahvistusta muuttujien rakenteelle, jota aineiston kerääjät ovat ennakoineet. Analyysin perusteella myös jokainen ehdokas sijoitetaan näille arvoulottuvuuksille. Kun käyttäjä vastaa vaalikoneen kysymyksiin, hänelle lasketaan sijainti samalla tavalla.

Tähän malliin kuuluu, että kaikki vaalikoneen kysymykset eivät mittaa mainittuja arvoulottuvuuksia. Myös nämä kysymykset ovat kuitenkin mukana tuloksen laskennassa. Niistä lasketaan perinteinen etäisyysmitta, joka yhdistetään arvoulottuvuuksien etäisyyteen painotettuna kysymysten määrällä.

Käyttäjälle suositetaan ehdokkaita kahden mainitun laskennan yhdistelmänä.

Onko eri kysymyksillä erilaiset painoarvot lopputuloksen kannalta?

Kyllä. Painoarvot syntyvät tilastollisesta analyysista eli lopulta siitä, miten ehdokasjoukko on kysymyksiin vastannut. Analyysi kertoo, miten paljon kukin kysymys vaikuttaa tiettyyn ulottuvuuteen, vaikkapa vasemmisto–oikeisto-akseliin. Kysymys otetaan huomioon laskennassa tällä painoarvolla. Vaalikoneessa siis saavat enemmän painoa sellaiset kysymykset, joiden on huomattu erottelevan ehdokasjoukkoa parhaiten.

Käytännössä tämä tarkoittaa, että jos jokin kysymys on toista painavampi, se mittaa tiettyä arvoulottuvuutta paremmin kuin muut.

Tiettyjen kysymysten painotus ei siis ole toimituksen päätös, vaan se perustuu siihen, miten näiden eduskuntavaalien ehdokasjoukko on vastannut.

Miten käyttäjä voi huomata tämän vaalikoneen tuloksissa?

Otetaan esimerkki. Käyttäjä vastaa vaalikoneessa pitkälti samalla tavalla kuin ehdokas, mutta he ovat yhdestä kysymyksestä eri mieltä. Jos kysymys on esimerkiksi veronkorotuksia koskeva, se tekee ehdokkaiden välillä selviä eroja vasemmisto-oikeisto-akselilla. Esimerkkitapauksessa ehdokas on tässä kysymyksessä vasemmalla, käyttäjä oikealla.

Jos käyttäjä olisikin ehdokkaan kanssa erimielinen myös muissa kysymyksissä, mutta niin, että käyttäjä vastaisi näissä enemmän vasemmistolaisesti, se toisi häntä jälleen arvoissa lähemmäs ehdokasta.

Näin siis olemalla yhdessä kysymyksessä eri mieltä saattaa päätyä kauemmas ehdokkaasta kuin niin, että on useammasta eri mieltä.

Algoritmi siis mittaa samansuuntaisuutta arvoissa, ei ainoastaan puhdasta etäisyyttä joka kysymyksessä.

Miksi teemakohtainen tulosnäkymä poikkeaa joissain tapauksissa ehdokkaan kokonaistuloksesta?

Vaalikoneen käyttäjälle lasketaan kokonaisyhteensopivuus arvoulottuvuuksien perusteella. Kokonaisprosentti saattaa siis näyttää erilaiselta kuin yksittäisten teemojen yhteensopivuuksista voisi päätellä.

Teemavertailu ei ota huomioon arvoulottuvuuksia, vaan se on lisätietoa varsinaiseen arvopohjaiseen ehdokassuositukseen. Ajatus on, että varsinaisen suosituksen rinnalla teemavertailu kertoo, mistä aihealueissa ehdokkaan ja käyttäjän välillä on eniten yhtäläisyyksiä tai eroja.

Taustalla on se, että kun vaalikoneen päätuloksen laskeva algoritmi etsii laajemmin samansuuntaisia vastauksia, teemakohtainen tulos lasketaan mittaamalla kunkin teeman kysymysten läheisyyttä käyttäjään. Laskenta antaa yleiskuvan siitä, miten paljon vastaukset teemoittain eroavat.

Millaisia päivityksiä HS:n vaalikoneen algoritmiin on tehty vaalikoneen julkaisun jälkeen?

Vaalikoneessa tuloslaskennan taustalla on tilastollinen analyysi, joka tehdään kaikkien ehdokkaiden vastauksille. Koska ehdokkaiden vastauksia on tullut lisää tai korjattu vaalikoneen julkaisun jälkeen, se tarkoittaa, että uusien vastausten myötä myös analyysi pitää tehdä uudestaan. Tässä tiedot päivityksistä: