Puheen luovuttamiselle on laadittava selkeät pelisäännöt

Puhe on hyvin henkilökohtaista, ja se kertoo meistä paljon. Sen vuoksi yritysten keräämän puhetiedon käytön on oltava lailla suojattua.

Tammikuussa 2021 ruotsalainen musiikin suoratoistopalvelu Spotify sai patentin puhetta analysoivalle ohjelmalleen. Se tunnistaa puhelimen kautta tallennetusta ihmisäänestä käyttäjän tunnetilan, sukupuolen, iän ja aksentin. Tietoja hyödyntäen Spotifyn algoritmit voisivat ehdottaa asiakkaalle uutta kuunneltavaa.

Palvelu kuulostaa harmittomalta, mutta tieto- ja yksityisyydensuojan kannalta kuluttaja joutuisi uudelle alueelle. Kun puheanalyysin tuloksiin yhdistetään käyttäjän kuunteluhistoria ja hänen ystäviensä musiikkimaku, yhtiö saa paitsi valtavasti dataa käyttäjistään, myös mahdollisuuden manipuloida kuluttajien tunteita tarjoamalla tietyntyyppistä musiikkia.

Myös verkkokauppa Amazon on kehittänyt algoritmin, jota patentin mukaan käytetään keräämään tietoa puhujien koetusta sukupuolesta, iästä, etnisestä alkuperästä, terveydestä ja tunteista.

Tiedot tällaisista hankkeista ovat herättäneet huolta ja keskustelua. Varsinkin, kun teknologiayritykset eivät mielellään kerro, mihin kaikkeen ne keräämäänsä tietoa käyttävät.

Puhe on tulevaisuudessa yhä tärkeämpi osa digitaalisia palveluita ja hyödykkeitä. Synteettistä puheääntä ei juuri erota aidosta, ja myös puheanalyysi kehittyy vauhdilla. Mitä nopeammin ääniperustaiset sovellukset ja käyttöliittymät yleistyvät, sitä enemmän tietoa itsestämme me luovutamme palvelujen tuottajille ja laitteiden valmistajille.

Puhe kertoo meistä paljon: se viestii ajatuksia, tunteita ja mielentiloja. Se sisältää tietoa kehon toiminnoista ja sairauksista. Etninen tausta sekä luokka- ja kulttuurierot paljastuvat puheen rytmissä, voimakkuudessa, painotuksissa ja sävelkorkeuden vaihteluissa. Äänteet, aksentit ja intonaatiot ovat osa identiteettiämme.

Toisaalta äänidataa on tarpeen kerätä monipuolisesti, jotta tekniikka toimisi mahdollisimman luotettavasti. Esimerkiksi Lahjoita puhetta -kampanjan avulla on tarkoitus kehittää suomenkielistä puheentunnistusta.

Yksi ongelma on puheen rikkaus, vivahteikkuus ja monimerkityksellisyys. Sen vuoksi puheentunnistus on väistämättä epätarkkaa. Karkea puheanalyysi yhdistettynä kuluttajia tyypitteleviin algoritmeihin tuottaa yksilötasolla helposti harhaan osuvaa ja stereotyyppistä tietoa käyttäjistä.

Toinen huolenaihe on, että oppivat deepfake-algoritmit osaavat jo muokata ja mallintaa puhetta hyvin uskottavasti. Tulevaisuudessa identiteettivarkaudet perustunevat yhä useammin ihmisten luovuttamaan puheeseen. Myös puheentunnistukseen perustuvien palvelujen väärinkäyttö kaapattujen tai syntetisoitujen äänten avulla on mahdollista.

Äänipalvelujen arkipäiväistyessä saatamme tulla liian huolettomiksi puheen suhteen. Tekstiviestien ja omakuvien lisäksi meidän pitää miettiä, millaisella äänellä luomme vaikutelmia itsestämme. Saatamme jopa omaksua erilaisia puhetapoja eri palveluja varten. Julkisilla paikoilla, kotona ja työpaikoilla meitä mahdollisesti kuuntelevat laitteet ovat omiaan lisäämään epämukavuutta, epäluuloja ja epäluottamusta.

Lisäksi on havaittu, että mitä inhimillisemmiltä tekoälylaitteet vaikuttavat, sitä avoimemmin me puhumme niille tunteistamme, kehostamme, ajatuksistamme ja mielentiloistamme. Ihmisellä on tarve ja halu inhimillistää muita olioita, niin elollisia kuin elottomiakin. Tätä varten kehitetään jo algoritmeja, jotka osaavat suodattaa arkaluonteista informaatiota tallennetusta puheesta.

Kaikkia riskejä emme pysty vielä kuvittelemaan. Siksi on tärkeää, että puheen käytölle luodaan eettiset ja juridiset pelisäännöt, joissa huomioidaan, miten moniulotteista informaatiota puhe voi sisältää.

Puhe, kuten muutkin biometriset tiedot, on hyvin henkilökohtaista, ja sen kerääminen sekä kaupallinen ja viranomaiskäyttö tulee olla lailla suojattua. Viime kädessä kyse on siitä, omistammeko me oman äänemme vai omistaako sen joku muu.

Pertti Grönholm ja Kimi Kärki

Kirjoittajat ovat dosentteja Turun yliopiston historian, kulttuurin ja taiteiden tutkimuksen laitoksella.

