Netin vihapuhe­tunnistimia voi harhauttaa helposti kirjoitus­virheillä ja ”rakkaussanoilla”, selvisi Aalto-yliopiston tutkimuksessa: Tekoäly hämääntyi etenkin jos kirjoitti sanoja yhteen - Teknologia | HS.fi
Teknologia

Netin vihapuhe­tunnistimia voi harhauttaa helposti kirjoitus­virheillä ja ”rakkaussanoilla”, selvisi Aalto-yliopiston tutkimuksessa: Tekoäly hämääntyi etenkin jos kirjoitti sanoja yhteen

Välilyöntien poistaminen sanojen välistä osoittautui tehokkaimmaksi keinoksi huijata vihapuheentunnistimia, kertoo Aalto-yliopiston tohtorikoulutettava Tommi Gröndahl.

Vihapuhetta tunnistavia tekoälytyökaluja pystyi hämäämään muun muassa kirjoittamalla lauseen ”I hate you” niin, että poisti sanojen välistä välilyönnit ja lisäsi loppuun sanan ”love”.

Julkaistu: 18.9.2018 13:34

Ihmisten on helppo kiertää vihapuheen suitsemiseen kehitettyjä tekoälytyökaluja, osoittaa Aalto-yliopiston Secure Systems -tutkimusryhmän yhdessä italialaisen Padovan yliopiston kanssa tekemä tutkimus.

Aalto-yliopiston tohtorikoulutettava Tommi Gröndahl kertoo, että kiertäminen onnistui kun tutkijat lisäsivät vihapuheeksi tai loukkaavaksi määriteltyjen kommenttien sekaan muun muassa kirjoitusvirheitä ja neutraaleja sanoja.

Luetuimmat - Auto & Tiede

Luitko jo nämä?