Netin vihapuhetunnistimia voi harhauttaa helposti kirjoitusvirheillä ja ”rakkaussanoilla”, selvisi Aalto-yliopiston tutkimuksessa: Tekoäly hämääntyi etenkin jos kirjoitti sanoja yhteen
Välilyöntien poistaminen sanojen välistä osoittautui tehokkaimmaksi keinoksi huijata vihapuheentunnistimia, kertoo Aalto-yliopiston tohtorikoulutettava Tommi Gröndahl.
Vihapuhetta tunnistavia tekoälytyökaluja pystyi hämäämään muun muassa kirjoittamalla lauseen ”I hate you” niin, että poisti sanojen välistä välilyönnit ja lisäsi loppuun sanan ”love”.Kuva: Kimmo Taskinen / HS
Antti Tiainen HS
18.9.2018 13:34
Ihmisten on helppo kiertää vihapuheen suitsemiseen kehitettyjä tekoälytyökaluja, osoittaa Aalto-yliopiston Secure Systems -tutkimusryhmän yhdessä italialaisen Padovan yliopiston kanssa tekemä tutkimus.
Aalto-yliopiston tohtorikoulutettava Tommi Gröndahl kertoo, että kiertäminen onnistui kun tutkijat lisäsivät vihapuheeksi tai loukkaavaksi määriteltyjen kommenttien sekaan muun muassa kirjoitusvirheitä ja neutraaleja sanoja.
Artikkeliin liittyviä aiheita