

Google Perspective arvioi verkkokommentteja loukkaavuuden perusteella. Vihapuheeksi alun perin tunnistettu lause läpäisee seulan, kun se sotketaan kirjoitusvirheellä ja sanalla ’rakkaus’. Kuva: Aalto-yliopisto.
Tutkimus: Vihapuhealgoritmeja on helppo huijata – rakkaus ja kielioppivirheet nujertavat koneoppimisenkin
Niin kutsutun vihapuheen ja loukkaavan kommentoinnin hillitsemiseksi on kehitetty automaattisia työkaluja, joiden väitetään tunnistavan verkkopalvelujen sääntöjen vastaisen tai jopa laittoman sisällön. Aalto-yliopiston Secure Systems -tutkimusryhmä on kuitenkin löytänyt parhaistakin koneoppimiseen perustuvista vihapuheentunnistimista merkittäviä heikkouksia.
Aalto-yliopiston tiedotteen mukaan käyttäjien on yllättävän helppo kiertää vihapuheen suitsemiseen kehitettyjä tekoälytyökaluja. Tarkoituksellinen tai tahaton huono kielioppi ja kirjoitusvirheet voivat tehdä vihanlietsonnasta ja loukkauksista tekoälylle vaikeita tunnistaa.
Suomen Uutiset kertoi vuosi sitten Aalto-yliopiston kehittämästä vihapuhekoneesta, jolla silläkin oli ongelmia suomenkielisen vihapuheen tunnistamisessa. Uusi tutkimus osoittaa, että englanninkieliset vihapuhekoneet eivät pärjää sen paremmin.
Ryhmä kokeili seitsemän uuden tunnistamistyökalun tarkkuutta. Kaikki reputtivat testit.
Nykyaikaiset luonnollisen kielen prosessointiin käytetyt mallit pystyvät luokittelemaan tekstiä merkkien, sanojen ja lauseiden piirteiden perusteella. Kun mallit joutuvat analysoimaan tekstidataa, jollaista ei ole käytetty niiden opettamiseen, tulosten laatu alkaa kärsiä.
– Lisäsimme vihapuheeksi tai loukkaavaksi määriteltyjen kommenttien sekaan kirjoitusvirheitä, muokkasimme sanojen rajoja tai lisäsimme joukkoon neutraaleja sanoja. Välilyöntien poistaminen sanojen välistä osoittautui englanninkielisen sisällön manipuloinnissa tehokkaimmaksi. Kaikkia keinoja yhdistelemällä saimme jopa Googlen kommenttien arvottamiseen käyttämän Perspective-työkalun sekaisin”, kertoo Tommi Gröndahl, Aalto-yliopiston tohtorikoulutettava.
Google Perspective luokittelee kommenttien loukkaavuutta tai ”toksisuutta” eri tekstianalyysin menetelmien avulla. Vuonna 2017 Washingtonin yliopiston tutkijat osoittivat, että Perspectiveä voi kuitenkin huijata lisäämällä tekstiin pieniä kirjoitusvirheitä.
Gröndahl havaitsi kollegoineen, että Perspective on sittemmin oppinut tunnistamaan myös kirjoitusvirheet, mutta se on edelleen huijattavissa muunlaisella manipuloinnilla, esimerkiksi poistamalla välilyöntejä ja lisäämällä harmittomia sanoja, kuten love, ’rakkaus’.
Perspectiven ja monen muun edistyneen vihapuheentunnistimen seulan läpäisi esimerkiksi lause ”I hate you” (”minä vihaan sinua”), kun se muokattiin muotoon ”Ihateyou love”.
Konteksti ratkaisee
Tutkijat huomauttavat, että asiayhteys määrittää pitkälti sen, tulkitaanko yksittäinen kommentti vihaksi vai vain asiattomaksi tai mauttomaksi. Vihapuhe on subjektiivista ja kontekstisidonnaista, ja tutkijoiden mukaan pelkät koneelliset tekstianalyysimenetelmät eivät riitä sen tarkkaan tunnistamiseen.
”Ihmiset muuttavat toimintaansa ja alkavat kokeilla eri tapoja kirjoittaa, koska he haluavat välttää kiinnijäämistä. Ollakseen tehokas tekoäly tarvitsee avukseen ihmisen tekemää tulkintaa”, uskoo tutkimusryhmän johtaja, Aalto-yliopiston professori N. Asokan.
Tekstiä analysoivien koneoppimismallien kehittämisessä tulisi tutkijoiden mukaan kiinnittää huomiota mallien opettamiseen käytettävän datan laatuun ja monipuolisuuteen, eikä niinkään mallien rakenteiden hiomiseen.
Ryhmän tulokset osoittavat myös, että vihapuheentunnistimet voisivat olla nykyistä tarkempia, jos ne analysoisivat tekstiä yksittäisten merkkien ja niiden yhdistelmien tasolla. Lisäksi kommenttien kontekstin luokittelua pitäisi saada hienovaraisemmaksi, jotta mallit osaisivat erottaa toisistaan esimerkiksi rasismin, seksismin ja henkilökohtaiset hyökkäykset.
Suomen Uutiset
Artikkeliin liittyvät aiheet
Mitä mieltä?
Viikon suosituimmat


Ideologinen pakkoruokinta alkaa vuonna 2026 – Antikainen: Helsinki kieltää lihan lapsilta
Helsingin kasvatuksen ja koulutuksen toimialan viisivuotissuunnitelman mukaan kouluissa ja päiväkodeissa ei enää tarjota kinkkuleikkeitä vuodesta 2026 alkaen. Vuoteen 2030 mennessä lihaa olisi tarjolla vain kahdesti viikossa ja joka toinen viikko ainoastaan kerran.

Varsinais-Suomen hyvinvointialue päätti: Laittomasti maassa oleville laajemmat terveyspalvelut – perussuomalaiset vastusti
Varsinais-Suomen hyvinvointialueen aluevaltuusto päätti eilen pitää laajemmat terveyspalvelut laittomasti maassa oleville. Suomen hallitus kuitenkin esittää, että viranomaiset rajaavat palveluita hieman. Varha oli jo ottamassa tulevan lakimuutoksen täysimääräisesti huomioon, mutta nyt alue aikoo kuitenkin tarjota laajempia palveluita.

10-vuotias tyttö raiskattiin – protestit vastaanottokeskuksella Dublinissa jatkuvat jo toista iltaa
Dublinissa on ollut väkivaltaisia mellakoita kahtena peräkkäisenä iltana, koska karkotettavaksi määrätyn turvapaikanhakijan epäillään raiskanneen 10-vuotiaan tytön vastaanottokeskuksessa. Poliitikot tuomitsevat mellakoinnin, mutta eivät ole valmiita antamaan kansalaisille mahdollisuutta vaikuttaa maahanmuuttopolitiikkaan väkivallattomin ja demokraattisin keinoin.

Keskusta ja SDP lakkauttamassa Ivalon yöpäivystyksen – vastoin lakia ja alueellista tasa-arvoa
Keskusta synnytti hyvinvointialueet lakeineen, keskittämisasetuksineen ja rahoitusmalleineen. Nyt sama puolue johtaa Lapin hyvinvointialuetta – ja haluaa lakkauttaa Ivalon yöpäivystyksen. Päätös on räikeässä ristiriidassa sen kanssa, mitä keskusta on julkisuudessa väittänyt puolustavansa.

Tanskan suosituin TikTok-tähti muuttaa Syyriaan – sateenkaarilippu lasten koululla oli viimeinen pisara
Tanskan suosituin tiktokkaaja on päättänyt muuttaa pois Tanskasta, koska haluaa lastensa kasvavan paikassa, jonka tavat ja arvot vastaavat hänen omiaan. Viimeinen pisara oli se, kun hän näki sateenkaaren värisiä Pride-lippuja lastensa koulussa. Sellaisessa ympäristössä hän ei halua lastensa kasvavan.

Päivän Pointti: Helsingin Sanomien pääkirjoitus pyrkii keventämään myymälävarkaiden syyllisyyttä – kauppiaiden huolet jäävät varjoon

Pieleen meni valtamedian ennustus: Javier Milei murskavoittoon Argentiinan vaaleissa
Argentiinan presidentti Javier Milei on johtanut puolueensa murskavoittoon sunnuntain välivaaleissa. Kahden ensimmäisen presidenttivuotensa aikana Milei on toteuttanut radikaaleja menoleikkauksia anarkokapitalismin hengessä. Valtamedia ennusti presidentin uudistusllnjalle mahalaskua vaaleissa mutta toisin kävi.

Saksalainen AfD-puolue kasvattaa suosiotaan liittokanslerin ja muiden puolueiden palomuureista huolimatta
Mitä korkeammalle Vaihtoehto Saksalle -puolueen (AfD) suosio kasvaa, sitä kovaäänisemmin vaaditaan sen kieltämistä. Liittokanslerin ja muiden puolueiden boikotoima puolue syyttää hallitusta yrityksestä hiljentää oppositio.

”Ovatko konservatiivit tyhmempiä?” – kysyi oppitunnilla oululaisen lukion yhteiskuntaopin opettaja
Perussuomalainen Nuoriso ja Perussuomalaiset Opiskelijat vaativat kriittistä keskustelua suomalaisen koulujärjestelmän vihervasemmistolaistumisesta.
















