
Aalto-yliopiston tutkijat kehittivät “vihapuhekoneen” – koneoppimiseen perustuvalla algoritmilla oli vaikeuksia tunnistaa suomenkielistä vihapuhetta
Joukko tietojenkäsittelyn, median ja viestinnän tutkijoita ja soveltajia toteutti kevään 2017 kuntavaalien aikana vihapuheen tunnistamiskampanjan, jossa käytettiin apuna koneoppimiseen perustuvaa algoritmia. Luokittelujärjestelmällä oli tosin vaikeuksia suomen kielen sanamuotojen kanssa. Algoritmilla oli lisäksi varsin rajoittunut kyky tulkita keskustelun tai kommentoinnin kontekstia.
Kampanjan aluksi algoritmia opetettiin tunnistamaan vihapuhetta muun muassa avoimista keskusteluryhmistä saatujen aineistojen perusteella. Algoritmi oppi laskennallisesti vertailemaan, mikä erottaa vihapuhetta sisältävän tekstin ei-vihapuheesta ja kehittämään luokittelujärjestelmän vihapuheelle.
Tämän jälkeen luokittelujärjestelmän avulla seulottiin päivittäin kaikki kunnallisvaaliehdokkaiden tuottama avoin sisältö Facebookissa ja Twitterissä noin kuukautta ennen vaaleja. Ehdokkaiden tilit saatiin kerättyä Ylen vaalikoneaineiston avulla.
Luokittelujärjestelmällä oli kuitenkin vaikeuksia suomen kielen sanamuotojen kanssa. Algoritmilla on lisäksi ihmistä rajoittuneempi kyky tulkita keskustelun tai kommentoinnin kontekstia.
Samoista ongelmista kontekstin ja kirjoitusvirheiden tunnistamisessa on kärsinyt myös Googlen kehittämä, vihapuheen tunnistamiseen keskittynyt Perspective-luokitin, Aalto-yliopiston tiedotteessa todetaan.
Tutkijoiden mukaan vihapuhekone kykenee toimimaan valtavien aineistojen seulojana, joka tuo esiin epäilyttäviä viestejä, mutta vain ihminen voi tehdä lopulliset päätelmät vaadittavista toimenpiteistä.
Vihapuhekone mahdollistaa valtavien tietomassojen seulomisen
– Viranomaisnäkökulmasta toimenpiteitä aiheutti korkeintaan 20 viestiä. Sanojen listaus ei sinänsä ole riittävää, koska merkitys tulee niiden yhdistelystä. Toisaalta meillä ei taas olisi resursseja näin mittavaan seurantaan ilman vihapuhekoneen ja tutkijoiden apua”, kertoo yhdenvertaisuusvaltuutettu Kirsi Pimiä.
– Viestejä luokitellessa tutkija joutuu ottamaan kantaa kieleen ja kontekstiin, minkä vuoksi algoritmin ’opettamiseen’ käytettävää aineistoa on tärkeää käsitellä useamman tulkitsijan voimin”, sanoo Salla-Maaria Laaksonen Helsingin yliopistosta.
Koneen tekijät pyrkivät tunnistamaan ainakin omasta mielestään kaikentyyppisen vihapuheen.
Maahanmuutto ja turvapaikanhakijat ovat usein näkyvimpiä teemoja, mutta yhtä tärkeää on tunnistaa esimerkiksi naisiin, etnisiin vähemmistöihin tai tiettyihin poliittisiin kantoihin kohdistuva vihapuhe, Aalto-yliopiston tiedotteessa todetaan.
– Vihapuhetta on aina ollut olemassa. Sitä on aina tuotettu pönkittämään oman ryhmän asemaa ja syrjimään toisia, mutta sosiaalinen media on tehnyt siitä aikaisempaa näkyvämpää, väittää Reeta Pöyhtäri Tampereen yliopistosta.
– Tunteisiin perustuva ilmaisu ja uskomukset korostuvat, ja niitä myös kierrätetään verkossa. Jos ehdokas esimerkiksi kampanjan aikana poisti kirjoituksensa nopeasti julkaisemisen jälkeen, se saattoi silti jäädä elämään kuvakaappauksena, kuvailee.
Vihapuhetta ei ole mainittu Suomen laissa, ja sen määrittely on tunnetusti vaikeaa. Hankkeessa käytettiin Euroopan neuvoston sekä Ethical Journalism Networkin rakentamaa vihapuhemääritelmää.
Helsingin yliopiston, Tampereen yliopiston ja Aalto-yliopiston hanke kytkeytyy neljään Suomen Akatemian ja Koneen Säätiön rahoittamaan tutkimushankkeeseen.
Suomen Uutiset
Artikkeliin liittyvät aiheet
Mitä mieltä?
Aiheeseen liittyviä artikkeleita


PS: Yhdenvertaisuusvaltuutetulta rahahanat kiinni – “Puuttuu mielipiteisiin, joista ei itse pidä”

Oikeusministeriö oli mukana rakentamassa järjestelmää, jolla kytättiin vaaliehdokkaiden jokaista someviestiä

Oikeusministeriö pyrki vaikuttamaan kuntavaaleihin – yhdenvertaisuusvaltuutettu vaati puoluesihteeriä poistamaan kampanjamateriaaleja somesta

Halla-aho: Suhteellisuutta vihapuhe- ja valeuutiskeskusteluun
Viikon suosituimmat

Helsingin teologisessa tiedekunnassa opiskeleva nainen kirjoitti loppuesseeseensä sanan “islamisaatio”, ja bumerangihan siitä tuli – “Ei voida arvostella”
Opiskelija käytti tenttivastauksensa yhdessä osassa sanaa ”islamisaatio.” Tentaattori ilmoitti, ettei tenttivastausta voi arvioida, koska siinä esiintyi termi, joka ei yliopiston mielestä ollut "akateemisesti vakiintunut". Tapaus osuu tieteenteon ytimeen. Opiskelija oli ehdottanut islamisaatiota jatkotutkimuksen aiheeksi. Jos jotakin väitettyä tai oletettua ilmiötä ei saa ehdottaa edes tutkimuskohteeksi siksi, että ilmiö ei ole ”akateemisesti vakiintunut”, putoaa tutkimukselta pohja. Yliopistojen tehtävä kun on juurikin tutkia sitä, mikä ei ole vielä tiedossa.

Valkoisen teinin tappajasta tuli Amerikan mustien sankari
Texasissa nuorten miesten nujakka päättyi toisen nuoren kuolemaan, koska musta nuorukainen oli tuonut koulun urheilukisoihin repussaan veitsen ja päätti käyttää sitä. Nyt valkoisen teinipojan tappajasta on tullut Amerikan mustien sankari, jolle ihmiset ovat lahjoittaneet jo yli puoli miljoonaa dollaria.

Hallitus harkitsee vakavasti palkkojen veroalea – SAK, jonka pitäisi olla duunareiden puolella, aloitti heti neliraajajarrutuksen: Vastustaa työntekijöiden ostovoiman vahvistamista
SAK ja ay-liike laajemminkin on jyrkästi asettunut vastustamaan hallituksen kaavailemaa ansiotuloverotuksen keventämistä - siitäkin huolimatta, että matalampi verotus tarkoittaa enemmän käteen jäävää vastiketta työn tekemisestä. Kokonaisuudessa kannattaa huomata, että vaikka veronalennukset hyödyttävätkin työntekijää ja lisäävät ostovoimaa, liitot eivät veronalennuksista hyödy mitään.

Hallitus päätti tuhdista veronalennuksesta duunareille: Työn teosta jää jatkossa entistä enemmän rahaa käteen
Työn tekemisestä tulee Suomessa entistä kannattavampaa. Hallitus on päättänyt, että verotus kevenee pieni- ja keskituloisilla 525 miljoonaa euroa jo vuonna 2026 ja kevennys nousee 650 miljoonaan euroon seuraavana vuonna eli vuonna 2027.

Ilmastonmuutos oli päivänpolttava puheenaihe jo 1600-luvulla
Ilmastokeskustelu muistuttaa tänään monin tavoin 1600-luvulla käytyjä väittelyitä ja käsityksemme ilmastonmuutoksesta peilaavat yllättävällä tavalla ikivanhoja ajatuksellisia rintamalinjoja. Yhdet vaativat kulutuksen vähentämistä, toiset uskovat vihreään teknologiaan ja kolmannet kieltävät kokonaan ihmisen vaikutuksen ilmastoon.

Näin käy, kun jengit ottavat vallan yhteiskunnassa: Haiti totaalisen romahduksen partaalla
Rikollisjengit ovat käytännössä kaapanneet vallan maailman köyhimpiin kuuluvassa maassa. Haiti on maan YK-suurlähettilään mukaan lähellä tilannetta, ”josta ei ole paluuta”. Vain pikainen ulkovaltojen puuttuminen kaaokseen voisi nykäistä saarivaltion pois kuilun reunalta.

Ruuan arvonlisävero laskee – kuluttajan ostovoima vahvistuu
Arvonlisäverotusta kevennetään alentamalla 14 prosentin arvonlisäverokantaan kuuluvien hyödykkeiden verokanta 13,5 prosenttiin vuodesta 2026 alkaen, valtiovarainministeri Riikka Purra kertoi keskiviikkoiltana hallituksen puoliväliriihen tiedotustilaisuudessa.

Brittipoliisi varoitti miestä kadulla: “puhu englantia”-kehotus voi olla viharikos
Newsweek-lehti uutisoi maailmalla leviävästä videosta, jolla brittipoliisi varoittaa miestä: Kehotus vaatia toista ihmistä "puhumaan englantia" voi olla tulkittavissa vihapuheeksi. Tapauksesta syntyi kohu, sillä video antaa lohduttoman kuvan sananvapauden tilasta Isossa-Britanniassa. Videon taustoista tiedetään kuitenkin rajallisesti. Myös poliisi on ollut verrattain vaitonainen tapahtuneesta.

Valtiovarainministeri Riikka Purra: Joko saataisiin veroja oikeaan suuntaan ja kasvu liikkeelle Suomessakin?
Perussuomalaisten puheenjohtaja, valtiovarainministeri Riikka Purra postaa veroista Facebookissa ja viestipalvelu X:ssä. Purran mukaan Suomi häviää verojen ja talouskasvun Ruotsi-maaottelun.

Ministeri Ranne: Asfaltti tuoksuu taas tänä kesänä – ”Tiehankkeet työllistävät nimenomaan suomalaisia”
Liikenne- ja viestintäministeri Lulu Ranne kertoo, että teitä korjataan taas ennätystahtiin perussuomalaisten vahtivuorolla.