
Aalto-yliopiston tutkijat kehittivät ”vihapuhekoneen” – koneoppimiseen perustuvalla algoritmilla oli vaikeuksia tunnistaa suomenkielistä vihapuhetta
Joukko tietojenkäsittelyn, median ja viestinnän tutkijoita ja soveltajia toteutti kevään 2017 kuntavaalien aikana vihapuheen tunnistamiskampanjan, jossa käytettiin apuna koneoppimiseen perustuvaa algoritmia. Luokittelujärjestelmällä oli tosin vaikeuksia suomen kielen sanamuotojen kanssa. Algoritmilla oli lisäksi varsin rajoittunut kyky tulkita keskustelun tai kommentoinnin kontekstia.
Kampanjan aluksi algoritmia opetettiin tunnistamaan vihapuhetta muun muassa avoimista keskusteluryhmistä saatujen aineistojen perusteella. Algoritmi oppi laskennallisesti vertailemaan, mikä erottaa vihapuhetta sisältävän tekstin ei-vihapuheesta ja kehittämään luokittelujärjestelmän vihapuheelle.
Tämän jälkeen luokittelujärjestelmän avulla seulottiin päivittäin kaikki kunnallisvaaliehdokkaiden tuottama avoin sisältö Facebookissa ja Twitterissä noin kuukautta ennen vaaleja. Ehdokkaiden tilit saatiin kerättyä Ylen vaalikoneaineiston avulla.
Luokittelujärjestelmällä oli kuitenkin vaikeuksia suomen kielen sanamuotojen kanssa. Algoritmilla on lisäksi ihmistä rajoittuneempi kyky tulkita keskustelun tai kommentoinnin kontekstia.
Samoista ongelmista kontekstin ja kirjoitusvirheiden tunnistamisessa on kärsinyt myös Googlen kehittämä, vihapuheen tunnistamiseen keskittynyt Perspective-luokitin, Aalto-yliopiston tiedotteessa todetaan.
Tutkijoiden mukaan vihapuhekone kykenee toimimaan valtavien aineistojen seulojana, joka tuo esiin epäilyttäviä viestejä, mutta vain ihminen voi tehdä lopulliset päätelmät vaadittavista toimenpiteistä.
Vihapuhekone mahdollistaa valtavien tietomassojen seulomisen
– Viranomaisnäkökulmasta toimenpiteitä aiheutti korkeintaan 20 viestiä. Sanojen listaus ei sinänsä ole riittävää, koska merkitys tulee niiden yhdistelystä. Toisaalta meillä ei taas olisi resursseja näin mittavaan seurantaan ilman vihapuhekoneen ja tutkijoiden apua”, kertoo yhdenvertaisuusvaltuutettu Kirsi Pimiä.
– Viestejä luokitellessa tutkija joutuu ottamaan kantaa kieleen ja kontekstiin, minkä vuoksi algoritmin ’opettamiseen’ käytettävää aineistoa on tärkeää käsitellä useamman tulkitsijan voimin”, sanoo Salla-Maaria Laaksonen Helsingin yliopistosta.
Koneen tekijät pyrkivät tunnistamaan ainakin omasta mielestään kaikentyyppisen vihapuheen.
Maahanmuutto ja turvapaikanhakijat ovat usein näkyvimpiä teemoja, mutta yhtä tärkeää on tunnistaa esimerkiksi naisiin, etnisiin vähemmistöihin tai tiettyihin poliittisiin kantoihin kohdistuva vihapuhe, Aalto-yliopiston tiedotteessa todetaan.
– Vihapuhetta on aina ollut olemassa. Sitä on aina tuotettu pönkittämään oman ryhmän asemaa ja syrjimään toisia, mutta sosiaalinen media on tehnyt siitä aikaisempaa näkyvämpää, väittää Reeta Pöyhtäri Tampereen yliopistosta.
– Tunteisiin perustuva ilmaisu ja uskomukset korostuvat, ja niitä myös kierrätetään verkossa. Jos ehdokas esimerkiksi kampanjan aikana poisti kirjoituksensa nopeasti julkaisemisen jälkeen, se saattoi silti jäädä elämään kuvakaappauksena, kuvailee.
Vihapuhetta ei ole mainittu Suomen laissa, ja sen määrittely on tunnetusti vaikeaa. Hankkeessa käytettiin Euroopan neuvoston sekä Ethical Journalism Networkin rakentamaa vihapuhemääritelmää.
Helsingin yliopiston, Tampereen yliopiston ja Aalto-yliopiston hanke kytkeytyy neljään Suomen Akatemian ja Koneen Säätiön rahoittamaan tutkimushankkeeseen.
Suomen Uutiset
Artikkeliin liittyvät aiheet
Mitä mieltä?
Aiheeseen liittyviä artikkeleita


PS: Yhdenvertaisuusvaltuutetulta rahahanat kiinni – ”Puuttuu mielipiteisiin, joista ei itse pidä”

Oikeusministeriö oli mukana rakentamassa järjestelmää, jolla kytättiin vaaliehdokkaiden jokaista someviestiä

Oikeusministeriö pyrki vaikuttamaan kuntavaaleihin – yhdenvertaisuusvaltuutettu vaati puoluesihteeriä poistamaan kampanjamateriaaleja somesta

Halla-aho: Suhteellisuutta vihapuhe- ja valeuutiskeskusteluun
Viikon suosituimmat

Teemu Keskisarjan kolumni: Aatu Arjalainen ja Nahom Hagos – kumpi on todempi uhka?

Someen jaettu pahoinpitely nostatti espanjalaisten raivon – afrikkalaisjengin ja paikallisten yhteenotot ovat jatkuneet yli viikonlopun
Paikallisten asukkaiden ja afrikkalaisjengin väliset väkivaltaisuudet ovat jatkuneet jo kolmatta yötä espanjalaisessa pikkukaupungissa. Taustalla ovat sosiaaliset ongelmat ja uskonnollinen eripura, joiden sanotaan olevan hallitsemattoman maahanmuuton seurausta. ”On aika panna vastaan ennen kuin on liian myöhäistä”, tulkitsee asukas paikallisten tuntoja.

Antikainen: Purra pisti komission herroille luun kurkkuun Brysselissä
Euroopan komissio on jälleen nostanut esiin ajatuksen uudesta EU:n yhteisvelasta. Toisin kuin vuonna 2021, jolloin valtiovarainministerinä toiminut keskustan Annika Saarikko hyväksyi EU:n elpymispaketin mukisematta, nyt valtionvarainministerinä on Riikka Purra, joka pisti Brysselissä EU-herroille luun kurkkuun ja sanoi: ei käy.

Päivän pointti: Missä Suomi-median logiikka Teksasin tulvauutisoinnissa? Väittää ehdotettujen menoleikkauksien vaikuttaneen ennen kuin niitä on tehty

Riippumattomalta medialta yläpeukkua Teemu Keskisarjan ehdotukselle Yle-veron uudelleenohjauksesta – pitkällä tähtäimellä kaiken median tulisi kuitenkin toimia markkinaehtoisesti
Aidosti riippumattomat ja itsenäiset media-alan tekijät pitävät ongelmallisena nykyistä Yle-veromallia, jonka turvin Yleisradio syö tilaa mediakentältä. Kansanedustaja Teemu Keskisarjan esitys Yle-veron uudelleenkohdistamisesta toisi mukaan kilpailua mediakentälle, sekä palauttaisi osittaisen protestoinnin mahdollisuuden kansalle.

Yliopistonlehtori emerita ajattelee liberaalilaatikon ulkopuolelta: Pakkoinkluusio ei toimi missään – ei kouluissa, työpaikoilla eikä maahanmuuttopolitiikassa
Voiko yliopistolla työskennellä ja luoda uraa, vaikka tunnustautuu kristityksi tai konservatiiviksi? Saako tieteentekijä vastustaa aborttia, pitää Israelin puolta ja puhua ääneen islamisaation luomasta uhkasta länsimaille? Kyllä, se on mahdollista, mutta ei mutkatonta. Ja ehkä siksi niin harvinaista.

Poliittinen myrsky Teksasin tulvien ympärillä yltyy: Lastenlääkäri sai potkut mauttoman somepäivityksen vuoksi
Teksasin tuhoisat tulvat ovat synnyttäneet Yhdysvalloissa paitsi valtavan inhimillisen tragedian, myös kiivaan poliittisen keskustelun. Useat liberaalit vaikuttajat ja demokraattisen puolueen keskeiset henkilöt ovat joutuneet rajun arvostelun kohteeksi syytettyään presidentti Donald Trumpia ja republikaanipuoluetta tulvien aiheuttamista vahingoista ja kuolemista.

Hallitus selvittää maahanmuuttajien arvot: ”Lupa asua Ruotsissa ei kuulu ihmisoikeuksiin”
Maahanmuutto- ja integraatiopolitiikan pitää perustus tosiasioihin, ei näppituntumaan saatikka oletuksiin. Näin ajattelee tuore opetus- ja integraatioministeri Simona Mohamsson (ent. Mohammad). Yhteiset tasavertaisuuteen perustuvat arvot on hyväksyttävä, sillä ”lupa asua Ruotsissa ei kuulu ihmisoikeuksiin”.

Päivän pointti: Toksinen vallankäyttö, toiminnan ristiriitaisuudet ja kasvava tyytymättömyys Pride-liikkeen sisällä herättävät pohtimaan, joko Pride-aikakausi on tullut päätökseensä

Työelämägallup: Vain vajaa puolet ammattiliiton jäsenistä tietää, että työttömyysturva ei edellytä liiton jäsenyyttä
Ammattiliittoon kuuluminen ei itsessään takaa turvaa työttömyyden varalta. Turvan takaa työttömyyskassan jäsenyys. Tämä ei ole selvää läheskään kaikille ammattiliittojen jäsenille.