
Aalto-yliopiston tutkijat kehittivät ”vihapuhekoneen” – koneoppimiseen perustuvalla algoritmilla oli vaikeuksia tunnistaa suomenkielistä vihapuhetta
Joukko tietojenkäsittelyn, median ja viestinnän tutkijoita ja soveltajia toteutti kevään 2017 kuntavaalien aikana vihapuheen tunnistamiskampanjan, jossa käytettiin apuna koneoppimiseen perustuvaa algoritmia. Luokittelujärjestelmällä oli tosin vaikeuksia suomen kielen sanamuotojen kanssa. Algoritmilla oli lisäksi varsin rajoittunut kyky tulkita keskustelun tai kommentoinnin kontekstia.
Kampanjan aluksi algoritmia opetettiin tunnistamaan vihapuhetta muun muassa avoimista keskusteluryhmistä saatujen aineistojen perusteella. Algoritmi oppi laskennallisesti vertailemaan, mikä erottaa vihapuhetta sisältävän tekstin ei-vihapuheesta ja kehittämään luokittelujärjestelmän vihapuheelle.
Tämän jälkeen luokittelujärjestelmän avulla seulottiin päivittäin kaikki kunnallisvaaliehdokkaiden tuottama avoin sisältö Facebookissa ja Twitterissä noin kuukautta ennen vaaleja. Ehdokkaiden tilit saatiin kerättyä Ylen vaalikoneaineiston avulla.
Luokittelujärjestelmällä oli kuitenkin vaikeuksia suomen kielen sanamuotojen kanssa. Algoritmilla on lisäksi ihmistä rajoittuneempi kyky tulkita keskustelun tai kommentoinnin kontekstia.
Samoista ongelmista kontekstin ja kirjoitusvirheiden tunnistamisessa on kärsinyt myös Googlen kehittämä, vihapuheen tunnistamiseen keskittynyt Perspective-luokitin, Aalto-yliopiston tiedotteessa todetaan.
Tutkijoiden mukaan vihapuhekone kykenee toimimaan valtavien aineistojen seulojana, joka tuo esiin epäilyttäviä viestejä, mutta vain ihminen voi tehdä lopulliset päätelmät vaadittavista toimenpiteistä.
Vihapuhekone mahdollistaa valtavien tietomassojen seulomisen
– Viranomaisnäkökulmasta toimenpiteitä aiheutti korkeintaan 20 viestiä. Sanojen listaus ei sinänsä ole riittävää, koska merkitys tulee niiden yhdistelystä. Toisaalta meillä ei taas olisi resursseja näin mittavaan seurantaan ilman vihapuhekoneen ja tutkijoiden apua”, kertoo yhdenvertaisuusvaltuutettu Kirsi Pimiä.
– Viestejä luokitellessa tutkija joutuu ottamaan kantaa kieleen ja kontekstiin, minkä vuoksi algoritmin ’opettamiseen’ käytettävää aineistoa on tärkeää käsitellä useamman tulkitsijan voimin”, sanoo Salla-Maaria Laaksonen Helsingin yliopistosta.
Koneen tekijät pyrkivät tunnistamaan ainakin omasta mielestään kaikentyyppisen vihapuheen.
Maahanmuutto ja turvapaikanhakijat ovat usein näkyvimpiä teemoja, mutta yhtä tärkeää on tunnistaa esimerkiksi naisiin, etnisiin vähemmistöihin tai tiettyihin poliittisiin kantoihin kohdistuva vihapuhe, Aalto-yliopiston tiedotteessa todetaan.
– Vihapuhetta on aina ollut olemassa. Sitä on aina tuotettu pönkittämään oman ryhmän asemaa ja syrjimään toisia, mutta sosiaalinen media on tehnyt siitä aikaisempaa näkyvämpää, väittää Reeta Pöyhtäri Tampereen yliopistosta.
– Tunteisiin perustuva ilmaisu ja uskomukset korostuvat, ja niitä myös kierrätetään verkossa. Jos ehdokas esimerkiksi kampanjan aikana poisti kirjoituksensa nopeasti julkaisemisen jälkeen, se saattoi silti jäädä elämään kuvakaappauksena, kuvailee.
Vihapuhetta ei ole mainittu Suomen laissa, ja sen määrittely on tunnetusti vaikeaa. Hankkeessa käytettiin Euroopan neuvoston sekä Ethical Journalism Networkin rakentamaa vihapuhemääritelmää.
Helsingin yliopiston, Tampereen yliopiston ja Aalto-yliopiston hanke kytkeytyy neljään Suomen Akatemian ja Koneen Säätiön rahoittamaan tutkimushankkeeseen.
Suomen Uutiset
Artikkeliin liittyvät aiheet
Mitä mieltä?
Aiheeseen liittyviä artikkeleita


PS: Yhdenvertaisuusvaltuutetulta rahahanat kiinni – ”Puuttuu mielipiteisiin, joista ei itse pidä”

Oikeusministeriö oli mukana rakentamassa järjestelmää, jolla kytättiin vaaliehdokkaiden jokaista someviestiä

Oikeusministeriö pyrki vaikuttamaan kuntavaaleihin – yhdenvertaisuusvaltuutettu vaati puoluesihteeriä poistamaan kampanjamateriaaleja somesta

Halla-aho: Suhteellisuutta vihapuhe- ja valeuutiskeskusteluun
Viikon suosituimmat

Vouti vie pian huumeparonin arvokellot ja loistoauton – Oikeusministerin viesti nuorille: ”Rikos ei kannata”
Hallitusohjelman mukaisesti oikeusministeriö on valmistellut rikoslain muutoksia, joiden tarkoituksena on iskeä vakavan järjestäytyneen rikollisuuden ytimeen. Kotietsintään sekä vangitsemisperusteisiin on tulossa muutoksia ja vääryydellä hankitun mammonan voi menettää valtiolle entistäkin helpommin. Rikos ei siten Suomessa kannata ja tulevaisuudessa vieläkin heikommin.

Punaviherkokoomuslaisten valvoma Helsingin energiayhtiö rahtaa pähkinänkuoria kaukaa Afrikasta – äänestäjä saa taas sitä mitä tilasi
Helsinki on ilmeisen aktiivisesti luopumassa kotimaisen polttoaineen käytöstä kaukolämmön tuotannossa. Energiayhtiö Helen lämmittää pääkaupunkia pähkinänkuorilla, jotka on laivattu Afrikan Norsunluurannikolta asti. Lieneekö kyseessä aito ympäristöteko, vai onko pähkinäralli pelkkää punaviherkokoomuslaisten poliittista hyvesignalointia.

Perussuomalaiset julkaisee uuden voikukka-logon, Purra fiilistelee: ”Tiedättehän tuon kauniin kukkasen, joka kasvaa kaikilla pihoilla ja jota on ihan mahdoton kitkeä”
Perussuomalaiset julkisti päivitetyn logonsa ja uuden sloganin lauantaina puoluetapahtuma Kiihdytysajoissa. Kasvisruoan ystävänä tunnettu puoluejohtaja Riikka Purra korosti myös PS-kukan terveyshyötyjä.

Purra: En halua espanjalaista sosialismia Lindtmanilta, Palestiinan tunnustamista Razmyarilta enkä Tuppuraista neuvottelemaan Saksaan
Puheenjohtaja Riikka Purra piti tänään perussuomalaisten puoluetilaisuudessa energisen puheen, jossa hän täsmensi perussuomalaisten ja SDP:n eroja konkreettisella tavalla.

Kolumni: EU:n ”huippudiili” – Maksa 7 000 miljoonaa euroa, saa 2 000 miljoonaa euroa
Espanjassa on paljastunut, että sosialistihallitus on käyttänyt vuosina 2024–2025 yli kymmenen miljardia euroa EU-elvytysrahoja eläkkeisiin ja valtion sosiaalimenoihin. Siis käytännössä jokapäiväisen kulutuksen paikkaamiseen, kirjoittaa Perussuomalaisen Nuorison varapuheenjohtaja Jyri Tallgren.

Tynkkynen: Vasta Brysselissä tajusin, millainen hirviö EU on – ”Vallan väärinkäyttöä, joka ohittaa demokratian
Perussuomalaisten europarlamentaarikko Sebastian Tynkkynen puhui viikonloppuna Helsingissä puoluetapahtuma Kiihdytysajoissa, ja kertoi, että vasta kahden vuoden työskentely Brysselissä on avannut hänelle silmät sille, kuinka syvälle EU on jo mennyt itsenäisten maiden vallan viemisessä.

Päivän pointti: Ilta-Sanomat kutsui vihreiden eduskuntavaaliehdokkaan arvioimaan perussuomalaisten uutta logoa

Purra ja Rantanen Kiihdytysajoissa: ”Yksikään muu puolue ei tule tekemään maahanmuutolle mitään”
Valtiovarainministeri Riikka Purra ja sisäministeri Mari Rantanen debatoivat maahanmuutosta perussuomalaisten puoluetapahtuma Kiihdytysajojen paneelikeskustelussa.

Työttömyyden kasvu johtuu edellisten hallitusten maahanmuuttopolitiikasta – Mäkelä: Sosialistien opit tuottavat vain kurjuutta ja leipäjonoja
Perussuomalaiset korostaa, että julkisen talouden sopeutustoimet tulee jatkossakin kohdentaa hyvinvointiyhteiskunnan kannalta toissijaisiin kohteisiin. Erilaisten mielipidetiedustelujen mukaan myös suurin osa Suomen kansasta kannattaa menosäästöjen kohdentamisia epäolennaisiin kohteisiin, kuten Yleisradioon ja kehitysapuun.

Ex-kansanedustaja Reijo Tossavaiselle sakot somekommentista: ”Tuomiossa on aika vahva poliittinen vivahde”
Helsingin käräjäoikeus tuomitsi perussuomalaisten entisen kansanedustajan Reijo Tossavaisen kunnianloukkauksesta. Tossavainen oli arvostellut Veronika Honkasalon osallistumista Palestiina-mielenosoitukseen.














