
Aalto-yliopiston tutkijat kehittivät ”vihapuhekoneen” – koneoppimiseen perustuvalla algoritmilla oli vaikeuksia tunnistaa suomenkielistä vihapuhetta
Joukko tietojenkäsittelyn, median ja viestinnän tutkijoita ja soveltajia toteutti kevään 2017 kuntavaalien aikana vihapuheen tunnistamiskampanjan, jossa käytettiin apuna koneoppimiseen perustuvaa algoritmia. Luokittelujärjestelmällä oli tosin vaikeuksia suomen kielen sanamuotojen kanssa. Algoritmilla oli lisäksi varsin rajoittunut kyky tulkita keskustelun tai kommentoinnin kontekstia.
Kampanjan aluksi algoritmia opetettiin tunnistamaan vihapuhetta muun muassa avoimista keskusteluryhmistä saatujen aineistojen perusteella. Algoritmi oppi laskennallisesti vertailemaan, mikä erottaa vihapuhetta sisältävän tekstin ei-vihapuheesta ja kehittämään luokittelujärjestelmän vihapuheelle.
Tämän jälkeen luokittelujärjestelmän avulla seulottiin päivittäin kaikki kunnallisvaaliehdokkaiden tuottama avoin sisältö Facebookissa ja Twitterissä noin kuukautta ennen vaaleja. Ehdokkaiden tilit saatiin kerättyä Ylen vaalikoneaineiston avulla.
Luokittelujärjestelmällä oli kuitenkin vaikeuksia suomen kielen sanamuotojen kanssa. Algoritmilla on lisäksi ihmistä rajoittuneempi kyky tulkita keskustelun tai kommentoinnin kontekstia.
Samoista ongelmista kontekstin ja kirjoitusvirheiden tunnistamisessa on kärsinyt myös Googlen kehittämä, vihapuheen tunnistamiseen keskittynyt Perspective-luokitin, Aalto-yliopiston tiedotteessa todetaan.
Tutkijoiden mukaan vihapuhekone kykenee toimimaan valtavien aineistojen seulojana, joka tuo esiin epäilyttäviä viestejä, mutta vain ihminen voi tehdä lopulliset päätelmät vaadittavista toimenpiteistä.
Vihapuhekone mahdollistaa valtavien tietomassojen seulomisen
– Viranomaisnäkökulmasta toimenpiteitä aiheutti korkeintaan 20 viestiä. Sanojen listaus ei sinänsä ole riittävää, koska merkitys tulee niiden yhdistelystä. Toisaalta meillä ei taas olisi resursseja näin mittavaan seurantaan ilman vihapuhekoneen ja tutkijoiden apua”, kertoo yhdenvertaisuusvaltuutettu Kirsi Pimiä.
– Viestejä luokitellessa tutkija joutuu ottamaan kantaa kieleen ja kontekstiin, minkä vuoksi algoritmin ’opettamiseen’ käytettävää aineistoa on tärkeää käsitellä useamman tulkitsijan voimin”, sanoo Salla-Maaria Laaksonen Helsingin yliopistosta.
Koneen tekijät pyrkivät tunnistamaan ainakin omasta mielestään kaikentyyppisen vihapuheen.
Maahanmuutto ja turvapaikanhakijat ovat usein näkyvimpiä teemoja, mutta yhtä tärkeää on tunnistaa esimerkiksi naisiin, etnisiin vähemmistöihin tai tiettyihin poliittisiin kantoihin kohdistuva vihapuhe, Aalto-yliopiston tiedotteessa todetaan.
– Vihapuhetta on aina ollut olemassa. Sitä on aina tuotettu pönkittämään oman ryhmän asemaa ja syrjimään toisia, mutta sosiaalinen media on tehnyt siitä aikaisempaa näkyvämpää, väittää Reeta Pöyhtäri Tampereen yliopistosta.
– Tunteisiin perustuva ilmaisu ja uskomukset korostuvat, ja niitä myös kierrätetään verkossa. Jos ehdokas esimerkiksi kampanjan aikana poisti kirjoituksensa nopeasti julkaisemisen jälkeen, se saattoi silti jäädä elämään kuvakaappauksena, kuvailee.
Vihapuhetta ei ole mainittu Suomen laissa, ja sen määrittely on tunnetusti vaikeaa. Hankkeessa käytettiin Euroopan neuvoston sekä Ethical Journalism Networkin rakentamaa vihapuhemääritelmää.
Helsingin yliopiston, Tampereen yliopiston ja Aalto-yliopiston hanke kytkeytyy neljään Suomen Akatemian ja Koneen Säätiön rahoittamaan tutkimushankkeeseen.
Suomen Uutiset
Artikkeliin liittyvät aiheet
Mitä mieltä?
Aiheeseen liittyviä artikkeleita


PS: Yhdenvertaisuusvaltuutetulta rahahanat kiinni – ”Puuttuu mielipiteisiin, joista ei itse pidä”

Oikeusministeriö oli mukana rakentamassa järjestelmää, jolla kytättiin vaaliehdokkaiden jokaista someviestiä

Oikeusministeriö pyrki vaikuttamaan kuntavaaleihin – yhdenvertaisuusvaltuutettu vaati puoluesihteeriä poistamaan kampanjamateriaaleja somesta

Halla-aho: Suhteellisuutta vihapuhe- ja valeuutiskeskusteluun
Viikon suosituimmat

Maahanmuuttajaperheelle yli 4 000 euroa puhtaana käteen – Lehtinen: Tuollaisiin palkkasummiin on haastavaa päästä suomalaisellekin
Kelan julkaisemien tilastojen mukaan Espoossa ja Vantaalla jo noin puolet toimeentulotukea saavista on vieraskielisiä. Suomessa esimerkiksi viiden lapsen perhe saa erilaisina tukina puhtaana käteen lähes 4 500 euroa, minkä lisäksi vuokrat sekä sähkö- ja vesilaskut hoidetaan valtion kassasta. Perussuomalaisten kansanedustaja Rami Lehtinen tyrmää nykyisen järjestelmän, joka on tehnyt veronmaksajista ulkomaalaisten elättäjiä.

Hyvinvointialue majoittaa maahanmuuttajia miljoonahuvilassa Tampereella – Vigelius: ”Käsittämätöntä”
Maahanmuuttajia on majoitettu arvokiinteistössä Tampereen Pyhäjärven rantatontilla noin vuoden ajan. Tamperelainen kansanedustaja ja perussuomalaisten 2. varapuheenjohtaja Joakim Vigelius on tiedosta tyrmistynyt.

Yle julkaisee valejuttuja, lokaa valheillaan Purraa – tällaisilla perusteilla Yle kieltäytyy korjaamasta tympeitä virheitään
Jo vuosikausien ajan Yleisradio on pitänyt linjanaan, että ”väestönvaihto”-sanan käyttäminen on varma merkki äärioikeistolaisesta salaliittoteoriasta. Tämä näkemys on itsessään kiistanalainen, mutta Ylen uuden tulkinnan mukaan nyt myös ”väestön vaihtuminen”-sanojen käyttäminen tarkoittaa tukea äärioikeistolaiselle salaliittoteorialle. Termiä on aiemmin pidetty neutraalina ja Yle käyttää sitä itsekin. Valtiovarainministeri Riikka Purra syyttää nyt Yleä valehtelusta. Sosiaalisessa mediassa Ylen uutistoimituksen uusi linjaus herättää suurta kummastusta. Erityisavustaja Matias Turkkila kirjoittaa.

Nuori ukrainalaisnainen tapettiin julmasti Yhdysvalloissa – vasemmistolaiset huolissaan rasismista
Ukrainalaisen pakolaisnaisen julma surma on järkyttänyt ihmisiä Yhdysvalloissa. Oikeistolaiset ovat huolissaan mustan miehen silmittömästä väkivallasta nuorta naista kohtaan. Vasemmistolaiset puolestaan ovat huolissaan rasismista: heidän mukaansa veriteko johtuu mistä tahansa muusta kuin demokraattien ajamasta löyhästä rangaistuslinjasta. Suomen media taas yrittää kehystää presidentti Trumpin pahantekijäksi.

Mistä väestönvaihdossa on oikeasti kyse – Ylen ja Ilta-Sanomien faktantarkistajilla faktat hukassa ja lähteet kateissa
Valtamedia on jauhanut viikkokaupalla villejä spekulaatioita salaliittoteorioista sen jälkeen, kun perussuomalaisten Teemu Keskisarja puhui väestönvaihdosta. Tosiasiassa väestönvaihdossa ei ole sen enempää salaista kuin liittoakaan, ja teorian sijaan se on paremminkin havainto. Väestönvaihto käsitteenä muistuttaa huonon maahanmuuttopolitiikan pitkävaikutteisista ja käytännössä peruuttamattomista vaikutuksista.

Tavallinen kansa suree, vasemmistolaiset riemuitsevat Charlie Kirkin kuolemasta – salamurhaaja yhä karkuteillä
Charlie Kirkin salamurhaaja on yhä pakosalla, mutta FBI:llä on johtolankoja. Vasemmistolaiset kaikkialla maailmassa ovat ilmaisseet ilonsa Kirkin kuolemasta. Suomen media vetää tietenkin esiin Hitler-kortin. Presidentti Trump lupaa hallintonsa etsivän kaikki terrorismin tukijat ja rahoittajat.

Mielenterveystyötä tekevä järjestö antoi 400 000 euron pääomalainan yksityiselle ravintolayhtiölle – samaan aikaan järjestöpomo valitettelee lisäresurssien puutetta
Mieli ry:n puheenjohtaja harmitteli Helsingin Sanomille, että hallituksen säästöt vaikeuttavat järjestöjen mahdollisuutta auttaa. Samaan aikaan Mieli ry:lla on kuitenkin ollut satojen tuhansien eurojen edestä ylimääräistä rahaa yksityisen ravintolatoiminnan tukemiseen.

Vieraskielisten Kela-tukiin hupenee jo yli miljardi euroa vuodessa – Perussuomalaiset: ”Sietämätöntä”
Monet poliitikot oikealta vasemmalle - ja myös mediassa esiintyvät tutkijat hokevat viikosta toiseen, kuinka maahanmuuton lisääminen muka olisi välttämätöntä julkisen talouden rahoittamiseksi. Kelan tuoreet luvut vieraskielisten osuudesta tukien saajina kuitenkin paljastavat karun todellisuuden maahanmuuttolobbarien puheiden takana.

Kolmannen sektorin poliittisiin hillotolppiin hupenee useita kymmeniä miljoonia euroja veronmaksajien rahaa – helsinkiläinen PS-varavaltuutettu keräsi järkyttävän listan
Veronmaksajan rahoilla ylläpidetään laidasta laitaan erilaisia kolmannen sektorin toimijoita, joista monella on kytköksiä poliittisiin puolueisiin. Samalla hintalappu veronmaksajalle nousee järkyttävän suureksi ottaen huomioon, että harva tavan kansalainen on koskaan edes kuullutkaan näistä toimijoista – saati sitten että tietäisi, mitä ne tekevät.

Perussuomalaiset ja Veronika Honkasalo ottivat jälleen kiivaasti yhteen eduskunnassa – Vigelius: ’’Vasemmisto vastustanut liki kaikkia maahanmuuton kiristyksiä’’
Tiistaina eduskunnan täysistunnossa vasemmistoliiton kansanedustaja Veronika Honkasalo ja useat perussuomalaiset kansanedustajat ottivat kiivaasti yhteen. Keskustelu koski hallituksen esitystä, jolla kiristettäisiin pysyvien oleskelulupien ehtoja.