
Aalto-yliopiston tutkijat kehittivät ”vihapuhekoneen” – koneoppimiseen perustuvalla algoritmilla oli vaikeuksia tunnistaa suomenkielistä vihapuhetta
Joukko tietojenkäsittelyn, median ja viestinnän tutkijoita ja soveltajia toteutti kevään 2017 kuntavaalien aikana vihapuheen tunnistamiskampanjan, jossa käytettiin apuna koneoppimiseen perustuvaa algoritmia. Luokittelujärjestelmällä oli tosin vaikeuksia suomen kielen sanamuotojen kanssa. Algoritmilla oli lisäksi varsin rajoittunut kyky tulkita keskustelun tai kommentoinnin kontekstia.
Kampanjan aluksi algoritmia opetettiin tunnistamaan vihapuhetta muun muassa avoimista keskusteluryhmistä saatujen aineistojen perusteella. Algoritmi oppi laskennallisesti vertailemaan, mikä erottaa vihapuhetta sisältävän tekstin ei-vihapuheesta ja kehittämään luokittelujärjestelmän vihapuheelle.
Tämän jälkeen luokittelujärjestelmän avulla seulottiin päivittäin kaikki kunnallisvaaliehdokkaiden tuottama avoin sisältö Facebookissa ja Twitterissä noin kuukautta ennen vaaleja. Ehdokkaiden tilit saatiin kerättyä Ylen vaalikoneaineiston avulla.
Luokittelujärjestelmällä oli kuitenkin vaikeuksia suomen kielen sanamuotojen kanssa. Algoritmilla on lisäksi ihmistä rajoittuneempi kyky tulkita keskustelun tai kommentoinnin kontekstia.
Samoista ongelmista kontekstin ja kirjoitusvirheiden tunnistamisessa on kärsinyt myös Googlen kehittämä, vihapuheen tunnistamiseen keskittynyt Perspective-luokitin, Aalto-yliopiston tiedotteessa todetaan.
Tutkijoiden mukaan vihapuhekone kykenee toimimaan valtavien aineistojen seulojana, joka tuo esiin epäilyttäviä viestejä, mutta vain ihminen voi tehdä lopulliset päätelmät vaadittavista toimenpiteistä.
Vihapuhekone mahdollistaa valtavien tietomassojen seulomisen
– Viranomaisnäkökulmasta toimenpiteitä aiheutti korkeintaan 20 viestiä. Sanojen listaus ei sinänsä ole riittävää, koska merkitys tulee niiden yhdistelystä. Toisaalta meillä ei taas olisi resursseja näin mittavaan seurantaan ilman vihapuhekoneen ja tutkijoiden apua”, kertoo yhdenvertaisuusvaltuutettu Kirsi Pimiä.
– Viestejä luokitellessa tutkija joutuu ottamaan kantaa kieleen ja kontekstiin, minkä vuoksi algoritmin ’opettamiseen’ käytettävää aineistoa on tärkeää käsitellä useamman tulkitsijan voimin”, sanoo Salla-Maaria Laaksonen Helsingin yliopistosta.
Koneen tekijät pyrkivät tunnistamaan ainakin omasta mielestään kaikentyyppisen vihapuheen.
Maahanmuutto ja turvapaikanhakijat ovat usein näkyvimpiä teemoja, mutta yhtä tärkeää on tunnistaa esimerkiksi naisiin, etnisiin vähemmistöihin tai tiettyihin poliittisiin kantoihin kohdistuva vihapuhe, Aalto-yliopiston tiedotteessa todetaan.
– Vihapuhetta on aina ollut olemassa. Sitä on aina tuotettu pönkittämään oman ryhmän asemaa ja syrjimään toisia, mutta sosiaalinen media on tehnyt siitä aikaisempaa näkyvämpää, väittää Reeta Pöyhtäri Tampereen yliopistosta.
– Tunteisiin perustuva ilmaisu ja uskomukset korostuvat, ja niitä myös kierrätetään verkossa. Jos ehdokas esimerkiksi kampanjan aikana poisti kirjoituksensa nopeasti julkaisemisen jälkeen, se saattoi silti jäädä elämään kuvakaappauksena, kuvailee.
Vihapuhetta ei ole mainittu Suomen laissa, ja sen määrittely on tunnetusti vaikeaa. Hankkeessa käytettiin Euroopan neuvoston sekä Ethical Journalism Networkin rakentamaa vihapuhemääritelmää.
Helsingin yliopiston, Tampereen yliopiston ja Aalto-yliopiston hanke kytkeytyy neljään Suomen Akatemian ja Koneen Säätiön rahoittamaan tutkimushankkeeseen.
Suomen Uutiset
Artikkeliin liittyvät aiheet
Mitä mieltä?
Aiheeseen liittyviä artikkeleita


PS: Yhdenvertaisuusvaltuutetulta rahahanat kiinni – ”Puuttuu mielipiteisiin, joista ei itse pidä”

Oikeusministeriö oli mukana rakentamassa järjestelmää, jolla kytättiin vaaliehdokkaiden jokaista someviestiä

Oikeusministeriö pyrki vaikuttamaan kuntavaaleihin – yhdenvertaisuusvaltuutettu vaati puoluesihteeriä poistamaan kampanjamateriaaleja somesta

Halla-aho: Suhteellisuutta vihapuhe- ja valeuutiskeskusteluun
Viikon suosituimmat

Ruotsille riitti, asumisperusteisen sosiaaliturvan periaate väistymässä – maahanmuuttajilta pois lapsilisät, asumistuet, sairauspäivärahat ja vanhempainrahat
Ruotsin hallitus on ottamassa rohkeaa askelta, josta Suomessa vasta keskustellaan: maahanmuuttajat eivät enää saa automaattisesti täyttä sosiaaliturvaa. Järjestelmään pääsee vasta riittävän oleskeluajan tai työrupeaman jälkeen. Uudistus astuu voimaan vuoden 2027 alusta.

Hallitus teki lopun miljonääri‑Vesterbackan bisneksestä ulkomaalaisilla nuorilla – yhtiö ajautuu konkurssiin
Pelibisneksillä aiemmin menestyneen Peter Vesterbackan Finest Future ‑yhtiö on konkurssimenettelyssä muun muassa maksamattomien työeläkevakuutusmaksujen vuoksi. Yhtiön keskeinen liikeidea on ollut ulkomaalaisten opiskelijoiden rekrytointi maksua vastaan suomalaisiin lukioihin.

Kolumni: Seta on totalitaarinen järjestö
Jääkiekkoilija Veli-Matti Savinainen kieltäytyi pukemasta Pride-paitaa TPS:n pelissä, koska ei halua julkisesti tukea Pride-ideologiaa. Turun Setan paikallisjohto ilmoitti, että Savinaisen ei olisi pitänyt edes pelata, kun hän ei suostunut käyttämään Pride-paitaa. Samalla Seta julkaisussaan valitti sitä, että Suomen syrjintälainsäädäntö estää tällaisen sivuuttamisen. Ajatus on pysäyttävä. Ihminen pitäisi sulkea ulos työtehtävästään siksi, että hän ei suostu julkisesti osoittamaan ideologista uskollisuutta Pridelle, kirjoittaa Perussuomalaisen Nuorison 1. varapuheenjohtaja Jyri Tallgren.

Sofia Virran somessa TPS-hyökkääjään kohdistama painostus ei tuottanut tulosta – Virta saikin itse lähteä TPS:n hallituksesta, TPS korostaa, että organisaation ei tulisi kääntyä pelaajiaan vastaan
Vihreiden puheenjohtajalle Sofia Virralle tuli tänään lähtö TPS:n hallituksesta. Taustalla on Virran eilinen yritys hiillostaa epäsuorasti TPS:n hyökkääjää Veli-Matti Savinaista, joka kieltäytyi käyttämästä Pride-paitaa kiekkokaukalossa. Sofia Virran painostusyritys johti kuitenkin siihen, että TPS ensin julkaisi eilen illalla julkisen anteeksipyynnön Savinaiselle. Tänään aamupäivällä TPS tiedotti, että Sofia Virta ei enää jatka TPS:n hallituksessa.

Turun Seta väläyttää lakimuutosta vastatoimena jääkiekkoilijalle, joka kieltäytyi pelaamasta Pride-väreissä
Pride-teemapelipaidasta henkilökohtaisen vakaumuksensa vuoksi kieltäytyneen jääkiekkoilija Veli-Matti Savinaisen tapaus on ollut viikonlopun keskustelunaihe. Savinaisen Pride-nihkeys poiki saman tien voimakkaan reaktion Setalta, cancelointiyrityksen ja jopa vihjailua lakimuutoksista. Vihreän puolueen puheenjohtajalla Sofia Virralla näyttäisi myös olevan oma roolinsa tapahtumien taustalla.

Lähihoitaja Mira: SDP:n ajatus vain yhdestä suomalaisesta hoitajasta hoivaosastolla on täysin järjetön
Lähihoitajana vajaat 10 vuotta toiminut Mira tyrmää SDP:n kansanedustaja Nasima Razmyarin ehdotuksen siitä, että hoivatyöpaikoilla riittäisi yksi suomalainen hoitaja ja muut voisivat olla ulkomaalaisia. Työssään ympärivuorokautisen tehostetun palvelun asumisyksiköissä Mira on nähnyt lukuisia vaaratilanteita johtuen ulkomaalaisten hoitajien puutteellisesta kielitaidosta.

Bergbom TPS:n kohuottelusta: ”Seta ja Sofia Virta, jättäkää Veli-Matti Savinainen rauhaan”
TPS:n SM-liigaottelussa syntyi viikonloppuna kohu, kun kokenut hyökkääjä Veli-Matti Savinainen kieltäytyi pelaamasta Pride-teemapelipaidassa. Perussuomalaisten eduskuntaryhmän 2. varapuheenjohtaja Miko Bergbom muistuttaa, että työntekijällä on Suomessa oikeus kieltäytyä poliittisesta tai ideologisesta toiminnasta työpaikallaan.

Rostila pöyristyi vaatimuksista syrjiä kultaleijonaa: Yrittääkö Seta tehdä toisinajattelijoista lainsuojattomia?
Perussuomalaisten kansanedustaja Onni Rostila tyrmää Turun seudun Setan kommentin Veli-Matti Savinaisen pelipaitakohusta.

Ex-valtiovarainministeri Suvi-Anne Siimes: Maahanmuuttajilla liian helppo tie Kelan eläkkeille
Työeläkevakuuttajien etujärjestön Telan väistyvä toimitusjohtaja, valtiovarainministerinäkin toiminut Suvi-Anne Siimes moittii Helsingin Sanomien haastattelussa että maahanmuuttajat pääsevät liian helposti Kelan eläkejärjestelmän piiriin. Hän näkee tämän ongelmana, joka rasittaa Suomen sosiaaliturvajärjestelmää ja uhkaa sen kestävyyttä pitkällä aikavälillä.

Koposelta aloite eduskunnassa: Kansaneläke ja takuueläke poistettava maahanmuuttajilta
Perussuomalaisten kansanedustaja Ari Koponen on jättänyt eduskunnalle toimenpidealoitteen, jossa esitetään kansaneläkkeen ja takuueläkkeen poistamista maahanmuuttajilta.
















