
Aalto-yliopiston tutkijat kehittivät ”vihapuhekoneen” – koneoppimiseen perustuvalla algoritmilla oli vaikeuksia tunnistaa suomenkielistä vihapuhetta
Joukko tietojenkäsittelyn, median ja viestinnän tutkijoita ja soveltajia toteutti kevään 2017 kuntavaalien aikana vihapuheen tunnistamiskampanjan, jossa käytettiin apuna koneoppimiseen perustuvaa algoritmia. Luokittelujärjestelmällä oli tosin vaikeuksia suomen kielen sanamuotojen kanssa. Algoritmilla oli lisäksi varsin rajoittunut kyky tulkita keskustelun tai kommentoinnin kontekstia.
Kampanjan aluksi algoritmia opetettiin tunnistamaan vihapuhetta muun muassa avoimista keskusteluryhmistä saatujen aineistojen perusteella. Algoritmi oppi laskennallisesti vertailemaan, mikä erottaa vihapuhetta sisältävän tekstin ei-vihapuheesta ja kehittämään luokittelujärjestelmän vihapuheelle.
Tämän jälkeen luokittelujärjestelmän avulla seulottiin päivittäin kaikki kunnallisvaaliehdokkaiden tuottama avoin sisältö Facebookissa ja Twitterissä noin kuukautta ennen vaaleja. Ehdokkaiden tilit saatiin kerättyä Ylen vaalikoneaineiston avulla.
Luokittelujärjestelmällä oli kuitenkin vaikeuksia suomen kielen sanamuotojen kanssa. Algoritmilla on lisäksi ihmistä rajoittuneempi kyky tulkita keskustelun tai kommentoinnin kontekstia.
Samoista ongelmista kontekstin ja kirjoitusvirheiden tunnistamisessa on kärsinyt myös Googlen kehittämä, vihapuheen tunnistamiseen keskittynyt Perspective-luokitin, Aalto-yliopiston tiedotteessa todetaan.
Tutkijoiden mukaan vihapuhekone kykenee toimimaan valtavien aineistojen seulojana, joka tuo esiin epäilyttäviä viestejä, mutta vain ihminen voi tehdä lopulliset päätelmät vaadittavista toimenpiteistä.
Vihapuhekone mahdollistaa valtavien tietomassojen seulomisen
– Viranomaisnäkökulmasta toimenpiteitä aiheutti korkeintaan 20 viestiä. Sanojen listaus ei sinänsä ole riittävää, koska merkitys tulee niiden yhdistelystä. Toisaalta meillä ei taas olisi resursseja näin mittavaan seurantaan ilman vihapuhekoneen ja tutkijoiden apua”, kertoo yhdenvertaisuusvaltuutettu Kirsi Pimiä.
– Viestejä luokitellessa tutkija joutuu ottamaan kantaa kieleen ja kontekstiin, minkä vuoksi algoritmin ’opettamiseen’ käytettävää aineistoa on tärkeää käsitellä useamman tulkitsijan voimin”, sanoo Salla-Maaria Laaksonen Helsingin yliopistosta.
Koneen tekijät pyrkivät tunnistamaan ainakin omasta mielestään kaikentyyppisen vihapuheen.
Maahanmuutto ja turvapaikanhakijat ovat usein näkyvimpiä teemoja, mutta yhtä tärkeää on tunnistaa esimerkiksi naisiin, etnisiin vähemmistöihin tai tiettyihin poliittisiin kantoihin kohdistuva vihapuhe, Aalto-yliopiston tiedotteessa todetaan.
– Vihapuhetta on aina ollut olemassa. Sitä on aina tuotettu pönkittämään oman ryhmän asemaa ja syrjimään toisia, mutta sosiaalinen media on tehnyt siitä aikaisempaa näkyvämpää, väittää Reeta Pöyhtäri Tampereen yliopistosta.
– Tunteisiin perustuva ilmaisu ja uskomukset korostuvat, ja niitä myös kierrätetään verkossa. Jos ehdokas esimerkiksi kampanjan aikana poisti kirjoituksensa nopeasti julkaisemisen jälkeen, se saattoi silti jäädä elämään kuvakaappauksena, kuvailee.
Vihapuhetta ei ole mainittu Suomen laissa, ja sen määrittely on tunnetusti vaikeaa. Hankkeessa käytettiin Euroopan neuvoston sekä Ethical Journalism Networkin rakentamaa vihapuhemääritelmää.
Helsingin yliopiston, Tampereen yliopiston ja Aalto-yliopiston hanke kytkeytyy neljään Suomen Akatemian ja Koneen Säätiön rahoittamaan tutkimushankkeeseen.
Suomen Uutiset
Artikkeliin liittyvät aiheet
Mitä mieltä?
Aiheeseen liittyviä artikkeleita


PS: Yhdenvertaisuusvaltuutetulta rahahanat kiinni – ”Puuttuu mielipiteisiin, joista ei itse pidä”

Oikeusministeriö oli mukana rakentamassa järjestelmää, jolla kytättiin vaaliehdokkaiden jokaista someviestiä

Oikeusministeriö pyrki vaikuttamaan kuntavaaleihin – yhdenvertaisuusvaltuutettu vaati puoluesihteeriä poistamaan kampanjamateriaaleja somesta

Halla-aho: Suhteellisuutta vihapuhe- ja valeuutiskeskusteluun
Viikon suosituimmat

Ilta-Sanomat teetti faktantarkistuksen Teemu Keskisarjan puheista, mutta lukijoille ei kerrota, että faktantarkistaja on vihreissä vaikuttanut kuntapoliitikko
Suomen Uutiset teki faktantarkistuksen Ilta-Sanomien käyttämän faktantarkistajan poliittisista kytköksistä. Tarkistuksessa selvisi, että Keskisarjan puheita arvioivalla faktantarkistajalla on taustaa ja kytköksiä vihreisiin.

Teemu Keskisarjan kolumni: V-sana, T-sana ja R-sana

Teemu Keskisarja: Väestönvaihto on ruma sana, mutta se on totta
Eilisessä A-studiossa Yle oli etukäteen tavoitellut asetelmaa, jossa maahanmuuton haittoja ja kustannuksia veronmaksajalle hämärretään tunnepuheella ja pöyristelyllä. Tällä kertaa Yle ei täysin onnistunut.

Päivän pointti: Vihreiden Sofia Virran puheet työtä tekevistä maahanmuuttajista ovat suuresti liioiteltuja

Reijonen: Apteekit juoksuttavat asiakkaita turhaan – ”Tähän on tultava loppu”
Onko sellainen tilanne tuttu, ettet saanutkaan kerralla apteekista mukaasi kaikkia Kela-korvattavia lääkkeitäsi? Suomessa on voimassa älytön systeemi, josta puhutaan liian vähän. Perussuomalaisten kansanedustaja Minna Reijonen vaatii loppua apteekeissa asioivien turhalle edestakaisin juoksuttamiselle.

Juutalaisia vihaava ”transnainen” murhasi lapsia katolisessa koulussa USA:ssa
Minneapolisissa tapahtui kouluammuskelu, jossa hyökkääjä tappoi kaksi lasta ja haavoitti lähes kahtakymmentä. Suomen valtamedia jätti järjestelmällisesti kertomatta, että ampuja oli Trumpia ja juutalaisia vihaava "transnainen".

Helsingin Sanomat kaivoi esille asiantuntijan, joka lausuu huntukiellon olevan islaminvastaisuutta – Purra: ”Väitteet eivät kestä loogista ja moraalista tarkastelua”

Teemu Keskisarja: Maahanmuuton lieveilmiöistä pitää puhua oikeilla nimityksillä – ”Työperäinen on valheellinen sana”
Perussuomalaisten 1. varapuheenjohtaja, kansanedustaja Teemu Keskisarja palaa vielä tämän viikon mediakohuun toteamalla, että hän hyvin ymmärtää, miltä Jussi Halla-ahosta aikoinaan tuntui selittää sata kertaa sama asia samoille ihmisille, jotka eivät ymmärrä tai eivät tahdo ymmärtää varsin selkeitä seikkoja.

Pridetys kuumentaa tunteita Tampereella – PS-valtuutettu Marika Puolimatka: ”Tällainen ei ole Tampereen kaupunginvaltuuston eettisten ohjeidenkaan mukaista toimintaa”
Tampereen kaupunginvaltuuston ensimmäisessä syyskokouksessa käytiin eilen vilkas keskustelu pride-liputuksesta luopumisesta, josta perussuomalaisten kaupunginvaltuutettu Marika Puolimatka ja joukko perussuomalaisten, kristillisdemokraattien sekä kokoomuksen valtuutettuja oli jättänyt aloitteen viime kaudella.

Väestönmuutos ei ole salaliittoteoriaa eikä äärioikeistoa – Purra: ”Se on totista totta, jonka tilastot ja pikkuhiljaa jo silmätkin todentavat”
Perussuomalaisten puheenjohtaja, valtiovarainministeri Riikka Purra muistuttaa maahanmuuton valtavista kustannuksista tavan kansalaiselle. - Yhä suurempi osa sosiaaliturvasta, yhä suurempi osa sotesta, ja yhä suurempi osa niin koulujen kuin vähemmistöteollisuudenkin erityispalveluista menee ulkomaalaistaustaisille. Se kaikki on pois suomalaisilta.