Sign In

Valtteri-botti tuottaa itsenäisesti vaaliuutisia usealla kielellä

7.4.2017

Poikkitieteellinen tutkimuskonsortio on alkuvuodesta valmistellut vaalibottia vaalibotti.fi, joka kirjoittaa itsenäisesti uutisia sunnuntain kuntavaalituloksista. Valtteriksi kutsuttu botti on ryhmän ensimmäinen yhteinen tuotos, jonka tulosten perusteella tutkimusryhmä jatkaa työtään uutisautomaation saralla. Botti tuottaa tekstiä suomeksi, ruotsiksi ja englanniksi kaikista Suomen kunnista.

"Robottikirjoittaja mahdollistaa massadataan perustuvan nopean ja kattavan uutisoinnin. Kuntavaalit, joissa on ehdolla 33 618 ehdokasta 311 kunnassa, ovat vaikeita kattaa manuaalisella raportoinnilla, erityisesti usealla kielellä. Siinä on avuksi monikielinen Valtteri-robotti, joka on kehitetty Immersive Automation -hankkeessa", sanoo tutkimusprofessori Caj Södergård VTT:stä.

Kieliteknologiaan erikoistunut data-analyytikko Leo Leppänen Helsingin yliopiston tietojenkäsittelytieteeteen laitokselta on kehittänyt uutisgeneraattoria viime viikkojen ajan.

– Tarkoituksena on tehdä generaattorin ensimmäinen versio käsin ja sitten kokemusten perusteella tunnistaa missä koneoppiminen tuo eniten lisäarvoa, Leppänen kertoo.

Valtteri valikoi oikeusministeriön vaalitulosdatasta annettuun teemaan liittyviä faktoja ja muodostaa niistä tekstikappaleita tutkimusryhmän toimittajataustaisten jäsenten tuottamien tekstipohjien avulla.

– Kuten monet ihmisten tekemät asiat, tämä vaikuttaa ensisilmäykseltä suhteellisen yksinkertaiselta. Mutta tietokoneelle tässä on suuri haaste: miten kone tietää mikä on kiinnostavaa tai tärkeää? Ihmisellä on tähän liittyen valtava määrä hiljaista tietoa, jonka olemassaoloa emme välttämättä edes tiedosta. Tietokone taas ei tiedä mitään, mitä emme sille erikseen kerro, Leppänen selostaa.

Myös VTT:n tutkija Magnus Melin on osallistunut Valtterin ohjelmointiprosessiin.

– Seuraavassa vaiheessa Valtteri tavallaan seuraa ihmisjournalisteja ja pyrkii löytämään juuri tätä ensimmäisestä versiosta puuttuvaa hiljaista tietoa. Tietokone vain on kovin hidas oppija, joten esimerkkejä tarvitaan paljon.
Leppänen korostaa, että kyseessä on kokeilumielessä kehitelty yksinkertainen järjestelmä.

Immersive Automation -projekti kehittää näkemystä uudenlaisesta mediajärjestelmästä, jossa yhdistyvät käyttäjäelämys, automatisoitu kerronta ja läheinen yhteistyö yleisön kanssa. Datasta ja koneoppimisesta ammentava kerronta mahdollistaa nykyistä huomattavasti yksilöllisemmän ja räätälöidymmän käyttäjäkokemuksen, jossa sisällön mukautuminen on keskeinen ominaisuus.

Projektia rahoittavat mm. Tekes, Helsingin yliopisto, VTT ja Viestintäalan Tutkimussäätiö sekä mediayritykset.

http://immersiveautomation.com/

Asiakaspalvelu
Sähköpostiinfo@vtt.fi
Puhelin020 722 7070
Avoinna arkisin klo 9.00 - 11.00 ja 12.00 - 15.00

Lisätietoa Valtterista ja Immersive Automation -projektista:

Hannu Toivonen, +358 50 9 112 405
hannu.toivonen@helsinki.fi

Carl-Gustav Lindén, + 358 40 5 157 682
carl-gustav.linden@helsinki.fi