Vaalit takana – datan avautuminen edessä?

Artikkeli on kirjoitettu Helsingin Tietojenkäsittely-yhdistys ry:n HETKY-lehteen.

Tieto ei ole niukkuudesta kärsivä resurssi. Digitaalisessa muodossa tietoa jaettaessa sen määrä ei vähene, eikä laatu heikkene, vaan pikemminkin päinvastoin – mitä useampi jotakin aineistoa käyttää, sitä suurempi sen arvo on.

Data laajasti käsitettynä on digitaalista raaka-ainetta, kuten tilastoja, julkaisuja, simulaatiomalleja, videotallenteita, kuvia, karttoja, paikkatietoa, 3d-malleja jne. Datan jalostuksen kierrossa se, mikä on jollekin lopputuote, vaikkapa valmis tilasto voi olla toiselle raaka-ainetta, jota yhdistetään muuhun dataan ja muokataan uudeksi lopputuotteeksi. Maailmalla ja Suomessakin alati voimistuva avoimen datan liikehdintä pyrkii siihen, että erityisesti julkinen sektori, mutta myös yritykset ja muut yhteisöt tarjoaisivat hallussaan olevia datavarantojaan avoimesti kaikkien käytettäväksi. Voisiko kaikki julkinen data olla myös avointa?

Kuva 1: Avoimella datalla tarkoitetaan aineistoja, joita kuka tahansa voi luvallisesti käyttää ja jakaa edelleen ja jotka ovat saatavilla koneluettavassa muodossa. Julkisen sektorin hallussa olevasta datasta osa on julkista ja osa on sensitiivistä. Luonnollisesti aineisto, joka ei ole julkista ei voi myöskään olla avointa. Toisin päin voisi olla, mutta siihenkin on vielä pitkä matka.

Virallista tietojen avautumista odotellessa monet palveluiden kehittäjät ovat valinneet teknisesti tuskallisemman ja joskus lain harmaalla alueella olevan lähestymistavan ja tehneet niin sanottuja screen scraper (ruudunraapija) -ohjelmia, jotka käyvät automaattisesti läpi verkkosivuja ja tallentavat tiedot sieltä tietokantaan. Näin esimerkiksi avoimia työpaikkoja kartalla näyttävä duunitori.fi on raapinut työvoimaviranomaisten sivuja.

Innovaatioita, tehoa ja demokratiaa

Julkishallinnon datan avaamisella edistetään keskeisesti kolmea päämäärää: 1.) innovaatiotoimintaa ja digitaalisten sovellusten ja palvelujen kehittymistä 2.)
hallinnon tehokkuutta ja 3.) läpinäkyvyyttä ja demokratiaa. Loistava esimerkki ensimmäisestä kategoriasta on Reittiopas.fi -palvelun avointa rajapintaa hyödyntävät erittäin suositut älypuhelinsovellukset. Hallinnon tehokkuus puolestaan syntyy siitä, että tietoa voidaan hyödyntää valmistelussa ja päätöksenteossa joustavammin eri viranomaisten välillä.

Läpinäkyvyyttä ja demokratiaa tukeva julkinen data on ollut erityisesti kiinnostuksenkohteena nyt vaalien aikaan. Avoimen demokratian palvelut, kuten Kansanmuisti.fi, Pikkuparlamentti.fi ja Vaalilupausarkisto.fi pyrkivät tekemään hallinnon prosesseista läpinäkyvämpiä ja edistämään kansalaisten osallistumista. Vaaleihin, ehdokkaisiin ja luottamushenkilöihin liittyviä datavarantoja on listattuna ehdolla.org -verkkosivustolle.

Datajournalismin kokeiluja eduskuntavaaleissa

Verkkosovellusten kehittämisen lisäksi myös journalismin keinoja ja avointa dataa yhdistävä datajournalismi on rantautumassa Suomeen. Erityisesti Helsingin Sanomat on pyrkinyt edistämään tätä järjestämällä ohjelmoijia ja journalisteja yhdistäneen HsOpen -tapaamisen, sekä julkaisemalla vaalikoneensa sisällön avoimena datana jo ennen vaaleja.

Vain viikon sisällä vaalikonedatan julkaisusta siitä oli jo tehty toistakymmentä erilaista visualisaatiota ja analyysia. Esimerkiksi Juha Törmänen teki vaalikonedatasta faktorianalyysin avulla interaktiivisen poliitikkokartan. Kartalla ehdokkaat asettuivat koordinaatistoon heidän vaalikonevastaustensa perusteella. Visualisaatio osoitti hyvin, että puolueilla on keskenään eroja. Erityisen mielenkiintoinen oli perinteisestä vasemmisto-oikeisto-akselista poikkeava pystyakseli, jonka ääripäissä olivat Vihreät ja Perussuomalaiset. Törmäsen poliitikkokartta keräsi viikossa yli 20 000 kävijää ja herätti huomattavan paljon keskustelua ja jatkoanalyyseja.

Kuva 2: Sosiologi ja toimittaja Veikko Eranti tarttui Juha Törmäsen toteuttamaan interaktiiviseen poliitikkokarttaan ja julkaisi blogissaan "10 havaintoa vaalikonedatan pohjalta". Kuvassa visualisaation pohjautuva havainto, joka kumoaa usein toistettua väitettä, että Viheät olisi Kokoomuksen puisto-osasto. Törmänen ja Eranti toimivat toisitaan riippumatta, mutta molemmat loivat lisäarvoa Helsingin Sanomien julkaisemaan avoimeen vaalikonedataan.

Kuva 2: Sosiologi ja toimittaja Veikko Eranti tarttui Juha Törmäsen toteuttamaan interaktiiviseen poliitikkokarttaan ja julkaisi blogissaan “10 havaintoa vaalikonedatan pohjalta”. Kuvassa visualisaation pohjautuva havainto, joka kumoaa usein toistettua väitettä, että Viheät olisi Kokoomuksen puisto-osasto. Törmänen ja Eranti toimivat toisitaan riippumatta, mutta molemmat loivat lisäarvoa Helsingin Sanomien julkaisemaan avoimeen vaalikonedataan.

Datan visualisointiin keskittynyt Datarangers -yritys teki Helsingin sanomien vaalikonedataan perustuen visuaalisen vaalikoneen. Myös siinä ehdokkaat oli asetettu kartalle heidän vastaustensa samankaltaisuuden perusteella. Visuaalisen vaalikoneen käyttäjä pystyi näkemään omien vastaustensa vaikutuksen välittömästi, kun sopivien ehdokkaiden määrä kartalla väheni, mitä tiukemmin rajasi omasta mielestään sopivat vastausvaihtoehdot.

Mielenkiintoista olisi nähdä vaalikoneiden tiedot yhdistettynä vaalirahoitusilmotuksiin ja eduskunnan datavarantoihin kansanedustajien äänestyskäyttäytymisestä, puheista ja muista valtiopäivätoimista. Eduskunta ei vielä tarjoa julkisiakaan aineistoja avoimena datana. Kansanmuisti.fi -palvelun kehittäjät ovat screen scraping -tekniikalla hankkineet tietokantaan suuren määrän kansanedustajien toimintaan liittyvää dataa ja julkaisseet mielenkiintoisen yhdenmukaisuuslaskurin, jossa verrataan edellisten vaalien ehdokkaiden vaalikonevastauksia vaalikauden aikana tehtyihin todellisiin äänestyksiin.

Antti Poikola on erikoistunut kansalaisten ja julkishallinnon välisten yhteistyöratkaisujen kehittämiseen ja avoimuuteen pohjautuvien toimintamallien jalkauttamiseen. Hän on Liikenne- ja viestintäministeriön julkaiseman “Julkinen data – johdatus tietovarantojen avaamiseen” -oppaan (Poikola, Kola Hintikka 2010) pääkirjoittaja.

Artikkeli on julkaistu Creative Commons Nimeä -lisenssillä. Creative Commons (CC) on yleinen lisensointimalli, jossa tekijänoikeuksien haltija voi rajoittavan “kaikki oikeudet pidätetään” -lauseen sijasta sallia teoksen tai aineiston vapaamman uudelleenkäytön. Tässä tapauksessa artikkelia saa uudelleenkäyttää, kunhan alkuperäinen kirjoittaja mainitaan.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s