Turun yliopiston ja Åbo Akademin oikeustieteellisten tiedekuntien ohella myös Eduskuntatutkimuksen keskus on tiiviisti mukana LAWPOL-hankkeen toteuttamisessa. Kumppaneihinsa verrattuna e-keskuksen tutkimusprofiili on hieman erilainen: siinä missä TY:n ja ÅA:n oikeustieteelliset tiedekunnat keskittyvät lainsäädäntöön ja lakien valmisteluun, e-keskuksen tiimin mielenkiinto kohdistuu ennen kaikkea politiikkapuheeseen ja eduskunta-aineiston analysoimisen mahdollistavien uusien työkalujen kehittämiseen.
Työ ei ole suinkaan alkanut tyhjästä: pohjana on jo aiemmin osana “Semanttiset parlamentit” -konsortiohanketta luotu FinParl-aineistokorpus, joka kokoaa yhteen eduskunnan täysistuntopöytäkirjat aina vuodesta 1907 alkaen – ja aineisto myös kumuloituu pöytäkirjojen lisääntyessä. Tämä koneluettavassa muodossa oleva tietovaranto toimii Lakitutkan tavoin LAWPOL-konsortion keulana; FinParl-aineiston parissa jo tehty työ näyttää suuntaa myös tulevalle urakalle.
Nyt ankkuri ja purjeet on nostettu, ja projekti on lähtenyt täyttä vauhtia eteenpäin. Matkan jatkuessa myös e-keskuksen tiimiläisillä riittää yhtä jos toista tehtävää ja ideoitavaa. Ruoria pitelee erikoistutkija Kimmo Elo, joka toimii samalla yhtenä konsortion johtajista. Peräsintä puolestaan luovii IT-suunnittelija Timo Ylikännö, joka vastaa infrastruktuurin teknisestä toteutuksesta, kuten datan keräämisestä ulkoisista lähteistä projektin järjestelmään.
Koska tavoitteena on kehittää uutta infrastruktuuria politiikkadokumenttien, ja erityisesti eduskunta-aineiston analysoimiseen, poikkitieteellisyyden parhaat puolet tulevat näkyvästi esiin myös e-keskuksen työskentelyssä; poikkitieteellisyys toimii projektin eräänlaisena polttoaineena, ja eri suuntiin haarautuvalla yhteistyöllä voidaan ammentaa niin tietojenkäsittelytieteen kuin kielitieteenkin erityisosaamista. Erilaisia lähestymistapoja on useita, joten myös e-keskuksen tutkimusavustajilla on tässä tärkeä rooli.
Tutkimusavustaja Kristian Martiskainen tekee yhteistyötä tietokonelingvistiikkaan paneutuneen TurkuNLP ryhmän kanssa; tavoitteena on kehittää työkaluja, jotka tietokoneavusteisen luonnollisen kielen käsittelyn (Natural Language Processing; NLP) keinoin voisivat tunnistaa tekstidatasta politiikan tutkimukselle kiinnostavia teemoja. Osaltaan kyse on siis digitaalisten ihmistieteiden, ja samalla LAWPOL-hankkeen, kovasta ytimestä. TurkuNLP-yhteistyössä on tiiviisti mukana myös tutkimusavustaja Jaakko Koljonen, joka on tutkinut lisäksi sentimenttianalyysin hyödyntämismahdollisuuksia, sekä kerännyt LAWPOL:issa käytettävää metadataa ja tutkimuskirjallisuutta.
Ennen liikkeelle lähtöä on tärkeää suunnitella tuleva reitti; niin myös uusien digitaalisten työkalujen kehittämisessä keskeistä on ollut sekä aikaisemmin tehdyn työn että uuden kysynnän hahmottaminen. Tutkimusavustaja Juuso Laine on kartoittanut parlamenttiaineistoon kohdistuvassa tutkimuksessa käytettyjen menetelmien kirjoa, jonka pohjalta voidaan arvioida, minkälaisten työkalujen kehittämiseen on syytä keskittyä. Tämä toimii samalla osviittana osana LAWPOL:ia rakennettavan bibliografian kehittämistä, joka kerää ja systematisoi parlamenttitutkimusta. Myös tutkimusavustaja Oskari Maunuksela on tehnyt tärkeää työtä jo olemassa olevien työkalujen ja aineiston, kuten korpuksien ja digitaalisten workbenchien, kartoittamisessa; menetelmien ja tutkimuksen tapaan myös näiden aineistojen tarkastelu auttaa LAWPOL portaalin tulevassa kehittämisessä. Workbench-selvitysten lisäksi Oskari on työstänyt muun muassa vaalipiirejä ja hallituksia koskevaa metadataa.
Olennainen osa niin TurkuNLP-yhteistyötä kuin itse LAWPOL-hankkeen kehitystä ja e-keskuksen työtä on ollut jo päättyneellä FIN-CLARIAH -hankkeella; LAWPOL:in tavoin myös FIN-CLARIAH keskittyi digitaaliselle aineistolle sopivan tutkimusinfrastruktuurin kehittämiseen, ja tämä työ on toiminut tärkeänä resurssina varsinkin e-keskukselle. Tutkimusavustaja Markus Korhonen on keskittynyt hankkeen parissa työskennelleen Pyry Kantasen kanssa tekstiverkostomenetelmiä hyödyntävien työkalujen kehittämiseen. Siinä missä Pyry on vastannut itse sovellusten kehittämisestä, Markus on keskittynyt erityisesti tarvittavan datan työstämiseen. Edistymisen osalta virstanpylväinä voidaan mainita joulukuussa julkistetut TNA ja KWIC (Key Word in Context) -sovellukset.
Vaikka liikkuvia osia on paljon, kurssi kulkee niin e-keskuksen osaprojekteilla kuin kaikilla LAWPOL:in tiimeillä lopulta samaan suuntaan: horisontissa siintää käyttäjäystävällinen ja monipuolinen tutkimusinfrastruktuuri, joka paitsi mahdollistaa laajan politiikka-aineiston tutkimisen alan asiantuntijoille, myös tuo sen lähemmäksi laajaa yleisöä.
Teksti: Markus Korhonen, kuvat: Pixabay