Tiede

Tutkijat perkasivat algoritmien avulla Suomen kansallis­bibliografian dataa – huomasivat, että yliopiston siirto Turusta Helsinkiin romautti julkaisemisen vuosikymmeniksi 1800-luvulla

Digitaalisten ihmis­tieteiden apulaisprofessori Mikko Tolonen tavoittelee menneisyydestä tietoa, jonka tulkinta ei vaadi arvailua.

Suomen ainoa yliopisto siirrettiin Turusta Helsinkiin vuonna 1828. Sitä ennen koko Suomi oli siirtynyt Ruotsin omistuksesta Venäjän autonomiseksi suuriruhtinaskunnaksi, ja Helsinki oli määrätty pääkaupungiksi.

Muun muassa emeritusprofessori Matti Klinge on korostanut autonomian ajan positiivisia vaikutuksia suomalaiseen sivistykseen.

Tulkintaan sisältyy vahva oletus siitä, että akateeminen toimintakin vahvistui Suomen siirryttyä osaksi Venäjää, sanoo digitaalisten ihmistieteiden apulaisprofessori Mikko Tolonen Helsingin yliopistosta.

Tolosen tutkimusryhmä on testannut oletusta digitaalisen historiantutkimuksen menetelmin.
Mainos (Teksti jatkuu alla)
Mainos päättyy

Suomen kansallisbiblio­grafiassa eli Fennica-kirjastoluettelossa on kymmeniä tuhansia Suomessa julkaistuja nimikkeitä vuodesta 1488 alkaen. Se kertoo julkaisemisen aktiivisuudesta.

Tietokannan läpikäyminen käsipelillä olisi melko toivoton tehtävä. Tolosen ryhmä ja datatieteilijä Leo Lahti antoivat urakan tietokoneille.

Tolosen alaa on erityisesti 1700-luvun aate- ja filosofian historia, mutta hänen tutkimusryhmässään työskentelee myös tietojenkäsittely- ja kielitieteilijöitä.

Ryhmän päämääränä on saada digitaalisia aineistoja, algoritmeja ja tilastotiedettä hyödyntämällä tietoa, jonka tulkinta ei vaadi arvailua.

Algoritmit perkasivat Fennica-tietokannan metadatan eli kuvailutiedot. Ne kertovat muun ­muassa teosten ilmestymisvuodet ja julkaisupaikat.

Kuvailutietojen perusteella julkaiseminen Turussa romahti vuoden 1809 jälkeen. Helsinki taas saavutti Turun 1700-luvun loppupuolen tason vasta 1800-luvun loppupuolella.



”Tiedontuotannon näkökulmasta muutos1800-luvulla näytti paljon dramaattisemmalta kuin Helsinki-keskeiset historioitsijat ovat antaneet ymmärtää”, Tolonen sanoo.

Digitaaliset aineistot tarjoavat historioitsijoille mahdollisuuden saada mitattavaa tietoa aiheista, joista tähän asti on voitu tehdä vain valistuneita arvauksia.

Niiden hyödyntäminen vaatii kuitenkin paljon työtä, myös yhteistyötä.

Historiassa on yhä suoranainen ihanne, että tutkija raportoi tuloksensa yksin kirjoittamassaan paksussa opuksessa. Monissa muissa tieteissä yhdellä muutaman sivun mittaisella artikkelilla saattaa nykyisin olla kymmeniä tekijöitä.

Tämä johtuu siitä, että yhden ihmisen ei enää ole mahdollista hallita kaikkia menetelmiä, joita esimerkiksi ilmakehän mallintaminen tai geenitutkimus vaatii.

Sama pätee yhä voimakkaammin myös historiaan, sanoo Tolonen.

”Kaikki perinteiset historioitsijat eivät hirveästi tykkää siitä, mitä olemme tekemässä, mutta meidän työssämme lähdekritiikki ja aineistojen tunteminen korostuvat yhä enemmän.”

”Suuri haaste on se, että uusien menetelmien merkitys pitää saada läpi sille suurelle osalle tutkijoita, jota metodien käyttö itsessään ei kiinnosta pätkääkään. Tätä varten tarvitaan esimerkkejä, joihin on vaikea väittää vastaan.”

Ensimmäinen edellytys digitaaliselle historiantutkimukselle ovat digitaaliset aineistot. Pelkkä vanhojen papereiden skannaaminen ei riitä.

Jotta tietokone pystyisi lukemaan skannattua aineistoa, se täytyy ajaa tekstintunnistusohjelman läpi. Sillä teksti saadaan muotoon, jota voi muokata ja jossa voi tehdä tiedonlouhintaa tai sanahakuja.

Merkkien tunnistamiseen tähtäävät menetelmät tunnistavat merkit parhaimmillaan 80–90-prosentin tarkkuudella. Tekstintunnistuksen läpikäyneet kirjoitukset ovat usein täynnä virheitä.

Seuraava vaihe onkin miettiä, miten aineistoja voidaan hyödyntää luotettavasti virheistä huolimatta. Tähän Tolosen ryhmä on hyödyntänyt muun muassa bioinformatiikassa käytettyä blast-ohjelmistoa.

Se on tarkoitettu vertailemaan esimerkiksi dna:n nukleotidien järjestystä, mutta yhtä lailla se soveltuu vertailemaan tekstinpätkiä 1700-luvun brittiläisestä kirjallisuudesta. Tähän käyttöön Tolosen ryhmä on soveltanut blastia yhdessä Turun yliopiston kieliteknologian tutkijan Filip Ginterin ryhmän kanssa.

Aineiston putsaaminen voi viedä jopa 80 prosenttia tutkimukseen käytetystä ajasta eikä ole aina kovin kiinnostavaa, Tolonen myöntää.

”Jonkun työ on kuitenkin pakko tehdä, että ala menisi eteenpäin.”

Tolonen kannustaa tutkijakollegoitaan tekemään yhteistyötä ja jakamaan siivottuja aineistoja avoimesti, jotta kaikkien ei täydy käydä läpi samaa ruljanssia. Säästynyt aika voidaan käyttää itse aiheen parissa.

Valitettavasti aineistojen saatavuudessa on kansainvälisesti suuria puutteita. Aineistoihin pääsy saattaa vaatia rahaa tai pitkällisiä sopimusneuvotteluita, vaikka tekijänoikeudet tai yksilönsuojakaan eivät olisi esteenä.

Usein puhutaan avoimen julkaisemisen tärkeydestä, mutta Tolosen mielestä vielä tärkeämpää voi olla tutkimusaineistojen ja -prosessien avoimuus.

Tietokoneet voivat viedä myös harhaan, jos tekijät tuntevat paremmin menetelmän kuin tutkimuskysymyksen.

Varoittava esimerkki digitaalisissa ihmistieteissä on Journal of the Association for History and Computing -lehdessä vuonna 2010 julkaistu artikkeli Plundering Philosophers, suomeksi Ryöstelevät filosofit.

Tekijät syyttivät plagioinnista 1700-luvun suurhankkeen, tietosanakirja Encyclopédien, tekijöitä. Heidän joukossaan oli sellaisia kuuluisia valistusajan filosofeja kuin Denis Diderot, Jean-Jacques Rousseau ja Voltaire.

Tutkijat vertailivat tietokoneiden avulla Encyclopédieta ja sitä ennen julkaistuja tietosanakirjoja ja päätyivät väittämään, että filosofit ovat ”ryöstäneet” ison osan sisällöstä muilta tekijöiltä.

Artikkelin kysymyksenasettelu perustuu Tolosen mukaan virheelliselle ymmärrykselle tuon ajan teosten luonteesta. Toisilta tekijöiltä lainaaminen oli yleinen ja hyväksytty tapa.

Nykyaikaiseen tekijänoikeuteen nojaava ajatus vääristi koko tutkimusta, vaikka menetelmä itsessään olikin Tolosen mielestä pätevä.

Puutteita voi olla myös aineistoissa. Kansalliskirjaston Fennicasta esimerkiksi puuttuu 1800-luvulta paljon ruotsinkielistä kirjallisuutta, koska luetteloa digitalisoitaessa jätettiin pois osa ruotsinkielisestä materiaalista. Silloin kyse oli tehostamisesta, mutta nyt päätös vääristää kuvaa siitä, mitä 1800-luvulla julkaistiin.

Tolonen sanoo, että perinteisiin metodeihin luottavilla historioitsijoilla on aihettakin epäluuloon. Jos tiedettä tehdään metodi edellä, mennään helposti harhaan.

”Meidän ideamme kaikessa tässä on se, että perinteinen aatehistoriallinen osaaminen ja aiempaa laajempi metodipohja yhdistyvät.”

Tolosen tutkimukset jatkuvat Pohjoismaiden ja Britannian 1600–1900-lukujen painotuotannon parissa. Työ on vasta alussa, ja esimerkiksi huomio Turun yliopiston siirron vaikutuksista tuli sattumalta – sitä ei ollut varta vasten lähdetty selvittämään.

Esimerkki osoittaa, miten nopeasti vanhat historiantulkinnat voivat joutua kyseenalaisiksi tai saada vahvistuksen.

Vielä syvemmälle historiaan uppoutuu Tolosen ja Ville Vaaran tutkimus brittiläisen filosofin ja historioitsijan David Humen History of England -teoksen lähteistä ja vaikutteista.

Historiantutkijat ovat yli 250 vuoden ajan väitelleet siitä, suosiko Hume teoksessaan monarkiaa puolustaneita lähteitä. Onko kirja puolueeton esitys vai osa poliittista agendaa?

Tolonen ja Vaara vertailivat blast-menetelmän avulla Humen teosta sen keskeisiin lähteisiin. He totesivat, että väitteet Humen puolueellisuudesta ovat rankasti liioiteltuja.

1700-luvulla tehtyjen historiankirjojen ja tietosanakirjojen retostelu 250 vuotta myöhemmin voi tuntua nykyihmisestä yhdentekevältä. Ne ovat kuitenkin olleet aikanaan valtavan vaikutusvaltaisia.

Encyclopédien ajatellaan osaltaan ruokkineen Ranskan vallankumousta, ja History of England on muokannut brittiläistä identiteettiä tähän päivään asti.

Digitaaliset menetelmät antavat mahdollisuuden punnita vanhoja kysymyksiä uuden todistusaineiston valossa. Lopullisesta totuudesta ei voi tieteessä puhua, mutta hypoteesit saadaan entistä vankemmalle pohjalle.

Aatehistorioitsijaa innostaa myös mahdollisuus mallintaa aatteiden leviämistä ajallisesti ja maantieteellisesti. Tähän ei Tolosen mukaan ole vielä uskottavasti kyetty.

Kaikkien historioitsijoiden ei tarvitse Tolosen mielestä tulevaisuudessakaan ohjelmoida, kunhan yhteistyö tietojenkäsittelytieteilijöiden kanssa toimii.

”En silti näe mitään syytä, miksi kaikki humanistit eivät voisi opetella koodausta. Joka tapauksessa tutkimukseen tarvitaan eri alojen koulutettuja ammattilaisia, ja näiden yhteinen kieli on kaikki kaikessa.”

    Seuraa uutisia tästä aiheesta

  • Tiede
  • Historia
  • Yliopistot
  • tietojenkäsittelytiede
  • Algoritmi

Kommentit

    Ei vielä kommentteja. Kirjoita ensimmäinen.

    Näytä lisää
    Luetuimmat
    • Juuri nyt
    • Päivä
    • Viikko
    1. 1

      Kolme kuoliaaksi kuristettua ihmistä, lukuisia hyökkäyksiä naisten kimppuun, raiskaamista ja vankilapakoja – näin Oulussa pajatsoja huijanneesta nuorukaisesta tuli kylmäverinen tappaja

      Tilaajille
    2. 2

      Moni vanhempi ei ymmärrä, mitä seuraa, kun lapsi saa kännykän – varaudu järkytykseen

    3. 3

      Katja Mikkola shoppaili ennen halparetkuja, mutta harkitsee nyt jokaista hankintaansa – Tässä 11 + 5 tapaa, miten voit ostaa ja kuluttaa vaatteita vastuullisemmin

    4. 4

      Huipulle pyrkivä suomalaistanssija Marko Juusela, 17, joutuu sietämään nimittelyä, läpsimistä ja kovaa kuria baletin huippukoulussa Venäjällä: ”Niin se menee, ja siihen olemme tottuneet”

    5. 5

      Yhteiskunta väheksyy varhaiskasvatuksen arvoa – mutta kun puhutaan yritystuista tai asehankinnoista, rahasta ei sitten yllättäen olekaan puutetta

    6. 6

      Autojen päästötestaus muuttui, mikä tekee autoista kalliimpia – VTT:n tutkija: ”Auton verotukselle on pakko tehdä jotain, tai tulee huomaamatta autoveron korotus”

    7. 7

      12-vuotias australialainen poika varasti vanhempien luottokortin, huijasi isoäidiltä passinsa ja lensi yksin lomalle Balille

    8. 8

      Lääkärien kiinteä kuukausipalkka on Euroopassa harvinaisuus – Suomessakin pitäisi alkaa palkita potilaiden määrän mukaan, sanovat asiantuntijat

    9. 9

      Sata vuotta sitten säveltäjä Toivo Kuula sai luodin päähänsä, eikä tappaja koskaan selvinnyt – Pari viikkoa sitten Kuulan tyttärenpoika sai puhelun, joka oli pudottaa hänet sängystä

      Tilaajille
    10. 10

      Donald Trump harkitsee armahdusta raskaan sarjan historiaa tehneelle maailmanmestarille 72 vuotta kuoleman jälkeen – taustalla Sylvester Stallonen soitto

    11. Näytä lisää
    1. 1

      Sata vuotta sitten säveltäjä Toivo Kuula sai luodin päähänsä, eikä tappaja koskaan selvinnyt – Pari viikkoa sitten Kuulan tyttärenpoika sai puhelun, joka oli pudottaa hänet sängystä

      Tilaajille
    2. 2

      Savonlinna lakkaa olemasta yliopistokaupunki, ja seuraukset ovat järisyttävät – ”Yli tuhannen ihmisen lähtö on kerralla iso isku”

    3. 3

      Mormonipoika tuli Suomeen vuonna 1999 kolkuttelemaan ovia ja opettamaan meitä, mutta kävikin niin, että Suomi teki hänestä hipsterin, diplomaatin ja eräihmisen

      Tilaajille
    4. 4

      Guruilu ja pitchaus uivat yliopistoihin, tekoälymystö jyräsi humanistit – siksi tarvitaan sivistyneistön vastaisku

    5. 5

      Miksi Lego-hahmojen pitää näyttää niin vihaisilta?

    6. 6

      Moni vanhempi ei ymmärrä, mitä seuraa, kun lapsi saa kännykän – varaudu järkytykseen

    7. 7

      Kolme kuoliaaksi kuristettua ihmistä, lukuisia hyökkäyksiä naisten kimppuun, raiskaamista ja vankilapakoja – näin Oulussa pajatsoja huijanneesta nuorukaisesta tuli kylmäverinen tappaja

      Tilaajille
    8. 8

      Suomalaisnaisilla on isommat rinnat ja pienempi ympärysmitta kuin ennen, kertovat rintaliiviyrittäjät sadan vuoden kokemuksella

    9. 9

      Suurin osa lapsista putoaa pois harrastuksista ”valioyksilöiden” tieltä

    10. 10

      Sulkevatko mielen­ilmaukset päiväkoteja tällä viikolla? Keskiviikkona suuri osa henkilö­kunnasta marssii ulos, perjantaina lasten­tarhanopettajat pyytävät satojen eurojen palkan­korotuksia

    11. Näytä lisää
    1. 1

      Näin Juhana Helmen­kalastajasta tuli Suomen tv-viihteen vihatuin tyyppi täsmälleen samasta syystä kuin 15 vuotta aiemmin

    2. 2

      Onnistujia yhdistää yksi olennainen piirre, ja psykologi Satu Kaski löysi sen – Nyt hän kertoo, mitä ominaisuuksia kannattaa kehittää, jos haluaa menestyjäksi

      Tilaajille
    3. 3

      Lastenpsykiatri Jari Sinkkonen: Suomeen tarvitaan vanhempien kansanliike, jos emme halua menettää lapsiamme peliriippuvuudelle

    4. 4

      Ammattikorkeakouluihin haetaan vilpillä sisään Helsingissä, helposti – ”Koe mittaa enemmänkin kykyä olla epärehellinen kuin oikeaa osaamista”

    5. 5

      Eteläsuomalainen pariskunta syytteessä alle kouluikäisen lapsensa törkeästä pahoinpitelystä – epäilyt paljastuivat, kun perhe oli lähdössä pitkälle purjehdukselle

    6. 6

      ”Ei 20 vuotta sitten ollut sen näköisiä hampaita” – Purentaelimistön vaivat ovat lisääntyneet huimasti, sanoo hammasasiantuntija, ja syy on kahdessa isossa muutoksessa

      Tilaajille
    7. 7

      Sata vuotta sitten säveltäjä Toivo Kuula sai luodin päähänsä, eikä tappaja koskaan selvinnyt – Pari viikkoa sitten Kuulan tyttärenpoika sai puhelun, joka oli pudottaa hänet sängystä

      Tilaajille
    8. 8

      Tätä lähes 100 vuotta vanhaa kuvaa pidetään nyt maailman vanhimpana meeminä – ja se osoittaa täydellisesti, ettei huumorimme ole muuttunut ollenkaan

    9. 9

      Maailmankuulu ruotsalainen dj ja musiikkituottaja Avicii on kuollut 28-vuotiaana – myös kuningasperhe ilmoitti surevansa prinssi Carl Philipin ja prinsessa Sofian häissä esiintynyttä tähteä

    10. 10

      Lukuisten autoilijoiden pihoilla kytee tuhansien eurojen vakuutus­pommi – heitä ei voi varoittaa, sillä käytännössä kukaan ei tiedä, keitä he ovat

    11. Näytä lisää
    Uusimmat
    1. Juuri nyt
    2. ”Juoksin kotiin mielessäni kuolleet hevoset ja päätön nainen” – Helsinkiläisnaisen jäämistöstä paljastui ennennäkemättömiä kuvia Helsingin valtauksesta 1918
    3. Toistakymmentä poliitikkoa haluaisi lämmittää helsinkiläisten koteja ydinvoimalla – energiayhtiö toppuuttelee
    4. Donald Trump harkitsee armahdusta raskaan sarjan historiaa tehneelle maailmanmestarille 72 vuotta kuoleman jälkeen – taustalla Sylvester Stallonen soitto
    5. Aito talviruokaihminen nauttii häpeilemättä kulhon lämmittävää chiliä vielä keväälläkin – tämä helppo vegaaninen muhennos maistuu sellaisenaan tai riisin kanssa
    6. 12-vuotias australialainen poika varasti vanhempien luottokortin, huijasi isoäidiltä passinsa ja lensi yksin lomalle Balille
    7. Teemu Pukki taistelee Tanskan maalikuninkuudesta – mestaruus jo melkein hyppysissä
    8. Autojen päästötestaus muuttui, mikä tekee autoista kalliimpia – VTT:n tutkija: ”Auton verotukselle on pakko tehdä jotain, tai tulee huomaamatta autoveron korotus”
    9. Turun puukotusiskun silminnäkijät pääsevät ääneen käräjäoikeudessa – HS seuraa istuntoa kello 9.30 alkaen
    10. Kolme kuoliaaksi kuristettua ihmistä, lukuisia hyökkäyksiä naisten kimppuun, raiskaamista ja vankilapakoja – näin Oulussa pajatsoja huijanneesta nuorukaisesta tuli kylmäverinen tappaja Tilaajille
    11. Vaikka puoliso lyö, moni sinnittelee suhteessa vuosia: ”Eihän edes luita murtunut” – Espooseen avattiin uusi turvakoti, ja se täyttyi saman tien
    12. Näytä lisää