6.1.2008 0:00
KVG on nuorisokieltä, jolla ojennetaan liian tyhmän kysymyksen tekijää. Ohje katso v***u googlesta lähtee ajatuksesta, että verkosta löytyy vastaus ongelmaan kuin ongelmaan.
Tietoa riittääkin. Viidentoista vuoden aikana verkkoon on tuupattu likipitäen kaikkea, jota vain suinkin voidaan muuntaa digitaaliseen muotoon: uutisia, tieteellisiä tutkimuksia, keskusteluja, sanakirjoja, musiikkia, liikkuvaa kuvaa . . .
Tiedosta ei silti ole apua, jos sitä on liikaa, sitä ei löydä tai se on yksipuolista. Kanadan kansalliskirjaston vuosiraportin mukaan verkossa julkaistaan 15 minuutissa yhtä paljon materiaalia kuin sitä on jo nyt paperisena Yhdysvaltojen kongressin kirjastossa.
Tietoa on niin paljon, että moni jo luottaa internetin maailmankuvaan. Se poikkeaa kuitenkin monin paikoin reaalimaailman oloista.
Suuri osa ihmisen henkisestä perinnöstä on yhä verkon ulkopuolella.
Minkälainen tieto netistä sitten puuttuu? Harva asia on kokonaan kateissa, mutta monet aihealueet ovat selvästi aliedustettuina. Tällaisia ovat esimerkiksi kirjallisuus, klassinen musiikki – ja yli nelikymppisten sielunelämä. Syyt vaihtelevat tekniikasta tekijänoikeuksiin, verkkokulttuurista maailman talousrakenteisiin:
Kaunokirjallisuuden johtava käyttöliittymä on edelleen paperinen kirja. Sanomalehtiarkistojen julkaisemista jarruttavat tekijänoikeuskysymykset. Kolmannen maailman poissaolo johtuu siitä, ettei kehitysmaissa ole juuri tietokoneita.
Verkkoon siirretty materiaali on kirjavaa myös siksi, että internetin johtoajatus on ollut alusta saakka ruohonjuuritasolta ponnistava vapaaehtoisuus. Toiminta on ollut usein kiinni innokkaiden amatöörien viitseliäisyydestä. Järjestelmällinen materiaalin muuntaminen digitaaliseen muotoon (esimerkiksi skannaamalla) on kallista ja hidasta, ja siinä on otettu vasta ensimmäiset askeleet.
Aineistovaatimuksissa pitää olla myös kohtuullinen. Internetin kulta-aikaa on eletty vasta viitisentoista vuotta. Kaikkea ei ole ehditty digitoida, vaikka kuinka olisi mieli tehnyt.
Suurimpien tietopottien päällä istuvat kirjastot, arkistot ja museot. Tiukan talouden valtakaudella niiden on harkittava tarkkaan, minkälaisiin digitointihankkeisiin ne lähtevät.
Helsingin yliopiston kirjastolle eli nykyiselle Kansalliskirjastolle on tarjottu vapaasti käytettäväksi monia aineistokokonaisuuksia, mutta henkilökuntaa ei riitä aineiston digitoimiseen.
"Meillä on omissa kokoelmissamme pelastettavana satatuhatta teosta, joita ei nytkään anneta ihmisten luettavaksi", Kansalliskirjaston ylikirjastonhoitaja Kai Ekholm sanoo.
Ekholm ei viivyttelisi pienen kansakunnan identiteettiä rakentavan aineiston julkaisemisessa.
"Kansallinen sivistyksemme voitaisiin digitoida kymmenessä vuodessa, jos rahoitus vain löytyisi. Saamme hankittua Bruce Willisin uusimman elokuvan vaikka mistä, mutta kukaan ei tallenna kansallista perintöämme puolestamme."
Laadukkaalle aineistolle on aina kysyntää, kunhan se saadaan vain laitetuksi verkkoon.
Esimerkiksi Kansalliskirjaston digikokoelman viime aikojen hitti on ollut pienpainatekokoelman teollisuushinnastot vuosilta 1810–1944. Palvelusta on ladattu vuodessa 3,5 miljoonaa tiedostoa – yksi joka kahdeksas sekunti.
Palvelussa voi selata vaikka Arabian astioiden hinnastoa tammikuulta 1931 tai Sinihappovaunu-yhtiön opaskirjaa Kuinka taistelu syöpäläisiä vastaan ja niiden hävittäminen tapahtuu. Sivustoa ovat kiitelleet niin keräilijät kuin historiantutkijat.
Iso laiva on jo kääntymässä. Ensi vuoden opetusministeriön budjettiin on ensimmäisen kerran korvamerkitty "kulttuuriperinnön digitoimiseen" kaksi miljoonaa euroa.
Rahan jakamisesta eri laitosten kesken ei ole vielä päätetty, mutta esimerkiksi Museoviraston tavoitteena on päästä jatkamaan kuva-arkistonsa digitointia. Virasto haluaa varautua tuleviin tasavuosijuhliin, kuten Suomen sodan 200-vuotisjuhlavuoteen ja 1900-luvun alun historiallisiin käännekohtiin.
Tällä hetkellä kolmen miljoonan kuvan kokoelmasta on skannattu vasta 100 000.
Laajamittaisissa digitointihankkeissa on vaaransa. Kun haukataan liian suurta kakkua, urakka voi käydä ylivoimaiseksi.
"Digimaailmassa on sellaista postmodernia meininkiä, että hankkeita on helpompi aloittaa kuin lopettaa", Kansallisen audiovisuaalisen arkiston tutkija Jari Sedergren toteaa.
Yksi tapa epäonnistua on käynnistää jättiurakka käyttämällä teknologiaa, joka on kokeiluvaiheessa ja jonka yleistymisestä ei ole varmaa tietoa. Kun hanke pitkittyy, tallennusformaatit vaihtuvat eikä valmista tietokantaa enää voi helposti päivittää.
"Mikään digitalisointihanke ei silti ole turha. Projektit on vain saatettava hallitusti loppuun asti", Sedergren sanoo.
Toisinaan sivusto on hyvin suunniteltu ja ajan tasalla, mutta sitä on käytännössä mahdotonta löytää. Tällöin tieto voi piileskellä niin sanotun syväwebin poimuissa.
Syväwebillä eli näkymättömällä webillä tarkoitetaan niitä internetin osia, jonne hakukoneet eivät pääse käsiksi. Näitä ovat esimerkiksi kirjaston lukuisat tietokannat.
"Kirjaston tietokantoihin on luetteloitu paljon asiasanoja, mutta niilläkään ei pääse kunnolla tiedon jäljille. Jos haluaa löytää kirjan, jossa käsitellään jotain tiettyä aihetta fiktiivisesti, netin kohdalla on aika hukassa", kirjastojen valtakunnallisten verkkopalvelujen johtava suunnittelija Erkki Lounasvuori sanoo.
"Esimerkiksi Google löytää kirjailijan nimellä tietoja kirjailijasta, ja tuotantoonkin pääsee käsiksi, jos tietää kirjan nimen. Kirjailijan ja teoksen nimellä saa myös hakutuloksia, mutta ne vievät harvoin sivulle, jossa kerrotaan kirjailijan juuri tästä teoksesta, saati sen saatavuudesta kirjastosta tai kirjakaupasta."
Yksi syy tiedon tehotuotannolle on verkon tehtävä uutisvälineenä. Tietoa tuotetaan paljon, ja lähes kaikki arkistoidaan.
Määrä onkin jo aikoja sitten kiilannut laadun edelle. Moni tieto on verkossa moneen kertaan, osa on vanhentunutta eikä kukaan siivoa aineistoa.
Jatkuvan tietotulvan lisäksi verkon tietovarantoa vaivaa yksipuolisuus, sillä sitä on rakennettu verkon alkuperäisen käyttäjäkunnan ehdoilla. Verkkokulttuurin kärkijoukossa ovat olleet nuoret (mies)opiskelijat, joita kiinnostavat tietokonepelit, fantasiakirjallisuus ja muu popkulttuuri.
Tämä näkyy vaikkapa yhteisöllisesti tuotetussa tietosanakirja Wikipediassa, jossa televisiosarja Big Brotherista kertova artikkeli on kymmenen kertaa pidempi kuin kirjailija George Orwellin esittely.
Moni tieteen ja opetuksen parissa työskentelevä on ollut huolissaan verkon vinouttamasta maailmankuvasta.
Kai Ekholmin mukaan on tehty havaintoja, että tieteellisissä opinnäytetöissä vältellään fyysistä arkistotyötä. Jos tietoa ei löydy netistä, oletetaan, ettei se olekaan tärkeää. Tiedon laatu on viime kädessä sen arvo, eikä tiedon nopeus tai käyttömukavuus. "Haluaisitko itse käydä lääkärillä, joka on kouluttanut itsensä googlen avulla?" Ekholm kysyy.
Kaikkea painettua saadaan tuskin koskaan nettiin, eikä siihen ole tarvettakaan.
"Me elämme jatkossa hybridimaailmassa, jossa tarvitaan sekä netin nopeasti tuotettua – ja joskus myös virheellistä – aineistoa, mutta myös syvempää ja laadukasta historia-aineistoa."
Internetin aliedustetut 6.1.2008
Helsingin Sanomat | hs.sunnuntai@sanoma.fi