Mielipide

Yritysten dataa tarvitaan tilastojen pohjaksi

Riippumattomasti

Vaikka

Datan

Yritysten

tuotetulle tiedolle on yhteiskunnassa kysyntää, ja tilastot ovat yksi yhteiskunnallisten päätösten perustana olevista tietolähteistä. Luotettavien tilastojen pohjaksi tarvitaan riittävän kattavia ja ajantasaisia tietoaineistoja.Yhteiskunnan tilan kuvaaminen voisi onnistua entistä nopeammin ja kattavammin yritysten toiminnan yhteydessä syntyvillä tietoaineistoilla. Tilastojen tekijöiden kannalta kiinnostavia olisivat esimerkiksi mobiilioperaattoreiden paikannusdata, päivittäistavarakaupan kassatapahtumat ja kanta-asiakasdata tai yritysten tilinpäätösaineistot kirjanpidon järjestelmistä.Tilastontuottajat eivät kuitenkaan vielä pääse näihin aineistoihin käsiksi, vaikka yritysten datalla on potentiaalia vastata myös tilastotuotannon haasteisiin.Viime keväänä vahvistetussa Suomen tietopolitiikassa aineistojen saatavuuden parantaminen nostettiin yhdeksi keskeisistä tavoitteista. Tilastointia koskevaa lainsäädäntöä uudistettaessa päättäjät voivat säätää lakia siihen suuntaan, että yrityksiä velvoitettaisiin jakamaan tietovarantojaan viranomaisille tutkimus- ja tilastointikäyttöön.suuri osa tilastotuotannossa tarvittavista aineistoista saadaan suoraan viranomaisten rekistereistä, tilastoinnissa tehdään vuosittain myös lukuisia kansalaisille ja yrityksille suunnattuja tiedonkeruita. Niillä kerätään ne tiedot, joita ei muuten ole saatavilla.Tiedonkeruita vaivaa kansainvälisesti lisääntyvä vastauskato: yhä useampi jättää vastaamatta kyselyihin. Vastaamatta jättävät etenkin ryhmät, joiden ääni saattaa muutenkin olla yhteiskunnassa heikosti kuuluvissa. Tyypillisesti vastaamatta jättäviä ryhmiä ovat nuoret, työttömät, yksin asuvat ja pienituloiset.Vastauskato, vastaajien tavoittamattomuus ja tiettyjen vastaajaryhmien liian pieni esiintymä otoksessa tuovat tilastoihin epävarmuutta. Tätä voidaan paikata erilaisilla matemaattisilla painotuksilla, mutta korjattunakaan tietomassa ei välttämättä vastaa riittävän hyvin todellisuutta.Yritysten toiminnan yhteydessä syntyvät data-aineistot voivat olla osa ongelman ratkaisua. Suurilla aineistoilla on mahdollista tarkentaa esimerkiksi suuresta vaihtelusta johtuvaa epävarmuutta, keventää osin yritysten ja kansalaisten vastaustaakkaa tai tuottaa kokonaan uusia yhteiskunnan tilaa kuvaavia tilastoaineistoja.Sekä Virossa että Suomessa on yhteistyössä teleoperaattorien kanssa testattu ja verrattu mobiililaitteiden käytössä syntyvän datan ja perinteisempien tilastointimenetelmien avulla tehtyjä tilastoja. Mobiililaitteiden paikannustietoa voidaan käyttää matkailutilastoinnissa tai esimerkiksi kuntien kesäkauden väestömäärän mittaamisessa. Tulokset ovat olleet rohkaisevia.jakaminen voitaisiin toteuttaa kumppanuutena, josta myös yritykset hyötyvät. Tilastovirastojen data-analyytikot voivat koostaa informatiivisista aineistoista myös yritysten tarpeisiin yksilöityä tietoa.Yritysten data-aineistojen käyttöä tilastoinnissa on kokeiltu monissa Euroopan maissa. Kaupoilta saatavien kassapääteaineistojen soveltuvuutta on selvitetty kuluttajien luottamuksesta kertovan indeksin ja kuluttajahintaindeksin laadinnassa. Esimerkiksi lääkkeiden, alkoholituotteiden ja päivittäistavarakaupan hintakehitystä tilastoidaan Suomessa jo yritysten datan avulla.Jotta data-aineistojen hyödyt saadaan kokonaisvaltaiseen käyttöön, on tehtävä yksittäisiä kokeiluja laajamittaisempia muutoksia. Ratkaisuja on kansainvälisesti etsitty sekä sopimusteitse että muuttamalla lainsäädäntöä.käsissä olevien tietoaineistojen luovuttamiseen ja käyttöön liittyy epävarmuutta. Kyse on myös yritysten sekä niiden asiakkaiden tietosuojasta, yksityisyydestä ja luottamuksesta. Keskustelua tietosuojanäkökulmasta auttanee se, että tietosuojavaatimukset ja eettiset kysymykset ovat tilastojen laatijoiden arkea jo nyt.Pohjoismaat ja Baltian maat ovat olleet edelläkävijöitä käyttäessään julkishallinnon toiminnassa syntyviä tietoaineistoja ja rekistereitä tilastoinnin lähteenä. Seuraavassa kehitysvaiheessa ajantasaisen ja laadukkaan tilastotiedon perustana voidaan hyödyntää nykyistä laajemmin myös yritysten hallussa olevaa dataa.