Tarkista selaimen asetuksista, että JavaScript ja evästeet ovat käytössä.

Mitä oikeastaan tiedämme Googlesta?

Google löytää 0,18 sekunnissa yli 6,6 miljoonaa hakutulosta. Miten ihmeessä tämä kaikki on mahdollista?

Tekniikka
 

Istun tietokoneen ääressä kotonani Helsingin Kalliossa.

Ei ole oikein mitään tekemistä, joten kirjoitan Googleen sanan koira ja painan enteriä. Kuluu 0,18 sekuntia, ja hakutulokset lävähtävät ruudulle. Linkkejä on yli 6,6 miljoonaa kappaletta, eikä niihin perehtymiseen yksi elinikä riitä.

Miten ihmeessä tämä on mahdollista? Missä hakusana käy ja mitä sille tapahtuu?

Google on maailman  suurin hakukone. Sillä tehdään joka päivä monta miljardia sanahakua. Kaikkien käyttäjien palveleminen vaatii jättiläismäisen koneiston, joka odottaa valppaana hakupyyntöjä yöt ja päivät.

Minun koirahakuni on yksi pieni pisara tässä koskessa.

Mutta näin haku alkaa: Tietokone muuttaa hakusanan ykkösiksi ja nolliksi. Siitä tehdään hakupyyntö, joka lähetetään kohti Googlea.

Hakupyyntö muistuttaa postipakettia siinä mielessä, ettei lähettäjän tarvitse vaivata päätään sillä, mitä kautta paketti löytää perille. Riittää, kun pakettiin merkitsee vastaanottajan.

Tietokoneesta hakupyyntö solahtaa ensin laajakaistamodeemiin ja siitä lankapuhelimen vanhaa kuparijohtoa pitkin kellariin.

Kun Google saa hakupyyntöni koirasta, sillä on jo vastaus melkein valmiina. Se on valmistautunut hakupyyntööni tutkimalla internetiä vuosikausia.

Asun kerrostalossa, joten nettiyhteys ulkomaailmaan kulkee kellarissa sijaitsevan talojakamon kautta. Tiedättehän ne kalseat, lukitut ovet, joissa on HPY:n, Elisan tai Soneran tarra jossain nurkassa.

Jakamossa signaali siirtyy isompaan kuparikaapeliin, joka sukeltaa maan alle.

Tätä kaapelia posotetaan joitakin satoja metrejä. Luultavasti jossakin Kallion nurkilla kaapeli yhdistyy tilaajakeskittimeen. Se kokoaa eri asuintaloista tulevia yhteyksiä valokuituverkkoon, joka kiemurtelee putkissa ja tunneleissa Helsingin alla.

Tämä verkko kytkeytyy yhteyksiin, jotka yhdistävät Suomen kaupunkeja toisiinsa.

Helsingistä matka jatkuu länteen päin. Hakupyyntöni koirasta etenee Turun eteläpuolelle Paraisiin, josta alkaa merimatka.

Itämeren pohjassa on järeä tietoliikennekaapeli, melkein kymmenen sentin paksuinen mötikkä. Kaapelin sisällä on melkein sata valokuitua, jotka ovat hiustakin ohuempia. Yhtä sellaista pitkin hakupyyntö lähtee kohti Ruotsia. Se säteilee kuidun sisällä valona, joka on ihmissilmälle näkymätöntä.

Ahvenanmaalla kaapeli nousee toviksi maanpinnalle ja painuu sitten taas mereen. Sen päätepiste on Tukholma. Siellä kallioon louhitussa bunkkerissa on verkkoliikenteen yhdysliikennepiste.

Ja siellä Google jo odottaakin.

Tukholma on yksi niitä paikkoja, joissa on sisäänpääsy Googlen omaan maailmanlaajuiseen tietoverkkoon.

Yleensä ajatellaan, että internet on yksi yhtenäinen verkko. Todellisuudessa näin ei kuitenkaan ole. Internet koostuu yritysten, yliopistojen ja muiden tahojen ylläpitämistä erillisistä verkoista. Ne on kytketty yhteen ja liikenne siirtyy verkosta toiseen mutkattomasti.

Yksi suurimmista internetin verkoista kuuluu Googlelle.

Se omistaa ja on vuokrannut käyttöönsä valokuituyhteyksiä eri puolilta maailmaa. Google ohjaa hakupyynnöt aina ensin mahdollisimman nopeasti tähän yksityiseen tietoverkkoonsa eli runkoverkkoon, jossa ne sitten ohjataan eteenpäin.

Googlen hakukonetta voi ajatella vaikkapa tehdasalueena.

Googlen runkoverkko on yksityisteiden rihmasto, jota pitkin kuljetaan laajan tehdasalueen rajoilta sen ytimeen.

Tehdasaluetta ympäröi aita, mutta aidassa on useita portteja, joista pääsevät läpi ne, joilla on tehtaaseen asiaa. Googlen omaan runkoverkkoon on pääsy yli 65 paikasta eri puolilta maailmaa: juuri Tukholmasta mutta myös Berliinistä, Chicagosta, Hongkongista, Sydneystä, Lagosista ja monesta muusta kaupungista.

Minne koiraa koskeva hakupyyntö ohjautuu tultuaan Googlen runkoverkkoon?

Sitä on vaikea sanoa. Google ei kerro, kuinka se ohjailee liikennettä verkossaan. Google tietää käyttäjistään valtavan paljon, mutta omista asioistaan se on varsin tuppisuinen.

Reitit myös vaihtelevat kerrasta toiseen, sillä Googlen oma verkko on laaja ja rönsyilevä.

Se kuitenkin tiedetään, missä ovat hakukoneen aivot.

Googlen ytimessä on kolmetoista suurta palvelinkeskusta, joissa lasketaan kaikki hakutulokset. Ne ovat Googlen aivot.

Palvelinkeskuksissa säilytetään myös Gmail-sähköposteja, Youtube-nettivideoita ja kaikkien muidenkin Googlen omistamien verkkopalveluiden käyttämiä tietoja. Google sai yrityksenä alkunsa hakukoneesta, mutta nykyään sillä on valtava määrä muitakin verkkopalveluita.

Euroopassa Googlella on palvelinkeskuksia Irlannissa, Belgiassa ja Suomessa. Suomalainen palvelinkeskus sijaitsee Haminassa, jossa Stora Enson entisen paperitehtaan betonihallit on täytetty tietokoneilla.

Google mainostaa mielellään sitä, kuinka ihmeellisiä paikkoja palvelinkeskukset ovat.

Palvelinten rivit hohtavat sinistä valoa pimeydessä. Viereisissä huoneissa Googlen henkilökunta valvoo niiden toimintaa yöt ja päivät. Insinöörit kamppailevat jäähdyttääkseen palvelimia, sillä hakukone kuumenee käytössä.

Työntekijät käyttävät shortseja, kun he käyvät palvelinten luona, koska lämpötila voi olla lähes 27 astetta. Energiaa säästyy, kun konesalia ei jäähdytetä enempää.

Kulkua palvelinkeskuksiin vartioidaan tarkasti. Työntekijät tunnistetaan sormenjälki- ja silmäskannereilla. Ketään ei haluta päästää tekemään tihutöitä palvelinkeskuksiin. Jos maailman suurimman hakukoneen toiminta häiriintyisi, siitä olisi maailmanlaajuista riesaa.

Mutta yhden keskuksen kaatuminen ei Googlea vielä paljon hetkauttaisi. Kaikki tiedot säilytetään useammassa kuin yhdessä palvelinkeskuksessa.

Varmuuden vuoksi Googlen työntekijät testaavat säännöllisesti palvelinkeskusten varotoimia tekemällä hyökkäyksiä. Niissä esimerkiksi häiritään tietoverkkoja tai puhkotaan jäähdytysvettä kuljettaviin putkiin reikiä.

Mutta palataan koira-hakuuni, mikä palvelinkeskus etsii sen tulokset?

Yksinkertaistettu vastaus on, että luultavasti se, joka sijaitsee lähimpänä eli Hamina. Googlen periaate on, että tieto haetaan aina nopeinta mahdollista reittiä. Tukholmasta on ainakin linnuntietä selvästi lyhin matka Haminan keskukseen.

Haku pujahti siis sisään Googlen omaan verkkoon Tukholmassa, mutta tieto kaivettiin esiin Haminan palvelinkeskuksesta.

Mutta tieto voidaan hakea muualtakin, vaikkapa Irlannista tai Belgiasta, jos Haminan palvelinkeskus tai sinne johtava reitti on ruuhkaantunut.

Ja oikeasti Googlen toiminta on monimutkaisempaa. Hakutuloksien kokoaminen ja päivittäminen on mutkikas prosessi. Sen eri vaiheita voidaan jakaa eri palvelinkeskuksille. Niiden roolit voivat myös muuttua ajan myötä.

Voi ajatella, että Googlen runkoverkko ja palvelinkeskukset ovat elimistö. Jokaisella elimellä on oma roolinsa, mutta ennen kaikkea ne tekevät yhteistyötä osana kokonaisuutta. Palvelinkeskukset käsittelevät tietoa yhteistuumin kuten ihmisaivojen eri osat käsittelevät.

Kun Google saa  hakupyyntöni koirasta, sillä on jo vastaus melkein valmiina. Se on valmistautunut hakupyyntööni tutkimalla internetiä vuosikausia.

Hakutulokset rakennetaan siten, että Google pitää kirjaa kaikkien löytämiensä verkkosivujen sisällöstä. Sen apuohjelmat, joita kutsutaan hämähäkeiksi, kartoittavat säännöllisesti verkkosivuja etenemällä linkistä toiseen.

Hämähäkit käyvät säännöllisesti läpi miljardeja sivustoja.

Se on valtava määrä, mutta todellisuudessa vain pieni osa siitä kaikesta tiedosta, mikä olisi internetissä löydettävissä.

Hämähäkit ovat loppujen lopuksi melko alkeellisia ohjelmistoja. Monenlaiset verkon tietokannat jäävät niiltä tutkimatta. Tutkivat journalistit ovat saavuttaneet uutisvoittoja ihan vain sillä, että ovat ymmärtäneet etsiä tietoa sieltä, mihin Googlen valokeila ei ulotu.

Mutta monelle verkonkäyttäjälle Google on yhtä kuin internetin näkyvä todellisuus.

Hämähäkit tutkivat, mitä sanoja niiden löytämillä sivuilla esiintyy. Tiedoista kootaan iso hakemisto.

Siitä voi tarkistaa, millä eri verkkosivuilla lukee aakkonen, aalto, aamu, aapinen, aarre, aavasaksa. . .

Tämän hakemiston avulla hakutulokset kootaan. Niiden järjestys tuloslistassa määritellään mutkikkaalla kaavalla.

Järjestykseen vaikuttaa esimerkiksi se, missä yhteydessä hakusana esiintyy sivulla, kuinka paljon muilta verkkosivuilta on linkkejä kyseiselle sivulle ja se, paljonko sivua on jaettu Twitterissä.

Koira on suomenkieliseksi hakusanaksi erittäin suosittu. Sana "koira" esiintyy kuukaudessa noin 820 000 haussa.

Tämä merkitsee, ettei hakupyyntöni välttämättä edes etene Tukholmasta Googlen palvelinkeskuksiin kuten Haminaan asti.

Monia suosittuja hakutuloksia säilytetään valmiiksi paketiksi koottuna verkkopalvelimilla, jotka sijaitsevat lähellä Googlen käyttäjiä. Ne ovat Googlen runkoverkossa, mutta lähellä sen reunaa eli paikkaa, jossa verkko kytkeytyy ulkomaailmaan.

Kuten Tukholmaa.

Google ei kerro, missä sillä on verkkopalvelimia.

Suomalaisia internetin yhdysliikennepisteitä ylläpitävän Ficix ry:n hallituksen puheenjohtaja Jorma Mellin kuitenkin päättelee, että Googlen julkinen verkkopalvelin sijaitsee juuri Tukholman seutuvilla.

Onkin varsin todennäköistä, että koira-hakuni ohjautuu sinne ja että hakutulokset löytyvät jo palvelimelta valmiina.

On kulunut vain silmänräpäys siitä, kun painoin enteriä.

Hakutulokset kiitävät tietokoneelleni samaa reittiä, jota hakusana eteni toiseen suuntaan: Tukholmassa hakutulos tulee ulos Googlen omasta verkosta ja jatkaa matkaa Maarianhaminaan ja Turkuun, sieltä Helsinkiin ja kerrostalon kellarista lankapuhelimen johtoa asuntooni.

Ja sitten ensimmäinen tulossivu aukeaa verkkoselaimeen.

Tuloslistan kärjessä on Wikipedia-artikkeli koirasta. Toisena on koiraharrastajien yhteisösivusto www.koirat.com.

Kymmenen kärjessä ovat myös Suomen kennelliiton sivu sekä Yliopistollisen eläinsairaalan sivu koirien veripankista. Listalta löytyy myös MTV3:n uutinen koirasta, joka hyökkäsi pyöräilijän kimppuun, sekä pilailusivusto Hikipedian juttu, jonka mukaan "koira on vittumainen luontokappale, joka on miehelle sama kuin timantit naisihmisille".

En enää klikkaa auki toista hakusivua. Moni Googlen käyttäjä tyytyy laillani katselemaan kymmentä ensimmäistä hakutulosta. Se, joka niiden joukkoon raivaa tiensä, pääsee parrasvaloihin.

Jaa että sellainen otus se koira sitten on.

Olisin todellinen koira-asiantuntija, jos vain perehtyisin kaikkeen tähän tietoon. Mutta Google tekee käyttäjänsä myös lyhytjännitteiseksi. Tietoa on niin vaivattomasti saatavilla, että sille on helppo kohauttaa olkapäitään.

Silmäilen hetken hakutuloksia, jonka Googlen valtava koneisto minulle auliisti tarjoilee. Sitten mielenkiintoni herpaantuu ja näppäilen Googleen hakusanan "kissa".

Jukka Pylväs
Aloitan "koiran" googlauksen kotisohvaltani Kalliossa.Hakupyyntö sujahtaa kuparijohtoa pitkin kellarissa olevaan talojakamoon.Kalliossa talojen yhteydet kootaan valokuituverkkoon.Itämeren pohjassa kulkee järeä tietoliikennekaapeli. Siellä se "koira"-hakukin menee.Ahvenanmaalla kaapeli nousee hetkeksi pinnalle.Tukholmassa, kalliobunkkerissa, on verkkoliikenteen yhdyspiste.Googlen palvelinkeskuksissa säilytetään Youtube-videoita ja G-mail-sähköposteja.
Aloitan "koiran" googlauksen kotisohvaltani Kalliossa.
Hakupyyntö sujahtaa kuparijohtoa pitkin kellarissa olevaan talojakamoon.
Kalliossa talojen yhteydet kootaan valokuituverkkoon.
Itämeren pohjassa kulkee järeä tietoliikennekaapeli. Siellä se "koira"-hakukin menee.
Ahvenanmaalla kaapeli nousee hetkeksi pinnalle.
Tukholmassa, kalliobunkkerissa, on verkkoliikenteen yhdyspiste.
Googlen palvelinkeskuksissa säilytetään Youtube-videoita ja G-mail-sähköposteja.