Jos katsot Orange is the New Black -sarjan, ehdottaa Netflix seuraavaksi Stallonen ja Schwarzeneggerin vankilaelokuvaa – Tutkija kertoo, miksi Netflixin suositukset toimivat niin surkeasti - Nyt.fi | HS.fi

Netflix, surkea suosittelija

Netflix on edelleen maailman suosituin suoratoistopalvelu, mutta isot kilpailijat kuten Disney+, Amazon Prime Video ja HBO Max uhkaavat jo kunnolla sen valta-asemaa. Yksi Netflixin kilpailuvaltti voisi olla sen suosittelija-algoritmi – mutta miksi se toimii käyttäjän kannalta niin kehnosti?


7.10. 13:48

Tämä videovuokraamo on kummallinen.

Paikka on täynnä mainoskylttejä, joissa mainostetaan vuokraamon omien tuotantojen elokuvia ja sarjoja. Elokuvia ei ole jaoteltu genrejen mukaan komedioihin, draamoihin, jännityselokuviin ja toimintaelokuviin, vaan hyllyjen päällä lukee tekstejä kuten:

Kyyniset komediat, joissa pääosaa esittää vahva nainen

Synkät äiti-tytär-indie-draamat

Herkeämättömät rikostrillerit

Vähäeleiset indie-draamat, jotka kertoivat häiriintyneistä perheistä

Kiinnostavaa elokuvaa tai sarjaa on vaikeaa löytää, koska kaikissa eri kategorioissa on samoja nimikkeitä. Melkein kaikissa hyllyissä iso osa on vuokraamon oman tuotannon B-luokan elokuvia ja sarjoja.

Tämä vuokraamo on surkea. Ihan kuin Netflix.

Netflix on maailman ysuosituin suoratoistopalvelu. Se on tehnyt pitkän matkan vuodesta 1997, kun se aloitti bisneksensä DVD-elokuvien tilauspalveluna.

25 miljardin dollarin liikevaihdolla pyörivän ja 208 miljoonan tilaajan Netflix on niin loistava brändi, että siitä on tullut synonyymi suoratoistopalveluille, vähän kuten Google on synonyymi hakukoneelle.

Mutta Netflix on vähän pinteessä.

Vuonna 2011 aloittanut vanha vihollinen Amazon Prime Video hengittää niskaan 200 miljoonalla tilaajalla, ja viime vuosina uusia kisaajia on tullut useita. Vuonna 2019 aloittanut Disney+ kasvaa aggressiivisesti. Se on kerännyt yli 100 miljoonaa tilaajaa alle 18 kuukaudessa.

Disney sai heti alkuun varaslähdön. Monet animaatiot, Marvel-leffat ja esimerkiksi Star Wars -elokuvat ovat aiemmin rikastuttaneet muiden suoratoistopalveluiden valikoimia. Disney otti kaikki omat tuotantonsa pois muilta alustoilta omaan rosteriinsa.

Vuonna 2019 aloittanut Apple TV+ on kerännyt jo 34 miljoonaa käyttäjää. Viimeisin suoratoistopalvelujätti on HBO Max, joka aloitti Yhdysvalloissa 2020. Sillä on jo 64 miljoonaa tilaajaa. Tänä vuonna HBO Maxia on alettu lanseerata ympäri maailmaa, ja lokakuun lopussa se tulee saataville myös Suomeen.

Netflix ei voi tuudittautua enää hegemoniseen asemaansa. Muuten ennustus, jonka totesi teknologiajulkaisu Wired, voi käydä toteen: ”Netflix on menettämässä cooliutensa”.

Yksi Netflixin kilpailuvaltti voisi olla sen algoritmi.

Algoritmit ovat digitaalisia asiakaspalvelijoita. Asiakas antaa algoritmeille tietoa hyväksymällä käyttöehdot: mihin kaikkiin ihmisen tietoihin se pääsee käsiksi. Algoritmit analysoivat, miten ihminen käyttää sovellusta ja prosessoivat tietoa. Sitten ne suosittelevat kohdennettua sisältöä.

Algoritmit ohjaavat suurta osaa ihmisen arjesta tarjoamalla sisältöä, jota se olettaa meidän haluavan. Asia toimii tietenkin myös päinvastoin: se, mitä algoritmi ei meille suosittele, jää pimentoon.

Niitä on kaikkialla: Spotifyssa, Googlessa, Facebookissa, Tiktokissa, Netflixissä, Youtubessa, Instagramissa, verkkolehdissä, verkkokaupoissa. Algoritmit työskentelevät väsymättä käytännössä jokaisessa digitaalisessa kaupallisessa palvelussa ja sovelluksessa.

Tarkoitus on tehdä käyttökokemuksestamme mahdollisimman miellyttävä ja koukuttava, jotta jatkamme sovelluksen käyttöä.

Jostain syystä Netflixin algoritmi ei tunnu toimivan. Nykyään palvelusta ei meinaa löytää kiinnostavaa katsottavaa. Kuten inc.com-sivusto asian muotoilee: ”yhdestä asiasta olemme varmasti kaikki samaa mieltä: Netflix on surkea antamaan suosituksia”.

Tampereen yliopiston tutkijatohtori Pekka Kallioniemi tutkii työkseen algoritmeja. Hän löytää useita syitä, miksi Netflixin algoritmi ei toimi kunnolla.

Algoritmit tallentavat ainoastaan kovan datan: katselumäärät, mitä on katseltu, katseluajan, kelaukset, lopetukset ja niin edespäin. Se, miksi ihminen elokuvaa katsoi ja mistä hän siinä piti, jää pimentoon.

”Se ymmärtää korrelaation, mutta ei kausaliteettia. Algoritmi ei siis pysty tunnistamaan tunnelatausta.”

Otetaan esimerkiksi Orange Is The New Black -sarja. Siinä on vankila-, LGBT- ja draamateemaista sisältöä. Jos katsojaa kiinnostavat draama ja LGBT-teema, mutta ei erityisemmin vankilateemasta, Netflix ei tajua tätä, vaan saattaa suositella Escape Plan -elokuvaa. Se on Sylvester Stallonen ja Arnold Schwarzeneggerin tähdittämää äijävankilaleffa.

Jos tämän suositellun elokuvan laittaa pyörimään, seuraavana Netflix saattaa suositella Schwarzeneggerin vuoden 1985 Commandoa.

Jos harhautuu katsomaan epämieluisaa sisältöä, suositukset alkavat mennä metsään, Kallioniemi kertoo.

”Katsoimme Kuka tappoi Saran -sarjaa. Se on meksikolainen roskasarja, jota katsoimme kokonaisen kauden toivoen, että se paranisi. Ei parantunut. Tämä katselu sekoittuu kuitenkin tuleviin suosituksiin.”

On outoa, että Netflixin käyttäjäkokemus ei ole parempi. Yritys on nimittäin data-analytiikan huippu, joka on saanut kerätä tietojaan vuodesta 2007 asti, kun se aloitti toimintansa.

Se tietää jokaisesta yli 200 miljoonasta käyttäjästä aika paljon: nimen, osoitteen, sähköpostiosoitteen ja IP-osoitteen. Netflixillä on tietoja käyttäjien internetin selaustoiminnasta ja demografisista tiedoista.

Netflix tietää, milloin ihminen katsoo, kuinka kauan hän katsoo ja millä laitteella katsoo. Se tietää, onko katsoja keskeyttänyt katselun, onko hän tämän jälkeen palannut katsomaan ohjelmaa ja katsooko ihminen sarjan kokonaisuudessaan vai ei. Se tietää, mitä on etsitty ja milloin.

Näiden tietojen pohjalta se rakentaa yksilöllisen kokemuksen käyttäjälleen.

Yhtiö käyttää data-analytiikkaa myös pohtiessaan, millaisia elokuvia ja sarjoja se alkaa tuottaa. Se laskee katseluiden ja muiden tietojen pohjalta, mikä yleisöihin vetoaa.

Myytin mukaan House of Cards -sarja on syntynyt ”nappia painamalla”, eli numeroita runttaamalla algoritmi on kertonut, millainen juoni ja maailma sarjassa tulisi olla, kenen pitäisi ohjata se ja keitä siinä näyttelisi.

Kun koneisto on näin hyvä, miksi käyttäjäkokemus on huono?

Esimerkiksi Tiktokin – paljon nuoremman ja siten vähemmän aikaa tietoja keränneen sovelluksen – algoritmi on verrattomasti parempi. Se osaa suositella käyttäjälleen hämmästyttävän hyvin oikeanlaisia sisältöjä.

Elokuvan katsominen on pitkä sisällönkulutussuoritus. Sen vuoksi yksittäisiä sisältökatseluita tulee vähemmän kuin Tiktokin maksimissaan kolmen minuutin videoista.

Mitä enemmän yksittäisiä katseluita, sitä tarkemmin algoritmi voi päätellä, mistä käyttäjä pitää.

Tiktokissa käyttäjä antaa algoritmille ”ohjeita” mieltymyksistään kymmeniä kertoja muutaman minuutin aikana. Netflixissä, jossa katsellaan pitkiä elokuvia ja sarjoja, algoritmi saa ohjeen kerran noin 20–240 minuutin aikana.

Puhutaan implisiittisestä palautteesta. Siihen sisältyvät kaikki toiminnot, joita suoritamme alustalla. Näitä ovat esimerkiksi reaktiot päivityksiin somessa, biisien aloitukset Spotifyssä ja seuraukset Twitterissä.

Sitten on eksplisiittinen palaute eli käyttäjän arvioinnit sisällöstä, esimerkiksi tähtiarviot tai arvio tuotteesta Amazonin verkkokaupassa.

Netflix tarvitsisi nimenomaan eksplisiittistä palautetta, koska sen sisällöistä on vaikeaa saada hyödyllistä implisiittistä palautetta. Siksi tuntuu hassulta, että Netflix rajoittaa eksplisiittisen palautteen antamista.

Aiemmin Netflixin käyttäjillä oli mahdollista arvostella sisältöä – antaa eksplisiittistä palautetta – mutta Netflix poisti 1–5-tähtiluokituksen vuonna 2017. Vuonna 2018 se poisti kaikki käyttäjien kirjoittamat arvostelut sivustoltaan.

Kymmenen vuoden aikana kertyneitä arvosteluita oli paljon. Esimerkiksi Stranger Things -sarjasta oli rustattu melkein neljätuhatta arvostelua, jotka huuhtoutuivat digitaalimereen.

Miksi Netflix ei halua palautetta, jolla se voisi kehittää sisältöään?

Yksi syy voi olla trollaus: käyttäjät saattoivat masinoida joillekin sisällöille yhden tähden, mikä sabotoi systeemiä. Netflix itse on kertonut, että arvosteluilla ei ollut oikein käyttöä.

Vai oliko sittenkin niin, että arvostelut eivät miellyttäneet Netflixiä?

Netflix on panostanut miljardeja omiin tuotantoihinsa ja jatkaa samalla tiellä. Tänä vuonna se aikoo panostaa 17 miljardia dollaria sisällöntuotantoon, josta valtaosa mennee sen omiin tuotantoihin.

Investoinnit ovat tuottanut tulosta. Laatu on ollut paikoin niin hyvää, että Emmyjä ja Oscareita on ropissut. Laadun lisäksi sarjat ovat olleet suosittuja.

Netflixin omien tiedotteiden mukaan esimerkiksi Bridgerton-sarjan ensimmäistä tuotantokautta on katsottu 82 miljoonaa kertaa ja The Witcherin ensimmäistä kautta 76 miljoonaa kertaa. Elokuvien puolella suosituimpia ovat olleet Extraction (99 miljoonaa katselua) ja Bird Box (89 miljoonaa katselua).

(Luvut eivät tosin ole verrannollisia esimerkiksi perinteisten tv-kanavien katsojalukuihin: Netflixille tarkoittaa yhtä katselua se, kun sarjan yhdestä jaksosta katsotaan 70 prosenttia sen kestosta, neljän viikon sisällä jakson ilmestymisestä. Elokuvien katselut lasketaan samalla 70 prosentin ja neljän viikon säännöllä.)

Netflixin strategia on jo pitkään ollut omaan originaalituotantoon satsaaminen. Kun tekee niin paljon kuin Netflix, massasta nousee väkisinkin laatusarjoja ja onnistuneita leffoja.

Netflixillä oli omia tuotantoja vuonna 2012 vain muutamia, kun vuonna 2017 niitä oli jo yli 250. Laatu ei ole pysynyt määrän mukana.

Vuonna 2012 käyttäjät arvioivat Netflixin omat tuotannot keskimäärin 4,2 tähden arvoisiksi. Vuonna 2018 ne olivat enää keskimäärin 3,2 tähden arvoisia. Sinä vuonna Netflix päätti poistaa arviot.

Samalla kun Netflix haluaa tuputtaa isolla rahalla tekemäänsä omaa tuotantoa, palvelusta poistuu koko ajan valtava määrä laadukasta sisältöä, kun lisenssioikeudet päättyvät – tai vaikka Disney+ kaappaa omat tuotantonsa omaan palveluunsa.

Häviävä materiaali heikentää osaltaan suosittelualgoritmin toimintaa, Kallioniemi kertoo.

”Niin sanottuja kontaktipisteitä katoaa: ihmiset eivät katso enää Chinatownia, koska sitä ei palvelussa ole, joten on vaikeampaa suositella vastaavanlaisia elokuvia”, Kalliokoski kertoo.

Kaikki tämä saa pahimmillaan aikaan vaikutelman, että Netflixistä ei löydä mitään kiinnostavaa.

Netflix ei silti vaikuta olevan ainakaan vielä pahassa pulassa. Sen tilaajamäärien kasvu hidastui tämän vuoden toisella kvartaalilla 85 prosenttia, mutta määrät ovat edelleen kasvussa. Netflix keräsi vuoden toisella kvartaalilla 1,5 miljoonaa lisätilaajaa.

Netflix-kokemus voisi toimia paremmin, jos sen algoritmi ymmärtäisi katsojia paremmin. Mutta tarkkoja ja osuvia suosituksia tarjoavasta sovelluksesta pitää aina maksaa vähän ekstraa. Kysymys ei ole rahasta, vaan tiedosta.

Jotta sovellus saa meidät viihtymään mahdollisimman hyvin, se tarvitsee käyttäjästään mahdollisimman tarkat tiedot. Netflixillä ei ole niin tarkkoja tietoja kuin monilla muilla sovelluksilla. Tiettävästi Netflix ei tarjoa myöskään tietojaan kolmansille osapuolille.

Esimerkiksi Tiktok – se, jolla on loistava suosittelualgoritmi – on tietoahmatti. Kallioniemi on tutkinut sovelluksen käyttöehtoja, ja hän nostaa sieltä muutaman seikan.

”Sovellus kerää demograafiset tiedot, kommentit, kuvat, videot, puhelimen ja sosiaalisen median kontaktit, tiedot, jotka syöttää kilpailuihin, arvontoihin ynnä muihin. Tiktok kerää kaikki tiedot yhdistetyistä sosiaalisen median palveluista, kolmansilta osapuolilta ja muilta käyttäjiltä sekä käytetystä laitteesta.”

Käytännössä Tiktok kerää Kallioniemen mukaan paljon muutakin profiloidessaan käyttäjäänsä.

”Se tekee todennäköisesti konenäön avulla ympäristön ja objektien tunnistusta. Se tekee sosiaalisten verkostojen tunnistusta, eli saa selville käytännössä kaikki ystävät ja tuttavat. Biometriset tiedot ja sormenjäljet tarjoavat aivan uudenlaisen kerroksen tähän profilointiin.”

Kallioniemen mukaan Tiktok voi periaatteessa nähdä käyttäjänsä olohuoneen seinällä Justin Bieberin julisteen, tunnistaa sen ja tarjota tämän jälkeen käyttäjälle Justin Bieber -aiheista sisältöä. Se osaa ainakin jossain määrin analysoida ihmisen tunnereaktion videoon.

Käyttäjä antaa kaikkeen tähän luvan, ja miksei antaisi: kun algoritmi tietää mahdollisimman paljon, käyttökokemus on paras mahdollinen. Mitä enemmän tietoa sovellus kerää, sitä paremmin se toimii, ja mitä paremmin se toimii, sitä enemmän ihminen käyttää sitä – ja antaa taas entistä enemmän ja tarkempaa tietoa.

Ongelma on siinä, että kukaan ei tiedä, mihin kaikkeen näitä tietoja käytetään, koska teknologiayhtiöt eivät ole läpinäkyviä.

Esimerkiksi Tiktok muotoilee Kallioniemen mukaan asian niin laveasti, että se saa hänen selkäpiinsä karmimaan.

”Käyttöehdoissa Tiktok antaa itselleen luvan käyttää keräämiään tietoja käytännössä mihin tahansa.”

Netflix on ilmeisesti tiedostanut algoritminsa ongelman, sillä se on ryhtynyt toimiin tilanteen parantamiseksi.

Alkaako se haistella ihmisten tunnereaktioita kuten Tiktok? Tai katseleeko se konenäön avulla olohuoneisiimme tunnistaakseen asunnostamme mahdollisia kiinnostuksenkohteitamme?

Ei.

Netflixin tulokulma on erilainen. Yhtiö kertoi vuonna 2019 lanseeraavansa palvelun nimeltään Netflix Collections.

Palvelu ei toistaiseksi ole edennyt testivaihetta pidemmälle, mutta sen ajatus on mullistava: tuoda algoritmin rinnalle entiteetti, joka ymmärtää hienosyisesti tunteita, korrelaatiota, kausaliteettia ja vaikka mitä.

Eli suosituksia leffoista ja sarjoista ei tekisikään algoritmi, vaan – ihmiset.

Osaston uusimmat

Luitko jo nämä?

Osaston luetuimmat

Nyt.fi luetuimmat