Tarkista selaimen asetuksista, että JavaScript ja evästeet ovat käytössä.

Mikäli JavaScript on käytössä, mutta jokin selainlaajennus estää sen lataamisen, poista selainlaajennus käytöstä.

Verkon käännösohjelmat toimivat yhä paremmin – testasimme, kuinka ne taipuvat suomen kieleen

Kääntimille suomi on vaikeampi kuin Euroopan yleiset kielet. Kääntämistä auttaa nyt tietokoneen hurja laskuvoima.

Tiede
 
Maarit Koponen Leena Salmi

Verkon sovellusten myötä koneen tekemien käännösten käyttö on lisääntynyt. Esimerkiksi Googlen ilmainen käännösohjelma on suosittu.

Koneella tehty käännös epäonnistuu silti useammin kuin onnistuu. Helpot kielelliset esimerkit kuten vieressä vielä onnistuvat melko hyvin.

Käännösohjelmilta eli kääntimiltä puuttuu kuitenkin asiayhteyden taju. Toinen puute on yleistiedossa. Käännin ei esimerkiksi välttämättä tiedä, että matkapuhelimet eivät ole eläviä.

Silti konekäännökset yleistyvät. Ne ovat yhä useammin myös ammattikääntäjän työväline. Ilmaisella verkkokääntimellä on roolinsa, kun halutaan nopeasti karkea käsitys tekstin sisällöstä. Ihan joka käyttöön se ei sovellu.

Antti Saloniemi HS
Testasimme, kuinka käännösohjelma suomentaa lauseen. Alkuperäinen lause oli: Kielestä toiseen kääntäminen on kiehtovaa. Tämä lause käännettiin toimituksessa ja avustajien avulla ensiksi englanniksi, ruotsiksi ja saksaksi. Sitten lauseet syötettiin Googlen käännösohjelmaan. Se on osoitteessa translate.google.com. Käännöskoetta laajennettiin vielä niin, että englanninkielinen lause käännätettiin kolmannen kielen kautta suomeksi. Loppukäännös pysyi kaikissa vaihtoehdoissa hyvin samanlaisena kuin alkuperäinen suomenkielinen lause.
Testasimme, kuinka käännösohjelma suomentaa lauseen. Alkuperäinen lause oli: Kielestä toiseen kääntäminen on kiehtovaa. Tämä lause käännettiin toimituksessa ja avustajien avulla ensiksi englanniksi, ruotsiksi ja saksaksi. Sitten lauseet syötettiin Googlen käännösohjelmaan. Se on osoitteessa translate.google.com. Käännöskoetta laajennettiin vielä niin, että englanninkielinen lause käännätettiin kolmannen kielen kautta suomeksi. Loppukäännös pysyi kaikissa vaihtoehdoissa hyvin samanlaisena kuin alkuperäinen suomenkielinen lause.

Kääntimissä on kaksi tapaa lähestyä vieraskielistä tekstiä.

Käännös ehkä onnistuu, jos etsii sanalle vastineen sanakirjasta, sana kerrallaan.

Jos siis haluaa kääntää vaikkapa lauseen "They play football" suomeksi, katsotaan englanti-suomi-sanakirjasta, että "they" on "he" ja "football" on "jalkapallo".

Tausta

Konekäännöstä yritettiin jo 1950-luvulla

Konekääntäminen ei ole uusi idea. Se juontaa juurensa ensimmäisiin tietokoneisiin toisen maailmansodan jälkeen.

Yhdysvalloissa laadittiin vuonna 1949 ns. Weaverin raportti. Siinä kääntäminen miellettiin salakirjoituksen selvittämiseksi, jota oli tehty sodan aikana.

Esimerkiksi venäjänkielinen teksti oli ikään kuin koodia, joka voitaisiin murtaa selvittämällä, mitä englanninkielistä sanaa kukin venäjänkielinen vastasi.

Aika oli optimistinen. Koneiden uskottiin pystyvän melkein mihin vain. Myös konekääntäminen olisi arkista muutamassa vuodessa.

Näin yksinkertaiseksi konekääntäminen ei osoittautunut. Esitykset vaikuttivat aluksi lupaavilta, mutta ne käänsivät vain muutamia virkkeitä.

Innostus laantui, ja 1960-luvun lopulla kehitys hidastui.

Uuteen vauhtiin konekääntäminen lähti 1980-luvulla. 2000-luvulle tultaessa tietokoneet tulivat taas avuksi. Kääntimiä alkoi tulla laajaan arkiseen käyttöön.

Mutta entä "play"? Se voi olla leikkiä, näytellä, pelata, soittaa tai ehkä leikki tai näytelmä. Suomea osaava ihminen voi päätellä, että tähän yhteyteen sopii verbi "pelata". Konekäännin ei kuitenkaan pysty tekemään tätä päätelmää sanakirjan avulla.

Ensimmäisiin kääntimiin on siksi tarvittu kieliopillisia jäsentimiä ja kieliopin sääntöjä. Niiden avulla käännösohjelma lähenee oikeaa vaihtoehtoa.

Ohjelma jäsentää ensin käännettävän tekstin. Se määrittää sanoille sanaluokat ja kieliopilliset suhteet.

Sitten se etsii sanastosta vastineet. Ohjelma hyödyntää tiettyjä sääntöjä, esimerkiksi että verbin "play" vastine on "pelata", koska sitä seuraa "football".

Lopuksi ohjelma tuottaa kohdekielen sääntöjen mukaisen käännöksen. Verbille tulee oikea persoonamuoto ja objektille oikea sijamuoto. Tällaisia ohjelmia kutsutaan sääntöpohjaisiksi.

Uudet käännösohjelmat hyödyntävät sääntöjen sijaan todennäköisyyksiä. Tällaisia ohjelmia kutsutaan siksi tilastollisiksi kääntimiksi.

Ohjelmaan on syötetty kaksikielisiä tekstejä. Kone "oppii" todennäköisiä käännöksiä tilastollisilla menetelmillä.

Ohjelma laskee aiempien käännösten avulla, kuinka usein kukin mahdollinen sanan vastine esiintyy vastaparina suomen kielen virkkeissä.

Yksittäisten sanojen lisäksi todennäköisyydet lasketaan myös pitemmille sanajonoille.

Esimerkiksi sanan "jalkapallo" edellä esiintyy harvoin sana "soittaa" tai "näytelmä". Ajatuksena on, että lopullinen käännös on lopulta todennäköisin vaihtoehto, eli "pelata".

Tilastoon perustuva ohjelma ei kuitenkaan silti tiedä, mitkä sanat vastaavat toisiaan.

Se olettaa kunkin englannin sanan mahdollisiksi käännöksiksi kaikki vastaavan suomenkielisen virkkeen sanat. Sitten se laskee todennäköisyyden, että sanan "they" jälkeen käännös on "pelaavat" ja "jalkapalloa".

Virheiden oletetaan jäävän tilastollisessa kääntämisessä harvinaisiksi. Jos aineistoa ei kuitenkaan ole taustalla riittävästi, se voi tuottaa yllättäviä käännöksiä.

Ilmaisten kääntimien tulokset etenkin suomeen käännettäessä ovat usein enemmän huvittavia kuin hyödyllisiä.

Ne voivat kuitenkin auttaa lukijaa. Hän voi käännöksen avulla suurin piirtein ymmärtää tekstin sisällön.

Ilmaiset kääntimet onkin yleensä tarkoitettu juuri tähän. Matkaa suunnitellessa voi esimerkiksi lukea hotellisivustolta, miten yöpyjät eri maista ovat hotellia kommentoineet. Matkoilla voi auttaa myös puheentunnistukseen yhdistetty käännin.

Konekäännös voi olla hyvä joillain kielillä. Suomen kielen konekääntäminen on kuitenkin hankalaa. Sitä vaikeuttaa kielemme rakenne ja sen runsaat taivutusmuodot.

Vaikkapa italian ja espanjan välillä konekääntäminen onnistuu paremmin kuin espanjan ja suomen. Italia ja espanja ovat sukukieliä ja rakenteeltaan lähellä toisiaan.

Suurilla kielialueilla kääntimiin on myös panostettu enemmän. Ranska–englanti-kääntimelle on paljon suuremmat markkinat kuin ranska–suomi -kääntimelle.

Konekäännin tuottaa harvoin täysin julkaisuun kelpaavaa käännöstä. Teksti voi kuitenkin olla riittävää siihen, että pienellä editoinnilla siitä tulee hyvää. Tällöin kääntäjä muokkaa kone apunaan käännöksen nopeammin kuin jos hän kääntäisi kaiken itse.

Ammatillisessa käytössä kääntimet eivät ole samanlaisia kuin internetin ilmaiset kääntimet.

Ne on esimerkiksi rakennettu jonkin tietyn organisaation tekstejä varten. Esimerkiksi Euroopan komissiolla on EU-teksteihin tarkoitetut kääntimensä.

Konekääntäminen onnistuu myös silloin, kun tarkoitus on kääntää vain hyvin suppean aihealueen tekstejä. Tällöin aihe rajaa, mitä sanastoa ja kieliopillisia rakenteita saa käyttää.

Esimerkiksi Kanadassa on jo vuosikymmenien ajan käytetty säätiedotuksissa onnistuneesti koneellista käännöstä. Kone kääntää englannista ranskaksi ja päinvastoin.

Kuulimme hiljattain, että kääntäjät olivat varsin tyytyväisiä, kun säätiedotteita kääntävä ohjelma tuli käyttöön Kanadassa – jo 1970-luvulla.

Kääntäjät kokivat säätiedotteiden kääntämisen yksitoikkoiseksi. Kun ne hoituivat koneen avustuksella, kääntäjien aika vapautui kiinnostavien tekstien kääntämiseen.

Konekääntäminen koetaan joskus uhkana kääntäjän ammatille. Silti ei vaikuta todennäköiseltä, että koneet korvaisivat ihmiset kääntäjinä.

Ihminen ei käännä mekaanisesti pelkkiä sanoja ja rakenteita. Hän tuntee tekstin käyttötavan, kohdeyleisön ja tyylin.

Ihmisen kielellistä luovuutta tarvitaan erityisesti kaunokirjallisuuden ja mainosten kääntämisessä.

Maarit Koponen kirjoittaa väitöskirjaa konekäännöksen editoinnista Helsingin yliopistossa.
Leena Salmi toimii monikielisen käännösviestinnän professorina Turun yliopistossa.

Tämä aihe on kiinnostava.

Kiitos mielipiteestäsi!