– OK Google... Sää!
Kuusitoista astetta ja pilvistä.
– OK Google… Missä on lähin baari?
Olutravintola Nokka, kilometrin päässä.
– Ok Google… Navigoi Turkuun.
Tunti neljäkymmentä kahdeksan, seuraavasta risteyksestä vasemmalle.
Näin helppoa on käyttää teknologiaa vuonna 2019. Puhelimet ja muut älyvimpaimet ymmärtävät puhettamme. Ihan selvää suomea.
Tähän liittyy kuitenkin myös uhkakuvia. Helsingin Sanomat kertoo suomalaisista, jotka tekivät työkseen puheentunnistuksen laadunvalvontaa.
Käytännössä he kuuntelivat esimerkiksi Applen ja Googlen älylaitteille annettuja äänikomentoja ja puheenpätkiä. Joukossa oli arkaluontoisiakin tietoja. Joku tunnisti kaverinsa.
Salakuuntelusta ei kuitenkaan ollut kyse. Tarkoituksena oli tarkistaa, käänsikö kone puheen oikein vai väärin. Tällä tavalla ihminen kouluttaa tekoälystä entistä parempaa puheentunnistajaa.
Helsingin Sanomien haastattelemien työntekijöiden mukaan tämä oli hämmentävä kokemus.
– Sitä tietää, että tietoja kerätään, mutta sitten kun se käytännössä tapahtuu, oli se jotenkin sairasta, yksi heistä sanoo.
Hämmentävältä se tuntuu myös käyttäjän kannalta. Mutta toisaalta, kovin yllättävää se ei ole.
Kuka kuuntelee?
Teknologian käyttäjät ovat tänään huolissaan tekoälystä, joka kuuntelee, lukee ja tulkitsee meitä.
Toisaalta, kuten Helsingin Sanomien, Bloombergin ja televisioyhtiö VRT:n artikkelit kertovat, olemme kovasti huolissamme myös siitä, jos toiset ihmiset kuuntelevat meitä.
Kumpaankin huoleen on perusteensa, mutta vaihtoehtoja ei ole. Jos puhumme koneelle, jonkun on pakko tulkita, mitä sanomme. Sen tekee joko tekoäly tai ihminen. Ja niin kauan kuin tekoäly ei pysty siihen riittävän hyvin – molemmat.
Tähän meidän tulee varautua, mikäli haluamme puheentunnistuksen edut käyttöömme.
Todettakoon, että puheentunnistuksen edut ovat ainakin suomalaisella kielialueella vielä sen verran rajalliset, ettei kännykän näpyttelijä menetä kovin paljon. Joskus olen sanellut tekstiviestejä puhelimelleni. Lopputulos on ollut usein koominen.
Jatkossa puheentunnistuksella voidaan kuitenkin saavuttaa merkittäviä tehokkuushyötyjä esimerkiksi sairaanhoidossa ja palvelualoilla. Vaikka vanhus ei enää kykene näppäilemään puhelinnumeroja, hän voi äänellään avata skype-yhteyden lapsenlapsien tai hoivapalvelujen tuottajien luo.
Lääkärin ei tarvitse siirtää katsettaan potilaasta.
Teknologiaennustajien mukaan kehitys kulkee kohti ääntä. Tutkimusyhtiö Gartnerin mukaan jo ensi vuonna 30 prosenttia nettihauista tehdään ilman ruutua.
Luvan kanssa vai ilman?
Ikävää on, jos nauhalle päätyy muutakin kuin komentoja.
- Helsingin Sanomien haastattelemien työntekijöiden mukaan nauhoitteiden joukossa oli sellaisia, jotka olivat tallentuneet vahingossa.
- Bloombergin haastattelema työntekijä kertoi käsittelevänsä päivittäin jopa sata sellaista viestiä, jotka olivat tallentuneet vahingossa – tai ilman käyttäjän antamaa käskyä.
- Televisioyhtiö VRT:n kuuntelemista tuhannesta nauhoiteesta yli 150 oli sellaisia, joissa käskyä “OK Google” ei oltu annettu.
Vahinkonauhoite voi syntyä käyttäjän tai ohjelmistokehittäjän virheestä – ja näiden kahden asian välillä on iso ero.
Jos kyse on käyttäjästä, se on kuin vahingossa soitettu “taskupuhelu”. Jos taas kyse on ohjelmistokehittäjän virheistä, tilanne on vakavampi.
Google tunnusti pari vuotta sitten, että sen Google Home Mini -älykaiuttimessa oli ollut tämän kaltainen ohjelmistovirhe. Se on huolestuttavaa, sillä eri uutislähteiden mukaan tallenteissa esiintyy nimiä ja muita yksityisiä tietoja.
Tämä on asia, jonka suhteen teknologiayhtiöitä olisi syytä valvoa.
Ääni tuntuu henkilökohtaiselta – ja on sitä
Mikä ero on lopulta sillä, syötämmekö hakutietoja koneille puheena vai vanhaan tapaan tekstinä?
Google ja kumppanit saavat meistä paljon enemmän tietoa seuraamalla tekstihakujamme, sijaintitietojamme ja kontaktilistojamme – kuin kuuntelemalla satunnaisia äänikomentoja.
Onko kyse vain siitä, että puhe tuntuu henkilökohtaisemmalta?
Epäilemättä. Toisaalta kannattaa muistaa, että puhe myös on henkilökohtaisempaa.
Teksti on pelkkää tekstiä, mutta ääni on biometrinen tunniste. Itä-Suomen yliopiston julkisoikeuden professori Tomi Voutilainen muistuttaa Helsingin Sanomien artikkelissa, että tietosuojalainsäädännön kannalta olisi ongelmallista, jos nauhoitteen viereen tallennettaisiin tieto siitä, kuka puhuu.
Tällaisesta toiminnasta ei ole merkkejä.
Sitä paitsi, jokaisella on mahdollisuus kytkeä äänikomennot pois käytöstä. Omassa Android-puhelimessani OK Google -toiminnot sammuvat näin:
- Avaa asetukset
- Avaa Google-asetukset
- Avaa Google-tili
- Avaa Tiedot ja personointi
- Sulje Puhe- ja äänitoiminta
Samasta paikasta saat ne myös päälle, mikäli uskot puheentunnistuksen olevan teknologian seuraava tärkeä kehitysaskel.
Lue myös: