Puhe on ollut tietokoneenkäytön tulevaisuus jo noin viisitoista vuotta. Siri ilmestyi vuonna 2011. Joka vuosi sen jälkeen joku on kirjoittanut artikkelin, joka julistaa näppäimistön päivien olevan luetut. Ja joka vuosi olet jatkanut kirjoittamista.
Tässä siis kysymys, jota kannattaa epäillä: miksi seuraavat kymmenen vuotta rikkoisivat tämän kaavan? Uskon, että niin käy, mutta en siitä syystä, jonka hypeartikkelit antavat. Puhe ei hävinnyt kaikkia näitä vuosia siksi, että se oli hidasta. Se hävisi sen takia, mitä tapahtui *sen jälkeen*, kun lopetit puhumisen.
Tuon aukon äärellä kannattaa pysähtyä hetkeksi. Se yksi asia, joka oikeasti hidasti puhetta, ratkaistiin hiljattain hiljaisuudessa, eikä useimmat ole vielä tajunneet sitä. Tässä on perustelu äänikeskeiselle tietokoneenkäytölle, rehelliset osat mukaan luettuna.
Ennustus, joka on jatkuvasti väärässä
On olemassa teknologiaennustus, joka palaa parin vuoden välein kuin komeetta: kirjoittaminen kuolee, puhe ottaa vallan. Se ilmestyi Sirin myötä, sitten Alexan, ja sitten jokaisen sanelusovellusaallon myötä. Näppäimistö oli aina juuri korvautumassa. Niin ei koskaan käynyt.
Jos haluat tietää miksi, katso mitä tapahtuu, kun joku kokeilee Macin sisäänrakennettua sanelua ensimmäistä kertaa. Hän puhuu kappaleen verran. Litterointi palaa jokaisen "öö":n kanssa, kaksi väärää alkua liitettyinä yhteen ja virkkeenä, joka venyi neljäänkymmeneen sanaan, koska hän ei pitänyt taukoa. Hän käyttää muutaman minuutin sen siivoamiseen, päättää että kirjoittaminen olisi ollut nopeampaa, ja palaa hiljaa näppäimistön ääreen viikon sisällä.
Siinä on koko tarina siitä, miksi puhe hävisi kerta toisensa jälkeen. Lupaus oli "lopeta kirjoittaminen". Todellisuus oli "kirjoita vähemmän, muokkaa enemmän". Ihmiset eivät hylänneet puhetta siksi, ettei se pysynyt heidän vauhdissaan. He hylkäsivät sen, koska siivoaminen vei takaisin sen ajan, jonka puhuminen säästi.
Puhe ei koskaan ollut se hidas osa
Tässä on se osa, joka hukkuu väittelyyn. Pelkän nopeuden osalta tämä kysymys ratkaistiin vuosikymmen sitten, ja puhe voitti sen helposti.
Hyvä työpöytäkirjoittaja yltää noin 40 sanaan minuutissa. Mukava puhe asettuu lähelle 150 sanaa minuutissa täysin vaivatta. Ääni päässäsi, se joka muotoilee virkkeen ennen kuin sormet ehtivät perässä, kulkee vielä nopeammin. Kirjoittaminen on tuon ketjun selvästi hitain lenkki.
Tämä ei ole vain karkea arvio. Vuonna 2016 Stanfordin, Baidun ja Washingtonin yliopiston tutkijat tekivät suoran vertailututkimuksen: tekstin puhuminen puhelimeen oli kolme kertaa nopeampaa kuin sen näppäileminen peukaloilla, ja puhuttu versio sisälsi vielä päälle *20 prosenttia vähemmän* virheitä. Nopeampaa ja tarkempaa, samassa testissä, kymmenen vuotta sitten.
Nopeus ei siis koskaan ollut esteenä. Pullonkaula oli yhden askeleen alempana, siinä sotkuisessa litteroinnissa, joka annettiin sinulle jälkeenpäin. Korjaa tuo askel, ja koko yhtälö muuttuu.
Mikä oikeasti muuttui: tekoälykerros puheen ja tekstin välissä
Puuttuva pala ei koskaan ollut parempi mikrofoni. Se oli kerros, joka osasi muuttaa raa'an puheen valmiiksi tekstiksi ilman, että sinun tarvitsee tehdä viimeistelyä. Kaksi asiaa kypsyi suunnilleen samaan aikaan tehdäkseen tämän mahdolliseksi.
Ensinnäkin litterointi muuttui aidosti hyväksi. Johtavat puhemallit yltävät nyt alle 5 prosentin sanavirhetasoon selkeällä keskustelevalla englannilla, ja avoimet mallit kuten Whisper osuvat lähelle 3 prosenttia. Raaka talteenotto ei ole enää heikko lenkki.
Toiseksi, ja tämä on se varsinainen muutos, suuret kielimallit muuttuivat tarpeeksi hyviksi *kirjoittaakseen uudelleen* litteroinnin sen sijaan, että vain tallentaisivat sen. Samanlainen malli, joka luonnostelee sähköpostin, osaa ottaa puhutun rönsyilysi, pudottaa täytesanat, korjata kieliopin ja pilkkoa puhemuurin oikeiksi kappaleiksi. Tuloste lakkaa olemasta tallenne siitä, mitä sanoit, ja alkaa olla luonnos siitä, mitä tarkoitit.
Tuo toinen kerros on koko pelin ydin. Se on ero sellaisen sanelun, joka antaa sinulle kotitehtävät, ja sellaisen sanelun välillä, joka antaa sinulle jotain, jonka voisit lähettää sellaisenaan. Juuri tämän työn Voicr tekee: pidät yhtä näppäintä pohjassa ja puhut normaalisti, ja teksti, joka päätyy leikepöydällesi, on jo viimeistelty, "öö":t poissa ja virkkeet siistittyinä. Sen siivousveron, joka tappoi puheen kahdeksikymmeneksi vuodeksi, se hoitaa puolestasi hiljaa.
Muutos näkyy jo datassa
Jos tämä olisi vain mukava teoria, odottaisit käyttölukujen olevan tasaisia. Ne eivät ole.
Ääniavustajien käytön Yhdysvalloissa ennustetaan ylittävän 157 miljoonaa ihmistä vuonna 2026, ja noin kolmasosa ihmisistä tekee nykyään hakuja äänellä päivittäin sen sijaan, että kirjoittaisi ne. Taskuissa ja työpöydillä lepää jo miljardeja äänikykyisiä laitteita. Käyttäytyminen ei odota lupaa; se leviää.
Selkein merkki tulee nuorimmilta työntekijöiltä. Fortunen käsittelemä tutkimus antaa ymmärtää, että Gen Alpha saattaa liittyä työelämään kirjoittamatta koskaan muodollista sähköpostia, valiten sen sijaan ääniviestit pomolleen. Selviääpä sähköposti tai ei, suuntaa on vaikea olla huomaamatta: niille, jotka kasvoivat pitäen nauhoitusnappia pohjassa puhuakseen, kappaleen kirjoittaminen tuntuu jo nyt hitaalta vaihtoehdolta.

Mikään tästä ei tarkoita, että näppäimistö katoaa ensi vuosineljänneksellä. Se tarkoittaa, että oletusarvo on siirtymässä. Äänikeskeisyys ei ole enää ennuste; se on trendiviiva, jonka voit jo jäljittää, ja se osoittaa yhteen suuntaan.
Miltä äänikeskeinen tietokoneenkäyttö oikeasti näyttää
"Äänikeskeinen" kuulostaa tieteiselokuvan keittiöltä, joka puhuu sinulle takaisin. Todellinen versio on tätä hiljaisempi ja rehellisesti sanottuna hyödyllisempi.
Se tarkoittaa, että puheesta tulee oletustapa saada ajatus paperille, ja näppäimistöstä tulee työkalu, johon tartut sen hiomiseen. Puhut sähköpostin, Slack-vastauksen, karkean ensiluonnoksen, muistiinpanon itsellesi. Sitten luet sen läpi ja korjaat sen yhden lauseen, joka osui väärin, muutamalla näppäimenpainalluksella. Talteenotto äänellä, muokkaus käsin.
Se osa, joka tekee tästä oikeasti elettävää, on sävy. Et puhu pomollesi samalla tavalla kuin puhut ryhmächatissä, ja työkalu, joka litistää kaiken yhdeksi ääneksi, hylätään nopeasti. Äänikeskeinen kokoonpano mukauttaa tulosteen sen mukaan, minne se on menossa: rento chatissa, asiallinen sähköpostissa, koruton koodikommentissa. Puhut joka kerta samalla tavalla, ja teksti muuttuu sopimaan tilanteeseen. Kirjoitin siitä, miten tämä muutti omaa päivittäistä työnkulkuani artikkelissa miten käytän tekoälyä kuromaan umpeen ajattelun ja kirjoittamisen välisen kuilun.
Huomaa, mikä tämä kuva ei ole. Se ei ole maailma ilman näppäimistöjä. Se on maailma, jossa puhut ensin ja kirjoitat toiseksi sen sijaan, että kirjoittaisit kaiken tyhjästä.
Mitä näppäimistö pitää itsellään
Perustelu äänikeskeiselle tietokoneenkäytölle, joka teeskentelee näppäimistön muuttuvan hyödyttömäksi, ei ansaitse luottamusta. On olemassa todellisia tehtäviä, joissa puhe on huono, eivätkä ne ole katoamassa minnekään lähiaikoina.
Jotkin asiat pysyvät nopeampina kirjoitettuina: - Koodi ja kaikki symbolipitoinen. Sanelu saa sanat oikein; se kompastelee sulkeisiin, alaviivoihin ja täsmällisiin muuttujanimiin. Koodi kirjoitetaan edelleen. - Meluisat tai jaetut tilat. Kannettavalle puhuminen hiljaisessa huoneessa on ihan ok. Sen tekeminen täydessä junassa tai avokonttorissa puhelimessa olevan ihmisen vieressä ei ole. - Mikä tahansa, mitä mieluummin et sanoisi ääneen. Kova palaute, arkaluontoinen vastaus, viesti, jota et halua naapurin kuulevan. Näppäimistö on yksityinen tavalla, jota puhe ei ole. - Kirurginen muokkaus. Kun luonnos enimmäkseen toimii, pilkun siirtäminen tai yhden sanan vaihtaminen on nopeampaa näppäimellä kuin virkkeellä.

Osa vastausta kysymykseen "kirjoitammeko vielä" on siis yksinkertaisesti kyllä, näiden osalta. Mikä muuttuu, on se, että näppäimistö lakkaa olemasta asia, jolla teet kaiken, ja muuttuu erikoistyökaluksi, johon tartut, kun puhe ei sovi. Se on alennus, ei sukupuutto.
Mitä tulee puheen jälkeen
Jos katsomme täydet kymmenen vuotta eteenpäin, puhe ei ole edes viimeinen pysäkki. Futuristisemmat syöttötavat ovat jo laboratoriossa.
Meta on esitellyt rannekkeen, joka lukee lihastesi sähköisiä signaaleja ja antaa sinun "kirjoittaa" pienillä sormenliikkeillä millä tahansa pinnalla, ilman näppäimistöä. Se on aidosti vaikuttava tutkimus. Mutta huomaa luvut: varhaiset testaajat ylsivät noin 21 sanaan minuutissa kirjoittaen käsieleillä. Se voittaa osan peukalokirjoittamisesta ja menee sen ohi kirkkaasti esteettömyystyökaluna, mutta se on silti murto-osa niistä 150 sanasta minuutissa, jotka saat pelkästään puhumalla.
Se on tämän kaiken hiljainen pointti. Lähitulevaisuudessa äänesi on nopein kanava ajatuksen ja valmiin tekstin välillä, joka ei vaadi leikkausta tai tieteiskuvitelmia. Neuraalinen syöttö on tulossa, ja sillä on eniten merkitystä ihmisille, jotka eivät voi puhua tai kirjoittaa mukavasti. Kaikille muille puhe on silta, jonka ylitämme ensin, ja se on jo täällä.
Kirjoitammeko siis vielä?
Kyllä. Mutta kymmenen vuoden sisällä kirjoittamisesta tulee poikkeus eikä refleksi. Siitä tulee se asia, johon tartut, kun puhe ei sovi hetkeen, samaan tapaan kuin tartut nykyään kynään: hyödyllinen, harkittu, eikä enää tapa, jolla teet suurimman osan kirjoittamisestasi.
Syy, miksi tällä kertaa on toisin, ei liity mitenkään puheen nopeutumiseen. Se oli aina nopeampaa. Kyse on siitä, että siivoaminen vihdoin hoituu, joten puhuminen ei enää tarkoita ilmoittautumista muokkaussessioon jälkeenpäin. Poista tuo vero, ja työpöytäsi hitaimmalla työkalulla on hyvin vähän jäljellä, mikä suosittelisi sitä arkikirjoittamiseen.
Sinun ei tarvitse ottaa kymmenen vuoden ennustetta uskon varassa testataksesi olettaman. Valitse seuraava vastauksesi, joka tarvitsee enemmän kuin kaksi riviä. Kirjoittamisen sijaan pidä saselunäppäintä pohjassa, sano mitä tarkoitat käsikirjoittamatta sitä, ja lue läpi mitä siitä tulee. Jos haluat sen tulevan ulos viimeisteltynä raa'an sijaan, juuri se on koko syy, miksi Voicr on olemassa: pidä FN pohjassa, puhu, liitä, ja teksti ilmestyy puhtaana ja sovitettuna siihen sovellukseen, jossa olet. Ilmainen taso kattaa 5 000 sanaa kuukaudessa, mikä riittää hyvin ottamaan selvää, elätkö jo siinä tulevaisuudessa, jota otsikot jatkuvasti lupaavat.

