Äänikirjojen tuotanto voi mullistua nopeammin kuin moni osasi odottaa

lentokoneessa kuuntelee podcast, äänikirja musiikki. kuva daniel mccullough.
Kuva Daniel Mccullough.

Päivitetty 2023-01-06: myös Apple on julkaissut AI-teknologialla tuotettuja äänikirjoja.
Äänikirjojen tuotanto on astumassa uuteen aikakauteen nopeammin kuin osasimme odottaa. Tietokoneen tuottama ihmisäänen jäljitelmä on jo nyt sillä tasolla, että teknologiaa voi käyttää esimerkiksi kokonaisen kirjan lukemiseen. Jokainen on joskus kuullut konemaisen äänen lukevan tekstiä, mutta harva ihminen kestää sellaisen kuuntelua kahta lausetta enempää. Nyt kuitenkin teknologia on kehittynyt mainiosti ihmiskorvin kuunneltavaksi.

Yksi tekijä tietokoneen tuottamaan luonnollisen äänen nopeaan kehitykseen juuri nyt ovat todennäköisesti olleet puhetta ymmärtävät pienet apulaislaitteet, kuten Amazon Echo, Google Assistant, Apple Siri ja Microsoft Cortana. Laitteelta tai vastaavalta puhelimeen asennetulta sovellukselta voi kysyä yksinkertaisia kysymyksiä, joihin sovellus vastaa tietokoneen muodostamalla äänellä. Koska tuotteiden takana ovat maailman suurimmat ja rahakkaimmat teknologiayritykset, kehitys on viime vuosina ollut melkoisen vauhdikasta (verrattuna viimeiseen 20 vuoteen, jonka aikana läpimurtoa odotettiin joka vuosi).

Joulukuussa 2022 ruotsalainen e-kirjojen ja äänikirjojen jakelija Axiell Media ilmoitti ryhtyvänsä tuottamaan kirjojen käännöksiä ja äänikirjoja tekoälyn avulla. Axiell on sopinut tarvittavan ohjelmistoteknologian käytöstä sen kehittäneen Reedz-yhtiön kanssa.

Google ei ole vielä pitänyt suurta meteliä omasta ääniteknologiastaan, mutta on kutsunut e-kirjojen julkaisijoita kokeilemaan uuden auto-narrator beta-versiota, joka osaa lukea julkaistun e-kirjan ääneen. Tämän lopputuloksena on äänikirja, jonka voi laittaa myyntiin.

Kokeilin tätä Googlen uutta äänikirjalukijaa. Sen aikaansaama äänikirja on hämmästyttävän hyvä. Mielestäni niin hyvä, että kuuntelen luontevasti kokonaisen kirjan.

Kuuntele tästä näyte äänikirjasta (lukijana ”Mary”) Gothenburg and Sweden’s West Coast:

Tässä vaiheessa Googlen automaattinen lukija osaa vain englantia, espanjaa, ranskaa, saksaa, ja portugalia.

Tässä ote ”Archien” lukemasta äänikirjasta The Best of Helsinki matkaoppaasta:

Myös matkaopas The Gems of Nice and the French Riviera on kulkenut automaattisen lukijan läpi. Aivan kuten ruotsalaisten ja suomalaisten nimien kanssa, ranskalaiset nimet tuntuvat olevan hankalia Googlen automaattiselle englanninkieliselle lukijalle.

Äänikirjan julkaisija voi valita lukijan äänen hänen kielen, iän, murteen ja sukupuolen mukaan. Lukunopeutta ja äänen korkeutta voi myös säätää.

PÄIVITYS 2023-01-06: Apple on kertonut omasta tekoälyteknologialla (AI, artificial intelligence) toimivasta äänikirjojen tuotannosta. Ensimmäiset äänikirjat on julkaistu. Apple neuvottelee kirjojen julkaisusta yksittäisten kustantajien kanssa. Tällä hetkellä vain englanninkieliset romaanit kelpaavat ohjelmaan. Myöhemmin yhtiö aikoo laajentaa valikoimaa myös muihin genreihin.

Mitä tästä seuraa? Olettaen, että äänikirjojen ystävät pitävät tietokoneen lukemaa kirjaa miellyttävänä kokemuksensa, äänikirjojen valikoima tulee kasvamaan valtavasti. Kaikki aiemmin julkaistut kirjat, jotka sopivat kuunneltaviksi tullaan julkaisemaan äänikirjoina. Google ei vielä ole ilmoittanut lopullista kustannusta tuotettua äänikirjaa kohden, mutta todennäköisesti se asettuu tasolle, joka pikemmin kannustaa tuottamaan äänikirjoja paljon kuin murehtimaan niiden kustannuksia.

google play äänikirjat: klaava travel guide