Menestyskirjailijat syyttävät tekoälyn kehittäjiä piraateiksi

nainen kynä kädessä, tyylitelty robotti digitaalinen kuva. Kuva: geralt, lisenssi pixabay

Yhdysvalloissa noin 8000 kirjailijaa, joukossa esimerkiksi Margaret Atwood, James Patterson, Michael Lewis, Suzanne Collins ja Nora Roberts ovat allekirjoittaneet tekolyä kehittäville suuryhtiöille osoitetun avoimen kirjeen. Kirjeessä vaaditaan yhtiöitä korvaamaan kirjailijoille teosten hyväksikäytöstä jo kehitetyissä tekoälytuotteissa, ja jatkossa sopimaan korvauksista kirjailijoiden kanssa. Lisäpotkua paikallisen kirjailijaliiton, The Authors Guildin, tukema kampanja hankkii syyttämällä teknologiayhtiöitä laittomasti kopioitujen kirjojen käytöstä tekoälysovellusten lähdeaineistona.

Mitä menestyskirjoilla (ja vähemmän menestyneillä kirjoilla) on tekemistä tekoälyn kanssa?

Kun vuoden 2022 loppupuolella ChatGPT-tekoälysovellus hämmästytti maailmaa luontevilla vastauksillaan ja kommenteillaan sen kehittänyt yritys OpenAI paljasti teknologian yleisen toimintaperiaatteen. Tekoälysovelluksia on monenlaisia, mutta luonnollista kommunikaatioita tavoitteleva ChatGPT perustuu kielen mallintamiseen hyvin laajan aineiston pohjalta (Large Language Model, LLM). Internetissä verkkosivustoilla tekstimuotoista aineistoa on valtava määrä tarjolla. ChatGPT ja muuta vastaavat tekoälysovellukset imuroivat siis netistä tekstiä niin paljon kuin irti saavat. Sen jälkeen alkaa mallintaminen, jossa katsotaan esimerkiksi mitkä sanat esiintyvät missä asiayhteydessä ja missä järjestyksessä. Tästä algoritmi pystyy tuottamaan erittäin luontevaa tekstiä, jossa ei välttämättä kuitenkaan tarkkaan katsottuna ole mitään tolkkua (vielä toistaiseksi).

Tekijänoikeuksilla suojatut kirjat ovat tyypillisesti saatavilla e-kirjoina ja äänikirjoina kirjakaupoissa, joten tekoälylle aineistoa verkosta imuroiva ohjelma ei näihin kirjoihin pääse käsiksi. Piraattisivustoille ja niillä laittomasti jaeltaviin e-kirjoihin imuriohjelma kuitenkin pääsee helposti kiinni.

Kirjailijoiden ja The Authors Guildin kirjeessä tekoälyä kehittäviä suuryhtiöitä syytetään juuri tällä tavalla tehdystä piratismista. Kirjeessä todetaan:

Ymmärtääksemme monet tekoälyjärjestelmien kehitykseen käytetyt kirjat ovat peräisin piraattisivustoilta. … mikään oikeuslaitos ei sallisi laittomasti hankittujen teosten käyttöä [kaupallisiin tarkoituksiin]. … tekoäly uhkaa vahingoittaa ammattikuntaamme tuottamalla massoittain keskinkertaisia koneen kirjoittamia kirjoja, tarinoita ja journalismia, jotka pohjautuvat meidän työhömme.

Kirjeessä piratismiväitettä ei perustella mitenkään, mutta ehkä The Authors Guildin juristit ovat lukeneet kampanjakirjeen, ja ovat valmiita esittämään faktoja syytetyille tekoälyä kehittävien yritysten juristeille. Kirje on osoitettu ChatGPT:n kehittäneelle OpenAI:lle, Alphabetille (Google), Microsoftille, Metalle (Facebook), IBM:lle ja Stability AI:lle.

NPR kertoo yhdysvaltalaisten kirjailijoiden tulojen tippuneen 42% vuosien 2009 ja 2019 välisenä aikana.

Tekoäly muuttaa jo maailmaa tai ainakin aiheuttaa pelkoa ja epävarmuutta. Yhdysvalloissa elokuvien ja televisiotuotantojen käsikirjoittajat yhdessä näyttelijöiden kanssa ovat lakossa tekoälysovellusten luoman epäluulon vuoksi. Suuret uutistalot, kuten New York Times ja Wall Street Journalia julkaiseva News Corp neuvottelevat Googlen tekoälyn käytöstä uutisten kirjoittamiseen. Jo vuosia puolestaan ennakkoluulottomat kirjailijat ovat hyödyntäneet tekoälyä työssään.