Tekoäly-yhtiö voitti ensimmäisen erän oikeusjutussa kirjailijoita vastaan

tuomarin nuija ja näppäimistö. kuva sasun bughdaryan, unsplash license.

Yhdysvalloissa on käynnistetty useita oikeusjuttuja tekoälyä kehittäviä suuria yhtiöitä vastaan. Varsinkin kirjailijat ovat olleet aktiivisia vaatimaan heidän tekijänoikeuksiensa kunnioittamista myös uuden teknologian murroksessa. Nyt Kaliforniassa on saatu ensimmäinen erä päätökseen OpenAI:n (ChatGPT:n kehittäjä) ja kirjailijoiden Sarah Silverman, Michael Chabon ja Paul Tremblay välisessä tekijänoikeuskiistassa. Tämän ensimmäisen erän voitti OpenAI, mutta jatkoa on luvassa jo kuukauden sisällä.

Kaliforniassa tätä tapausta hoitava tuomari kirjoitti kiistan osapuolille näkemyksensä kirjailijoiden syyttämästä tekijänoikeuksien hyväksikäytöstä OpenAI:n tekoälykehityksessä.

Tuomari ei ole nähnyt todisteita, että OpenAI:n ChatGPT-tuotteen tuottama teksti rikkoisi poikkeuksetta tekijänoikeuksia. ChatGPT:n tuotoksen pitäisi hyvin samankaltainen alkuperäisen kirjan kanssa, jotta rikkomus olisi todettavissa.
Myöskään ei ole todisteita siitä, että ChatGPT:n opettamiseen käytetyistä kirjoista olisi jätetty pois tekijänoikeusinformaatio.
Ei ole näyttöä siitä, että tekoäly olisi aiheuttanut taloudellista vahinkoa kirjailijoille soveltamalla kirjojen sisältöä omiin tarkoituksiinsa.

Vain yhdestä kirjailijoiden esittämästä syytöksestä Kaliforniassa kiistan hoitaakseen saanut tuomari oli samaa mieltä: OpenAI todennäköisesti on käyttänyt tekijänoikeuksien alaista aineistoa ChatGPT-tekoälyn kouluttamiseen. Se saattaa hänen mielestään olla rikkomus.

Kirjailijoiden taistelu ei lähtenyt suotuisasti käyntiin, mutta tämä on vasta alkua. Tuomari antoi osapuolille kuukauden aikaa täydentää syytteitään ja vastineitaan.

Tämä oikeudenkäynti siis jatkuu, samalla kun useita vielä suurempia vastaavia oikeusjuttuja lähtee liikkeelle. Suomessa kirjailijoiden yhdistykset ja tekijänoikeuksia valvovat järjestöt ovat tilanteen tasalla, mutta käytännössä kaikki suuret tekoäly-yhtiöt ovat Yhdysvalloissa, joten siellä ratkotaan ensimmäiset tapaukset.

Miksi kiista tekijänoikeuksista?

Suuria kielimalleihin perustuvia tekoälyjärjestelmiä opetetaan syöttämällä niille valtava määrä aineistoa. Ihmisten kanssa kommunikointiin tarkoitetut tekoälypalvelut opettelevat lukemalla mahdollisimman paljon kirjoja ja muita dokumentteja. Näitä löytyy helpoiten ja nopeimmin internetistä. Esimerkiksi Meta on myöntänyt hyödyntäneensä piraattikirjapaketteja, joissa pelkästään yhdessä oli noin 200 000 kirjaa.

Tekoäly kokoaa ihmisen kanssa kommunikoidessaan vastauksensa aineistosta mitä sille syötetty. Kun esimerkiksi ChatGPT-palvelua kokeilee, joku saattaa tunnistaa osan tai kaiken tekstin tekoälyn tuottamasta viestistä. Kenties se on ote kirjasta.

Tekoälyn kehittäjä, tässä tapauksessa OpenAI imuroi verkosta ilmaiseksi ainestoa, jonka muut ovat tehneet, yhtiön teknologia hyödyntää aineistoa uudella tavalla, laskuttaa siitä asiakkaitaan, mutta alkuperäisen – mahdollisesti tekijänoikeuksien alaisen – aineiston tekijät ovat paitsi aineiston hyödyntämisestä, niin myös taloudellisesta hyödyntämisestä ulkona kuin lumiukot.