
Yhdysvalloissa kirjailijat ja kirjailijajärjestöt tarttuivat hanakasti asianajajien apuun kun ensimmäiset tapaukset tekoälyn opettamisesta kirjoilla (ilman sopimusta) tulivat julkisuuteen. Myös jotkut mediatalot, kuten The New York Times on haastanut tekoäly-yhtiöitä oikeuteen artikkelien luvattomasta käytöstä. Kun on kyse uudesta tavasta hyödyntää julkaistua aineistoa ratkaisut vievät kuitenkin aikaa. Yksi ensimmäisistä oikeuden päätöksistä saatiin kesäkuussa 2025 kun Kalifornian pohjoisen alueen tuomari William Alsup hyväksyi Anthropic-yhtiön tavan hyödyntää kirjallisuutta tekoälyn koulutukseen.
Anthropic, joka kehittää Claude-nimistä suurta kielimallia (LLM), kopioi kirjoja teknologiansa opettamiseen kahdella tavalla: piraattikirjapaketteja useasta lähteestä ja ostamalla käytettyjä paperikirjoja.
Arviolta noin seitsemän miiljoonan tekijänoikeuksilla suojattujen kirjojen piraattikopioiden imurointi ei miellyttänyt tuomaria (huolimatta siitä, että isot pojat olivat tehneet samoin aiemmin), vaan hän määräsi toisen oikeudenkäynnin ratkomaan piraattikirjojen tapausta.
Anthropicin toinen tapa kopioida kirjoja oli hankkia miljoonia paperikirjoja, irrottaa niistä sivut skannaamisen helpottamiseksi, ja skannata tekstit tietokantaan. Google aikoinaan sai aikaan valtaisan kohun kun se ryhtyi projektiin skannata kaikki maailman kirjat, jotta niistä voisi etsiä hakukoneella tietoa. Sama konsepti. Tämä tapa opettaa tekoälyä oli kalifornalaisen tuomarin mielestä sallittua yhdysvaltalaisen fair use -käsitteen mukaan. Yhtiö hävitti paperikirjat skannaamisen jälkeen, jolloin kopioita ei tuomarin mielestä ollut yhtiöllä tallessa.
Entä miten kirjojen hyödyntäminen tekoälyn koulutukseen Suomessa ja Euroopassa koetaan tekijänoikeuksien kannalta? Yhdysvalloissa tähän astiset tekijänoikeuksia koskevat kiistat ovat koskeneet yrityksiä, jotka kehittävät tekoälyjärjestelmiä myydäkseen niiden avulla kehitettyjä palveluita voitolla.
Euroopan Unioni sai vuonna 2024 valmiiksi AI Act kehyssäännöstön, jonka mukaan tekoälyjärjestelmiä luokitellaan niiden kyvykkyyden ja toiminnallisen riskitason mukaan. Selkeitä sääntöjä tekijänoikeuksilla suojatun aineiston käyttöön tekoälyn koulutukseen ei vielä kuitenkaan EU-tasolla ole. Henna Virkkunen on ehdottanut asian ottamista mukaan kun tekijänoikeusdirektiiviä uudistetaan.
Suomessa Kopiosto on muiden pohjoismaisten tekijänoikeusjärjestöjen kanssa ottanut kantaa tekoäly-yhtiöiden villin lännen käytäntöihin muistuttamalla tekijänoikeuksilla suojattujen teosten käytön vaativan sopimista. Uusi teknologia, kuten tekoäly ei ole järjestöjen mukaan poikkeus tähän sääntöön. Ratkaisukin olisi valmiina: kollektiivinen lisensointi. Tämä tarkoittaa esimerkiksi sitä, että kouluissa voidaan opetuksessa hyödyntää kirjoja, musiikkia, kuva-aineistoa ja videomateriaalia ilman että kaikilla opetukseen osallistuvilla on sitä varten lisenssi.
Yhteistä linjaa ei tällä hetkellä näytä Yhdysvaltojen ja Euroopan kesken asiassa näytä olevan. Ratkaisuakin taitaa kumpikin hakea omalla tavallaan. Yhdysvalloissa on tapana käydä oikeutta kunnes osapuolilta loppuu raha palkata asianajajia tai konsensus löytyy, kun puolestaan Euroopassa laitetaan säännöt kohdalleen ja sen jälkeen pyritään toimimaan niiden mukaan.