{"id":8277,"date":"2026-01-15T10:36:00","date_gmt":"2026-01-15T08:36:00","guid":{"rendered":"https:\/\/klaava.fi\/?p=8277"},"modified":"2026-01-12T17:38:49","modified_gmt":"2026-01-12T15:38:49","slug":"tekoalyjarjestelmien-muistista-loytyy-monen-kirjan-sisalto-vaikka-yhtiot-ovat-muuta-kertoneet","status":"publish","type":"post","link":"https:\/\/klaava.fi\/?p=8277","title":{"rendered":"Teko\u00e4lyj\u00e4rjestelmien muistista l\u00f6ytyy monen kirjan sis\u00e4lt\u00f6, vaikka yhti\u00f6t ovat muuta kertoneet"},"content":{"rendered":"\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"2384\" height=\"1463\" src=\"https:\/\/klaava.fi\/media\/2026\/01\/books-three-pages2-draw.jpg\" alt=\"kolme kirjaa, jokaisen kirjan sivun yhdist\u00e4\u00e4 kaavio\" class=\"wp-image-8276\"\/><figcaption class=\"wp-element-caption\">  <\/figcaption><\/figure>\n\n\n\n<p>Kirjailijat, valokuvaajat ja elokuvantekij\u00e4t ovat jo vuosia olleet huolestuneita teostensa luvattomasta k\u00e4yt\u00f6st\u00e4 teko\u00e4lyj\u00e4rjestelmien opettamiseen. Oikeussalissa on k\u00e4sitelty, ja tullaan jatkossa k\u00e4sittelem\u00e4\u00e4n useita tapauksia, joita <a href=\"https:\/\/klaava.fi\/?p=8165\">kirjailijat<\/a> ja <a href=\"https:\/\/www.france24.com\/en\/france\/20250312-french-authors-publishers-take-on-meta-using-their-books-to-train-ai\">kustantajat<\/a> ovat nostaneet suuria kielimalleja kehitt\u00e4vi\u00e4 yhti\u00f6it\u00e4 vastaan. Teknologiayhti\u00f6iden vastaus luovan tekij\u00f6iden huoleen on t\u00e4h\u00e4n asti ollut yhten\u00e4inen: teko\u00e4lyn koulutuksessa sovelletaan koneoppimista, joka on eritt\u00e4in kallis, monimutkainen ja valtavasti dataa vaativa operaatio. Koneoppiminen pureksii kaiken hankitun datan teko\u00e4lyn ymm\u00e4rt\u00e4m\u00e4ksi rakenteeksi, eik\u00e4 alkuper\u00e4isi\u00e4 teoksia ole j\u00e4rjestelm\u00e4ss\u00e4 tallessa. N\u00e4in ei kuitenkaan ole. <a href=\"https:\/\/arxiv.org\/abs\/2601.02671\">Stanfordin ja Yalen yliopistojen tutkijat<\/a> ovat kalastaneet nelj\u00e4n yhdysvaltalaisen teko\u00e4lyn sy\u00f6vereist\u00e4 esimerkiksi Harry Potter -kirjan k\u00e4yt\u00e4nn\u00f6ss\u00e4 koko sis\u00e4ll\u00f6n.<\/p>\n\n\n\n<p><a href=\"https:\/\/www.theatlantic.com\/technology\/2026\/01\/ai-memorization-research\/685552\/?gift=XXMIpN-TqdDnsWlArfcjaQ5a-kFBdAM-b64DxSIgSdI\">The Atlantic kertoo<\/a> tutkijoiden testanneen nelj\u00e4\u00e4 suosittua suurta kielimallia &#8211; OpenAI ChatGPT, Anthropic Claude, Google Gemini ja xAI Grok &#8211; joista jokainen piti tallessa alkuper\u00e4isi\u00e4 kirjoja tai pitki\u00e4 jaksoja kirjoista. He testasivat kielimallien kirja-arkistoa kyselem\u00e4ll\u00e4 niilt\u00e4 kolmentoista kirjan tekstej\u00e4. K\u00e4yt\u00e4nn\u00f6ss\u00e4 kokonaiset Harry Potter and the Sorcerer\u2019s Stone, The Great Gatsby, 1984 ja Frankenstein -kirjat l\u00f6ytyiv\u00e4t kielimallien muistista.<\/p>\n\n\n\n<p>Teko\u00e4ly\u00e4 kehitt\u00e4v\u00e4t asiantuntijat pit\u00e4v\u00e4t todenn\u00e4k\u00f6isen\u00e4 syyn\u00e4 kirjojen l\u00f6ytymiseen kielimallien tietokannoista niin kutsuttua <em>lossy compression<\/em> tekniikkaa, jolla dataa paloitellaan ja tiivistet\u00e4\u00e4n. Idea on hieman sama kuin valokuvista tutussa JPG-formaatissa ja audiotallenteissa k\u00e4ytetyss\u00e4 MP3 tiedostoformaatissa.<\/p>\n\n\n\n<p>The Atlanticin artikkelissa on hyv\u00e4 esimerkki valokuvasta, jonka Stability AI:n koneoppimisalgoritmi oli kopioinut internetist\u00e4. Valokuva on k\u00e4rsinyt hieman koneoppimisen aikana, mutta se on edelleen heti tunnistettavissa samaksi alkuper\u00e4isen kuvan kanssa. Teksti\u00e4 algoritmit eiv\u00e4t k\u00e4sittele samalla tavalla, vaan algoritmi muodostaa kopioiduista tekstipalasista uusia lauseita k\u00e4ytt\u00e4jilleen. Tutkijat tosin l\u00f6ysiv\u00e4t my\u00f6s laajat alkuper\u00e4istekstit esimerkiksi George R. R. Martinin A Game of Thrones ja Toni Morrisonin Beloved kirjoista.<\/p>\n\n\n\n<p>Joka tapauksessa, tekij\u00e4noikeuksilla suojattuja teoksia on kopioitu &#8211; p\u00e4\u00e4asiassa ilman sopimusta &#8211; teko\u00e4lyj\u00e4rjestelmiin, niit\u00e4 on hy\u00f6dynnetty kaupallisiin tarkoituksiin, ja ne edelleen ovat tallessa j\u00e4rjestelmiss\u00e4 koska teko\u00e4lyn toiminta niit\u00e4 tarvitsee. Kiistat tekij\u00e4noikeuslakien soveltamisesta uuteen teko\u00e4lyteknologiaan todenn\u00e4k\u00f6isesti tulevat entist\u00e4 monimutkaisemmiksi.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Kirjailijat, valokuvaajat ja elokuvantekij\u00e4t ovat jo vuosia olleet huolestuneita teostensa luvattomasta k\u00e4yt\u00f6st\u00e4 teko\u00e4lyj\u00e4rjestelmien opettamiseen. Oikeussalissa on k\u00e4sitelty, ja tullaan jatkossa k\u00e4sittelem\u00e4\u00e4n useita tapauksia, joita kirjailijat ja kustantajat ovat nostaneet suuria kielimalleja kehitt\u00e4vi\u00e4 yhti\u00f6it\u00e4 vastaan. Teknologiayhti\u00f6iden&hellip; <a href=\"https:\/\/klaava.fi\/?p=8277\">More<\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[127],"tags":[497,1337,499,554,130],"class_list":["post-8277","post","type-post","status-publish","format-standard","hentry","category-media","tag-copyright","tag-koneoppiminen","tag-tekijanoikeus","tag-tekoaly","tag-tutkimus"],"_links":{"self":[{"href":"https:\/\/klaava.fi\/index.php?rest_route=\/wp\/v2\/posts\/8277","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/klaava.fi\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/klaava.fi\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/klaava.fi\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/klaava.fi\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=8277"}],"version-history":[{"count":1,"href":"https:\/\/klaava.fi\/index.php?rest_route=\/wp\/v2\/posts\/8277\/revisions"}],"predecessor-version":[{"id":8278,"href":"https:\/\/klaava.fi\/index.php?rest_route=\/wp\/v2\/posts\/8277\/revisions\/8278"}],"wp:attachment":[{"href":"https:\/\/klaava.fi\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=8277"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/klaava.fi\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=8277"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/klaava.fi\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=8277"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}