Ciepło przyjęliście poprzedni wpis autorstwa Zuzanny Skurzak, więc czas na kolejny. Wtedy rozmawialiśmy o aferce wokół Legimi – dziś temat to AI. Na ile może sobie pozwolić przy „zaczerpywaniu” cudzej pracy?
Może się tu przydać Andy Warhol, ale przede wszystkim krytyczne wypowiedzi jednego z jej twórców. O tym od następnego akapitu opowie już Zuzanna.
Prawo generatywnej sztucznej inteligencji do dozwolonego użytku
Pod koniec października Suchir Balaji, do niedawna badacz w OpenAI, wygłosił mowę, w której uderzył w sposób, w jaki firma zbiera dane do trenowania swoich modeli. To kolejny młody i utalentowany pracownik, który zachwycony możliwościami sztucznej inteligencji (AI) chciał przyczynić się do jej doskonalenia, ale, poznawszy od środka warsztat rynkowego giganta, podjął decyzję o odejściu z firmy z powodów wątpliwości natury etycznej i prawnej.
Chodzi tu o działania, które Balaji określa jako łamanie prawa autorskiego. Do trenowania dużych modeli językowych (LLM) używano wszelkich treści dostępnych w internecie (m.in. pirackie kopie książek, artykuły za paywallem czy treści tworzone przez użytkowników np. Reddit, a pozyskiwane bez ich wyraźnej zgody). Praktyki OpenAI mają wpływać niekorzystnie na pojedynczych użytkowników, przedsiębiorstwa i usługi internetowe jako całość, czyli na podmioty, które pozwoliły wytrenować LLM.
Przesłanki dozwolonego użytku
Wspomnieni dawni pracownicy największych firm na rynku AI zgodnie uważają, że cały system trenowania LLM jest jak domek z kart — bez żadnych podstaw prawnych do użycia, często chronionych prawem autorskim, treści. Sam Balaji wzywa do bardziej restrykcyjnych regulacji prawnych. W swoim artykule tezę o łamaniu prawa autorskiego przez wytwory AI oparł na przesłankach z amerykańskiego Copyright Act of 1976 (Section 107; dalej: amerykańska ustawa), które postaram się tu przenieść na grunt polskiej Ustawy o z dnia 4 lutego 1994 r. o prawie autorskim i prawach pokrewnych (Dz. U. z 2022 r. poz. 2509, z 2024 r. poz. 1222, 1254; dalej: polska ustawa).
Aby móc mówić o dozwolonym użytku, trzeba ustalić wcześniej cel powstania nowego utworu. Może to być m.in. (posłużę się tu pojęciami z polskiej ustawy, głównie z jej art. 29, gdzie wymieniono cele dozwolonego przytaczania urywków innych utworów — ich odpowiedniki znajdziemy w ustawie amerykańskiej):
- analiza krytyczna,
- polemika,
- sprawozdanie o aktualnych wydarzeniach,
- nauczanie,
- badania naukowe.
Już na tym etapie należałoby się zastanowić, czy odpowiedzi dostarczane przez Chat GPT służą spełnieniu któregokolwiek z tych celów, nawet przyjmując założenie, że mamy do czynienia z tworem, który spełnia podstawowe przesłanki uznania za przedmiot ochrony, a więc “utworem”. Te przesłanki to twórczy charakter, uzewnętrznienie i niepowtarzalność. Czy odpowiedzi Chatu GPT można uznać na wzór kolażu za na tyle oryginalne połączenie elementów innych utworów, że zasługują one na samodzielną ochronę i nie wymagają dodatkowych licencji?
Przesłanki, które na kanwie amerykańskiej ustawy Balaji proponuje wykorzystywać do oceny dozwolonego użytku w przypadku jakiegokolwiek wytworu generatywnej AI to:
- potencjalny wpływ na wartość utworu chronionego, w tym jego wartość rynkową;
- cel i charakter wykorzystania utworu, m.in. czy są to cele czysto zarobkowe, czy niezarobkowe cele edukacyjne;
- charakter utworu chronionego;
- istotność i ilość wkładu twórczego w zestawieniu z całością utworu chronionego.
Wszystkie z nich omówię poniżej, opierając się na argumentach użytych przez Balajego oraz własnych przemyśleniach.
- Wpływ rynkowy
Tutaj ocena może się skrajnie różnić w zależności od konkretnych utworów i ich twórców. Nie ułatwia jej też fakt, że OpenAI nie dzieli się informacjami na temat źródeł treści wykorzystywanych do trenowania swoich modeli. Jednak prowadzone badania powoli dostarczają dane potwierdzające zmniejszony ruch (np. ilość zapytań) na platformach, które przypuszczalnie mogły być źródłem danych dla Chatu GPT. Niestety wobec braku oficjalnej informacji od OpenAI nie można tego stwierdzić z pewnością. Balaji przywołuje przykład Stack Overflow, ale jednocześnie mówi, że podobnego spadku nie zaobserwowano w przypadku Reddit. Zwraca również uwagę na kwestię licencji OpenAI ze Stack Overflow, Reddit, The Associated Press czy News Corp — czy zostałyby one podpisane, gdyby rzeczywiście chodziło tu o dozwolony użytek?
Ta perspektywa spojrzenia na ochronę praw autorskich jest to o tyle ważna, że trudno rozmawiać o nich w oderwaniu od ich przełożenia na realne wynagrodzenie dla osób, które zarobkowo zajmują się tworzeniem utworów (np. redaktorzy The Associated Press). Co więcej nawet w sytuacji, kiedy dany twórca nie jest twórcą zawodowym (np. użytkownicy Reddit), nie oznacza to, że należy pozbawiać go możliwości zarobku proporcjonalnego do ilości treści dostarczanych w ramach tworzenia niezawodowego.
Niestety art. 34. polskiej ustawy jako generalną zasadę przyjętą dla dozwolonego użytku przewiduje brak wynagrodzenia dla twórcy — przypadki wynagrodzenia muszą być wyraźnie przewidziane w ustawie. Zawsze obowiązkowe jest jedynie “wymienienie imienia i nazwiska twórcy oraz źródła” przy uwzględnieniu “istniejących możliwości”. Nietrudno zauważyć, że Chat GPT nie spełnia nawet tych minimalnych wymagań. Należałoby się zastanowić, czy na pewno taki przepis jest adekwatny do platformy komercyjnej (Chat GPT udostępnia przecież wersję płatną, z której ok. 10 mln użytkowników), która sama notuje dochody z pracy, mniej lub bardziej twórczej, autorów, którym z tego tytułu nie przysługuje żadne wynagrodzenie. Taki rozjazd między obecną regulacją a sytuacjami, w jakich chcielibyśmy móc ją zastosować, powinien skłonić do refleksji na temat aktualizacji ustawy. Warto w tym miejscu przytoczyć art. 35. polskiej ustawy, który ogranicza dozwolony użytek do “normalnego korzystania z utworu” i sytuacji, kiedy nie są zagrożone “słuszne interesy twórcy”. Nic nie stoi na przeszkodzie, żeby ten ostatni interpretować szeroko jako interes ekonomiczny, bezpośrednio powiązany z liczbą użytkowników platform takich jak Stack Overflow. W świecie idealnym można by omawiane sytuacje próbować objąć wachlarzem art. 43. ust. 1 polskiej ustawy, który przyznaje twórcy prawo do wynagrodzenia, jeśli nic innego nie wynika z umowy o przeniesienie autorskich praw majątkowych lub o udzielenie licencji. Jednak najpierw musiałoby dojść do zawarcia takiej umowy np. ze wspomnianymi użytkownikami Reddit. Zdaje się, że skoro możliwe było wprowadzenie mechanizmu opt-in na potrzeby zgód dotyczących plików cookies, to podobnie można by rozwiązać sprawę zgód użytkowników na wykorzystanie ich tekstów do trenowania AI. Po ich udzieleniu domyślnie przysługiwałoby im wynagrodzenie — “godziwe i odpowiednie do zakresu udzielonego prawa, charakteru i zakresu korzystania oraz korzyści wynikających z korzystania z utworu” (art. 43 ust. 2. polskiej ustawy).
- (Nie)zarobkowy cel wykorzystania utworu
Tutaj Balaji zwraca uwagę na kolejność badania poszczególnych przesłanek. Nawet jeśli pierwsza z nich zostanie spełniona, tzn. nowy utwór wpływa negatywnie na wartość rynkową utworu oryginalnego, wciąż może okazać się, że mamy do czynienia z dozwolonym użytkiem (np. krytyczna recenzja książki, w której krytyk wykorzystuje jej fragmenty, która w wyniku tej recenzji może stracić potencjalnych czytelników). Kluczowe będzie określenie celu wykorzystania utworu oryginalnego. Balaji wspomina tu rozróżnienie znane amerykańskiej doktrynie na “użycie zamienne i niezamienne” (tzw. “substituting and non-substituting uses”). W praktyce sprowadza się ono do tego, że wykorzystanie dokładnie tego samego fragmentu utworu oryginalnego może być uznane za dozwolone lub nie w zależności od tego, czy celem była np. racjonalna krytyka a nie wyparcie z rynku utworu oryginalnego.
Ciekawym przykładem, kiedy sądom przyszło się zmierzyć z tym zagadnieniem była sprawa Authors Guild. v. Google dotycząca Google Książki. Sąd uznał wtedy, że nieuprawniona digitalizacja przez Google (we współpracy z bibliotekami uniwersyteckimi, które Google poprosił o udostępnienie zasobów) utworów objętych prawem autorskim i umożliwienie użytkownikom wyświetlania ich fragmentów nie są w tym przypadku naruszeniem dozwolonego użytku. Cele udostępnienia fragmentów utworów oryginalnych znajdujących się na Google Książki i utworów oryginalnych nie są bowiem zbieżne — Google Książki dostarcza jedynie ogólnej informacji o utworze, czyni go bardziej dostępnym dla społeczeństwa. Usługa nie jest jednak zamiennikiem dla utworów oryginalnych w całości. To z kolei pozwala uznać działanie Google za mieszczące się w zakresie dozwolonego celu dozwolonego użytku, tj. “badań naukowych”. Dodatkowo udostępniane przez Google Książki fragmenty są po prostu krótkie. Nie ma więc szansy by stały się zamiennikiem rynkowym dla oryginałów. W tej sprawie sąd zajął się też rozumieniem pojęcia “praw pokrewnych”. Uznano, że dla ich powstania niezbędna jest zmiana formy utworu (np. ekranizacja czy audiobook książki istniejącej wcześniej tylko w wersji papierowej). Nie powstaną one, jeśli jedyna “zmiana” polega na udostępnieniu fragmentu zamiast całości utworu. Obecnie ten wyrok rozpatruje się w kontekście wypożyczeń cyfrowych (“controlled digital lending”) czy technologii używanych do ilościowych analiz tekstów (“text data mining”).
Przesłanka zbieżności celów (“transformativeness”) publikacji utworu oryginalnego i tego, którego twórca powołuje się na dozwolony użytek, stała się też podstawą wyroku amerykańskiego Sądu Najwyższego w sprawie Andy Warhol Foundation for the Visual Arts v. Goldsmith. Uznano wtedy, że drugi chronologicznie utwór, czyli ten, w którym wykorzystano oryginał, musi mieć inny cel w znaczeniu czysto ilościowym i ekonomicznym — jeśli utwór oryginalny i ten, w którym został wykorzystany, mają ten sam lub bardzo podobny cel oraz ten drugi ma charakter zarobkowy, to istnieje wysokie prawdopodobieństwo, że nie będzie można się powołać na dozwolony użytek. Sprawa dotyczyła licencji na zdjęcie Prince’a wykonane przez Lynn Goldsmith w ramach współpracy z Newsweekiem (zachowała jednak prawa do zdjęcia), wykorzystane później przez Andy’ego Warhola. Ten ostatni wbrew brzmieniu umowy użył zdjęcia nie tylko do jednorazowego druku sitowego, ale do serii 15 innych zdjęć, z których jedno wykorzystano w specjalnym wydaniu magazynu Vanity Fair po śmierci Prince’a w 2016 r. Na tej kanwie znów pojawił się motyw praw pokrewnych. W tym przypadku uznano ich istnienie z powodu zmiany celu, charakteru i znaczenia utworu, a także jego przesłania (szeroka interpretacja przesłanki “transformativeness”).
Przekładając opisywaną przesłankę na grunt Chatu GPT, warto się zastanowić, czy jego odpowiedzi służą temu samemu celowi co treści, na których był trenowany? Niestety złożoność narzędzia i różne potrzeby jego użytkowników utrudniają, o ile nie uniemożliwiają, jednoznaczną odpowiedź na to pytanie. Balaji proponuje w zamian zadać sobie pytanie o to, czy szkody rynkowe powodowane przez Chat GPT są wynikiem dostarczania przez niego utworów-zamienników, czy jednak nie ma tu aż tak wyraźnego ciągu przyczynowo-skutkowego jak w przypadku wspomnianej negatywnej krytyki książki? Według Balajego odpowiedź jest prosta — Chat GPT dostarcza utwory-zamienniki. Najlepszym tego dowodem jest wspomniany już przykład Stack Overflow — obie platformy mają pomagać w znalezieniu odpowiedzi na konkretne pytania, np. z zakresu matematyki, a jednocześnie zaobserwowano odpływ użytkowników ze Stack Overflow po powstaniu Chatu GPT.
W poszukiwaniu tej przesłanki w polskiej ustawie warto przyjrzeć się jej art. 23 ust. 1. Przewiduje on nieodpłatne korzystanie “z już rozpowszechnionego utworu” “bez zezwolenia twórcy”, ale tylko “w zakresie własnego użytku osobistego”. Oczywiście nie obejmuje więc Chatu GPT, który jest publicznie dostępny — co więcej też w wersji płatnej.
- Charakter utworu objętego prawami autorskimi
W tej przesłance kluczowe jest rozróżnienie między utworem kreatywnym (“creative work”), którego twórca może liczyć na większą ochronę, oraz utworem opartym na faktach (“factual work”), który będzie chroniony mniej rygorystycznie. Patrząc na sprawę z drugiej strony, przy utworze kreatywnym trudniej powołać się na dozwolony użytek, podczas gdy łatwiej będzie go uzasadnić w przypadku utworów o silniejszym powiązaniu ze zdarzeniami, które rzeczywiście miały miejsce. Sam Balaji stwierdza, że ten czynnik jest najmniej istotny, ponieważ wszystkie treści dostępne w internecie są w jakimś stopniu chronione.
O podobnym stopniowaniu na gruncie polskiej ustawy można mówić na etapie oceny, czy mamy w ogóle do czynienia z utworem, który, jak wspomniałam wyżej, musi cechować się twórczym charakterem.
- Wkład twórczy
Balaji dla jego oceny przywołuje stanowiska dwóch głównych “szkół” (rozróżnienie jest również jasno widoczne w opisanym wcześniej wyroku Authors Guild. v. Google). Pierwsza (zorientowana na “input”) z nich mówi, że skoro trenujemy modele na całych utworach chronionych, to ich odpowiedzi są również w całości tymi chronionymi utworami, co wyklucza przyjęcie dozwolonego użytku. Druga (zorientowana na “output”) proponuje wziąć za punkt wyjścia odpowiedzi, które niemal nigdy nie są kopiami utworów chronionych. Zatem “ilość użytego utworu” (“amount used”) jest niemal równa zeru, co przemawia za dozwolonym użytkiem. Ta druga interpretacja jest według Balajego o tyle błędna, że prawo autorskie chroni nie tyle sam utwór, co raczej kreatywne wybory twórcy. Przyjrzyjmy się zasygnalizowanemu wcześniej przykładowi kolażu — jego autor może uzyskać ochronę właśnie w wyniku kreatywnego połączenia elementów, do których z osobna nie przysługują mu żadne prawa. Podobnie będzie z nowelami. Ich autorzy zyskują ochronę w związku z innowacyjnym zestawieniem słów — rzadko wymyślają nowe słowa.
Teoria informacji umożliwia tu bardzo precyzyjne badania ilościowe. Co więcej trzeba mieć na uwadze całe odpowiedzi i całe utwory chronione. Możemy mieć bowiem do czynienia z sytuacją, kiedy LLM sprawnie “miesza” fragmenty utworów wykorzystanych do jego trenowania, co może sprawiać wrażenie, że utwór chroniony został wykorzystany w rozsądnych proporcjach. Innym istotnym aspektem jest to, ile razy w procesie trenowania został użyty dany fragment utworu chronionego, ponieważ przekłada się to na to, jak silnie LLM będzie łączył ze sobą dane zbitki słów.
Na gruncie polskiej ustawy podobne wnioski moglibyśmy wyprowadzić z jej art. 3 i art. 29². Pierwszy z nich dotyczy ochrony różnego rodzaju zbiorów i antologii, które zyskują ochronę w oparciu o “twórczy charakter” “doboru, układu lub zestawienia”. Drugi dotyczy niezamierzonego włączania utworu do innego utworu. Jest to dozwolone, “o ile włączony utwór nie ma znaczenia dla utworu, do którego został włączony”. Znów wracamy więc do kwestii ilościowej i tego, jak bardzo kreatywne jest nowe zestawienie.
Koszta…
…pieniężne
Duże firmy już przyglądają się sytuacji pod kątem podjęcia ewentualnych kroków prawnych. Morgan Stanley szacuje, że cały sektor AI może spodziewać się miliardowych strat w wyniku potencjalnych opłat licencyjnych i ugód. Pojawiają się też propozycje opłat dla twórców treści, z których AI korzysta do generowania swoich odpowiedzi. Testowane rozwiązania to np. systemy zbierania danych z tylko po wyrażeniu zgody (mechanizm znany m.in. z plików cookies) oraz opracowywanie nowych metod trenowania AI, które wymagałyby mniej danych i byłyby bardziej transparentne w zakresie wykorzystywanych źródeł.
…społeczne
Dane prezentowane w artykule Balajego jasno pokazują odpływ użytkowników z tradycyjnych platform, które do tej pory były ich podstawowym źródłem informacji, na rzecz Chat GPT. Jest to o tyle ironiczne, że swoje działanie Chat GPT zawdzięcza właśnie tym platformom, które teraz są pozbawiane przez niego użytkowników. To zjawisko jest błędnym kołem, ponieważ odbieranie użytkowników tradycyjnym platformom oznacza, że Chat GPT powoli będzie niszczył fundament, na którym stoi, a zatem ograniczał sobie możliwość pozyskiwania nowych, wysokojakościowych treści z platform, które tracą użytkowników.
Nie możemy też zapominać o tak podstawowej rzeczy jak kontrola źródła pozyskiwanej informacji. Chat GPT w najlepszym wypadku dostarczy nam poprawną odpowiedź na pytanie, ale dopiero dopytany będzie próbował znaleźć, lub wymyślić, do niej źródło. Czy można ufać w ciemno takiej odpowiedzi, kiedy nie znamy jej źródła? Oczywiście dotyczy to w większym stopniu pytań z dziedzin humanistycznych niż ścisłych, gdzie AI może pokazać drogę dojścia do danej odpowiedzi. Być może w dobie internetu już dawno straciliśmy kontrolę nad źródłami, jako że ich ilość uniemożliwia każdorazowe sprawdzanie wiarygodności danej strony internetowej. Wciąż jednak, kiedy korzystamy z wyszukiwarki, kontrolujemy, na jaką stronę wchodzimy. AI musimy natomiast w większości przypadków wierzyć w ciemno — tak, jak w to, że jej twórcy poważnie podejdą do kwestii praw autorskich.
Podsumowanie
Problem praw autorskich w dobie AI jest wielowymiarowy. Oczywiście wchodzą tu w grę aspekty czysto prawne, ale nie da się uciec od aspektów etycznych, ekonomicznych czy społecznych, w tym nawet kwestii nieuczciwej konkurencji. Całe zagadnienie zdecydowanie wymaga dalszych badań oraz śledzenia rozwoju technologii i dalszych kroków największych gigantów na tym rynku. Sam Balaji uważa, że żaden z tych czterech aspektów nie przemawia za zastosowaniem dozwolonego użytku do Chatu GPT. Postarałam się pokazać, że ustawa amerykańska i polska są w gruncie rzeczy zbieżne w zakresie opisywanym przez Balajego. Jednak ich praktyczne zastosowanie dopiero będziemy mogli obserwować, kiedy sprawy związane z AI staną się przedmiotem ocen sądów. Dlatego też warto śledzić rozwój wydarzeń.
Źródła:
- Materiał prasowy: https://www.forbes.com/sites/virginieberger/2024/10/29/ex-openai-researcher-how-chatgpts-training-violated-copyright-law/
- Artykuł Suchira Balajiego: https://suchir.net/fair_use.html
- Prawo do kolażu: https://legalnakultura.pl/pl/prawo-w-kulturze/prawnik-odpowiada-zapytaj-prawnika/grafika/2064,prawa-autorskie-dziel-wykorzystywanych-przy-tworzeniu-kolazy#gsc.tab=0
- Liczba użytkowników płatnych wersji Chatu GPT: https://backlinko.com/chatgpt-stats
- Authors Guild. v. Google: https://www.authorsalliance.org/2023/02/24/fair-use-week-2023-looking-back-at-google-books-eight-years-later/