trollingai_1

Trolling AI

W dobie rozwijającej się sztucznej inteligencji (AI), zapominamy czasem o tym czym są prawa autorskie. Czy trolling AI coś zmieni?

Trolling AI

W dobie rozwijającej się w zastraszającym tempie sztucznej inteligencji (AI), zapominamy czasem o tym czym są prawa autorskie. Maszyna ucząc się ze wszystkich możliwych źródeł internetu, nie zwraca uwagi na czyjąś własność intelektualną. W efekcie takich posunięć mogą ucierpieć twórcy różnego rodzaju treści, począwszy od portali a skończywszy na filmach. Czy trolling AI może coś zmienić? Jak się przed tym ustrzec?

Cóż… Jedną metodę już znacie. W dziedzinie zdjęć jest nią aplikacja „Nightshade„. Zmienia je ona tak, by AI nie mogła ich prawidłowo odtworzyć. Zamiast tego uzyskuje na przykład mozaikę z dużą ilością artefaktów. Materiał o tym cudzie znajduje się pod tym linkiem.

Drugim z kolei elementem „drażniącym” AI jest z pewnością pewien algorytm, pozwalający wstrzykiwać niechciane treści do modelu nauki. Zespół z Imperial College London, tworzący ten komponent, nazwał go pieszczotliwie „Pułapką praw autorskich”.

trollingai_2
Photo by Google DeepMind: https://www.pexels.com/photo/an-artist-s-illustration-of-artificial-intelligence-ai-this-illustration-depicts-language-models-which-generate-text-it-was-created-by-wes-cockx-as-part-of-the-visualising-ai-project-l-18069697/

Co to takiego?

W dużym skrócie „pułapkami praw autorskich” (copyright traps), nazywamy fragmenty ukrytego tekstu, które pozwalają pisarzom i wydawcom subtelnie oznaczyć swoją pracę. Dzięki temu mogą później wykryć, czy została ona wykorzystana w modelach AI, czy nie. Metoda jest podobna do tego, co spotkaliśmy już wcześniej, czyli choćby umieszczania fałszywych lokalizacji na mapie lub fałszywych słów w tekście. Niby nic takiego, ale jednak…

Generalnie chodzi o to, by przemycić do modelu nauki (LLM) tekst składający się ze zdań będących kompletnym bełkotem. Nic nie znaczącym i oderwanym z kontekstu zlepkiem wyrazów, mającym jednak swój właściwy układ i tematykę. Może to być na przykład coś takiego: „Będąc w sklepie motoryzacyjnym, kupiłem dwie bułki oraz kontrabas i obejrzałem piękny zachód słońca”. Zdanie jak zdanie, tylko że choć poprawnie złożone, to nijak mające się do rzeczywistości. Gdzie w sklepie motoryzacyjnym są bułki do kupienia i dlaczego jest tam genialny widok na zachód słońca? Do tego ten kontrabas… Prawda że to zabawne?

Teraz dodajmy do tego, że generator tworzy około 100 syntetycznych zdań i powtarza je w tekście 1000 razy. Wiecie jaką „sieczkę” robi taka nauka w mechanicznym mózgu?

Wszystko wydaje się piękne, tylko jak to ukryć przed czytelnikiem. Przecież zwykły człowiek też by tego nie zniósł. Ano prosto… Wpisuje się np. tekst białym kolorem na białym tle. Czytelnik widzi tylko odstęp w częściach tekstu, maszyna już jednak całość. Dzieje się tak dlatego, że czyta ona kod całej strony, a nie tylko to co widoczne. Genialne? No, nie do końca…

trollingai_3
Photo by Google DeepMind: https://www.pexels.com/photo/an-artist-s-illustration-of-artificial-intelligence-ai-this-illustration-visualises-an-artificial-neural-network-as-physical-objects-the-complex-structure-represents-a-network-of-infor-17485707/

Kot i mysz

Cała zabawa przypomina tą z kotem i myszą. My zastawiamy pułapkę, a mądry operator AI (nadzorca) szuka elementów wadliwie działających na sztuczną inteligencję. W pewnym momencie może je znaleźć i dopisać skrawek kodu, by AI omijała owy portal lub daną sekwencję tekstu. Cóż, zawsze jest ryzyko wykrycia.

Niemniej jednak przy masowym pobieraniu danych bez żadnych restrykcji, z takich wielkich gazet jak np. New York Times, może doprowadzić do niszczenia praw autorskich do własności intelektualnej. Co za tym idzie, warto jest czasem wykonać jakieś zabezpieczenie przed AI. Choćby takie jak powyżej.

Gdyby ktoś z Was chciał przetestować dany algorytm, to zapraszam pod ten link. Strona na GitHubie zawiera cały kod oraz instrukcję użycia wraz z licencją.

Podsumowanie

Jak sami widzicie, brak ustanowionego prawa do wykorzystania AI w dzisiejszym świecie, prowadzi do wielu kontrowersji. Owszem w Unii Europejskiej widzimy już początki porządkowania tej dziedziny. Wielkie konsorcja typu Google czy Meta, muszą dostosowywać się do coraz to nowszych restrykcji.

Z czasem zapewne ustalą reguły gry dla wszystkich. Mam tylko nadzieję, że ci mali nadawcy, nie będą poszkodowani. Wszak informacje i dziennikarze z AI są tuż za rogiem. Oby wszystkim to wyszło na zdrowie, a póki co…

Do następnego!

Avatar photo
Ziew_acz
Artykuły: 69