Newsy

Algorytmy mają niższą skuteczność w wykrywaniu plagiatów muzycznych niż ludzie. Mogą być jednak cennym narzędziem pomocniczym

2023-12-08  |  06:15

Sztuczna inteligencja nie zastąpi ludzi w ocenianiu, czy dany utwór muzyczny jest plagiatem – uważają naukowcy z Auckland. Analizie poddano 40 historycznych spraw o plagiat. Sztuczna inteligencja wykazała o 8 pkt proc. niższą skuteczność niż ludzie. Do podstawowych ograniczeń zastosowania algorytmów w takich sprawach zalicza się zbyt małą i obarczoną błędem selekcji bazę wiedzy. Sztuczna inteligencja opiera się bowiem na sprawach, w których zapadły wyroki, nierzadko kontrowersyjne. Większość sporów z oczywistym wynikiem było natomiast rozstrzyganych poza wokandą.

Zasady rozstrzygania o plagiacie różnią się nieco w zależności od kraju, jednak głównym modelem, jaki ma zastosowanie, jest ten stosowany w USA. Decyzje podejmuje zespół sędziów na podstawie odsłuchu utworu. Nie jest to więc podstawa naukowa oparta o kryteria ilościowe. Decyzja opiera się na opinii grupy osób, które po przesłuchaniu danych utworów stwierdzają, czy są one do siebie zbyt podobne. Jeśli tak, kwestionowany utwór zostaje uznany za plagiat, a jeśli osoby nie stwierdzą, że utwory są do siebie nadmiernie podobne, wtedy nie ma plagiatu. Jest to uproszczony opis tego procesu. Problem polega na tym, że oceny ludzi, w jakim stopniu dane rzeczy brzmią podobnie, mogą być dość subiektywne – mówi w wywiadzie dla agencji Newseria Innowacje dr Patrick Savage z Uniwersytetu w Auckland.

Naukowiec wspólnie z prof. Quentinem Atkinsonem stworzył algorytm Percent Melodic Identity, a dr Dominik Schnitzer z Austriackiego Instytutu Badawczego Sztucznej Inteligencji opracował algorytm Musly. Oba te narzędzia są uznawane za najlepsze w wykrywaniu plagiatów muzycznych. W ramach pracy badawczej zespół naukowców próbował odpowiedzieć na pytanie, czy zautomatyzowane algorytmy mogą zapewnić nowy obiektywizm w decyzjach o naruszeniu praw autorskich do muzyki, ograniczając tym samym liczbę, skalę i koszt spraw sądowych.

Chcieliśmy się przekonać, czy można przewidzieć historyczne przypadki naruszenia prawa autorskiego na podstawie obiektywnych kryteriów, takich jak podobieństwo stwierdzone na podstawie algorytmu i spostrzeżeń, oceny ludzi. Staraliśmy się zgromadzić jak największą próbę historycznych spraw. Zebraliśmy około 40 spraw z całego świata, w większości ze Stanów Zjednoczonych, ale także z krajów takich jak Japonia, Chiny, Nowa Zelandia i Tajwan – wyjaśnia dr Patrick Savage.

W badaniu analizowanych spraw naukowcy zastosowali algorytmy podobieństwa, z których jeden opierał się na melodii, a drugi na całej ścieżce dźwiękowej, z uwzględnieniem takich elementów jak rytm i barwa dźwięku oraz brzmienie wokalu i instrumentów. Prowadzili również eksperymenty z udziałem ponad 50 osób, które słuchały wersji oryginalnych pełnych nagrań dźwiękowych oraz wersji zmodyfikowanych z samą melodią, a także wersji midi na pianinie. Uczestnicy mieli za zadanie ocenić podobieństwo tekstu.

– Wyniki nieco nas zaskoczyły. Myśleliśmy, że melodia będzie najlepszym czynnikiem predykcyjnym, ponieważ w przeszłości była uważana za najlepszy miernik oryginalności, jednak nasze przewidywania nie spełniły się w całości. Najlepszą wartość predykcyjną miały pełne wersje audio słuchane przez ludzi. Ocena melodii na podstawie algorytmów również była dość dokładna i sprawdzała się w  około 75 proc.  przypadków, jednak nie była tak dobra jak ludzka ocena po wysłuchaniu pełnego materiału dźwiękowego, w przypadku której poprawność oceny historycznych przypadków wynosiła 83 proc. – wskazuje badacz z Uniwersytetu w Auckland.

W ocenie naukowców algorytmy nie zastąpią oceny ludzkiej w sprawach o plagiat, ale mogą być istotnym wsparciem w ich pracy. Jednym z podstawowych ograniczeń sztucznej inteligencji w takich zastosowaniach jest fakt, iż jest ona szkolona na ograniczonej bazie utworów. Odnosi się to zarówno do ich liczby, jak i miejsca, gdzie powstawały.

Jeżeli zaprojektujemy algorytmy w oparciu o muzykę zachodnią i przypadki naruszenia praw autorskich z USA, będą one działały lepiej w tych przypadkach, ale mogą nie sprawdzać się tak dobrze w innych systemach czy kulturach. Jest to uniwersalny problem związany z algorytmami. Jeśli chodzi konkretnie o prawa autorskie i plagiat, niektórych rzeczy nie można usłyszeć na ścieżce dźwiękowej, na przykład tego, czy dana strona miała dostęp do utworu drugiej strony, czy go słyszała. Jest to element oceny, którego nie można wywnioskować z samego utworu. Należy również wziąć pod uwagę, na ile oryginalny jest dany materiał. Może on być dość podobny, jednak jeśli określony motyw występuje w wielu różnych materiałach, to podobieństwo nie powinno znacząco wpływać na ocenę. Można spróbować uwzględnić ten element w algorytmach, ale trudno tutaj osiągnąć stuprocentową niezawodność – ocenia dr Patrick Savage.

Poza tym baza opiera się wyłącznie na analizie spraw, co do których w przeszłości zapadły wyroki, a to dodatkowo zawęża objętość danych wsadowych. Co więcej, wyroki niekiedy były kontrowersyjne. Tak było chociażby w przypadku piosenki „Blurred Lines” Robina Thicke’a, który powstał we współpracy z Pharellem Williamsem i raperem T.I. Rodzina amerykańskiego piosenkarza soulowego, Marvina Gaye'a, pozwała twórców, twierdząc, że ich dzieło jest plagiatem jego utworu „Got to Give It Up”. Sąd przyznał rację powodom, z czym wiele osób do dziś się nie zgadza. Decyzją sądu muzycy musieli zapłacić rodzinie artysty 7,4 mln dol. z zarobionych na utworze niemal 17 mln dol.

Musimy polegać na orzeczeniach sądu, nawet jeśli się z nimi nie zgadzamy. Być może poważniejszym problemem jest w tym przypadku błąd selekcji próby. Ze wszystkich roszczeń w sprawach o naruszenie praw autorskich na świecie wiele jest dość przejrzystych. Utwory są w oczywisty sposób identyczne, czyli prawa autorskie zostały ewidentnie naruszone. Zazwyczaj te najbardziej oczywiste sprawy nie trafiają do sądu, ponieważ jeśli podobieństwo jest zbyt oczywiste, nie warto poświęcać czasu i pieniędzy na postępowanie sądowe. Strony zawierają ugodę lub rezygnują. W ten sposób uzyskujemy próbę obciążoną błędem selekcji, która zawiera wyłącznie sprawy najbardziej skomplikowane, interesujące i toczące się o największą stawkę – tłumaczy naukowiec z Auckland.

Jak podkreśla, algorytmy mogą pomóc członkom zespołów oceniających w zdecydowaniu, czy mają do czynienia z plagiatem

– W naszym opracowaniu mamy do czynienia z 40 sprawami przedstawionymi w dwóch wymiarach – podobieństwo  na podstawie oceny i podobieństwo melodii. Jeśli by przedstawić nowe przypadki w sądzie i umieścić na mapie podobieństwa melodii i innych cech, byłby to lepszy kontekst do podjęcia decyzji. Mimo mniejszego podobieństwa utworów, ale przy wystąpieniu określonych kontekstów być może dany przypadek powinien zostać uznany za naruszenie praw autorskich, chociaż w poprzedniej sprawie tak się nie stało. Dysponując kontekstem i ilościowym przedstawieniem podobieństw oraz możliwością porównania ich z historycznymi sprawami, będzie można wyeliminować w pewnym stopniu subiektywny element oceny i stworzyć bardziej niezawodne podstawy dla przyszłych spraw sądowych – ocenia dr Patrick Savage.

Mimo ograniczeń znacznie obniżających skuteczność zautomatyzowanych narzędzi wykrywających plagiat firmy z branży muzycznej zaczynają eksperymentować z ich wdrażaniem. Tak jest m.in. w przypadku Spotify. Operator platformy udostępnił w 2020 roku narzędzie Plagiarism Risk Detector and Interface, przeznaczone dla autorów muzyki. Działa na zasadzie analizy partytur zawierających podstawowe elementy utworu, w tym jego melodię, tekst i harmonię. Dzięki temu muzycy mogą zgłaszać własne utwory do analizy pod kątem ryzyka plagiatu, a detektor krzyżuje dane ze wszystkimi utworami, które znajdują się w bazie danych. Po analizie użytkownik widzi okno, w którym zaznaczone są fragmenty utworu pojawiające się w dziełach innych twórców.

Oprócz wspomnianego wyżej sporu z udziałem Robina Thicke’a do najsłynniejszych spraw o plagiat zalicza się m.in. tę, która wiąże się z utworem „Frozen” Madonny. Belgijski sąd uznał w 2005 roku roszczenia kompozytora Salvatore’a Acquavivy, który stwierdził liczne podobieństwa ze swoją skomponowaną wcześniej piosenką „Ma Vie Fout L’camp”.

Również w Polsce nie brakuje podobnych sporów. Kilka głośnych spraw toczyło się z udziałem Sławomira Świerzyńskiego, lidera zespołu Bayer Full, tworzącego muzykę z nurtu disco polo. W 2021 roku sąd orzekł, że twórca przywłaszczył piosenkę „Tawerna »Pod Pijaną Zgrają«” autorstwa Grzegorza Bukały. Zespół został pozwany także przez Mariusza Gabrycha, który uznaje się za autora piosenki „Wszyscy Polacy to jedna rodzina”. Jeszcze wcześniej, w 2012 roku, Sąd Apelacyjny w Łodzi uznał, że zespół, nagrywając piosenkę „Taka muzyka”, dopuścił się częściowego plagiatu „Takiej piosenki” Karola Płudowskiego.

Czytaj także

Kalendarium

Więcej ważnych informacji

Newseria na XVI Europejskim Kongresie Gospodarczym

Jedynka Newserii

Jedynka Newserii

Konsument

T-Mobile startuje w Polsce z nowym konceptem. Pozwoli klientom przetestować i doświadczyć najnowocześniejszych technologii

T-Mobile już od kilku lat realizuje strategię, która mocno skupia się na innowacjach i doświadczeniach klienta związanych z nowymi technologiami. Połączeniem obu tych elementów jest Magenta Experience Center – nowoczesny koncept, który ma zapewnić klientom możliwość samodzielnego przetestowania najnowszych technologii. Format, z sukcesem działający już na innych rynkach zachodnioeuropejskich, właśnie zadebiutował w Warszawie. Będą z niego mogli korzystać zarówno klienci indywidualni, jak i biznesowi.

Problemy społeczne

W Polsce brakuje dostępnych cenowo mieszkań. Eksperci mówią o kryzysie mieszkaniowym

 Większość osób – nawet ze średnimi, wcale nie najgorszymi dochodami – ma problem, żeby zaspokoić swoje potrzeby mieszkaniowe, ale też z tym, żeby po zaspokojeniu tych potrzeb, po opłaceniu wszystkich rachunków i opłat związanych z mieszkaniem, mieć jeszcze środki na godne życie – mówi Aleksandra Krugły z Fundacji Habitat for Humanity Poland. Jak wskazuje, problem stanowi nie tylko wysoki współczynnik przeciążenia kosztami mieszkaniowymi, ale i tzw. luka czynszowa, w której mieści się ponad 1/3 społeczeństwa. Tych problemów nie rozwiąże jednak samo zwiększanie liczby nowych lokali. Potrzebne są również rozwiązania, które umożliwią zaangażowanie sektora prywatnego w zwiększenie podaży dostępnych cenowo mieszkań na wynajem.

Konsument

Od 28 kwietnia Polacy żyją na ekologiczny kredyt. Zmiana zachowań konsumentów może odwrócić negatywny trend

Dzień Długu Ekologicznego, czyli data, do której zużyliśmy wszystkie zasoby, jakie w ciągu roku może zapewnić Ziemia, w tym roku w Polsce przypada 28 kwietnia, kilka dni wcześniej niż rok temu. Coroczne przyspieszenie tego terminu to sygnał, że czerpiemy bez umiaru z naturalnych systemów, nie dając im czasu na odbudowę. – Polskie społeczeństwo staje się coraz bardziej konsumpcyjne, kupujemy i wyrzucamy coraz więcej. Ale też nie mamy tak naprawdę efektywnego narzędzia, żeby temu zapobiec – ocenia Filip Piotrowski, ekspert ds. gospodarki obiegu zamkniętego z UNEP/GRID-Warszawa.

Partner serwisu

Instytut Monitorowania Mediów

Szkolenia

Akademia Newserii

Akademia Newserii to projekt, w ramach którego najlepsi polscy dziennikarze biznesowi, giełdowi oraz lifestylowi, a  także szkoleniowcy z wieloletnim doświadczeniem dzielą się swoją wiedzą nt. pracy z mediami.