Newsy

Przyszłością systemów antyplagiatowych będzie stworzenie profilu językowego studenta. To pozwoli wychwycić prace kupowane na zamówienie

2019-10-11  |  06:20
Mówi:Gabriela Górska, doktorantka psychologii społecznej UW, pracowniczka Laboratorium Interaktywnych Technologii, OPI PIB
dr inż. Marek Kozłowski, kierownik Laboratorium Inżynierii Lingwistycznej Ośrodka Przetwarzania Informacji – Państwowego Instytutu Badawczego
  • MP4
  • Na 300 tys. prac dyplomowych przebadanych w tym roku w 8 proc. z nich zostały przekroczone poziomy ostrzegawcze. To oznacza, że przynajmniej 40 proc. treści może potencjalnie pochodzić z innego źródła. Algorytm Jednolitego Systemu Antyplagiatowego analizuje ok. miliarda dokumentów, weryfikuje autentyczność pracy także w porównaniu z obcojęzycznymi. Problemem są też prace kupowane na zamówienie. W przyszłości pomoże z nimi walczyć stworzenie językowego i stylistycznego profilu autora.

    – Studenci często nie są zmotywowani do tego, żeby rzetelnie napisać swoje prace. Nie są nawet zainteresowani tematem, o którym piszą – mówi agencji Newseria Biznes Gabriela Górska, psycholożka społeczna UW z OPI PIB. – Może nie są w stanie rzetelnie napisać pracy przez dużą ilość codziennych obowiązków. Jedno z badań przeprowadzonych na Uniwersytecie Mikołaja Kopernika w Toruniu pokazuje, że częściej plagiatują osoby, które są zatrudnione i jednocześnie studiują.

    Problem nadużyć może w pewnej mierze mieć swoje źródło w szkołach wyższych, które nie zawsze przygotowują do napisania pracy dyplomowej czy bibliografii we właściwy sposób. Zdecydowana większość studentów ocenia plagiat jako naganny, z drugiej jednak strony duża grupa próbuje oszukać system. Nie zawsze też mają świadomość, co tak naprawdę jest plagiatem.

    – Niektóre z badań pokazują, że studenci myślą, że plagiatem jest wyłącznie nieoznaczony cytat, a nie wiedzą o tym, że ubranie czegoś we własne słowa czy właśnie przetłumaczenie z jednego języka na drugi też jest plagiatowaniem. Popełniają więc coś, o czym teoretycznie wiedzą, że jest złe, nie wiedząc jednocześnie, że w praktyce to czynią – tłumaczy Gabriela Górska.

    Część studentów przy pisaniu prac jest kreatywna: nie tylko korzysta z wielu źródeł, lecz także sięga po prace obcojęzyczne. Jeszcze inni decydują się na mechaniczne zmiany i techniczne ingerencje w tekst.

    – Są różne rodzaje nadużyć autorskich, m.in. tworzenie kopii z innych prac. Mając dużą bazę referencyjną, jesteśmy w stanie znaleźć te podejrzane dokumenty i zaznaczyć wspólne fragmenty między dokumentem źródłowym a badanym – mówi dr inż. Marek Kozłowski, kierownik Laboratorium Inżynierii Lingwistycznej Ośrodka Przetwarzania Informacji – Państwowego Instytutu Badawczego.

    Z danych OPI PIB wynika, że algorytmy Jednolitego Systemu Antyplagiatowego przebadały już ponad 300 tys. prac dyplomowych. Statystyki wskazują, że w przypadku 8 proc. z nich został przekroczony poziom ostrzegawczy, co oznacza, że przynajmniej 40 proc. treści pracy może potencjalnie pochodzić z innego źródła. Próg alarmowy, w którym podobieństwo szacuje się na ok. 70 proc., przekroczyło 2,5 proc. prac.

    – Takie podstawowe techniki to są techniki znakowej manipulacji tekstem, czyli wprowadzanie białych znaków albo mikrospacji. Biały znak jest niewidoczny dla osoby czytającej, ale system widzi ten znak jak każdy inny. Mikrospacje, czyli spacje o rozmiarze czcionki 1, również są niewidzialne dla użytkownika. Dla systemu to ciąg liter oddzielonych od siebie spacjami – tłumaczy dr inż. Marek Kozłowski.

    Jeszcze kilka lat temu takie manipulacje były częstsze, bo mniejsze było też ryzyko ich znalezienia. Jednolity System Antyplagiatowy takie nadużycia rozpoznaje jednak od razu.

    – Rysujemy rozkład długości słów. Jeżeli jest bardzo dużo słów o długości jednej–dwóch liter lub występuje bardzo dużo słów o znacznej długości, po kilkadziesiąt znaków, to istnieje podejrzenie, że ktoś wykonał tego rodzaju nadużycie – wskazuje ekspert.

    JSA wyłapuje nie tylko manipulacje tekstem czy lustrzane zapożyczenia, fragmenty zbliżone semantycznie i tzw. mozaiki, czyli wykorzystanie fragmentów kilku różnych prac do stworzenia jednej, lecz także fragmenty podobne semantycznie. JSA porównuje długie fragmenty tekstu i w ten sposób zauważy np. zmiany w kolejności zdań czy szyku wyrazów, a jako zapożyczenie oceni też przeplatanie własnymi słowami oryginalnego tekstu.

    – Kolejne nadużycie studentów to tłumaczenie innych prac. Czyli wtedy, gdy student bierze pracę napisaną w innym języku i tłumaczy ją automatycznie albo samodzielnie. Jeżeli tłumaczy sam, jest to pewien wkład własny, co jest trudne do wykrycia. Natomiast można też tłumaczyć pracę automatycznie narzędziami informatycznymi, np. translatorami – zaznacza Kozłowski.

    Jednolity System Antyplagiatowy jest w stanie znaleźć większość nadużyć, jest jednak bezradny w przypadku zjawiska tzw. ghostwritingu, czyli kupowania gotowych prac napisanych przez inną osobę. Nie zawsze jest też w stanie znaleźć kopie kilku prac z różnych języków. JSA weryfikuje oryginalność tekstów m.in. w zestawieniu z tekstami zawartymi w internecie czy Ogólnopolskim Repozytorium Pisemnych Prac Dyplomowych, gdzie wśród kilku milionów prac znajdują się także prace obcojęzyczne. Te bazy muszą być jednak ciągle rozwijane, podobnie jak metody walki z ghostwritingiem.

    – Kolejne kroki, które należy wykonać w rozwoju walki z plagiatami to, po pierwsze, profilowanie behawioralne, czyli gromadzenie dokumentów napisanych przez daną osobę w celu stworzenia profilu autora i weryfikowania każdej pracy z tym profilem. Będzie można wtedy stwierdzić, czy praca jest z nim zgodna, czy odbiega stylem od innych prac danej osoby. A druga kwestia to weryfikowanie, czy praca nie jest przetłumaczona z innego języka – ocenia dr inż. Marek Kozłowski.

    Czytaj także

    Więcej ważnych informacji

    Jedynka Newserii

    Jedynka Newserii

    Transport

    W transporcie ubywa pasażerów, ale przybywa gapowiczów. Długi za jazdę bez ważnego biletu przekraczają już 144 mln zł

    Z powodu pandemii średni spadek przychodów ze sprzedaży biletów – zarówno w komunikacji miejskiej, jak i na kolei – szacuje się na ponad 80 proc. Z publicznego transportu wciąż nie korzysta tylu pasażerów, co wcześniej, za to pojawia się coraz więcej gapowiczów. W Rejestrze Dłużników BIG InfoMonitor figuruje ich już ponad 115 tys. z łącznym długiem 144,3 mln zł, a rekordzista z Pomorza ma do zapłaty ponad 219 tys. zł. Niższe wpływy z biletów, a z drugiej strony wzrost kosztów związany z zaostrzonymi procedurami bezpieczeństwa powodują, że przewoźnicy są coraz bardziej zniecierpliwieni i zdeterminowani w odzyskiwaniu długów.

    Bankowość

    Prof. Marian Noga: Banki w Polsce są w bardzo złej kondycji. Upadek choćby jednego z nich wywołałby efekt domina

    Zysk sektora bankowego w pierwszych miesiącach br. spadł o ponad 40 proc. Rekordowo niskie stopy procentowe, odpływ kapitału z rynku bankowego, znaczny wzrost ryzyka kredytowego i upadłości banków, które może wywołać falę domina – to główne zagrożenia, którym sektor będzie musiał stawić czoła w nadchodzących miesiącach. Jak ocenia prof. Marian Noga z wrocławskiej WSB, efektem będzie dalsze zaostrzanie polityki kredytowej, co ograniczy dostępność finansowania w gospodarce, a banki uciekną w inne produkty inwestycyjne. – Niedługo Rada Polityki Pieniężnej będzie musiała podnieść stopy procentowe, żeby wzmocnić złotego i przeciwdziałać rosnącej inflacji, dzięki czemu banki zaczną powoli odrabiać straty związane z kredytowaniem gospodarki – dodaje.

    Jak korzystać z materiałów Newserii?

    Ważne informacje dla dziennikarzy i mediów

    Wszystkie materiały publikowane w serwisach agencji informacyjnej Newseria przeznaczone są do bezpłatnej dystrybucji poprzez serwisy internetowe, stacje radiowe i telewizje, wydawców prasy oraz aplikacje pełniące funkcję agregatorów newsów. 

    Szczegóły dotyczące warunków współpracy znajdują się tutaj.

    Konsument

    Tegoroczne wakacje pod znakiem ścisłych restrykcji. Na kolonie i obozy wyjedzie 80 proc. mniej uczniów [DEPESZA]

    Około 240 tys. dzieci i młodzieży wyjedzie w tym roku na letnie kolonie i obozy. Te upłyną jednak pod znakiem ścisłych restrykcji. Dzieci muszą być przygotowane na stosowanie się do zasad higieny, a na organizatorów zostały nałożone dodatkowe wymogi. – Z kolei rodzice w tym roku poza organizacją i logistyką powinni bardziej skupić się na kwestiach zdrowia i pomyśleć o dodatkowym ubezpieczeniu dla dzieci – podkreślają przedstawiciele ERGO Hestii. Przyda się ono np. w razie nagłej choroby lub nieszczęśliwego wypadku.

    Surowce

    Polska zacieśnia współpracę z USA w sektorze energetyki. Kluczowy atom i dostawy skroplonego gazu

    Dostawy skroplonego gazu to kluczowy obszar polsko-amerykańskiej współpracy w sektorze energetyki. PGNiG, które stawia na dywersyfikację dostaw i uniezależnianie się od rosyjskiego surowca, sukcesywnie zwiększa wolumen zakupu LNG od Amerykanów. Do 2024 roku będzie to ponad 9 mld m3 rocznie. Kolejnym perspektywicznym obszarem współpracy jest też energetyka jądrowa. – Pojawiają się kolejne zapowiedzi Amerykanów, którzy są zainteresowani uczestnictwem w polskim projekcie atomowym – mówi ekspert ds. energetyki Mateusz Kubiak.