Main content

TÉMA: Národní registr VŠKP a systém na odhalování plagiátů

JITKA BRANDEJSOVÁ> jibra@fi.muni.cz > MICHAL BRANDEJS> MIROSLAV KŘIPAČ> JAN KASPRZAK

Téma plagiátorství nabízí mnoho základních a opakovaně i několik kontroverzních otázek. Položme si některé z nich i v našem článku, aniž bychom u všech museli dojít k jednoznačným řešením. Není ani tak cílem dát nesporné odpovědi, jako spíše posbírat a shrnout otázky, které slýcháváme, a podívat se tak na problematiku plagiátorství z více stran. Hlavním cílem článku však zůstává téma uvedené v titulku, a tím je projekt Národního registru vysokoškolských kvalifikačních prací a systému na odhalování plagiátů.

Co je plagiátorství?

Definice z internetového slovníku cizích slov, kterou formuloval podle informací zde uvedených prof. PhDr. Rudolf Kohoutek, CSc., říká, že plagiátorství je opisování, vydávání cizí práce za vlastní, neuvedení zdrojů ze kterých práce čerpá, publikování cizích výsledků výzkumu a vývoje bez uvedení pramenů. Plagiát je podvrh; úmyslná napodobenina vydávaná za vlastní dílo; umělecká nebo vědecká krádež. Pro srovnání: Wikipedia.org nabízí zcela shodnou definici, tj. že plagiátorství je užití nebo blízká napodobenina jazyka a myšlenek jiného autora a jejich vydávání za své vlastní dílo. Názor, že neexistuje jednoznačnost v definici plagiátů a volající po nápravě tohoto stavu, by se snad dal považovat za bezpředmětný a tyto iniciativy za zbytečné. Všem je jistě zcela jasné, že opsal-li člověk do svého díla cizí text, aniž by uvedl autora, je zcela jistě plagiátorem.

Těžší situace se může jevit u pojmu self-plagiátorství nebo autoplagiátorství, které představuje opisování, kopírování výtvorů vlastní osoby či svých dřívějších prací, aniž by byly zmíněny (definice je citována z internetového slovníku cizích slov). Je však vůbec možné opisování od sebe samého považovat za plagiátorství? Vždyť přece nepoškozujeme jiné autory a neporušujeme autorská práva. Znamená to, že toto počínání je „jen“ neetické? Chceme-li se těmto otázkám jednoznačně vyhnout, je na místě se řádně citovat.

Jaké jsou příčiny plagiátorství?

Zdroj Wikipedia.org zmiňuje, že v oblasti vědy, vzdělání a žurnalistiky má plagiátorství svoji historii již po staletí, ale vývoj internetu, kde se na webových stránkách objevují články v elektronické podobě, způsobil, že se kopírování cizích prací stalo mnohem jednodušším. Vše můžeme sdílet, odevšad můžeme čerpat, informace máme na dosah ruky a těžíme z těchto možností. V dobách dřívějších studií byly veškerými knížkami dostupnými ke studiu buď skripta nebo anglické publikace v jedné kopii a další informace se při zpracování vysokoškolské práce už očekávaly od studentů. V některých oborech je tomu tak dodneška. Nebylo to těžší, ale bylo to jiné. Jsme raději, když dnes můžeme pracovat s mnohem širším spektrem zdrojů. Ale možná právě proto je obtížnější čerpat a nevyužít přitom přesné interpretace, ba dokonce znění myšlenek. S tím je však potřebné se smířit a nemyslet si, že správnou cestou je články nezveřejňovat a neponechávat je volně dostupné v elektronické formě. To je trochu proti samotnému účelu vědy a vzdělání, jejichž výsledky by tu měly být pro všechny. Zejména utajování informací dává naopak příležitost podvodníkům a spekulantům, protože ti, budou-li chtít, se k pramenu stejně dostanou.

Jak moc je plagiátorství rozšířené?

Častou otázkou, s níž se u veřejnosti setkáváme, je, zda je plagiátorství opravdu tak rozšířené v terciálním vzdělávání. Ne, není rozšířeno více než kdekoli jinde. Je ojedinělé stejně jako kterékoli jiné prohřešky, stejně ve vzdělávání jako v jiných oblastech a stejně u nás jako ve světě. Začalo se však o něm mluvit například v souvislosti s poklesky politiků a známých osobností, protože jde přirozeně o mediálně atraktivní téma, což nemůžeme mít novinářům ani čtenářům za zlé. Za zlé to můžeme mít pouze hříšníkům. Získat tímto nečestným způsobem akademický titul na vysoké škole, a teď už bez ohledu na to, kdo se za osobou plagiátora skrývá, ukazuje na dost významnou vadu charakteru. I když je potřeba připomenout, že plagiátorství není běžné, přesto figuruje mezi důvody disciplinárních řízení, často na místě prvním. Zejména na vysokých školách a fakultách, kde jsou na psaní rozsáhlých textových prací během studia kladeny značné nároky.

Jedním z důvodů k rozšíření plagiátů může být velký počet studentů na vysokých školách a z toho vyplývající množství zpracovávaných závěrečných, seminárních či jiných prací. Bylo by však správné pro získání vyšší kvality textů snížit kvantitu studentů? Trendem v naší krajině je, aby studovalo co nejvíce mladých lidí, abychom vytvářeli znalostní společnost (tedy čím vzdělanější členové společnosti, tím větší přínos pro ekonomiku a další rozvoj země). Statisticky skutečně studuje více lidí než v dřívějších dobách a o co jednodušší přístup ke vzdělání mají, o to těžší je naplnit originalitu vlastního studia tím, že napíší zcela jedinečnou závěrečnou nebo i seminární práci. Můžeme se také setkat s názory, že sami učitelé nemohou dostatečně kontrolovat práce, které vedou, protože ani při nejlepší vůli nemohou odhalit podobnost či shodnost textů od tolika studentů za mnoho let. Při velkém množství generovaných prací může být nadlidský úkol pojmout podezření z plagiátorství a ještě nadlidštější zjistit zdroj opisování a prokázat to. Učitelé, kteří učí menší počet studentů, mohou mít práci s odhalením plagiátů samozřejmě jednodušší, pokud ani počet zpracovávaných prací není vysoký.

Lze plagiátorství předcházet?

Umíme vychovávat studenty, aby neopisovali? Máme je dnes - více než dříve - učit potřebné zákony a normy? Stačí začít s výchovou na vysoké škole? Je účelnější vtloukat tyto zásady dětem už na základní škole při psaní referátů, nebo je účelnější nechat informace až na dobu studia na VŠ, kdy je potřebují nejvíce? To jsou další otázky, které se nabízejí.

Nedostatečná výchova k etice při zpracování studijních výsledků ve vysokoškolských pracích a ke správnému použití cizího textu a citování jiného autorského díla obecně převažuje. S výchovou se rozhodně nemá otálet, ale také nelze úplně spoléhat na to, že všichni studenti základních nebo středních škol porozumějí přesně důvodům a důsledkům, proč nelze používat texty z internetu nejjednodušším způsobem, tj. „kopíruj a vlož“ (copy and paste). Neočekávejme, že ze středních škol přijdou poučení uživatelé se znalostmi, jak zacházet s cizím textem, a na vysoké škole již nebude potřeba žádné osvěty.

Zcela zřejmou prevencí před plagiátorstvím je zveřejňování kvalifikačních prací. Netroufnu si opisovat, pokud vím, že moje práce je někde zveřejněna. Novela vysokoškolského zákona by to měla zaručovat. A jaká je skutečnost? Zveřejňují školy závěrečné práce? Některé ano, některé ne. Ačkoli autorský zákon není vůči vysokoškolskému stoprocentně optimální, je jejich zveřejňování prostřednictvím internetu správné a řešitelné. Aniž bychom se pouštěli do rozebírání právního problému, je zcela zřetelné, že existují univerzity, které nemají se zveřejňováním závěrečných prací problém a není to proto, že by neměly právní oddělení a činily tak z neznalosti. Také rozšiřující se technologie a principy Webu 2.0 by mohly účinně pomáhat v boji proti plagiátorství, pokud jsou využívání a otevřenost zdrojů adresné.

Je možné eliminovat plagiátorství zadáváním stále nových témat pro seminární nebo závěrečné práce, což přispívá k jejich kvalitě? Mnoho zadání je založeno na měřeních, výpočtech, srovnávání a vyhodnocování čísel, hodnot, ale mnoho je také postaveno na srovnávání kritických postojů ke konkrétním existujícím tématům (Evropská unie, historické události aj.). Tady nemusí být vždy dostatek prostoru k vynalézavosti.

Je trochu nezvyklé, když softwarový nástroj určený k odhalení plagiátu až po jeho vzniku slouží k prevenci, ale je to fakt ověřený zkušeností. Dvouleté pozorování potvrdilo skutečnost, která se předpovídala, že tento nástroj přináší (zatím) největší preventivní výsledky v boji proti plagiátorství. Když totiž student ví, že jeho práce může být dříve nebo později srovnána tímto systémem, nedovolí si zneužít cizího textu neoprávněným způsobem. Pokud by samozřejmě byly výše jmenované ostatní prostředky dostatečné, plnil by tento nástroj jen funkci detekce plagiátorství, k níž je primárně určen.

Mají exemplární postihy a veřejně odsouzené případy na základě disciplinárních řízení za opisování preventivní účinek? Ano, i zde jde o velmi silnou zbraň, protože většina studentů má respekt před případným vyloučením ze studia.

Jaké otázky zde nezazněly?

Na mnoho otázek k plagiátorství, s nimiž je možná dnešní konfrontace, zde nedošlo. Diskutují se například osobní poklesky učitelů, kteří „prý“ navádějí k plagiátorství, nebo jsou dokonce sami plagiátory, ale toto lidské selhání je zcela ojedinělé. Otázkou také zůstává, zda veřejné mínění a média pomáhají v boji proti plagiátům, nebo této snaze spíše škodí. Naše zkušenosti s novináři jsou veskrze pozitivní a souhlasíme s tím, že do velké míry jejich zásluhou se tato problematika řeší a „nezametá pod koberec“. Ale je nutné dodat, že v tomto směru mohou existovat i jiné subjektivní zkušenosti. Nedostaly zde prostor právní aspekty plagiátorství a mnohé další otázky dostatečné na další článek.

Proč projekt Národní registr VŠKP a systém na odhalování plagiátů?

Častý dotaz novinářů zní: „Proč jste se rozhodli vytvořit program na odhalování plagiátů? Znamená to, že jste se s plagiátorstvím na vaší škole potýkali tak moc, že jste museli něco udělat?“ Ne. Nás k tomu vedly jiné důvody, které jsme dostali od našich uživatelů, v tomto případě od učitelů.

Ale začněme od začátku. Jsme totiž trochu napřed v používání systému pro podporu studia - Informačního systému Masarykovy univerzity (dále IS MU). V roce 2004 vznikl v IS MU archiv závěrečných prací a podpora odevzdávání elektronických prací byla zakotvena ve Studijním a zkušebním řádu MU. Všechny byly zpřístupněny uživatelům v IS MU, tj. na intranetu, což představovalo v té době už přes 40 tisíc osob. I když práce byly přístupné jen interním zájemcům, pravděpodobnost šíření elektronické verze díla po internetu byla vysoká. Vznikl tak první dotaz na plagiátorství: „Jak tomu zabráníte?“ A brouk do hlavy byl nasazen. Na konci roku 2004 vznikla pro IS MU další nová myšlenka - vyvinout kompletní e-learningový systém pro elektronickou podporu výuky. O rok později dostali učitelé tyto nástroje k dispozici. Znamenalo to, že by poskytovali studentům různé digitální materiály, ale i vlastní publikace ke studiu, do tzv. studijních materiálů. Jenže učebnice, které učitelé vytvoří, jsou cenné, jejich vzniku věnují velké úsilí, proto si nemohou dovolit dát je v plén plagiátorům. Pedagogové vědí, že vývoji neuniknou, nechtějí bránit pokroku a znemožnit svým studentům jednodušší přístup ke studijním zdrojům. Žádají tedy nástroj proti zneužití dokumentů. A tak došlo 16. srpna 2006 k definitivnímu naplnění jejich přání. Všem uživatelům IS MU byl dán nástroj na odhalování plagiátů, přesněji na vyhledávání podobných dokumentů. Software se velmi rychle dostal do povědomí veřejnosti a médií, řešení bylo vnímáno velice pozitivně. Mnoho škol nás začalo oslovovat a projevovat o něj zájem. Když jsme v roce 2007 převzali za významný počin v oblasti elektronických zdrojů prestižní cenu Inforum za zpřístupněný Archiv závěrečných prací s funkcí odhalování plagiátů, rádi jsme „podlehli“ těmto žádostem. Rozhodli jsme se pustit se do projektu, který by přinesl službu i ostatním školám. Entuziasmus převážil nad prozíravostí, ale i po roce zkušeností, ne vždy jednoduše získaných kvůli rozsáhlosti projektu a heterogennosti prostředí, máme pocit, že rozhodnutí bylo správné. Do projektu se zapojilo v rámci rozvojového programu MŠMT sedmnáct českých veřejných vysokých škol a mimo jeho rámec další soukromé, státní a zahraniční vysoké školy. Z projektu původně národního se tak ve skutečnosti stal projekt mezinárodní. Vznikla tím elektronická databáze vysokoškolských kvalifikačních prací (bakalářských, diplomových, disertačních a rigorózních) na serveru Vysokoškolské kvalifikační práce - http://theses.cz/. V současné době je v systému 22 tisíc závěrečných prací a počet bude narůstat, ať už z důvodu probíhajícího projektu nebo jeho rozvoje v dalších letech. Toto však není počet dokumentů, mezi nimiž se práce porovnávají. Těch je v současné době 1,2 milionu.

O technologii

Masarykova univerzita, resp. vývojový tým Informačního systému MU vyvinul vlastní a ojedinělou implementací specifického algoritmu systém pro vyhledávání podobných souborů. Zasloužily se o to poměrně cenné zkušenosti nejen z víceletého provozu, ale především z provozu pro mnoho uživatelů (přes 70 tisíc) a porovnávání v prostředí velkého množství dokumentů (mezi miliony elektronických dokumentů). Systém zpracovává práce vícefázově. Vložený soubor je analyzován a zpracován tak, že je připraven pro vyhledání podobností. To nastává ve finální fázi, kdy uživatelé použijí jednu z funkcí pro vyhledání potenciálních plagiátů. Díky více fázím je vyhledání rychlé a proběhne během několika sekund.

Systém je autentizovaným webovým systémem. Vyhledávání podobných souborů nabízí v autentizované části systému Theses.cz. Umožňuje jednak přímé vyhledání, kdy u zvolených konkrétních souborů použijeme volbu s ikonou dvou vajíček „podobné jako vejce vejci“. Funkci používá například učitel, má-li podezření, že konkrétní soubor je plagiátem. Další možnost je určena pro manažery a jde o Globální vyhledání plagiátů. Tato speciální aplikace slouží pro výpis všech nalezených podobností. Příkladem použití je situace, kdy správce periodicky kontroluje nové soubory ohledně plagiátorství. 

Systém má několik základních služeb. Eviduje popisné údaje závěrečných prací škol, tzv. metadata, vyhledává fulltextově a tematicky v závěrečných pracích, vyhledává v metadatech, vyhledává potenciální plagiáty podle kritérií (podle procentuální podobnosti textu, mezi všemi univerzitami nebo jen na vybrané fakultě, vložené po určitém datu atp.), umožňuje využít systém jako vlastní archiv závěrečných prací studentů vysoké školy. Každá škola má možnost konfigurace systému - vlastní nastavení podle vlastních požadavků. Může zpřístupnit práce nebo metadata jen svým uživatelům, zpřístupnit práce veřejnosti; zpřístupnit metadata - záznamy o práci (název, klíčová slova, anotaci, jméno, příjmení studenta aj.) veřejnosti. Samozřejmými jsou aplikace pro správu osob a dat, pro import údajů o pracích a import plných textů (hromadně správci nebo individuálně studenty; strojově automaticky nebo ručně), k dispozici je formát importu dat. Systém obsahuje podporu pro evidenci posudků k závěrečným pracím a informace o umístění práce (např. adresu webu). V systému je integrována antivirová ochrana souborů a důmyslný systém přístupových práv. Systém lze navíc rozšířit na další práce (na jiné internetové adrese) a napojit na vybrané zdroje na internetu. Dalšími doplňkovými aplikacemi v systému jsou Vývěska, Diskuse, Úschovna, Web, Záložky, Řízení projektu.

Nutno ještě dodat, že celý projekt je v mnohém značně ojedinělý a průkopnický. Ve světě se systematicky nesbírají závěrečné práce z více škol proto, aby se v nich vyhledávaly plagiáty. Nikdy se nespojilo tolik vysokých škol v podobném projektu. Internetové vyhledávače nemohou nahradit tento sytém už proto, že nemají přístup k vysokoškolským pracím (kromě prací z několika škol, které už práce zveřejňují). Systém pracuje přesně, nikoli s heuristikou. Zvládá zpracovat velké množství dat s krátkými odezvami.

Plány

Nově se ve spolupráci s deseti českými veřejnými vysokými školami pod vedením Masarykovy univerzity připravuje projekt Odhalování plagiátů v seminárních pracích (Odevzdej.cz - http://odevzdej.cz/). Cílem tohoto projektu je nabídnout vysokým školám možnost vyhledávat plagiáty i mezi seminárními pracemi, referáty, eseji, úlohami, projekty, laboratorními cvičeními, protokoly, zprávami, slohovými cvičeními aj.