Objava raziskovalnih podatkov v odprtem dostopu

V ADP se z veseljem odzovemo na vabila raziskovalnih organizacij, ki želijo poglobiti znanje raziskovalcev o ravnanju z raziskovalnimi podatki. 16. marca 2021 smo v sodelovanju s predstavniki CLARIN.SI in DARIAH-SI skušali odgovoriti na vprašanje, kje naj podatke objavljajo raziskovalci s Filozofske fakultete, pod okriljem katere raziskujejo geografi, jezikoslovci, sociologi, zgodovinarji, psihologi in drugi. 

V spletni delavnici v organizaciji Filozofske fakultete UL smo med drugim skušali odgovoriti tudi na nekaj temeljnih vprašanj, za katere ugotavljamo, da še zmeraj begajo raziskovalce, ki so pred odločitvijo, ali sploh objaviti podatke in kje naj jih objavijo. V nadaljevanju jih na kratko povzamemo.

(Vir: ADP)

Kaj so raziskovalni podatki

Ena od pogostih dilem je, kaj sploh so podatki. Raziskovalne podatkovne infrastrukture smo usposobljene za delo z raziskovalnimi podatki, ki so opredeljeni kot ‘digitalno berljivi zapisi o dejstvih, ki predstavljajo osnovno podlago za znanstveno raziskovanje in ki v okviru znanstvene skupnosti veljajo kot ustrezno sredstvo za preverjanje veljavnosti raziskovalnih spoznanj’ (Nacionalna strategija odprtega dostopa do znanstvenih objav in raziskovalnih podatkov v Sloveniji 2015-2020). Pri našem delu se srečujemo s podatki, ki se razlikujejo po nastanku oz. metodi zbiranja (npr. opazovanje, eksperiment, spletna anketa, …), po načinu hrambe oz. formatu, v katerem so dostopni (PDF, excel, …), po prikazu (besedilni, multimedijski, …) in po področju ali instrumentu, s katerim so bili zbrani. O tem, kaj so podatki in katere bi veljalo arhivirati in objaviti, se področni eksperti za arhiviranje dogovorimo v individualnem svetovalnem pogovoru z raziskovalcem oz. raziskovalko. 

Odprti dostop do podatkov ni edina možnost

Odprta znanost, odprti dostop in zdaj še odprti podatki! Do njih lahko prosto dostopamo, jih ponovno uporabimo, povezujemo z drugimi podatki in jih delimo z drugimi uporabniki za raziskovalne, izobraževalne ali druge namene. V idealnem primeru njihova raba ni omejena, kar je označeno z ustrezno licenco.“ (Open Science Training Handbook, 2018, str. 10).
Ker v družboslovju in humanistiki pogosto delamo s podatki o ljudeh, le redko lahko podatke objavimo v odprtem dostopu in brez omejitev, saj moramo skrbno paziti na varstvo osebnih podatkov. Po Evropski uredbi o varstvu osebnih podatkov pojem “osebni podatki” “pomeni katero koli informacijo v zvezi z določenim ali določljivim posameznikom (v nadaljnjem besedilu: posameznik, na katerega se nanašajo osebni podatki); določljiv posameznik je tisti, ki ga je mogoče neposredno ali posredno določiti, zlasti z navedbo identifikatorja, kot je ime, identifikacijska številka, podatki o lokaciji, spletni identifikator, ali z navedbo enega ali več dejavnikov, ki so značilni za fizično, fiziološko, genetsko, duševno, gospodarsko, kulturno ali družbeno identiteto tega posameznika;” (GDPR, 4. člen)

Ne glede na zakonske omejitve in predpise smo arhivi družboslovnih podatkov in repozitoriji s področja humanistike že pred tem, opirajoč se na raziskovalno etiko o zaščiti udeležencev raziskav, razvili različne režime dostopa do raziskovalnih podatkov. Odprti dostop je tako samo eden od možnih načinov. V ADP uporabniki najpogosteje dostopajo do podatkov tako, da se registrirajo in opredelijo svoj namen uporabe. Do najobčutljivejših podatkov lahko dostopajo samo raziskovalci, ki pred uporabo podpišejo pogodbo, do podatkov pa dostopajo preko varne povezave ali v varni sobi. Več o pravilih uporabe podatkov preberite na povezavi.

Spomniti velja tudi, da poleg različnih vrst režima dostopa do podatkov raziskovalci udeležence zaščitijo še z drugimi pristopi npr. z anonimizacijo ali psevdonimizacijo, s katerimi se njihova identiteta zakrije do te mere, da niso več prepoznavni. 

Premalokrat pa raziskovalci že pred odhodom na teren pomislimo tudi na možnost, da bi udeležence vprašali, ali morda želijo ostati imenovani. Že večkrat se je izkazalo, da udeleženci, kadar ne gre za najobčutljivejša vprašanja, želijo ostati imenovani, saj se tako pokaže njihov prispevek k boljšemu razumevanju določenega pojava.  

Krajina podatkovnih repozitorijev

Če so se pred leti raziskovalci spraševali, zakaj sploh arhivirati in objaviti podatke, se danes sprašujejo, kje objaviti podatke. K temu je prispevalo dejstvo, da nekateri financerji raziskav in založbe znanstvenih revij zahtevajo objavo podatkov, na katerih avtorji publikacij utemeljujejo svoja spoznanja. Po drugi strani pa se je povečalo število ponudnikov podatkovnih storitev. Po njihovem namenu in obsegu storitev, ki jih nudijo, jih delimo na: 

  1. (zaupanja vredne) področne repozitorije (ADP, CLARIN.SI, DARIH-SI)  
  2. institucionalne repozitorije (npr.RUL – Repozitorij Univerze v Ljubljani)
  3. splošne repozitorije (npr. Zenodo, FigShare)

V okviru finančnega sklica Obzorje Evropa financer napoveduje, da je podatke potrebno ponuditi v arhiviranje in objavo v zaupanja vreden repozitorij (Horizon Europe, General MGA, osnutek, 25. 2. 2021). To so običajno področno specifični repozitoriji, ki so pridobili certifikat, da izpolnjujejo zahteve za dolgotrajno varno hrambo in kjer so raziskovalcem na voljo strokovnjaki za svetovanje.

(Vir: cessda.eu)

Institucionalni in splošni repozitoriji so primerni, kadar področni repozitorij ne obstaja ali podatki niso dovolj kakovostni, da bi jih bilo upravičeno hraniti na dolgi rok. Osnovna ločnica med storitvami je v tem, da področni repozitoriji raziskovalcem nudijo strokovno podporo – preverijo kakovost podatkov in opravijo tehnični pregled (celovitost dokumentacije, pravne in etične izzive). Postopek pregleda lahko do neke mere primerjamo z recenzijo članka pred objavo. 

Institucionalni in splošni repozitoriji pa so neke vrste odlagališča, kjer raziskovalci postopek objave opravijo sami in tudi nimajo zagotovila, da bodo podatki tam shranjeni na dolgi rok. Zato je pred objavo podatkov potrebno premisliti o vrednosti podatkov, ki ste jih ustvarili in pomenu za znanost ter se potem odločiti, kam jih velja ponuditi v objavo. Podobno kot se odločimo, v kateri reviji želimo objaviti članek. 

Vsekakor pa velja poudariti, da o podatkovni objavi govorimo takrat, kadar so izpolnjeni naslednji minimalni pogoji: Zagotovljeni so standardni metapodatki, iz katerih je mogoče razumeti opis raziskave, opravljen pregled kakovosti podatkov in tehnični pregled dokumentacije, datoteko je mogoče najti v podatkovnih bazah oz. katalogih ter arhiv je zagotovil bibliografske informacije, potrebne za citiranje podatkovne datoteke. 

Za takšne in drugačne dileme in vprašanja smo vam področni repozitoriji na voljo pe e-pošti ali preko telefona. Posnetek celotne delavnice in predstavitev sta dostopna med učnimi gradivi ADP

Prejšnji članek

Uporaba računalniških programov za analizo besedilnih podatkov

Naslednji članek

Kam po podatke o družbenih vidikih Covid-19?

Dodaj odgovor

Vaš e-naslov ne bo objavljen. * označuje zahtevana polja