Neenaka razvitost podatkovnih storitev in infrastrukture v Sloveniji

V Arhivu družboslovnih podatkov smo organizirali predstavitev poročila Opis stanja na področju raziskovalnih podatkov v Sloveniji. Namen predstavitve je bil seznaniti predstavnike različnih področij raziskovalne skupnosti z izsledki raziskave, ki smo jo izvedli med slovenskimi raziskovalci, znanstvenimi knjižničarji in vodji raziskovalnih oddelkov ali programov.

Predstavitev je potekala v torek, 5. februarja 2013, od 9. do 11. ure, v prostorih Fakultete za družbene vede. Na tokratno srečanje smo povabili del nosilcev programov, ki so vključeni v Načrt razvoja raziskovalnih infrastruktur 2011-2020 (PRACE, LifeWatch, C-ERIC, EATRIS, ELIXIR, EPOS) ter predstavnika ministrstva dr. Albina Kralja in predstavnico ARRS dr. Lidijo Padar Tičar, ki operativno pokrivata to področje.

Že v teku predstavitve, ko smo poročali o primerih ‘pomanjkljivega’ ravnanja s podatki v Sloveniji, se je razvila živahna razprava. Potrebno je bilo pojasnjevati, da so izsledki naše raziskave omejeni z možnostmi uvida, ki jih nudi izbrani metodološki pristop, se pravi priložnostni namensko izbrani vzorec 22 intervjuvancev. Ti sicer prihajajo z različnih področij in imajo različne vloge v življenjskem krogu raziskovalnih podatkov, razumljivo pa je, da metodologija ne omogoča statističnih posplošitev na celo populacijo. Vendar osnovni nesporazum ni bil toliko iz metodološke plati, pač pa za nekatere udeležence zaključki poročila niso bili skladni z njihovim dojemanjem narave znanstvenega dela. Ali gre pri tem tudi za neskladje med normativno posredovano samopodobo znanstvenega dela, (se pravi idealizirano v smislu približevanja temu, kakšna naj bi znanost načeloma bila) in njegovim praktičnim potekom? Znanstvenik naj bi bil popoln v izpolnjevanju zahtev, kot so skrajna pazljivost pri ravnanju s podatki, vključno z njihovo podrobno dokumentacijo skladno s področnimi standardi, nesebična pripravljenost deliti podatke z drugimi, poudarjanje hipotetično deduktivnega pristopa pri ustvarjanju podatkov, pri katerem se v tej idealizirani sliki kaže vrednost podatkov, kot bi bila izčrpana in zadosti dobro predstavljena že z znanstveno objavo članka. Izpostavili so etične norme in pa tudi stroge mehanizme kontrole, ki so domnevno v naravoslovnem znanstvenem okolju toliko bolj zahtevni zaradi svetovne konkurence pri objavljanju. Ali se to povsem sklada z dejanskim potekom raziskovanja? Podobno kot mnoge druge študije dejanskega poteka znanstvenega raziskovanja so tudi naši izsledki pokazali, da sta realnost in samopodoba znanosti v smislu ideala lahko različni (glej npr. http://dx.doi.org/10.1080/13645570600655282).

Vabljeni udeleženci  sodelujejo v mednarodnih infrastrukturnih projektih s seznama ESFRI in so tako predstavljali zelo izbrano publiko, ki vsak na svojem področju delujejo pri ustvarjanju in tudi pri skrbi za podatke, vključno s potencialom, da se oblikujejo tudi kot nacionalna podatkovna storitev z določenega področja. Naš namen pridobivanja kritičnih odzivov na poročilo je bil tako dosežen. Udeleženci sestanka so povedali, da imajo izkušnje z mednarodnimi podatkovnimi repozitoriji in bazami, in ne samo da poznajo stroge protokole in standarde na področju ravnanja s podatki, pač pa da jih tudi vsakodnevno izvajajo. Izražali so začudenje, kako da obstajajo področja, ki so pri iskanju rešitev šele na začetku. Omenjali so napredne primere uredniških politik revij, ki zahtevajo deponiranje podatkov v javnem dostopu ob objavi članka.

Odprla se je zanimiva razprava, ki je po svoje potrdila ugotovitve poročila: obstaja velika razlika med področji, ki so vključena v mednarodne znanstvene kroge in imajo tam možnost uporabljati mednarodno vzpostavljeno podatkovno infrastrukturo in drugimi, ki so glede hrambe in dostopa do podatkov zaradi pomanjkanja ponudbe ali neizkoriščanja področnih podatkovnih storitev prepuščeni sami sebi. Velik razkorak med pričakovanji in izkušnjami enih in drugih kaže, da bo posebnosti okolij potrebno upoštevati pri oblikovanju politik, ki bodo določale ravnanje z raziskovalnimi podatki, financiranimi z javnimi sredstvi.

Poleg upoštevanja razlik v okoljih, iz katerih prihajajo udeleženci, pa je pri razumevanju izsledkov poročila pomembno vedeti, da ne gre za razlikovanje med dobro in slabo znanostjo. Ker so bili naši sogovorniki na predstavitvi pretežno naravoslovci, so hitro na dan prišli predsodki, da drugim znanostim ne sodi atribut znanstvenosti, vsaj ne v isti meri kot pri naravoslovju. V poročilu ugotavljamo, da so intervjuvanci ne glede na področje med razlogi za manj dosledno skrb za podatke navajali pomanjkanje časa, sredstev, potrebne kompromise, ki jih je potrebno sprejeti zaradi praktičnosti in osebnih navad pri organiziranju znanstvenega dela, ne pa nepoznavanje ‘pravil’. Obenem so vedno izražali prepričanje, da tovrstni kompromisi ne ogrožajo veljavnosti podatkov, da kakovost analize in zaključkov zaradi tega ni trpela. Iz tega ne moremo izpeljati nobenih sklepov glede kakovosti posameznih znanstvenih disciplin, zlasti ne v smeri domnevne inferiornosti katere od njih.

Prav tako je pomembna lekcija s predstavitve, da so tudi osnovni pojme glede sistema odprtega dostopa do podatkov lahko narobe razumljeni. Še bolj se je potrebno posvetiti seznanjanju o koristih odprtega dostopa do raziskovalnih podatkov in o potencialu, ki ga glede na sedanje stanje odprti podatki predstavljajo. Dokument EU Komisije ‘ Communication Towards better access to scientific information: Boosting the benefits of public investments in research‘ npr. navaja ugotovitve projekta Parse.insight, da raziskovalci vendarle niso tako zelo pripravljeni deliti podatke z drugimi, saj jih samo 25% izjavlja, da so njihovi podatki odprto dostopni, medtem ko ostali dovoljujejo samo bolj ali manj omejen dostop, denimo znotraj raziskovalne skupine, posamezne discipline, ali pa sploh ne. In dalje ugotavljajo, da ta trenutno razširjena praksa ni posledica premajhnega zanimanja raziskovalcev za podatke drugih, saj bi kar 63% raziskovalcev te podatke rado uporabljalo znotraj posamezne discipline in 40 % iz ostalih disciplin. Prav tako poročajo v 53%, da so že imeli izkušnjo, da so iskali podatke drugih, pa niso bili dostopni (glej PARSE – Insight into Digital Preservation of Research Output in Europe, str. 34 in 35).

Nekateri odzivi na naše poročilo, ki je po vsebini poziv k izboljšanju stanja, morda kažejo tudi, koliko je interes posameznih ustanov in projektov, da se na področju dostopa do podatkov kaj spremeni. Kot ugotavljamo tudi v poročilu, nekaterim sedanje stanje bolj ali manj neformalnih podatkovnih izmenjav ustreza. Izhodišče pobud po urejanju področja pa je, da je to stanje z vidika porabe sredstev za znanost in kakovosti njenih rezultatov manj učinkovito v primerjavi s pazljivo zasnovanim sistemom odprtega dostopa, skladnim tudi z ideali znanosti.

Predstavitev je del projekta Odprti podatki, katerega naročnik sta Ministrstvo za izobraževanje, znanost, kulturo in šport ter ARRS, in je del širših mednarodnih pobud (npr. OECD), katerih cilj je vzpostavitev sistema odprtega dostopa do raziskovalnih podatkov financiranih z javnimi sredstvi.

Dostop do poročila Opis stanja na področju raziskovalnih podatkov v Sloveniji.

Dostop do delavnice Problemi in rešitve na področju podatkovnih storitev v Sloveniji.

Prejšnji članek

Kako do podatkov v ADP? Nekaj pogostih vprašanj

Naslednji članek

Opening Data Servicer in Social Sciences – Mednarodna konferenca

Dodaj odgovor

Vaš e-naslov ne bo objavljen. * označuje zahtevana polja