{"id":6950,"date":"2022-02-10T13:15:30","date_gmt":"2022-02-10T12:15:30","guid":{"rendered":"http:\/\/www.adp.fdv.uni-lj.si\/blog\/?p=6950"},"modified":"2022-04-16T09:52:11","modified_gmt":"2022-04-16T07:52:11","slug":"analiza-obseznih-kvali-podatkov","status":"publish","type":"post","link":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/2022\/02\/10\/analiza-obseznih-kvali-podatkov\/","title":{"rendered":"Nekaj prakti\u010dnih napotkov pri analizi obse\u017enej\u0161ih zbirk kvalitativnih podatkov"},"content":{"rendered":"<p>Spodbuda za blog je nastala v okviru seminarja ADP Na\u010drtovanje ravnanja s kvalitativnimi raziskovalnimi podatki: primer Spomin na medije v Jugoslaviji, ki je potekal 7. septembra 2021. Gosta seminarja sta bila dr. Jernej Amon Prodnik in dr. Jernej Kalu\u017ea iz Centra za raziskovanje dru\u017ebenega komuniciranja na Fakulteti za dru\u017ebene vede, ki sta se sprehodila skozi \u017eivljenjski krog podatkov in predstavila nekaj dilem in re\u0161itev, ki vodijo do kakovostne podatkovne objave. Med drugim predstavita tudi konkretne postopke, ki jih je potrebno izvesti pred arhiviranjem podatkov in njihovo znanstveno rabo.<\/p>\n<p>Posnetek seminarja si oglejte na <a href=\"https:\/\/www.youtube.com\/watch?v=73EtTbMQjI8\" target=\"_blank\" rel=\"noopener\">Youtube kanalu ADP<\/a>. Prezentacije so dostopne na spletni strani ADP: <a href=\"https:\/\/www.adp.fdv.uni-lj.si\/publikacije_adp\/publikacija\/391\/\" target=\"_blank\" rel=\"noopener\">prvi del in drugi del<\/a>.<\/p>\n<p>Podatki iz raziskave, ki jo predstavljata, so dostopni v <a href=\"https:\/\/www.adp.fdv.uni-lj.si\/opisi\/medjug20\/\" target=\"_blank\" rel=\"noopener\">Katalogu ADP<\/a>.<\/p>\n<p>________________________________<\/p>\n<p><em>Pi\u0161e: dr. Jernej Kalu\u017ea<\/em><\/p>\n<p>V pri\u010dujo\u010dem prispevku bomo predstavili nekaj napotkov pri analizi obse\u017enej\u0161ih zbirk kvalitativnih podatkov, denimo intervjujev. Izhajali bomo iz raziskave Novinarstvo v socialisti\u010dni Jugoslaviji in imaginariji medijev skozi ob\u010dinstvo, ki poteka od leta 2019, in v okviru katere bo v kratkem arhiviranih 96 intervjujev, ki so jih opravili \u0161tudentje in \u0161tudentke s svojimi starimi star\u0161i ali drugimi starej\u0161imi osebami. Ti intervjuji se tematsko osredoto\u010dajo na uporabo medijev v \u010dasu socialisti\u010dne Jugoslavije. Poleg tega je v njih pogosto predstavljeno tudi \u0161ir\u0161e razumevanje ter vrednotenje socialisti\u010dnega re\u017eima in \u0161e posebej novinarstva ter medijev \u010dasu Jugoslavije.<\/p>\n<p>V svojem <a href=\"http:\/\/www.adp.fdv.uni-lj.si\/blog\/2021\/blog\/nekaj-eticnih-dilem-pri-vkljucevanju-studentov-v-raziskovalno-delo\/#axzz7KTatHQGQ\" target=\"_blank\" rel=\"noopener\">prispevku za blog ADP<\/a> je dr. Jernej Amon Prodnik \u017ee predstavil vidik dela s \u0161tudenti in eti\u010dne dileme, ki se v tem kontekstu pojavljajo. Te tematike bom tokrat (tudi zato, ker v delo s \u0161tudenti nisem bil posebej globoko vpleten) pustil ob strani. Osredoto\u010dil se bom na predstavitev nadaljnjega dela, ki smo ga v okviru omenjene raziskave opravili od trenutka, ko so \u0161tudentje \u017ee oddali transkripte opravljenih intervjujev. Ta besedila je bilo potrebno obdelati in sistemati\u010dno urediti z namenom njihovega arhiviranja v ADP. Obenem pa smo ta besedila tudi kvalitativno analizirali in jih \u00bbkodirali\u00ab glede na obravnavano vsebino. Ti postopki niso posebej specifi\u010dni za na\u0161o raziskavo in jih je mogo\u010de nasploh razumeti kot generi\u010dne v primeru raziskav, ki temeljijo na ve\u010dji koli\u010dini besedilnih podatkov.<\/p>\n<h3><strong>Slogovno in oblikovno urejanje transkriptov<\/strong><\/h3>\n<p>Osnovni napotki glede transkribiranja na spletni strani ADP (glej <a href=\"https:\/\/www.adp.fdv.uni-lj.si\/blog\/2018\/blog\/vodic-za-pripravo-transkriptov-v-druzboslovju\/\" target=\"_blank\" rel=\"noopener\">Vodi\u010d za pripravo transkriptov v dru\u017eboslovju<\/a>) \u017ee obstajajo. Intervjuje lahko transkribirajo izvajalci intervjujev, raziskovalci, profesionalne slu\u017ebe, za nekatere svetovne jezike pa deluje tudi avtomatska transkripcija, ki pa v primeru sloven\u0161\u010dina \u2013 vsaj po moji vednosti \u2013 \u0161e ne da zadovoljivih rezultatov. V praksi je pri transkriptih pomembno da so med seboj, \u0161e posebej \u010de jih opravljajo razli\u010dne osebe, \u010dim bolj slogovno in oblikovno poenoteni. To pomeni, da morajo biti v vseh intervjujih enak na\u010din lo\u010devanja med vpra\u0161anji in odgovori, enaka pisava, razmak vrstic, ipd. V ta namen so v primeru na\u0161e raziskave \u0161tudentje dobili osnovne napotke glede transkribiranja in vzorec transkripta, ki so mu morali slediti. Smiselno je tudi, da so na za\u010detku vsakega transkripta navedeni osnovni demografski podatki o intervjuvancu (ime, spol, starost, itd.) in osnovni podatki o samem intervjuju (\u010das, kraj, trajanje itd.). Z vidika kvalitete in raznovrstnosti rabe raziskovalnih podatkov je gotovo koristno, \u010de transkript \u010dim natan\u010dneje posnema govor, vklju\u010dno z rabo nare\u010dja in vklju\u010denimi opisi nebesednega komuniciranja. Tovrstna natan\u010dnost sicer lahko predstavlja v dolo\u010denih situacijah tudi problem (razli\u010dni zapisi iste besede, denimo \u00bbtelevizija\u00ab in \u00bbtelevizja\u00ab delajo te\u017eave pri iskanju po klju\u010dnih besedah ali pri avtomatski obdelavi podatkov). Zato smo \u0161tudentom v navodilih svetovali, naj ne posnemajo na silo pogovornega jezika (vendar naj vseeno upo\u0161tevajo osnovne zna\u010dilnosti govorjenje besede). Poleg tega smo jim svetovali uporabo oglatih oklepajev za razlago nebesednega komuniciranja, velikih \u010drk (za glasen govor) in pod\u010drtovanja (za poudarjeno intonacijo). V znanstvenem kontekstu je namre\u010d splo\u0161no na\u010delo transkribiranja, da to ohrani \u010dim ve\u010d podatkov izvornega govora in tega posnema, kar pa lahko v praksi predstavlja tudi problem, posebej v kolikor se intervjuje daje v avtorizacijo, saj nekateri pri\u010dakujejo, da bodo transkripti pre\u010di\u0161\u010deni na podoben na\u010din kot so pri objavljenih intervjujih v medijih.<\/p>\n<h3><strong>Anonimizacija: kvaliteta podatkov in varovanje zasebnosti<\/strong><\/h3>\n<figure id=\"attachment_6953\" aria-describedby=\"caption-attachment-6953\" style=\"width: 325px\" class=\"wp-caption alignright\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-6953\" src=\"http:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-content\/uploads\/2022\/02\/aninimizacija_blog_1-300x213.png\" alt=\"\" width=\"325\" height=\"231\" srcset=\"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-content\/uploads\/2022\/02\/aninimizacija_blog_1-300x213.png 300w, https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-content\/uploads\/2022\/02\/aninimizacija_blog_1-1024x726.png 1024w, https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-content\/uploads\/2022\/02\/aninimizacija_blog_1-768x544.png 768w, https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-content\/uploads\/2022\/02\/aninimizacija_blog_1.png 1067w\" sizes=\"auto, (max-width: 325px) 100vw, 325px\" \/><figcaption id=\"caption-attachment-6953\" class=\"wp-caption-text\">Vir: prezentacija Amon Prodnik in Kalu\u017ea, 2021<\/figcaption><\/figure>\n<p>Eden izmed najpogostej\u0161ih korakov pri obdelovanju podatkov za namene njihovega arhiviranja je anonimizacija, katere namen je prepre\u010devanje identifikacije. O tem postopku je na spletni strani ADP mogo\u010de najti kar nekaj koristnih informacij (glej npr.<br \/>\nOrodje za anonimizacijo QualiAnon in <a href=\"https:\/\/www.adp.fdv.uni-lj.si\/novice\/2020\/01\/14\/UKAN_2020\/\" target=\"_blank\" rel=\"noopener\">Priro\u010dnik: Anonymisation Decision-Making Framework book<\/a>). V primeru polstrukturiranih spominskih intervjujev je vredno temu procesu posvetiti \u0161e posebno pozornost. Vpra\u0161anje anonimizacije je dobro imeti v mislih \u017ee preden se za\u010dne opravljati intervjuje ter ga nasloviti \u017ee v soglasju za sodelovanje pri raziskavi. V soglasju je potrebno natan\u010dno opredeliti ali (in v kolik\u0161ni meri) bo intervju anonimiziran oziroma ponuditi posamezniku izbiro, ali \u017eeli v raziskavi sodelovati anonimno ali ne. Poleg anonimiziacije intervjuvancev pa je potrebno poskrbeti tudi za anonimizacijo tretjih oseb, ki so v intervjujih omenjene, posebej \u010de ne gre za javne osebe, funkcionarje, ipd. Poleg neposrednih identifikatorjev namre\u010d poznamo tudi posredne identifikatorje, ki so v spominskih intervjujih posebej pogosti, saj v njih prihaja do vklju\u010devanja osebnih anekdot, ki so polne navajanja to\u010dnih lokacij, imen tovarn, \u0161ol ali dogodkov. V praksi je zato v\u010dasih te\u017eko presoditi, kdaj anonimizacija zmanj\u0161uje kvaliteto podatkov (in kako se temu u\u010dinku izogniti). Pri anonimizaciji je smiselno slediti tudi ob\u010dutku, kateri podatki bi lahko povzro\u010dili nelagodje in nestrinjanje (in ali so ti podatki relevantni za samo raziskavo). V na\u0161em primeru smo se ponekod odlo\u010dili, da namesto identifikatorjev uporabili opise, ki \u0161e vedno omogo\u010dajo razumevanje konteksta povedanega (denimo \u00bbh\u010dera sogovornika\u00ab namesto \u00bbna\u0161a Jasna\u00ab). Anonimizirali smo lastna imena (otrok, lokacij, prijateljev), ne pa krajevnih imen, imen regij, mest, ipd.<\/p>\n<h3><strong>Kodiranje intervjujev in uporaba temu namenjene programske opreme<\/strong><\/h3>\n<p>O rabi programov za analizo besedilnih podatkov na spletni strani ADP \u017ee obstajajo bolj podrobni zapisi (glej npr. prispevek z naslovom <a href=\"http:\/\/www.adp.fdv.uni-lj.si\/blog\/2017\/uporabnik\/politicna-participacija-mladostnikov-v-sloveniji\/?fbclid=IwAR0Z3cFfPihBmGooZ26Alep1-fzri0YrEItcCJ4kVK_Hy06iPpkwAIpy-W8#axzz4c8tBl0P5\" target=\"_blank\" rel=\"noopener\">Politi\u010dna participacija mladostnikov v Sloveniji<\/a>, na ADP-jevem YouTube kanalu pa si je mogo\u010de ogledati tudi seminar na to temo z naslovom <a href=\"https:\/\/www.youtube.com\/watch?v=4T7FTHnteOo\" target=\"_blank\" rel=\"noopener\">Prakti\u010dni vidiki rabe programov za analizo besedilnih podatkov<\/a>, ki ga je vodil dr. Urban Boljka). V kontekstu na\u0161e raziskave smo strukturo vsebinskega kodiranja zasnovali tako, da je sledila vsebinskim navodilom, ki smo jih posredovali \u0161tudentom. Ti so se morali osredoto\u010dati na tri glavne teme (uporaba medijev, zaupanje v medije, mnenje o re\u017eimu) skozi \u0161tiri \u010dasovna obdobja (otro\u0161tvo, mladost, srednja leta, zrela leta).<\/p>\n<p>Izhajajo\u010d iz prej\u0161njih izku\u0161enj, sem se v primeru omenjene raziskave odlo\u010dil, da sku\u0161am opraviti vse delo, ki terja branje zbranih podatkov \u2013 pregledovanje demografskih podatkov intervjuvancev, anonimiziranje, slogovno in oblikovno urejanje transkriptov in vsebinsko kodiranje \u2013 v enem koraku. Lahko si namre\u010d predstavljate, da je podrobno branje transkriptov 96 intervjujev (s povpre\u010dno dol\u017eino ene ure, kar znese cca. 6000 besed transkripta\/intervju, vse skupaj pa torej cca. 576 000 besed) precej dolgotrajno opravilo. To opravilo pa bi bilo \u0161e veliko dalj\u0161e, \u010de bi najprej vsa besedila prebral z namenom priprave na arhiviranje (anonimizacija, oblikovanje besedila), ter potem \u0161e enkrat z namenom vsebinske analize (kodiranje intervjujev). Nekateri programi za analizo kvalitativnih podatkov (sam sem uporabljal NVivo 10) tudi omogo\u010dajo funkcijo urejanja in vsebinskega spreminjanja besedil. Tovrstno ve\u010dopravilnostno branje sicer zahteva precej koncentracije. Prav tako priporo\u010dam predhodno branje izbranega vzorca besedil. Samo na tej podlagi je mogo\u010d temeljit razmislek glede metodolo\u0161kih postopkov in vzpostavitev sheme kodiranja (ki lahko pokrije vse v besedilih obravnavane teme), vzpostavitev kriterijev anonimizacije, seznanitev z najpogostej\u0161imi oblikovanimi napakami, vzpostavitev jasnih vsebinskih kategorij,&nbsp; sistematizacija razvr\u0161\u010danja delov besedila, itd.<\/p>\n<h3><strong>Predaja podatkov arhivu ADP<\/strong><\/h3>\n<figure id=\"attachment_6954\" aria-describedby=\"caption-attachment-6954\" style=\"width: 404px\" class=\"wp-caption alignright\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-6954\" src=\"http:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-content\/uploads\/2022\/02\/blog_2_predaja-300x223.png\" alt=\"\" width=\"404\" height=\"300\" srcset=\"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-content\/uploads\/2022\/02\/blog_2_predaja-300x223.png 300w, https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-content\/uploads\/2022\/02\/blog_2_predaja-1024x760.png 1024w, https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-content\/uploads\/2022\/02\/blog_2_predaja-768x570.png 768w, https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-content\/uploads\/2022\/02\/blog_2_predaja.png 1079w\" sizes=\"auto, (max-width: 404px) 100vw, 404px\" \/><figcaption id=\"caption-attachment-6954\" class=\"wp-caption-text\">Vir: prezentacija Amon Prodnik in Kalu\u017ea, 2021<\/figcaption><\/figure>\n<p>Splo\u0161ne napotke glede urejanja podatkov in navodila za postopek predaje ter merila za sprejem je mogo\u010de najti na spletni strani ADP (glej: <a href=\"https:\/\/www.adp.fdv.uni-lj.si\/deli\/postopek\/\" target=\"_blank\" rel=\"noopener\">Postopek predaje<\/a>). V primeru na\u0161e raziskave smo v ADP oddali: 1.) transkripte pregledanih intervjujev, 2.) izjavo o izro\u010ditvi, 3.) obrazec opis raziskave in spremljevalno dokumentacijo (matrico, excel tabelo vseh intervjujev z osnovnimi demografskimi podatki, navodila \u2013 demografski podatki transkripta, formo transkripta in vzorec soglasja). Spremljevalni material je posebej pomemben zato, ker lahko ostalim, ki bi \u017eeleli uporabljati te podatke, razlo\u017ei kontekst raziskave. Kakovostne raziskave, ki so objavljene v arhivu, se po merilih ARRS \u0161tejejo kot znanstvene objave in sicer kot \u00bbzaklju\u010dena znanstvena zbirka podatkov ali korpus\u00ab, kar se vrednoti s 30 to\u010dkami. Tovrstna zbirka podatkov pridobi tudi bibliografski zapis in DOI \u0161tevilko, kar je smiselno navajati pri sklicevanju na bazo podatkov v \u010dlankih, s \u010dimer se poskrbi tudi za la\u017ejo preverljivost in reproduktibilnost raziskave. V znanstvenih revijah postaja namre\u010d vse bolj standard, da se zahteva (ali vsaj priporo\u010da), da so podatki, na katere se objavljeni \u010dlanki sklicujejo, javno dostopni.<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Spodbuda za blog je nastala v okviru seminarja ADP Na\u010drtovanje ravnanja s kvalitativnimi raziskovalnimi podatki: primer Spomin na medije v Jugoslaviji, ki je potekal 7. septembra 2021. Gosta seminarja sta bila dr. Jernej Amon Prodnik in dr. Jernej Kalu\u017ea iz Centra za raziskovanje dru\u017ebenega komuniciranja na Fakulteti za dru\u017ebene vede, ki sta se sprehodila skozi \u017eivljenjski krog podatkov in predstavila nekaj dilem in re\u0161itev, ki vodijo do kakovostne podatkovne objave. Med drugim predstavita tudi konkretne postopke, ki jih je potrebno izvesti pred arhiviranjem podatkov in njihovo znanstveno rabo.<\/p>\n","protected":false},"author":1,"featured_media":2580,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":""},"categories":[15,21,136],"tags":[],"class_list":["post-6950","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-blog","category-novo","category-uporabnik"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/posts\/6950","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/comments?post=6950"}],"version-history":[{"count":11,"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/posts\/6950\/revisions"}],"predecessor-version":[{"id":6963,"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/posts\/6950\/revisions\/6963"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/media\/2580"}],"wp:attachment":[{"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/media?parent=6950"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/categories?post=6950"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/tags?post=6950"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}