{"id":5246,"date":"2018-02-06T08:27:15","date_gmt":"2018-02-06T07:27:15","guid":{"rendered":"http:\/\/www.adp.fdv.uni-lj.si\/blog\/?p=5246"},"modified":"2018-02-07T12:35:30","modified_gmt":"2018-02-07T11:35:30","slug":"prevod-tezavra-elsst-v-slovenscino","status":"publish","type":"post","link":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/2018\/02\/06\/prevod-tezavra-elsst-v-slovenscino\/","title":{"rendered":"Prevod tezavra ELSST v sloven\u0161\u010dino"},"content":{"rendered":"<p>Tezaver <a href=\"https:\/\/elsst.ukdataservice.ac.uk\/\">ELSST<\/a> danes obsega ve\u010d kot 3300 klju\u010dnih besed s podro\u010dja dru\u017eboslovja. Zasnovali so ga leta 2000 v okviru projekta <a href=\"http:\/\/www.data-archive.ac.uk\/about\/projects\/limber\">LIMBER<\/a>, v katerem je sodelovalo pet nacionalnih arhivov dru\u017eboslovnih podatkov iz Velike Britanije, Nem\u010dije, Gr\u010dije, Francije in Norve\u0161ke.<\/p>\n<p>Izvorno je tezaver obsegal nabor angle\u0161kih besed, s\u010dasoma pa so ga prevedli v vse ve\u010d evropskih jezikov. Septembra 2017 smo kot trinajsti jezik dodali \u00a0sloven\u0161\u010dino (<a href=\"https:\/\/elsst.wordpress.com\/2017\/09\/22\/translating-elsst-into-slovenian-2\/\">Translating ELSST into\u00a0Slovenian<\/a>).<\/p>\n<p>Prevod smo pripravili v Arhivu dru\u017eboslovnih podatkov v sodelovanju s <a href=\"https:\/\/www.cjvt.si\/\">Centrom za jezikovne vire in tehnologije<\/a> Univerze v Ljubljani, ki je del slovenske raziskovalne infrastrukture za jezikovne vire in tehnologije <a href=\"http:\/\/www.clarin.si\/info\/o-projektu\/\">CLARIN.SI<\/a>. V prvem koraku so strokovnjaki za jezikovne tehnologije pripravili avtomatiziran prevod terminov. V naslednjem koraku smo nato sodelavci ADP ro\u010dno pregledali pripravljene prevode in izbrali najustreznej\u0161e, pri \u010demer so se posvetovali tako z jezikoslovci kot z raziskovalci, podro\u010dnimi strokovnjaki.<\/p>\n<p>Prevajalski projekt smo pri\u010deli z identificiranjem prevajalskih virov, ki so jih nato jezikovni tehnologi uporabili v procesu avtomatiziranega prevoda. Uporabili smo naslednje vire: Veliki angle\u0161ko-slovenski slovar; IATE &#8211; ve\u010djezi\u010dna terminolo\u0161ka zbirka EU; Evroterm \u2013 ve\u010djezi\u010dna terminolo\u0161ka zbirka; seznam slovensko-angle\u0161kih klju\u010dnih besed, ki ga je pripravila Osrednja dru\u017eboslovna knji\u017enica Jo\u017eeta Gori\u010darja, EuroVoc \u2013 ve\u010djezi\u010dni tezaver Evropske unije in <a href=\"http:\/\/www.stat.si\/StatWeb\/Methods\/Classifications\">standardne klasifikacije<\/a> Statisti\u010dnega urada Republike Slovenije.<\/p>\n<p>Pred pri\u010detkom prevajanja smo morali vse zbrane termine in prevode iz razli\u010dnih virov uskladiti. Termini v tezavru ELSST so zapisani z velikimi \u010drkami in pogosto v mno\u017einski obliki \u2013 to odlo\u010ditev je sprejela ekipa, ki je izdelala izvorno angle\u0161ko slovarsko bazo. Priprava je tako vklju\u010devala zapis prevodov iz vseh virov z velikimi \u010drkami in odlo\u010danje, kdaj pri slovenskih prevodih uporabiti edninsko ali mno\u017einsko obliko.<\/p>\n<p>Rezultat avtomatizirane prve faze prevajanja je bil najmanj en prevod za vsak posamezni termin, pri \u010demer smo razlikovali med polnimi in sestavljenimi prevodi. Avtomatsko orodje je v prevajalskih virih poiskalo enega ali ve\u010d prevodov za iskane termine. V primeru ve\u010dbesednih terminov je orodje termin razdelilo na besede oziroma sklope besed, nato pa za vsak posamezen del poiskalo prevod. Prevodi po delih so bili nato zdru\u017eeni v sestavljen prevod termina.<\/p>\n<figure id=\"attachment_5274\" aria-describedby=\"caption-attachment-5274\" style=\"width: 290px\" class=\"wp-caption alignright\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-5274 size-thumbnail\" src=\"http:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-content\/uploads\/2018\/02\/slika222-290x290.png\" alt=\"\" width=\"290\" height=\"290\" \/><figcaption id=\"caption-attachment-5274\" class=\"wp-caption-text\">Beseda well-being iz tezarva ELSST (Vir: elsst.ukdataservice.ac.uk)<\/figcaption><\/figure>\n<p>Postopek prevajanja je pri sestavljenih prevodih bolj zapleten in vklju\u010duje zaporedje algoritmov, ki nato privedejo do kon\u010dne prevajalske re\u0161itve. Ve\u010dbesednega termina namre\u010d ni smiselno zgolj razbiti na posamezne besede, ki ga sestavljajo, temve\u010d je v izhodi\u0161\u010du ideja, da najdemo najdalj\u0161i (ve\u010d)besedni del termina, za katerega lahko dobimo polni prevod. Pri tem je treba upo\u0161tevati \u0161e morebitne razlike v edninskih in mno\u017einskih oblikah ter pri prevodu poskrbeti za ustrezno slovni\u010dno obliko (ujemanje pridevnikov in samostalnikov).<\/p>\n<p>Ob koncu avtomatskega prevajalskega postopka je vsak termin iz angle\u0161kega tezavra vklju\u010deval najmanj en slovenski prevod, ve\u010dinoma pa ve\u010d prevodov, ter oznako, iz katerega prevajalskega vira prevod prihaja. V naslednjem koraku smo v ADP pregledali vse avtomatsko pripravljene prevode in za vsak termin izbrali najustreznej\u0161ega. Postopek pregleda, preverjanja in morebitnega urejanja oziroma popravljanja je potekal ro\u010dno. Vklju\u010deval je pet nalog:<\/p>\n<ul>\n<li>izbor najustreznej\u0161e mo\u017enosti prevoda za posamezni termin izmed predlaganih;<\/li>\n<li>preverjanje in izbor terminov s potencialno problemati\u010dnimi prevodi (npr. ve\u010d mo\u017enih izbir prevoda, manjkajo\u010di ustrezni prevod);<\/li>\n<li>pri odlo\u010ditvi za ustrezen prevod smo si pomagali \u0161e s t.i. \u00bb<a href=\"https:\/\/elsst.ukdataservice.ac.uk\/elsst-guide\/elsst-structure\/scope-notes\">Scope notes\u00ab,<\/a> s katerimi ELSST dodatno pojasni pomen posameznega termina;<\/li>\n<li>posvetovanje s strokovnjaki na posameznih raziskovalnih podro\u010djih, kjer so bili zaznani potencialno problemati\u010dni prevodi;<\/li>\n<li>posvetovanje s strokovnjakinjo za terminologijo korpusno jezikoslovje;<\/li>\n<li>potrjevanje kon\u010dnega seznama prevodov.<\/li>\n<\/ul>\n<p>Pol-avtomatizirani prevod tezavra ELSST v sloven\u0161\u010dino je prvi primer takega pristopa k prevodu in predstavlja novost v projektni skupini ELSST, ki deluje v okviru konzorcija evropskih dru\u017eboslovnih arhivov CESSDA.<\/p>\n<p>V ADP smo si prizadevali, da bi v sodelovanju s CLARIN.SI pripravili \u010dim bolj\u0161i prevod tezavra v slovenski jezik, obenem pa smo kot eden manj\u0161ih arhivov tak pristop izbrali tudi zaradi omejenih kadrovskih kapacitet.<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ena od zahtev konzorcija CESSDA je, da dr\u017eave \u010dlanice oz. izvajalci storitev  pripravijo prevod tezavra ELSST v nacionalne jezike. V ADP smo za prevod tezavra v slovenski jezik poskrbeli v preteklem letu. Za razliko od ostalih \u010dlanic smo se v sodelovanju s Clarin prevoda lotili s pomo\u010djo programskih orodij. Ve\u010d v nadaljevnanju.<\/p>\n","protected":false},"author":1049,"featured_media":2580,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":""},"categories":[15,198,192],"tags":[50,195,197,196],"class_list":["post-5246","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-blog","category-cessda","category-stroka","tag-adp","tag-elsst","tag-iskanje","tag-tezaver"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/posts\/5246","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/users\/1049"}],"replies":[{"embeddable":true,"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/comments?post=5246"}],"version-history":[{"count":10,"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/posts\/5246\/revisions"}],"predecessor-version":[{"id":5275,"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/posts\/5246\/revisions\/5275"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/media\/2580"}],"wp:attachment":[{"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/media?parent=5246"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/categories?post=5246"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.adp.fdv.uni-lj.si\/blog\/wp-json\/wp\/v2\/tags?post=5246"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}