22. nov. 2014

Digitalno družboslovje in vsebinska informatika

Kaj natančno je digitalna humanistika ali digitalno družboslovje, nam morda niti ni jasno, mnogi namreč to besedno zvez uporabljajo za pojav, ko imamo besedila, slike ali zvoke shranjene na računalniškem pomnilniškem mediju.

Na Slovenskem se na mnogih področjih kulturne dediščine uveljavlja informacijska tehnologija in konkretna uporaba večjih podatkovnih zbirk. Najbolj široko se verjetno uporablja bibliografski in knjižnični sistem COBISS, v zadnjih letih se Narodna in univerzitetna knjižnica močno širi v digitalno smer preko portala in sistema dLib, podobno se razvija na Sistory in še nekaterih drugih ožje tematsko usmerjenih spletnih servisih. Nepremično kulturno dediščino Ministrstvo za kulturo pokriva v okviru INDOK centra, kjer v povezavi GIS dediščine in Europeane lahko pregledujemo prostorsko razporeditev in nekaj vsebine posameznih objektov, ki so v evidenci kulturne dediščine. Na bolj teoretično področje obdelave podatkov s področja kulturne dediščine morda lahko uvrstimo povezavo Inštituta Jožef Stefan, ZRC SAZU in Filozofske fakultete, v okviru katere nastajajo besedni korpusi slovenščine, analitika besedišča, tudi glasbene dediščine, SSKJ in še kaj. V Arhivu RS in drugih arhivih morda v to rubriko sodijo iskalniki ARS in SIRANET in nekatera pisna in slikovna gradiva, ki so že konkretno dostopna uporabnikom, vključno s skenogrami matičnih knjig.

Značilnost večine naštetih informacijskih sistemov naj bi bila služiti uporabniku, a v bistvu gre običajno za sistem servisa ena na ena: torej iščem nek podatek in ga tudi dobim. Iskanje je lahko neposredno, torej po vsej bazi iščemo neko besedo ali besedno zvez, lahko pa hierarhična, torej se po stopnjah približujemo iskanemu vprašanju. Šibko vsebinsko mreženje, nobenih povezav po logičnih ključih, nobene analitike - vse to zgolj tisto, kar omogoča algoritem, ki je že v osnovi vgrajen v neke splošne iskalnike, torej preprosti iskalnik po nizui nekih črk.

Hud problem, tako se zdi, pri tem predstavlja prehod iz papirne oblike vodenja podatkovnih zbirk na digitalnega. Mnoge sicer danes digitalne podatkovne zbirke namreč niso veliko več kot veren posnetek papirne. V primerih dragocenih arhivskih listin je skenogram brez dodane vrednosti sicer smiselna in edino primerna rešitev, v večini primerov pa posnemanje nekdanjega papirnega sistema kaže le na močan princip vztrajnosti, ki v bistvu prezira ali se najboljšem primeru izogiba mnogim možnostim današnje informacijske tehnologije. Danes je na primer nedopustno, da kazalo vsebine v knjigi, ki jo kupimo kot digitalno knjigo, ni oblikovano kot seznam živih kazalk, ki nas z dotikom premaknejo na stran, ki je v kazalu klasično navedena. Podobno je z opombami ali navedbami referenc v znanstvenih člankih. Morda v eno smer še gre, nazaj na mesto iskanja pa redko.Želja biti informatiziran očitno obstaja, saj nastajajo nove podatkovne zbirke, predvsem na spletu lahko zasledujemo stalno vznikanje različnih projektnih pristopov. Žal ob poglobljenem pregledu v mnogih primerih zadnjih let lahko opazimo novo težavo: morebitna dodana vrednost se pojavlja le na področju oblikovanja, vsebine in povezanosti teh vsebin pa so prepogosto iste, ali še manj intuitivne. Podvajanje na primer opažamo pri knjižnih portalih, nepremični kulturni dediščini, naravovarstvenih atlasih, celo dvojni prepis zapiskov slovenskih umetnostnih zgodovinarjev, ki so orali ledino varstva kulturne dediščine, se na spletu pojavlja v dveh različicah. Podvajanje v organizacijskem smislu, ki je za uporabnike vsekakor moteče, za državo pa drago, je primer dveh iskalnikov po arhivskih fondih v Sloveniji. Brez dvoma bi se našli še primeri celo več hkratnih kopij, saj iste podatke, celo kar iste stavke z napakami vred iz skladovnic znanja kulturnega varstva pogosto uporabljajo pri spletnih turističnih predstavitvah na lokalni ali projektni ravni.

Pravzaprav je žalostno, da denarja raje ne uporabimo za napredek, oziroma, da nam napredek s področja oblikovanja ali tehnične informatike pomeni več kot napredek na področju vsebine in vsebinske informatike. Ali še več: zdi se, da ustvarjalci oziroma skrbniki gradiv več pozornosti posvečajo sebi in svoji uspešnosti v okviru samoustvarjene paradigme, namesto da bi se posvetili cilju, torej uporabniku.

To je nekako tako, kot bi imeli dve vzporedni avtocesti, pa malo prometa, pa še slabo bi bili označeni. Saj človek nekako pride na cilj, ampak stalno te nekaj skrbi, če si se odločil za pravo cesto, če ni morda na oni drugi nekaj rahlo drugega. Humanizem in družboslovje sta zelo živi zadevi. Digitalizacija še bolj. Prav lahko se vam zgodi, da boste nekaj iskali, a našli nekaj povsem drugega.