2. dec. 2014

Napredna vizualizacija podatkov



Informacijska doba prinaša s svojimi obsežnimi možnostmi  hrambe in obdelave velike količine podatkov tudi problem predstavljivosti celote. Velikih podatkovnih zbirk tako niti ni mogoče dojemati, ob naraščanju ali dinamiki podatkov pa človekovi možgani sploh niso več sposobni slediti stanju in spremembam. Hkrati se upravljalci zavedajo, da je stanju in spremembam treba slediti, če hočemo gradivo dobro upravljati in strokovno ali upravljalsko delo kakovostno izvajati ali načrtovati. Velike količine na videz razpršenih podatkov je torej nujno potrebno smiselno povezati in prikazati. Možnosti je seveda več in nekatere so uveljavljene že dalj časa, na primer prikaz nekih lokacij na zemljevidu ali predstavitev števil v obliki stolpičastega ali črtnega grafa. Informacijska doba pa s seboj prinaša in omogoča še več naprednejših oblik prikazovanja, od interaktivnosti, tridimenzionalne predstavitve, dinamike in sosledij, preko dvo ali večdimenzionalnih matričnih sistemov, do uporabe algoritmov, ki skupine podatkovnih enot po na videz naključnih postopkih preobrazijo v človeku bolj razumljive in logične strukture. Ker je urejene podatke, ki imajo vsaj nekaj lastnosti standardiziranih, mogoče kombinirati s podatkovnimi zbirkami z istega prostora, časa ali podobne vsebine, se seveda odpirajo tudi mnoge nove možnosti analitskega in komparativnega dela.
Vizualizacija večjih ali velikih količin podatkov je zahtevno delo. Za kakovosten rezultat je potrebno poznati predvsem:

- vsebino in lastnosti podatkov ter njihovo dinamiko,
- strukturo podatkovnih zbirk, ki jih obdelujemo,
- principe generalizacije ali možne generalizacije, pri kateri se podatki ne izgubljajo ali ponarejajo,
- programska orodja, vključno s posdtopki in algoritmi, ki so za določen tip podatkov uporabni,
- povezljivost vsebin z drugimi tematikami znotraj stroke ali navzven,
- smiselne oblikovne možnosti posameznih prikazov,
- navade in dojemljivost ciljnih skupin uporabnikov.

Lepo je imeti podatkovno zbirko. Vendar to ni zadosti. Dobro je imeti tako zbirko tudi dobro urejeno. A tudi to še ne zadostuje. Bistvo podatkovne zbirke je namreč informacija, ki koristi zainteresiranemu uporabniku.


Indeks krajev v podatkovni zbirki filmov Slovenskega filmskega arhiva in njihove povezave. 

Vsako vozlišče predstavlja kraj ali lokacijo, v katerem je del filma ali oddaje posnet. Iz analitske slike na bistevno bolj enostaven način vidimo, katere vsebine prevladujejo, kot če bi prebirali kazalo krajev, ki ga vsebuj katalog, dostopen na spletni strani ARS. V obdelavi je okrog 8000 filmskih naslovov in okrog 15.000 povezav med kraji in temi naslovi. 

Iz diagrama vidimo, da se določene vsebine povezujejo predvsem geografsko, pri čemer so dobro zaznavne tudi razdalje med posameznimi kraji, ki so predvsem vsebinske narave in ne toliko geografske. Opazne so gruče slovenskih krajev, okolica Ljubljane, Beograda in krajev z območja bivše države, navzgor so se oddaljila gesla, povezana z nekdanjo Sovjetsko zvezo in ZDA. Okrog osnovnega preplega so se kot osamljeni razporedili filmi, ki prikazujejo samo in izključno določen kraj. Velikost črk posameznega gesla je sorazmerno glede na število uporabe kraja kot krajevnega gesla.
Izdelano s programom Gephi in algoritmoma ForceAtlas2 in OpenOrd.