Rahvusraamatukogus leidub eriilmelisi kultuuriandmeid, mis võivad olemuselt olla nii metaandmed (autor, aasta, teose mõõtmed jne), teoste täistekstid kui ka pildid (näiteks plakatid ja kaardid). Kuna andmeid seostatakse eelkõige reaalteadustega, siis on kultuuriandmed jäänud pigem tagaplaanile. Samas on just nende kaudu võimalik paljastada seni teadmata mustreid ja seoseid ning selle kaudu panustada Eesti digitaalse kultuuripärandi väärindamisse. Samuti on kultuuriandmetel oluline roll suurte keelemudelite arengus.
RaRa digilabori tiim on kokku pannud nimekirja potentsiaalsetest lõputööde teemadest. Pakume teemasid nii humanitaarteadusliku kui ka tehnilisema poole pealt, lootes kõnetada üliõpilasi kõigist teadusvaldkondadest. Kindlasti ei ole nimekiri lõplik ehk meie poole tasub pöörduda ka enda teemaga. Omalt poolt saame panustada konsultatsioonide pakkumisega. Meiega saab ühendust võtta kirjutades e-posti aadressile digilab@rara.ee või individuaalselt digilabori tiimiliikmetele.
RaRa peamised andmestikud ja digitaalarhiivid:
RaRa pakub ka tasuta infonõustamist: https://www.rara.ee/uuri/tippteadja/.
OCR kvaliteedi hindamine ja parandamine
Optiline märgituvastus (inglise keeles Optical Character Recognition ehk OCR) on trükitud või käsitsi kirjutatud teksti teisendamine digitaalseks tekstiks. RaRa materjalide seas leidub erineva OCR kvaliteediga andmeid. Potentsiaalsed uurimisteemad oleksid järgmised:
Kultuuriteemad
RaRa andmekogud pakuvad mitmekülgseid võimalusi kultuuri uurimiseks. Täistekstide kõrval talletatakse ka metaandmeid ehk andmeid andmete kohta, need sisaldavad teose infot (autor, aasta, asukoht jne). Näiteks on võimalik uurida:
Meelestatusanalüüs
Meelestatusanalüüs on meetod, millega on võimalik tuvastada tekstis väljendatud emotsioone ja tonaalsust. Materjalina on võimalik kasutada ajalehti, mille puhul saab uurida erinevate väljaannete, autorite ja kogukondade suhtumist kindlatesse teemadesse. Võimalik oleks uurida:
Pildimaterjalid
Rahvusraamatukogul on ka rikkalik pildikogu, mille hulgas leidub näiteks üle 17 000 plakati ja 5000 kaardi. Neid materjale on digimeetoditega uuritud vähe. Võimalikud teemad oleksid:
Arvutimängud
RaRa materjalide hulgas on ohtralt tekstilist ja pildilist materjali, mida saab kasutada arvutimängude tehniliseks ja sisuliseks arendamiseks. Näiteks on võimalik materjale kasutada visuaalseks kujunduseks ning kõnedialoogide arendamiseks. Samuti saab andmeid rakendada kvaliteetsete õpimängude loomiseks. Kutsume üles RaRa kogusid avastama ja nende põhjal mänge looma!
Linkandmete täiendamine RaRa materjalide abil
RaRa-s leiduvaid andmeid on võimalik seostada teiste andmebaasidega, et analüüsi parandada ja andmeid väärindada. Kutsume üles leidma võimalusi RaRa andmete linkimiseks Vikiandmete platvormiga.
RaRa digilabori sisu loomine
Omaette eesmärgiks saab võtta ka RaRa digilaborisse blogipostituste sarja loomise. Samuti on võimalik luua uusi tööriistu (näiteks visualiseerida erinevate andmete linkimist) või täiendada vanu (näiteks täiustada Raamatud kaardil tööriista).
Eesti Rahvusraamatukogu
Narva mnt 11, 15015 Tallinn
+372 630 7100
info@rara.ee
rara.ee