Huvi korral võta meiega ühendust: digilab@rara.ee.
Eesti Rahvusraamatukogus leidub mitmesuguseid kultuuriandmeid, sealhulgas metaandmeid (nt raamatu pealkiri, autor, ilmumiskoht jne), teoste täistekste ja pilte (nt plakatid ja kaardid). Digiteeritud kultuuripärandi uurimine aitab paljastada peidetud seoseid ja mustreid, samuti on kultuuriandmetel oluline roll suurte keelemudelite arengus. Teadustöö tegemine panustab eesti kultuuri rikastamisse ja väärindamisse.
RaRa digilabori tiim on kokku pannud nimekirja potentsiaalsetest lõputöö teemadest ja eelmisel õppeaastal valminud töödest. Pakume nii tehnilisi kui ka humanitaar- ja sotsiaalteaduslikke teemasid, lootes kõnetada üliõpilasi erinevatest teadusvaldkondadest. Nimekiri ei ole lõplik ehk kindlasti tasub ühendust võtta ka enda teemaga.
Pakume andmeid ja konsultatsiooni, kuid juhendaja tuleb leida ülikoolist.
Koostöö tingimus on, et lõputööst peab valmima blogipostitus RaRa digilabori blogisse.
RaRa peamised andmestikud ja digitaalarhiivid:
RaRa pakub ka tasuta infonõustamist: https://www.rara.ee/uuri/tippteadja.
Värvi- ja fondianalüüs
Võrgustikuanalüüs
RaRa materjalidest saab moodustada andmestikke, mille abil on võimalik uurida erinevaid teemasid
Arvutimängud
Linkandmete täiendamine
RaRa digilaborisse sisu loomine
Suurte keelemudelite kasutamine RaRa materjali uurimiseks
Valminud lõputöödega saab tutvuda peagi.
Teised teemad
Lisaks väljapakutud teemadele valmis Tartu Ülikooli arvutiteaduse instituudis tudengiprojekt, mis kasutab ka DIGAR-i materjali.
Tutvu Hendrik Matvejevi ja Riki-Taavi Nurme tudengiprojektiga „Kultuuriajakirja AKADEEMIA kaardistamine“.
Tudengiprojekt võitis Tartu Ülikooli arvutiteaduse instituudi tudengiprojektide võistlusel bakalaureuse kategoorias esimese koha.
OCR kvaliteedi hindamine ja parandamine
Optiline märgituvastus (inglise keeles Optical Character Recognition ehk OCR) on trükitud või käsitsi kirjutatud teksti teisendamine digitaalseks tekstiks. RaRa materjalide seas leidub erineva OCR kvaliteediga andmeid. Potentsiaalsed uurimisteemad oleksid järgmised:
Tutvu Loore Lehtmetsa ja Mari-Anna Meimeri bakalaureusetööga „Ajalooliste eestikeelsete OCR tekstide järeltöötluse ja hindamise automatiseerimine Eesti Rahvusraamatukogu jaoks“.
Töö märgiti ära üliõpilaste teadustööde riiklikul konkursil.
Pildimaterjalid
Rahvusraamatukogul on ka rikkalik pildikogu, mille hulgas leidub näiteks üle 17 000 plakati ja 5000 kaardi. Neid materjale on digimeetoditega uuritud vähe. Võimalikud teemad oleksid:
Tutvu Gregory Harlan Kuusmiku bakalaureusetööga „Postkaartide loomine tehisintellektiga“.
Tutvu Helina Piibelehe magistritööga „Sugude ja soorollide kujutamine piltidel“.
Kultuuriteemad
RaRa andmekogud pakuvad mitmekülgseid võimalusi kultuuri uurimiseks. Täistekstide kõrval talletatakse ka metaandmeid ehk andmeid andmete kohta, need sisaldavad teose infot (autor, aasta, asukoht jne). Näiteks on võimalik uurida:
Tutvu David Jaansoni bakalaureusetööga „Eesti tutvumiskuulutuste analüüs Nelli Teataja näitel“.
Teised teemad
Lisaks väljapakutud teemadele kirjutas ajalootudeng Tormi Lust RaRa andmete põhjal lõputöö tubakareklaamidest Eesti ajalehtedes aastatel 1920–1940.
Tutvu Tormi Lusti bakalaureusetööga „Tubakareklaamid Eesti ajalehtedes aastatel 1920-1940: korpusepõhine analüüs“.
Eesti Rahvusraamatukogu
Tõnismägi 2, 10122 Tallinn
+372 630 7100
info@rara.ee
rara.ee