Peida filtrid
Näita filtreid
JÄRJEKORD
TÜÜP





KATEGOORIA













Vaata veel

FORMAAT









Vaata veel

AUTORIÕIGUS MÄRKSÕNAD

























Vaata veel

PÄRITOLU





Andmestike ülevaade
Andmestike ülevaade
Loe lähemalt digilabori andmestike võimalustest
Vaata veel

Digilaboris on hetkel esitatud peamiselt Eesti Rahvusraamatukogu digikollektsioonide põhjal loodud metaandmestikud. Lisaks on digilaboris Eesti Märksõnastiku andmed ning tulevikus lisatakse teisigi kultuuripärandi andmestikke.

RaRa andmestikud jaotuvad kolmeks suuremaks osaks: Digiarhiiv DIGAR, Digiteeritud Eesti Artiklid DEA ja Eesti Rahvusbibliograafia. DIGAR sisaldab endas erisuguseid andmeid, nt raamatuid, perioodikat, maakaarte, noodilehti, postkaarte. DEA sisaldab peamiselt ajalehetekste, aga ka uuemat perioodikat. Eesti Rahvusbibliograafia sisaldab metaandmeid Eestis ilmunud või Eestiga seotud trükipublikatsioonide kohta. Andmestikud on jaotatud temaatiliselt. Digilabori andmestikud on loodud võimaldamaks vahetut ligipääsu digikollektsioonide kasutajaliidese taga olevatele andmetele. Andmestikke ning nendega seonduvat infot täiendatakse jooksvalt.

Digilaboris olevaid metaandmeid võib kasutada vastavalt Creative Commonsi litsentsile CC0 1.0. CC0 litsents tähendab, et tegu on avalikku omandisse antud andmetega. Andmeid võib kopeerida, töödelda, muuta ja jagada nii ärilistel kui mitteärilistel eesmärkidel. Eesti Rahvusraamatukogule kui andmestiku autorile viitamine ei ole sealjuures kohustuslik, aga me palume lahkelt seda teha, kui te andmeid või nendel põhinevat tööd jagate.

Eesti Rahvusbibliograafia

Eesti rahvusbibliograafia andmebaas ERB (https://www.ester.ee/search~S95*est) registreerib andmeid rahvusteavikute kohta. Rahvusteavikutena käsitletakse:

  • Eestis avaldatud väljaandeid olenemata keelest, andmekandjast ja ilmumisajast; 
  • välismaal avaldatud eestikeelseid väljaandeid; 
  • eesti autorite ning Eestit ja eestlasi käsitlevaid välismaal avaldatud võõrkeelseid väljaandeid (Estonica kollektsioon). 

Andmebaasi haldab Eesti Rahvusraamatukogu, kes täidab rahvusbibliograafia uurimise ja loetlemise ülesannet Eestis vastavalt Eesti Rahvusraamatukogu seadusele, Säilituseksemplari seadusele ja Rahvusraamatukogu põhikirjale. ERB-i koostamise põhimõtted on fikseeritud dokumendis Rahvusbibliograafia koostamise alused. Andmebaasi täiendatakse uute andmetega pidevalt, kuid mitte harvemini kui üks kord nädalas.

Registreerimise käigus koostatakse igale väljaandele detailne, teavikus avaldatud andmetele tuginev kirjeldus, mis sisaldab pealkirja, väljaandmise eest vastutavate isikute ja organisatsioonide andmeid, kirjastuse ja trükikoja andmeid, trükikorduse andmeid, füüsilist kirjeldust (leheküljed, mõõdud jne) ning kuuluvust mõnda sarja. Täiendavalt lisatakse juurde otsitunnused – märksõnad, liigiindeksid ning seotud isikute ja organisatsioonide normitud nimekujud.

Kõik andmed vastavad rahvusvahelistele standarditele:

  • ISBD (International Standard Bibliografic Description) – kirjeldavad andmed;
  • AACR2 (Anglo-American Cataloguing Rules 2) – otsitunnused;
  • UDC (Unversal Decimal Classification) – liigiindeksid;
  • MARC21 – kasutusel andmevahetusvorminguna.

ERB-i avaandmed on jaotatud teavikulaadide järgi rühmadesse: raamatud, perioodika (ajakirjad, ajalehed, jätkväljaanded), kaardid, noodid, videosalvestised, helisalvestised, piltteavikud ning multimeediaväljaanded. Sealjuures on andmed raamatute kohta jaotatud kolmeks – eestikeelsed, muukeelsed ja vabakasutuses olevad raamatud. Eraldi on kättesaadavad ka Eesti rahvusbibliograafia isikute ja kollektiivide andmed.

ERB-i metaandmed on kättesaadavad läbi OAI-PMH protokolli MARC21XML vormingus ning Zenodo repositooriumis TSV formaadis. Andmemahu vähendamiseks ja loetavuse suurendamiseks on detailsete MARC21XML failide teisendamisel TSV failiformaati vaikimisi eemaldatud kõik väljad, mis on tühjad vähemalt 90% kirjete puhul.

Rahvusraamatukogu digiarhiiv DIGAR

DIGAR (https://www.digar.ee) on Rahvusraamatukogu kasutajakeskkond, mis pakub juurdepääsu digitaalarhiivis talletatud väljaannetele. Nende hulgas on raamatuid, ajalehti, ajakirju, kaarte, noote, fotosid, postkaarte, plakateid, illustratsioone, audioraamatuid ning muusikafaile. Raamatute ja perioodika vorming on enamasti PDF või EPUB, pildimaterjalil JPEG ja helisalvestistel WAV. Digilaboris olevad DIGAR-i metaandmed tehakse kättesaadavaks EDM vormingus (Europeana Data Model) läbi OAI-PMH protokolli, mis on teisendatud ka TSV ning JSON failiformaatidesse.

DIGAR Eesti artiklid DEA

DIGAR Eesti artiklid (https://dea.digar.ee) pakub juurdepääsu suurele osale läbi aegade Eestis ilmunud või välismaal eesti keeles avaldatud digitaalselt sündinud ja digiteeritud ajalehtedele, lisaks alates 2017. aastast ilmuvatele ajakirjadele ja jätkväljaannetele, mis on registreeritud aastaväljaandes „Eesti rahvusbibliograafia. Perioodika“.

Portaal võimaldab väljaandeid sirvida, aga ka otsida ajalehtedes avaldatut, lugeda artiklite täistekste, lisada artiklitele märksõnu, koostada leitud artiklitest nimestikke ning saata neid oma e-postile, jagada leitud informatsiooni sotsiaalvõrgustikes ja palju muud.

Kasutajatele on võimaldatud juurdepääs 2014. aastast ilmunud ajalehtedele, 2017. aastast ilmunud ajakirjadele ja jätkväljaannetele, ning osaliselt ka vanematele ajalehtedele. Portaali täiendatakse iga päev. Vanemad ajalehed (1821–2013) lisatakse nimetuse haaval vastavalt konverteerimiskavale.

DIGAR Eesti artiklid ajakirjade metaandmed tehakse kättesaadavaks läbi OAI-PMH protokolli ja on esitatud MARC21XML vormingus. Digiteeritud ajalehtede täistekstid ning metaandmed on kättesaadavad JupyterLab keskkonnast.

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper mattis, pulvinar dapibus leo.

Kureeritud Eesti rahvusbibliograafia
Kureeritud Eesti rahvusbibliograafia
Andmetöötluseks kohandatud ERB-i metaandmed

Eesti rahvusbibliograafia (ERB) koondab infot eestikeelsete, Eestis ilmunud, eesti autorite loodud ja Eestit või eestlasi käsitlevate teoste kohta. Teave ERB-i koostamise kohta on kirjeldatud RaRa kodulehel.

ERB-i metaandmeid avaldatakse väljaande laadi (raamatud, ajalehed, helisalvestised jne) kaupa MARC21XML formaadis. MARC21 on raamatukogudes kasutatav failiformaat, mis on suunatud info kataloogimisele, kuid mis ei ole sobilik andmetöötlusele ja -analüüsile. RaRa digilabori avamisel lisandus võimalus ERB-i metaandmestikke alla laadida ka tabelkujul, mille puhul on kaasatud kõige sagedamini täidetud veerud ning tehtud esialgne andmete puhastus. ERB-i metaandmestikud on leitavad digilabori andmestike alamlehel.

Nüüdseks on valminud avatud lähtekoodiga töövoog, mis muudab algsed MARC21XML failid kureeritud tabelkujul andmestikeks. Andmestike kureeritus väljendub selles, et andmestikke on puhastatud ja kohandatud lähtudes kasutajate soovidest ja digihumanitaaria uurimismeetodite eripäradest. Hetkel on kureerimisel keskendutud raamatute ja isikute andmestikele. Rohkem infot kureeritud ERB-i loomisest saab lugeda peatselt avaldatavast teemale pühendatud teadusartiklist „Curated Bibliographic Data: the Case of Estonian National Bibliography“ ning töövoo lähtekoodi dokumentatsioonist. Töövoo tulemusena saadud andmestikud on TSV-failidena üles laetud Zenodo repositooriumisse.

Kureeritud ERB-i töövoo lähtekood GitHubis: https://github.com/RaRa-digiLab/enb-curator 

Raamatute kureeritud metaandmestik Zenodo repositooriumis:

Näited raamatute metaandmestikus sisalduvast infost: 

  • Raamatu pealkiri ja alampealkirjad
  • Teose loomisesse panustanud isikud
  • Kirjastaja ja trükikoda või trükkal
  • Ilmumisaasta ja -kümnend
  • Ilmumiskoht ja selle koordinaadid
  • Keeleinfo, sh tõlketeoste puhul raamatu originaalkeel
  • Teema- ja žanrimärksõnad
  • Geograafilisele piirkonnale, ajaperioodile, organisatsioonile või isikule viitavad märksõnad
  • Raamatu mõõtmed ja lehekülgede arv
  • Digiteerituse seis, sh olemasolul viide raamatu digiversiooni(de)le

Kuidas andmestikule viidata:

Kruusmaa, K., Tinits, P., & Nemvalts, L. (2024). Curated Estonian National Bibliography - books [Andmestik]. Eesti Rahvusraamatukogu. https://doi.org/10.5281/zenodo.14083327

Isikute kureeritud metaandmestik Zenodo repositooriumis:

Näited andmestikus sisalduvast infost: 

  • Isiku nimi ja selle erinevad kirjapildid
  • Sünniaasta, olemasolul surma-aasta
  • Amet
  • Sugu
  • Geograafiline tegutsemispiirkond
  • Lühibiograafia
  • VIAF-i (Virtual International Authority File) identifikaator
  • Wikidata identifikaator

Kruusmaa, K., Tinits, P., & Nemvalts, L. (2024). Curated Estonian National Bibliography - persons. [Andmestik]. Eesti Rahvusraamatukogu. https://doi.org/10.5281/zenodo.14094584

Kutsume andmestikke uurima ja analüüsima! Küsimusi või ettepanekuid saab esitada e-posti aadressil digilab@rara.ee. Samuti ootame andmestiku põhjal loodud andmelugusid digilabori blogisse


Kureeritud ERB-i tutvustav pisipilt on pärit Rahvusarhiivi fotokogust (RA, EAA.2111.1.14967).

OCR tekstiparandused
OCR tekstiparandused
DEA keskkonnas ühisloomena sündinud ajalehtede tekstiparandused

Aastate jooksul on ligi 500 kasutajat panustanud DIGARi tekstide korrigeerimisse ja nende pingutuste tulemusel on parandatud üle 800 000 rea. See andmestik sisaldab valikut algtekstide ja paranduste paaridest.

Andmestik koos dokumentatsiooniga asub siin: https://zenodo.org/records/13325713

Tekstiparanduste kogumine DIGAR keskkonnas on toimunud ühisloome käigus.

Eeltöötlus

DIGARi arhiivis olevad tekstiparandused salvestatakse muudatuste logidena, seega on algtekst pöördprojekteeritud, st parandatud osad algse sisuga asendatud. Tekstid on tugevalt filtreeritud. Täpsemalt on kaasatud ainult tekstiparanduspaarid, mis vastavad järgmistele kriteeriumidele:

  • Parandatud tekst sisaldab vähemalt 80% tähestikulisi tähemärke.
  • Originaaltekstide ja parandatud tekstide pikkuse erinevus ei ületa 5%.
  • Suhteline Levenshteini kaugus kahe teksti vahel on vähemalt 0,1.

Nende kriteeriumite abil on proovitud välistada tekste, mis on osaliselt toimetatud, milles on liiga palju numbreid, loendeid või muid mittealfabeetilisi sümboleid, või kus olulised osad on kustutatud või lisatud (sageli segmenteerimisvigade parandamiseks).

Kvaliteedihindamine

Kuna parandused on ühisloome tulemus, esineb neis vigu ja nad pole käsitletavad lõpliku tõena. Ligikaudse ülevaate saamiseks paranduste tekstikvaliteedist on nii originaal- kui ka parandatud tekstid läbinud GPT-4o mini, mis on neile määranud loetavuse skoori 1-st 5-ni. Selleks kasutati järgmist viipa:

The following is the OCR output from a digitized historical Estonian newspaper from {year}. Analyze the text placed after "TEXT" and decide if it is reasonably free of OCR errors. Return a rating on the scale of 1 to 5.

5 - The text is clear and readable. It may contain unusual spellings and use of punctuation throughout, but there are no distorted words.
4 - The text is readable, but contains some distortions of alphabetical characters. These distortions do not impede understanding the text at any given point.
3 - The text is readable with minor difficulties. Words and phrases may be noticeably distorted.
2 - The text is only readable with great difficulties. All or almost all sentences contain severe errors that make it very hard to understand.
1 - The text is unreadable. It contains mostly gibberish and random symbols, almost no words are recognizable.

If you are hesitating between 4 and 5, it is probably a 5. If you are hesitating between 2 and 3, it is probably a 2.

Note: the use of "w" instead of "v" and "=" instead of "-" are elements of historical orthography an do not count as errors.

Do not reply anything else than a number from 1 to 5, unless explicitly asked to do so.

TEXT:
{ocr_transcription}
Raamatud
Raamatud
DIGAR-is ja ERB-is leiduvate raamatute metaandmed

Eesti rahvusbibliograafia

Eestikeelsed raamatud

Eesti rahvusbibliograafia alamhulk, mis sisaldab eestikeelsete ja osaliselt eestikeelsete raamatute metaandmeid. ERB-is leiduvate eestikeelsete raamatute metaandmestik on kättesaadav:

  • Zenodo repositooriumis TSV-failina
  • ZIP-failina MARC21XML formaadis
  • OAI-PMH protokolli kaudu MARC21XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=raamat&metadataPrefix=marc21xml
Andmestiku ajaline, keeleline ning temaatiline jaotus

Kuidas andmestikule viidata:

Eesti Rahvusraamatukogu. (2023). Eesti rahvusbibliograafia – eestikeelsed raamatud [Andmestik]. https://doi.org/10.5281/zenodo.8228805

Muukeelsed raamatud

Eesti rahvusbibliograafia alamhulk, mis sisaldab muukeelsete teoste metaandmeid. ERB-is leiduvate muukeelsete raamatute metaandmestik on kättesaadav:

  • Zenodo repositooriumis TSV-failina
  • ZIP-failina MARC21XML formaadis
  • OAI-PMH protokolli kaudu MARC21XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=muukeelne&metadataPrefix=marc21xml
Andmestiku ajaline, keeleline ning temaatiline jaotus

Kuidas andmestikule viidata:

Eesti Rahvusraamatukogu. (2023). Eesti rahvusbibliograafia – muukeelsed raamatud [Andmestik]. https://doi.org/10.5281/zenodo.8228821

Vabakasutuses olevad teosed

Eesti rahvusbibliograafia alamhulk, mis sisaldab vaid avalikus kasutuses olevate teoste metaandmeid. ERB-is leiduvate vabakasutuses olevate teoste metaandmete andmestik on kättesaadav:

  • Zenodo repositooriumis TSV-failina
  • ZIP-failina MARC21XML formaadis
  • OAI-PMH protokolli kaudu MARC21XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=vabakasutus&metadataPrefix=marc21xml
Andmestiku ajaline, keeleline ning temaatiline jaotus

Kuidas andmestikule viidata:

Eesti Rahvusraamatukogu. (2023). Eesti rahvusbibliograafia – ligipääsupiiranguta raamatud [Andmestik]. https://doi.org/10.5281/zenodo.8228830

Kasutusnäited

Üks visuaalne ülevaade ERB-is registreeritud raamatutest on näha siin. Vt kood siin.

Rahvusraamatukogu digitaalarhiiv

Raamatud

DIGAR-is leiduvate raamatute metaandmestik on kättesaadav erinevates formaatides.

  • OSF-i repositooriumis TSV- ja JSON-failidena (NB! Hetkel ei ole linkide kaudu võimalik metaandmestikku alla laadida. Andmestikku on võimalik saada kirjutades digilabori tiimile e-posti aadressil digilab@rara.ee).
  • OAI-PMH protokolli kaudu XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=book&metadataPrefix=edm
Andmestiku ajaline, keeleline ja temaatiline jaotus

Standardid

DIGAR-is leiduvate standardite metaandmestik on kättesaadav läbi OAI-PMH protokolli XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=standard&metadataPrefix=edm

Perioodika
Perioodika
DIGAR-is, DEA-s ja ERB-is leiduva perioodika metaandmed

Eesti rahvusbibliograafia

Perioodika

Eesti rahvusbibliograafia alamhulk, mis sisaldab perioodika metaandmeid. ERB-is leiduva perioodika metaandmestik on kättesaadav:

  • Zenodo repositooriumis TSV-failina
  • ZIP-failina MARC21XML formaadis
  • OAI-PMH protokolli kaudu MARC21XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=perioodika&metadataPrefix=marc21xml
Andmestiku ajaline, keeleline ning temaatiline jaotus

Kuidas andmestikule viidata:

Eesti Rahvusraamatukogu. (2023). Eesti rahvusbibliograafia – perioodika [Andmestik]. https://doi.org/10.5281/zenodo.8228827

Rahvusraamatukogu digitaalarhiiv

Ajakirjad (–2016)

DIGAR koondab ajakirju kuni aastani 2016. Nende metaandmestik on kättesaadav järgnevates formaatides:

  • TSV- ja JSON-failidena
  • OAI-PMH protokolli kaudu XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=journal&metadataPrefix=edm
Andmestiku ajaline, keeleline ning temaatiline jaotus

Jätkväljaanded

DIGAR-is leiduvate jätkväljaannete metaandmestik on kättesaadav läbi OAI-PMH protokolli XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=serials&metadataPrefix=edm

DIGAR Eesti artiklid

Ajalehed ja ajakirjad (2017–)

DEA hõlmab ajalehti aastast 1811 ning ajakirju ja muid jätkväljaandeid aastast 2017. DEA-s leiduvate ajakirjade metaandmestik ja täistekstid on kättesaadavad läbi OAI-PMH protokolli MARC21XML formaadis: https://dea.digar.ee/cgi-bin/dea-oaiserver?verb=ListRecords&metadataPrefix=marc21

Ajalehtede täistekstide ligipääsuks suuremas hulgas on võimalik kasutada Jupyter Notebook põhist ligipääsupunkti siin.

Perioodiliselt uuendatav ülevaade DEA tekstide kollektsioonist on näha siin.

Pildimaterjal
Pildimaterjal
DIGAR-is ja ERB-is leiduva pildimaterjali metaandmed

Eesti rahvusbibliograafia

Kaardid

Eesti rahvusbibliograafia alamhulk, mis sisaldab kaartide metaandmeid. ERB-is leiduvate kaartide metaandmestik on kättesaadav:

  • Zenodo repositooriumis TSV-failina
  • ZIP-failina MARC21XML formaadis
  • OAI-PMH protokolli kaudu MARC21XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=kaardid&metadataPrefix=marc21xml
Andmestiku ajaline, keeleline ning temaatiline jaotus

Kuidas andmestikule viidata:

Eesti Rahvusraamatukogu. (2023). Eesti rahvusbibliograafia – kaardid [Andmestik]. https://doi.org/10.5281/zenodo.8228811

Piltteavikud

Eesti rahvusbibliograafia alamhulk, mis sisaldab graafikateoste metaandmeid. ERB-is leiduvate piltteavikute metaandmestik on kättesaadav:

  • Zenodo repositooriumis TSV-failina
  • ZIP-failina MARC21XML formaadis
  • OAI-PMH protokolli kaudu MARC21XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=piltteavikud&metadataPrefix=marc21xml
Andmestiku ajaline, keeleline ning temaatiline jaotus

Kuidas andmestikule viidata:

Eesti Rahvusraamatukogu. (2023). Eesti rahvusbibliograafia – graafika [Andmestik]. https://doi.org/10.5281/zenodo.8228809

Rahvusraamatukogu digitaalarhiiv

Kaardid

DIGAR-is leiduvate kaartide metaandmestik on kättesaadav erinevates formaatides.

  • TSV- ja JSON-failidena
  • OAI-PMH protokolli kaudu XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=map&metadataPrefix=edm
Andmestiku ajaline, keeleline ning temaatiline jaotus

Plakatid

DIGAR-is leiduvate plakatite metaandmestik on kättesaadav läbi OAI-PMH protokolli XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=poster&metadataPrefix=edm

Postkaardid

DIGAR-is leiduvate postkaartide metaandmestik on kättesaadav samuti läbi OAI-PMH protokolli XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=postcard&metadataPrefix=edm

Heli
Heli
DIGAR-is ja ERB-is leiduva helimaterjali metaandmed

Eesti rahvusbibliograafia

Helisalvestised

Eesti rahvusbibliograafia alamhulk, mis sisaldab helisalvestiste metaandmeid. ERB-is leiduvate helisalvestiste metaandmestik on kättesaadav:

  • Zenodo repositooriumis TSV-failina
  • ZIP-failina MARC21XML formaadis
  • OAI-PMH protokolli kaudu MARC21XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=helisalvestised&metadataPrefix=marc21xml

Kuidas andmestikule viidata:

Eesti Rahvusraamatukogu. (2023). Eesti rahvusbibliograafia – helisalvestised [Andmestik]. https://doi.org/10.5281/zenodo.8228834

Noodid

Eesti rahvusbibliograafia alamhulk, mis sisaldab nootide metaandmeid. ERB-is leiduvate nootide metaandmestik on kättesaadav:

  • Zenodo repositooriumis TSV-failina
  • ZIP-failina MARC21XML formaadis
  • OAI-PMH protokolli kaudu MARC21XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=noodid&metadataPrefix=marc21xml
Andmestiku ajaline, keeleline ning temaatiline jaotus

Kuidas andmestikule viidata:

Eesti Rahvusraamatukogu. (2023). Eesti rahvusbibliograafia – noodid [Andmestik]. https://doi.org/10.5281/zenodo.8228832

Rahvusraamatukogu digitaalarhiiv

Helisalvestised

DIGAR-is leiduvate helisalvestiste metaandmestik on kättesaadav läbi OAI-PMH protokolli XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=soundrecording&metadataPrefix=edm

Noodid

DIGAR-is leiduvate nootide metaandmestik on kättesaadav läbi OAI-PMH protokolli XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=sheet_music&metadataPrefix=edm

Videod
Videod
ERB-is leiduva videomaterjali metaandmed

Eesti rahvusbibliograafia

Videod

Eesti rahvusbibliograafia alamhulk, mis sisaldab videoteoste metaandmeid. ERB-is leiduvate videote metaandmestik on kättesaadav:

  • Zenodo repositooriumis TSV-failina
  • ZIP-failina MARC21XML formaadis
  • OAI-PMH protokolli kaudu MARC21XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=video&metadataPrefix=marc21xml
Andmestiku ajaline, keeleline ning temaatiline jaotus

Kuidas andmestikule viidata:

Eesti Rahvusraamatukogu. (2023). Eesti rahvusbibliograafia – video [Andmestik]. https://doi.org/10.5281/zenodo.8228836

Isikud ja kollektiivid
Isikud ja kollektiivid
ERB-is leiduvate isikute ja kollektiivide metaandmed

Eesti rahvusbibliograafia

Isikud

ERB-is leiduvate isikute metaandmestik on kättesaadav:

  • ZIP-failina MARC21XML formaadis
  • OAI-PMH protokolli kaudu MARC21XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=person&metadataPrefix=marc21xml

Kollektiivid

ERB-is leiduvate kollektiivide metaandmestik on kättesaadav:

  • ZIP-failina MARC21XML formaadis
  • OAI-PMH protokolli kaudu MARC21XML formaadis: https://data.digar.ee/repox/OAIHandler?verb=ListRecords&set=organization&metadataPrefix=marc21xml
Eesti rahvusbibliograafia
Eesti rahvusbibliograafia
Eesti rahvusbibliograafia metaandmestik

Eesti rahvusbibliograafia

Eesti Rahvusbibliograafia andmestik, mis sisaldab kõigi väljaannete laadide metaandmeid. ERB-i metaandmestik on kättesaadav:

  • Zenodo repositooriumis TSV-failina.
Andmestiku ajaline, keeleline ning temaatiline jaotus

Kuidas andmestikule viidata:

Eesti Rahvusraamatukogu. (2023). Eesti rahvusbibliograafia [Andmestik]. https://doi.org/10.5281/zenodo.8228794

Eesti märksõnastik EMS
Eesti märksõnastik EMS
Kõiki ainevaldkondi hõlmav tesauruse struktuuriga märksõnastik

"Eesti märksõnastik" (EMS) on kõiki ainevaldkondi hõlmav tesauruse struktuuriga märksõnastik raamatute, perioodikaväljaannete, artiklite, nootide, helisalvestiste, kaartide jm teavikute eestikeelseks märksõnastamiseks ja infootsinguks.

Märksõnastikku uuendatakse jooksvalt,  sellega tegeleb EMSi toimetus.

EMSi märksõnu kasutatakse

- e-kataloogis ESTER
- Eesti artiklite andmebaasis ISE
- rahvusbibliograafia andmebaasis ERB

- rahvaraamatukogude koondkataloogis URRAM
- raamatukogude info- ja kataloogisüsteemi RIKS kasutavates raamatukogudes
- mitmel pool mujal.
Rahvaraamatukogudes ja kooliraamatukogudes on „Eesti märksõnastiku“ kasutamine teavikute märksõnastamiseks töökorralduse juhenditega kohustuslikuks tehtud.

EMSi maht on ligikaudu 61 000 märksõna ja äraviiteterminit (sünonüümi). Täpse ülevaate annab leht „EMS arvudes“. Märksõnastik sisaldab ka kohanimesid, kuid ei sisalda isikute, asutuste ega organisatsioonide nimesid. Märksõnastikku tehtavad muudatused kajastuvad EMSis reaalajas.

Märksõnastikku haldab ELNET Konsortsium, vastutusvaldkonnad on jagatud raamatukogude vahel.

EMS on veebis tasuta kättesaadav. Kokkuleppel ELNET Konsortsiumiga võib EMSi andmestikku ja tarkvara kasutada infosüsteemide arendamisel.

Vorming: Masinloetav MARC21
Päringu süntaks: https://ems.elnet.ee/teenus.php?vorming=M&sona=[otsingusõna]
Näidispäring: https://ems.elnet.ee/teenus.php?vorming=M&sona=kaubamärgid

Vorming: Inimloetav MARC21:
Päringu süntaks: https://ems.elnet.ee/teenus.php?vorming=i&sona=[otsingusõna]
Näidispäring: https://ems.elnet.ee/teenus.php?vorming=i&sona=kaubamärgid

Vorming: MarcXML:
Päringu süntaks: https://ems.elnet.ee/teenus.php?vorming=X&sona=[otsingusõna]
Näidispäring:https://ems.elnet.ee/teenus.php?vorming=X&sona=kaubamärgid

Vorming: Mitmesõnalised märksõnad:
Päringu süntaks: https://ems.elnet.ee/teenus.php?vorming=I&sona=[otsingusõna]+[otsingusõna]
Näidispäring: https://ems.elnet.ee/teenus.php?vorming=I&sona=asutuste+arhiivid

Kõik stringi sisaldavad märksõnad (kärpemärk %):
Päringu süntaks: https://ems.elnet.ee/teenus.php?vorming=I&sona=%[otsingusõna]%
Näidispäring: https://ems.elnet.ee/teenus.php?vorming=I&sona=%arhiiv%

Vorming: Marc21 (Authority) masinloetavas formaadis (vt https://www.loc.gov/marc/specifications/):
Päringu süntaks: https://ems.elnet.ee/id/[märksõna ID]#marc21
Näidispäring: https://ems.elnet.ee/id/EMS007185#marc21

Vorming: Marc21 inimloetavas formaadis (Marc21-I):
Päringu süntaks: https://ems.elnet.ee/id/[märksõna ID]#marc
Näidispäring: https://ems.elnet.ee/id/EMS007185#marc

Vorming: MarcXML formaadis (vt http://www.loc.gov/standards/marcxml/):
Päringu süntaks: https://ems.elnet.ee/id/[märksõna ID]#xml
Näidispäring: https://ems.elnet.ee/id/EMS007185#xml

Kui ID on mittesobival kujul, on vastus „Sõnu ei leidu“:
Näidispäring: https://ems.elnet.ee/id/midaiganes#marc21
Kui ID on sobivas formaadis, aga sellist ID-d ei leidu või on sõna kustutatud, on vastus 0

Vorming: Masinloetav Marc21:
Päringu süntaks: https://ems.elnet.ee/teenus.php?id=[ID]&vorming=M
Näidispäring: https://ems.elnet.ee/teenus.php?id=EMS005160&vorming=M

Vorming: Inimloetav Marc21:
Päringu süntaks: https://ems.elnet.ee/teenus.php?id=[ID]&vorming=I
Näidispäring: https://ems.elnet.ee/teenus.php?id=EMS005160&vorming=I

Vorming: MarcXML:
Päringu süntaks: http://ems.elnet.ee/teenus.php?id=[ID]&vorming=X
Näidispäring: http://ems.elnet.ee/teenus.php?id=EMS005160&vorming=X

Väli (v.a 00X väljad) koosneb välja numbrist, kahest indikaatoripositsioonist ja alamväljadest andmesisu jaoks. Tühja indikaatoripositsiooni tähistab kaldkriips. Alamvälja tähis koosneb märgist $ ja mingist tähest või numbrist. Siin tutvustatakse lühidalt olulisemaid elemente, täpsemalt vt https://www.loc.gov/marc/authority/ecadhome.html

LDR leader, nt 00000nza2200000n%00
001 kontrollnumber, milleks on EMS ID, nt EMS167171
003 kontrollnumbri andja kood ErEMS
008 püsipikkusega väli mitmesuguse kodeeritud info jaoks,6 esimest kohta näitavad kirje koostamise aega aakkpp, nt 130823|n|anznnbabn||n|

040 kirje koostamise andmed, ei varieeru: $aErEMS$best$cErEMS$fems
072 7 EMSi valdkonna number, kuhu sõna kuulub, ja EMSi kood, nt $a53$2ems
Väli võib korduda
150 normitud teemamärksõna, nt $ainfokeskkond
151 normitud kohamärksõna, nt $aAbja-Paluoja
155 normitud vormimärksõna, nt $aõigusaktid

450, 451, 455 äraviiteterminid (sünonüümid) normitud märksõnadele, nt
450 $ainforuum; 451 $aAbja; 455 $anormatiivaktid

450, 451, 455 9 ingliskeelsed vasted, nt 450 9 $ainformation environment;
451 9 $aNarva river; 455 9 $alegal acts

550, 551, 555 seotud märksõnad ja nende URI-d alamväljal $0
$wg – laiem termin
$wh – kitsam termin
$w puudub – muu tähenduslik seos
nt
150 $aalalõualuu
450 $amandibula
450 9$amandible
550 $wg$alõualuud$0https://ems.elnet.ee/id/EMS029481
550 $wh$aalalõuapõnt$0https://ems.elnet.ee/id/EMS149978
550 $aalalõualiiges$0https://ems.elnet.ee/id/EMS147267

670 allikas, nt $aRegio Eesti Teede Atlas, Regio, 1998.
680 seletus alamvälja tähisega $i, nt $iIsikute, organisatsioonide ja süsteemide kogum, milles kogutakse, töödeldakse ja levitatakse infot. Hõlmab ka informatsiooni ennast.

Sõnastik uueneb pidevalt ja on alla laetav nii MARC21, MARCXML formaadis.

Masinloetav Marc21: link

Inimloetav Marc21: link

MarcXML: link

Näita veel

Liitu Eesti Rahvusraamatukogu uudiskirjaga

    AVATUD
    RaRa väike maja
    E-R 10—20
    L 12—19
    P Suletud

    RaRa saatkond Solarises
    E-P     10—19
    KONTAKT

    Eesti Rahvusraamatukogu
    Narva mnt 11, 15015 Tallinn
    +372 630 7100
    info@rara.ee
    rara.ee

    linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram