Keeletöötlus

Uku Raudvere ja Kristel Uiboaia loodud keeletöötlustööriist võimaldab sissetrükitavat või failina üleslaaditavat teksti lemmatiseerida ning morfoloogiliselt analüüsida.

Lemmatiseerimine on sõnade algvormi kujule muutmine – eesti keeles on tekstisiseselt paljud sõnad käändes, mis teeb teksti analüüsi keeruliseks, kuid lemmatiseerimisega on võimalik sõnu standardiseerida.

Morfoloogiline analüüs näitab, milline on sõna vorm, nt sõnaliik, kääne või pööre ning arvuline väärtus (ainsus või mitmus). Tööriist esitab väljundi CSV-failina.

Tööriist on leitav veebilehelt https://tekstianalyys.utlib.ut.ee/index.html#.

Liitu Eesti Rahvusraamatukogu uudiskirjaga

    AVATUD
    RaRa väike maja
    E-R 10—20
    L 12—19
    P Suletud

    RaRa saatkond Solarises
    E-P     10—19
    KONTAKT

    Eesti Rahvusraamatukogu
    Narva mnt 11, 15015 Tallinn
    +372 630 7100
    info@rara.ee
    rara.ee

    linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram