Keeletöötlus

Uku Raudvere ja Kristel Uiboaia loodud keeletöötlustööriist võimaldab sissetrükitavat või failina üleslaaditavat teksti lemmatiseerida ning morfoloogiliselt analüüsida.

Lemmatiseerimine on sõnade algvormi kujule muutmine – eesti keeles on tekstisiseselt paljud sõnad käändes, mis teeb teksti analüüsi keeruliseks, kuid lemmatiseerimisega on võimalik sõnu standardiseerida.

Morfoloogiline analüüs näitab, milline on sõna vorm, nt sõnaliik, kääne või pööre ning arvuline väärtus (ainsus või mitmus). Tööriist esitab väljundi CSV-failina.

Tööriist on leitav veebilehelt https://tekstianalyys.utlib.ut.ee/index.html#.

Liitu Eesti Rahvusraamatukogu uudiskirjaga

  AVATUD
  RaRa väike maja
  E-R 10—20
  L 12—19
  P Suletud

  RaRa saatkond Solarises
  E-P     10—19
  KONTAKT

  Eesti Rahvusraamatukogu
  Narva mnt 11, 15015 Tallinn
  +372 630 7100
  info@rara.ee
  rara.ee

  linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram