Me ei tea veel, kuidas keelemudel tegelikult õpib

Signe Heiberg

10.12.2024

Intervjuu on ilmunud ajakirjas Raamatukogu: https://www.rara.ee/raamatukogudele/ajakiri-raamatukogu/#flipbook-df_29818/1/, RaRa kodulehel: https://www.rara.ee/uudised/me-ei-tea-veel-kuidas-keelemudel-tegelikult-opib/ ja ajalehes Postimees: https://kultuur.postimees.ee/8165090/kultuuris-kuum-tehisaru-raamatukogudes-kuidas-opetada-juturoboteid-moistma-kultuuriparandit.

Veel mõned aastad ja elamegi Matrixis¹ ‒ või on elul teised plaanid? Tehisintellekt (TI) on raamatukogude ukse juba avanud, aga enne, kui ta end koduselt tundma hakkab, tuleks küsida, kes ta on ja mida kaasa toob. Kohtun andmeteadlase Krister Kruusmaa ja digihumanitaar Laura Nemvaltsiga, et vaadata sisse kevadel alustanud raamatukogudele mõeldud koolitusse. Selle üheks teemaks on, mida valdkond võidab või kaotab, kui andmetel, algoritmidel ja arvutusvõimsusel põhinev programm, eestikeelse nimega TI, end sõbraks pakub.

Enne vestluse algust kostub asjalik märkus tehisintellekti termini kasutamise kohta. Ehkki sageli kuuleme lühendit „AI“, siis vähemalt kirjakeeles oleks õigem kasutada „TI“. . Ja veel üks nüanss: sageli räägitakse tehisintellektist, mõtlemata, mida täpsemalt silmas peetakse. Mururobot liigub automatiseeritud protsessi alusel, kuid see süsteem pole sama mis pildituvastusprogrammil, mis ütleb, kas pildil on kass või koer. Mõlemat kiputakse aga nimetama tehisintellektiks. Programm, mis suudab ise koera ja kassi joonistada, on juba midagi palju enamat. Kui programm loob ise pildi, teksti, heli või ka video, nimetatakse seda inglise keeles terminiga generative AI² (tootev TI). Raamatukogunduses ei kujutata juba ammu ette infotöötlust ilma automatiseeritud süsteemita, kuid TI kui autonoomselt tegutsev programm puudutab raamatukogusid aastal 2024 sama palju kui kogu ühiskonda. TI võimekuse, ohtude ja võimalustega on mõistlik kursis olla kõigil ühiskonnaliikmetel.

Mida tehisintellekti koolitus pakub?
K: Tehisintellekt (TI) oma uutes vormides muudab fundamentaalselt seda, kuidas inimene informatsiooniga suhestub. Raamatukogudes on palju infot hoiul ja sellepärast peaks raamatukogutöötaja TI võimalustega kursis olema, selleks ongi koolitus loodud.

Mille eest te raamatukogutöötajaid hoiatate?
K: Me tegelikult rohkem julgustame, natuke hoiatame ka. Inimestel on hirmud või kõhklused, mis tihti on asjata. Samas on ohtusid, mida mõnikord ei märka ja siis saame tähelepanu juhtida, millised need on ja missugused on tegelikult riskikohad.
L: Tuletame meelde, et TI keelemudelid ei ole neutraalsed. Kuigi need võivad sellistena tunduda, põhinevad need õpetatud andmetel, mis sisaldavad teatud vaatenurki või seisukohti, millel on mõju väljundile.

Kas teil on mõni näide?
K: Oleme lasknud ChatGPT-l soovitada suvelugemist. Saime palju soovitusi, aga ükski ei olnud eesti autori kirjutatud; isegi kui küsimus oli esitatud eesti keeles ja vastus anti samuti eestikeelsena.

Oleme siis ChatGPT-ga suheldes tema väärtushinnangute süsteemis.
K: Nagu teadusuuringud näitavad, on juturobotitel päris kindlad väärtushinnangud, kuigi nad proovivad esineda neutraalselt ja igati vältida näiteks poliitilisi värvinguid ja stereotüüpide väljendamist. Mõnele küsimusele vastamisest võib robot isegi keelduda, aga vaatamata sellele võib kujundlikult öeldes kõnelemas näha Ameerika lääneranniku tehnoloogiasektoris töötavat kõrgepalgalist valget meest, kes valib demokraate. Juturobotid on poliitiliselt kallutatud ja enamasti pigem vasakpoolsete vaadetega.

Kuidas raamatukogude töötajad end tunnevad TI-ga suheldes?
K: Ma arvan, et teadlikkus on alles tekkimas. Selle koolitusega tahame kaotada raamatukogutöötajate sisenemisbarjääri ja seejärel saame tegeleda nüanssidega. Kui raamatukoguhoidja ise ei kasuta juturoboteid või pildimootoreid, siis ikkagi puutub ta aina enam kokku nende vahendusel loodud sisuga. Raamatukogudel on oma osa ühiskonna infopädevuse kasvatamisel ja selleks on vaja olla pädev tehisintellekti teemadel. Meil kõigil on mõistlik vaatamata oma tööle TI olemust tunda.
L: Koolitust läbi viies on tundunud, et pigem on juturobotitest ja pildimootoritest kuuldud ja natuke neid ka proovitud, aga meie koolitus annab valdkonnasisese mõtestatud vaate. Katsetame koos ja vaatame seejuures, milles on TI osav ja milles mitte.

Kas te ise adute lõpuni, kuidas juturobotitelt nagu neist kuulsamalt ChatGPT-lt vastused tulevad?
K: Keelemudeli töötamisprotsess on üldiselt lihtne: sisuliselt prognoositakse järgmist sõna. Näiteks kui kuuleme tuttavat lauset Kui Arno isaga koolimajja jõudis, olid tunnid juba …, leiab meie aju selle lause lõpetamiseks sobiliku sõna. Keelemudel töötab samamoodi. Kui see on lauset piisavalt palju näinud, siis parameetrid ütlevad, et statistiliselt kõige tõenäolisem oleks sinna lisada just selline sõna.
Kui üldine tööpõhimõte on lihtne, siis mingisuguse konkreetse väljundi seletamine on väga raske. Kui lasta kirjutada luuletus mõnel teemal, siis jääb varjatuks, miks mudel kasutab just selliseid riime ja sõnu. Keelemudelite n-ö kapoti alla vaatamine on väga keeruline, kuna need koosnevad miljarditest parameetritest. Paralleelselt süsteemide arendamisega uuritakse, kuidas näha mudeli sisse. Seega oleks iga konkreetse väljundi selgitamine nagu arvutile neurokirurgiline protseduur.
L: Mina tunnen, et saan küll keelemudelite treenimis- ja tööprotsessist teoreetiliselt aru, kuid see, kuidas keelemudel päriselt õpib, käib minu jaoks üle pea. See kipub jääma justkui mustaks kastiks. Mulle tundub, et ka mudelite loojatele endile.
K: See on õige, mudeli õppimisvõime pole päris selge ka loojatele enestele. Keelemudelite loomine ei ole teadus, seda ütlevad paljud. See on midagi inseneeria ja musta maagia vahepealset. Ma ütlen must maagia sellepärast, et inimesed ei tea täpselt, kuidas see töötab ja miks see nii töötab. Järgmise sõna ennustamine on pigem täiesti robustne ja tuim lähenemine, mis ei vaja näiteks keerulisi teooriaid keele või intelligentsi olemuse kohta.
Iga sõna prognoosimiseks on vaja olenevalt mudelist kas 10, 100 või isegi 500 miljardit arvutustehet. Kui teha mudel hästi suureks ja kasutada seal miljardeid või isegi sadu miljardeid tehteid sõnade arvutamiseks, siis mingist hetkest alates ilmnevad mudelil justkui intellekti tunnused. Mudel hakkab midagi oskama, ilma et teda oleks eksplitsiitselt õpetatud. Mingisuguseid reegleid selle kohta, et siin tuleb küsimusele nii vastata ja luuletust sedaviisi jätkata, tänapäevastes keelemudelites ei ole. Mudel ise oskab seda. Miks ta niimoodi oskab, see on tõesti väga keeruline. Me veel täpselt ei tea seda, aga see ei tähenda, et seda pole võimalik tulevikus välja uurida.

Aeg muudab inimesi, mis tähendab, et muutuvad ka vastused. Kui eri ajastutel küsida, mis on elu mõte, siis ühtset vastust olla ei saa, sest vastus sõltub konkreetses ajastus elavate inimeste teadmistest, aga ka väärtustest ja uskumustest.
K: Ma alustaks selle vastusega natuke kaugemalt. Tehisintellekt on tegelikult üsna vana valdkond ja ei hõlma ainult keelemudeleid. Kui kasutame sihtkohta jõudmiseks Google Mapsi, siis navigatsiooniprogramm arvutab välja parima teekonna. Ka ilmaprognoosisüsteem arvutab tõenäosust, kas homme sajab või mitte. Mõlemad süsteemid põhinevad tehisintellektil ja nende eesmärk on prognoosida õiget vastust. Ainult üks vastus saab olla õige ja mudel proovib selle õige üles leida. Hiljem saab kontrollida, kas sadas või mitte.
Keele puhul ei ole meil sageli ühtainsat õiget vastust, sest küsimusele võib vastata mitut moodi ja sõltuvalt kõneleja taustast. See, kuidas keelemudel vastab, lähtub kahest asjast. Esimene on alusandmete koostis ‒ milliste tekstimassiivide alusel see vastuseid moodustab, ja teine algoritmile antud suunised – arendajate loodud reeglid.
Kui keelemudelilt küsida, mida ma pean tegema, kui mul on depressioon, võiks mudel põhimõtteliselt vastata, et hüppa sillalt alla – see on keeleliselt täiesti loogiline konstruktsioon. Aga inimesed ei soovi sellist vastust mitte kunagi näha ja seepärast on teatud teemade osas suunatud mudelit andma n-ö õigeid vastuseid, mis on inimlikult sobivad. Seega valib keelemudel vastuste lõpmatust hulgast sobiva variandi lähtudes nii alusandmete iseloomust kui ka oma loojate arusaamadest.
L: Mulle meeldib tuua näidet: kui me treeniks ühte keelemudelit Nõukogude Eesti ja teist tänapäevaste ajalehtede alusel, siis tõenäoliselt annaksid mudelid ühele ja samale küsimusele üsna erinevad vastused. Seega määrab vastuse eelkõige materjali valik, samuti on palju mõju mainitud reeglitel ja parameetritel. Näiteks ChatGPT annab märku, kui genereeritud vastus on mingil viisil ohtlik või kahjulik. Laseme koolitusel osalejatel küsida mudelilt ühe üsna julma sisuga teose kokkuvõtet, mis enamikel juhtudel toob vastusesse hoiatava märkuse.

Krister Kruusmaa selgitab, kuidas toimus loomeprotsess, kus luuletust kirjutasid ChatGPT ja inimene.
Foto: Aron Urb

Põhimõtteliselt võiks mudel pakkuda välja justkui kaks varianti depressiooni raviks. Esiteks: võta tablett ja hüppa sillalt alla, aga kui sa sillalt alla hüppad, siis pead arvestama, et sel võib olla fataalne tagajärg. Tableti võtmisel võid sa terveks saada ja see on ohutum. Aga arendajate seltskond annab suunise, et võta tablett, ja jätab selle teise variandi ära.
K: Üldjoontes küll. Depressiooni näide on hea, sest on universaalne: nii Räniorus kui ka meil mõeldakse ühtemoodi, et depressiooni puhul peaks abi otsima. Tegelikult on aga väga palju selliseid nüansirikkamaid küsimusi, millele võivad olla erinevad õiged vastused, olenevalt sellest, millises kontekstis või kultuuris seda on küsitud. Siin tulebki jälle mängu arendajate poolne suunamine, mis tugineb teatud väärtushinnangutele. Me peaksime teadma, et mingisugused asjad on keelemudelist välja jäänud. Mitte et arendajad oleks sealt tahtlikult midagi välja jätnud, vaid konkreetses kultuuriruumis ei pruugi infot ollagi või arendajad ei pruugi selle peale tulla.
Räniorus arendatud tehnoloogia, isegi kui ta kõneleb eesti keeles, ei ole kultuuriliselt neutraalne. See ei ole eesti keeles nii kvaliteetne ja ka nii ohutu nagu inglise keeles.

Kuidas ikkagi saavad süsteemid meid kõiki aidata?
L: Kui räägime spetsiifiliselt ChatGPT-st, siis on selle tugevuseks ideede genereerimine. Kui parasjagu ei ole kelleltki nõu küsida, siis saab ideed või probleemi arutada juturobotiga, kes ei väsi ja on alati valmis kuulama. Samuti vastab juturobot väga kiiresti. Samas tasub taaskord meelde tuletada, et vastuste lugemisel ei tohi unustada kriitilist meelt. Koolitusel oleme kuulnud lugu sellest, kuidas raamatukogutöötajad on pidanud otsima ChatGPT soovitatud teost, mida päriselt olemas ei olnud.
K: Tehisintellekti ja juturoboti vahel on nagu võrdusmärk, aga see ei ole tegelikult nii. Tehisintellekt on tegelikult palju laiem valdkond kui juturobotid ja ka need ei ole veel leidnud endale kõige sobivamat vormi. Võib-olla viie aasta pärast tundub suhteliselt iganenud, et inimene räägib spetsiaalses jutuaknas robotiga. Pigem liigub tulevik selles suunas, et keelemudeli lahendused on sujuvalt lõimitud teiste toodetega. Näiteks Apple’i telefonis on Siri, mis on uute iPhone’i mudelite puhul tegelikult ChatGPT. Tänu sellisele integratsioonile saab inimene telefoni kaudu tehisintellektiga suhelda suuliselt.
Raamatukogundusse jõuavad tööriistad, mis saaksid nii raamatukogude töötajaid kui ka külastajaid aidata. Võib-olla on selleks lugemissoovituste genereerimise mootor, mis oleks parem kui täringuviske põhimõttel baseeruv. Inimene saab natukene kirjeldada oma eelistusi ja kui süsteem on liidestatud lugemisvaraga või teoste metaandmetega, siis saab TI teha informeeritud valiku ja pakkuda mõne hea lugemissoovituse.

Mis siis raamatukogutöötajatest saab?
K: Ei tasu karta, et tehisintellekt võtab inimestelt tulevikus töö ära. Pigem võib öelda, et inimesed, kes oskavad tehisintellekti kasutada, võtavad tulevikus ära nende inimeste töö, kes ei oska. TI on tööriist nagu iga teine.

Kuidas sellised süsteemid saaksid raamatukogutöötajatele kasulikud olla?
K: Minu meelest on raamatukogudel selles protsessis hästi suur roll, mida raamatukogud ise alles hakkavad teadvustama. Suur tähtsus on raamatukogudes oleval digiteeritud kultuuripärandil.
Näiteks see, et ChatGPT räägib eesti keelt, on täiesti juhuslik. Arendajad on internetist kokku kogunud andmeid, kuhu on sattunud piisaval määral eestikeelseid tekste. Juhtumisi õppis see mudel nagu kogemata ära eesti keele, nüüdseks enam-vähem arvestataval tasemel. Sama ei saa öelda Eestit puudutavate teadmiste kohta. Veebist saadud andmed on sageli halva kvaliteediga ja pärinevad kes teab kust – suhtlusportaalide kommentaaridest, masintõlgitud tootejuhenditest jne. Aga kus asuvad head, sisukad, tekstiliselt kvaliteetsed andmed, mis peegeldavad eesti keelt ja kultuuri? Raamatukogudes. Seal on suured andmete massiivid, eriti rahvusraamatukogudes, aga ka teistes andmebaase omavates raamatukogudes.

Kas vanad tekstid on piisavalt koherentsed?
K: Inglismaal on tehtud katse, kus keelemudelit treeniti vanade tekstidega. Tulemusena vastaski keelemudel nagu 16. sajandi filosoofid. Kui me hakkame tekste vaatama ajateljel, siis on väga suur osa olemasoleva materjali koguhulgast loodud viimaste aastakümnete jooksul.
Vanemat materjali tuleb enne kasutust filtreerida. Näiteks nõukogudeaegset Sirpi ja Vasarat võiks treeningandmetena kasutada küll, aga võib-olla täiesti kommunistlikku propagandat ei ole mõtet kasutada. Rahvusraamatukogul on seni kasutamata veebiarhiiv, mis on justkui avamata Pandora laegas. Sinna on kogutud ligikaudu kakskümmend aastat eestikeelseid veebitekste. Andmebaase omav raamatukogu saab olla partner neile, kes vajavad kvaliteetset eestikeelset treeningmaterjali.
L: Treeningmaterjalina on kõige väärtuslikumad kas digitaalselt sündinud või kõige viimasena digiteeritud materjalid, kuna neist on võimalik kätte saada kõige kvaliteetsemat tekstilist sisu. Palju aastaid tagasi digiteeritud materjali puhul võib takistuseks osutuda tekstituvastuse kehv kvaliteet.

Mis on teie vaatest oluline sõnum raamatukogudele?
K: Raamatukogud ei pea ennast üldse tundma järelsörkija rollis. Oleme arengus jõudnud sinnamaani, kus raamatukogudel on tohutud võimalused ja on aeg päris julgesti digiteemadel kaasa rääkida. Raamatukogudel on isegi teatud eelis ja seda peaks julgelt tunnetama. Mitte arvama, et ah, mis meie siin, mingid raamatukogud, kes kogu aeg on ära unustatud ja nii edasi, vaid et nüüd just ongi raamatukogude aeg käes.
L: TI-d ei tasu karta, seda tuleks katsetada töö lihtsustamiseks. Samas ei tohi unustada kriitilist mõtlemist, kuid see ei ole ilmselt infoteadlastele uudiseks. Ja nagu mainitud, siis suure digikoguga raamatukogud on muutunud keelemudelite treenimisel hindamatuks partneriks. Seda positsiooni tasub kindlasti ära kasutada.

Kas näete rahvaraamatukogudel olulisemat infopädevuse kujundaja rolli?
K: Jah, rahvaraamatukogu roll on pigem infopädevuse kujundamine ja selleks loodud tööriistade kasutamise õpetamine, desinformatsiooni olemuse selgitamine. Kasvavas infomüras on ülioluline olla tark infotarbija. Rahvaraamatukogudest on võimalik leida verifitseeritud informatsiooni. Kui inimene tahab veenduda, kas nähtud pildil olev olukord – nt Jaan Poska Disneylandis – on tõene või mitte, siis raamatukogutöötaja paistab selles osas lootuskiirena. Tema on spetsialist, kes oskab juhatada õige riiuli juurde, kus seisavad Poska elulooraamatud, või tutvustab muid võimalusi, kuidas vajalikku infot leida võib. Raamatukoguhoidja on toimetatud info hoidja.

Kuidas teie saate aru, kas pilt või tekst on tehisintellekti loodud?
K: Võimalik on küll mõnikord aru saada, aga hästi rasvases kirjas tuleb lisada, et sellele ei tasu loota. Mõnikord on jah mingi kõhutunne, et see võib nii olla. Tegelen TI teemadega iga päev ja ei ole kindel, et jõuan jälile tehisintellektiga loodule.
Peame alati mõtlema, mida mõni kindel tekst või pilt öelda tahab või milline on selle mõju – eriti kui räägime valeinformatsioonist. Seda saab kerge vaevaga ka ilma tehisintellektita toota ja levitada. Kui me hakkame ainult seda otsima, kas see pilt on võlts või mitte, siis tegelikult küsime vale asja. Siis just laseme end mõjutada, kui pöörame tähelepanu ainult pildi saamisviisile.
L: Nii tekstide kui ka piltide puhul on täheldatud tüüpvigu, mis reedavad tehisintellekti kasutamist, kuid mudelid lähevad järjest paremaks. Näiteks on pildimootorid inimeste kujutamisel eksinud sageli käte, eriti sõrmede joonistamisel. Sellised vead on hakanud kaduma. Olen tähele pannud arutelusid, kuidas internetis oleks tehisintellekti loodud pilte justkui vähem, mis tegelikkuses tähendab tõenäoliselt hoopis seda, et TI pilte on raskem eristada n-ö päris piltidest.
K: Valeinformatsiooni kasutatakse enamasti lihtsalt inimeste tähelepanu saamiseks. Teatud Facebooki-lehed toodavadki sensatsioonilist sisu piltide abil. Näiteks: vaata, siin on kuueaastane tüdruk, kes on maalinud selle imelise pildi. Ja siis seal all on kommentaarid, et oi kui andekas. Muidugi teenib see leht oma lõbuks raha nende klikkide ja tähelepanu pealt.
L: Ja kommenteerijad ei ole sageli päris inimesed, vaid robotid. On tekkinud olukord, kus digitaalses maailmas on järjest keerulisem aru saada, kas juttu aetakse reaalse inimesega või mitte.
K: Surnud interneti teooria ütleb, et internetis aastate jooksul toimunud tehnoloogiliste edusammude tõttu on enamik veebis saadaolevast sisust loonud robotid ja tehisintellekt, mitte inimesed.

Neid uusi infokihte, mida ehitatakse olemasolevate peale, on järjest rohkem. Ja kas varsti olemegi hetkes, kus hakkame juba endas kahtlema ‒ kes ma olen?
K: Siis tasub ChatGPT käest küsida (muigega).

Laura Nemvalts kõneleb tehisintellektist raamatukogudes mäluasutuste suveseminaril.
Foto: Signe Heiberg

Ma arvan, et ta annab ju suunatud vastuse!
L: Hiljuti lisandus ChatGPT-le võimalus sisse lülitada mälu, mis nopib vestlustest kasutaja kohta andmeid. Seega ei pruugi vastus olla mitte ainult suunatud, vaid lausa isikupärastatud. Üks aspekt, mille osas hoiatame, on see, et inimesed ei jagaks juturobotitega isiklikku infot. ChatGPT vestlused jõuavad serveritesse väljaspool Euroopat, kus neid kasutatakse uute mudelite treenimiseks.

Kes on need inimesed, arendajad, kes TI-d n-ö meie hüvanguks arendavad?
K: OpenAI (ChatGPT looja) alustas põhimõtteliselt MTÜ-na. Nende eesmärk oli arendada välja kvaliteetne tehisintellekt enne, kui keegi kuskil teeb seda kuritahtlikul eesmärgil. ChatGPT oligi kvaliteedilt tehnoloogias järgmine samm ja peab nentima, et väga heas n-ö pakendis.
Praegu on OpenAI algsest MTÜ mudelist juba kaugel ja saab palju kriitikat. Kuigi selles nimes on sõna „avatud“ (open), on siiski tegemist eraomanduses oleva tootega. Ainus võimalus osaleda on maksta. Viimase aasta jooksul on OpenAI kõrvale tõusnud Google, kelle mudelid on peaaegu samal tasemel. Lisaks on veel Amazoni alla kuuluv Anthropic, Microsofti Copilot ja natuke teistest erinev Meta. Meta on öelnud teiste üllatuseks, et nemad panustavad avatud mudelitele. Metal on sisuliselt kõige rohkem andmeid, sest talle kuuluvad populaarsed keskkonnad Facebook, Instagram ja WhatsApp. Mõni aeg tagasi muutsid nad oma privaatsustingimusi ja ütlevad nüüd, et võivad kõiki sinu andmeid oma mudelite loomiseks kasutada. Kinnise, eraomandis toote asemel hakkasid nad tegema mudeleid, mida kasutaja saab alla laadida ja käivitada oma isiklikus arvutis. Mõistagi peab see arvuti piisavalt võimas olema. Mudelit saab kasutada lokaalselt, mis annab võimaluse kõigile asutustele ja inimestele, kes ei taha või ei tohi oma andmeid kolmandale osapoolele töötluseks saata, nagu see ChatGPT puhul toimub.

Kas see paistab nagu väikestviisi heategevus?
K: Selles ei saa kindel olla, kuna me ei tea, mis on Meta pikaajalised eesmärgid selles vallas.

Mis saab raamatukogudest viie või kümne aasta pärast?
L: Üks suuremaid muutusi on just info süstematiseerimises ja korrastamises. Raamatukogudel on keeruline vaid inimtööjõuga luua piisavalt head ülevaadet kogu sellest teabest, mis nende valduses on. TI-tööriista ehk kratiga saab aidata kataloogida rohkem teavet vähesema vaevaga. Raamatukogude tööd lihtsustab kindlasti tehisintellekti abil märksõnastamine, kataloogimine, info otsimine jne. Kataloogimine ei puuduta ainult raamatuid, vaid ka perioodikat, veebisaite jpm. Inimesed leiavad vajaliku info paremini ja kiiremini üles. Kui varem jäid väiksed asjad kõrvale, siis tulevikus need kõrvale ei jää ja raamatukogude infosüsteemis (e-kataloogis) saab olema rohkem infot ning see on mugavamini ja kiiremini leitavam.
K: Olen Lauraga nõus, kõik see hakkab mõjutama raamatukogude toimimist. Aga selles, mida raamatukogu kasutajatele tähendab, tehisintellekti tõttu midagi murrangulist ilmselt ei juhtu. Ei ole nii, et tulevikuraamatukogu on fundamentaalselt teistsugune. Raamatukogude põhiolemus on olnud üsna stabiilne juba aastasadu ning võib-olla on hea, kui see jääb nii ka tulevikus.

IFLA tehisintellektist

IFLA on 2023. a novembris avaldatud tehisintellekti teemalises strateegiadokumendis toonud välja keelemudeli ChatGPT peamised probleemid.

Kolm valikulist murekohta, millele pole lahendust leitud

esitab kallutatud väiteid, nt taastoodab kallutatud oletusi soo ja poliitika kohta;
ei kinnita oma allikaid või isegi leiutab neid;
ähvardab kiirendada sisu kontrollimatut loomist ja seda saab kasutada valeuudiste loomiseks, avaliku arvamuse manipuleerimiseks ja polariseerimiseks, valeinformatsiooni levitamiseks ja demokraatia kahjustamiseks või isegi vägivalla õhutamiseks.

Kolm potentsiaalset globaalset ohtu

avaldab olulist keskkonnamõju;
süvendab digitaalset lõhet sotsiaalsete kihtide vahel, sest on ennekõike nende inimeste kasutuses, kellel on raha, ja paneb seeläbi ebasoodsasse olukorda need, kellel raha pole;
võib rikkuda autoriõigusi, kasutades teksti ja andmeid ilma loata. Vähesed keelemudelite pakkujad on teinud kasutatud treeningandmete üksikasjad avalikult kättesaadavaks.

Tehisintellekti tugi raamatukogule

rutiinsetele päringutele vastamine;
kasutajatelt teabe kogumine;
kasutajate toetamine rutiinsete protsesside abil.

Täispikkuses saab lugeda https://www.ifla.org/g/ai/developing-a-library-strategic-response-to-artificial-intelligence/

Kasulikke koolitusmaterjale

Lifehackeri uus sari Exposing A.I.
https://lifehacker.com/series/exposing-ai
Leia TI loodu tekstist ja pildilt, aga ka vestlusest, muusikast, kõnest ja videost.

TI ja ChatGPT juhendid raamatukogudele
https://library.fiu.edu/ai/libguides

1. 1999. a valminud ulmefilm, kus tegevus toimub tehisintellekti loodud virtuaalses tulevikuühiskonnas.
2. KAS TEHISINTELLEKT LOOB VÕI TOODAB? — teater. muusika. kino.

Me ei tea veel, kuidas keelemudel tegelikult õpib

IFLA tehisintellektist

Kasulikke koolitusmaterjale

Liitu Eesti Rahvusraamatukogu uudiskirjaga