Saates on külas TLÜ tehisaru külalislektor Krister Kruusmaa.
Räägime tehisintellektist, tehisaru baromeetrist - baromeeter.ai.
Tehisaru baromeeter (baromeeter.ai) on platvorm, mille meie külaline on koos kolleegidega mitmest ülikoolist loonud hindamiseks, kui hästi tehisarud eesti keelt ja meelt tunnevad.
Kuidas see töötab? Asi on lihtne - sisesta viip, loe kahe erineva tehisaru vastust ja vali neist parem. Nendest pisikestest duellidest moodustub jooksev edetabel, mis näitab, millised keelemudelid eestlaste jaoks parasjagu kõige targemad ja loomulikumad on.
Saadud andmeid (kasutajate eelistusi) saab kasutada selleks, et mudelid eesti keeles mõistlikumaks teha, st neid näidete abil edasi õpetada. See on ülivajalik näiteks selleks, et sügisel koolidesse tulevad süsteemid päris napakad ei oleks: ei peaks Nõukogude perioodi parimaks osaks Stalini aega ega arvaks, et Katku Villu on see, kes Eestisse katku tõi, või et ühe naksitralli nimi on Noksitrall (kõik päris näited). Selliste nõrkuste otsimine on lõbus, aga aitab tegelikult kaasa eesti keele ja kultuuri püsimiseks.
.......
Tehisaru baromeeter on Eesti teadlaste loodud platvorm, mille eesmärk on hinnata, kui hästi mõistavad ja kasutavad tänapäeva tehisarud eesti keelt. Veebilehel baromeeter.ai saab võrrelda erinevate keelemudelite vastuseid ning aidata kaasa nende järjestamisele – ja seeläbi eesti keele ja meele hoidmisele tehisaru ajastul.
Platvormi arendavad koostöös Tartu Ülikool, Tallinna Tehnikaülikool, Tallinna Ülikool ja Eesti Keele Instituut. Tehisaru baromeeter tugineb avatud lähtekoodiga ChatBotArena platvormile, mille töötasid välja California Ülikooli Berkeleys ja LMSYS teadlased. Algne platvorm on kohandatud emakeelseks, et paremini hinnata keelemudelite võimekust just eesti keeles.
Tehisaru baromeetril on kolm funktsiooni:
* Regulaarselt uuenev edetabel: Kasutajate hinnangute põhjal kujuneb pidevalt uuenev järjestus, mis näitab, millised mudelid on eesti keeles kõige kvaliteetsemad. Edetabel peegeledab nii mudelite keeleoskust, faktiteadmisi, ohutust kui stiili ja iseloomu.
* Andmete kogumine keelemudelite arendamiseks: Iga antud hinnang ja küsimus aitab teadlastel koguda väärtuslikku sisendit, mida saab kasutada keelemudelite peenhäälestamiseks parema eesti keele toetuse eesmärgil.
* TI-teadlikkuse tõstmine: Baromeeter on hea võimalus katsetada erinevaid keelemudeleid, võrrelda vastuseid ning saada paremat aimu keelemudelite tugevustest ja nõrkustest just meie keelekeskkonnas.
Kutsume kõiki huvilisi osalema! Projekti esialgne eesmärk on koguda kokku 50 000 võrdlust (praegust häälte arvu näed edetabeli vahelehel). Iga klikiga aitad parandada eesti keele nähtavust tehisaru maailmas.
Meeskond:
Kairit Sirts (projektijuht), Tartu Ülikool
Hele-Andra Kuulmets, Tartu Ülikool
Aleksei Dorkin, Tartu Ülikool
Krister Kruusmaa, Tallinna Ülikool
Kommentaarid
Alates 02.04.2020 kuvab ERR kommenteerija täisnime.