Slovenska LLM Areno: Prihodnost vrednotenja jezikovnih modelov v Sloveniji
0.25
0.5
0.75
1.25
1.5
1.75
2
Evalvacija velikih jezikovnih modelov za slovenščino predstavlja poseben izziv. Že tako pomanjkljive evalvacijske množice ne povejo celotne zgodbe. V ta namen smo v okviru projekta Povejmo postavili Slovensko LLM areno (arena.cjvt.si). Gre za spletno platformo, kjer lahko uporabniki ocenjujejo modele. Takšna platforma predstavlja pomemben temelj za prihodnost tako iz vidika evalvacije modelov kot pridobivanja učnih podatkov za prilagajanje s človeškimi preferencami. V tem predavanju predstavimo motivacijo za razvoj arene, njeno implementacijo ter prve rezultate.