Priprava učne množice za opredelitev kolokativnosti in druge dejavnosti v projektu KOLOS
Priprava učne množice za opredelitev kolokativnosti in druge dejavnosti v projektu KOLOS
0.25
0.5
0.75
1.25
1.5
1.75
2
Avtomatsko luščenje kolokacij temelji predvsem na izračunu statističnih sopojavitev besed v besedilnem korpusu, vsi tako izluščeni kandidati pa niso ustrezni. Da bi opredelili, kaj je legitimna statistična kolokacija na eni in slovarsko relevantna kolokacija na drugi strani, smo pripravili učno množico kolokacij, ročno razvrščenih v različne kategorije. Rezultati označevanja učne množice so uporabni ne samo za opredelitev kolokativnosti, temveč tudi za identifikacijo najpogostejših težav pri luščenju in s tem potencialnih izboljšav avtomatske metode.