Učenje povzemanja besedil s pretvorbo v semantično mrežo
Delo Jurija Leskovca, pod mentorstvom akad. prof. dr. Ivana Bratka, sodi na področje elektronske obdelave dokumentov v naravnem jeziku. Ukvarja se s težkim problemom avtomatske izdelave povzetkov besedil. Zaradi vrtoglavo naraščajoče količine elektronsko dostopnih dokumentov je to področje raziskav izrednega praktičnega pomena. Leskovec je izdelal sistem, ki z globoko stavčno analizo določi logično strukturo besedila. Iz te strukture izloči trojice osebek-povedek-predmet, ki jih poveže v semantični graf. Iz množice primerov takih grafov se sistem z metodo podpornih vektorjev sam nauči razpoznavati, katere trojice sodijo v povzetek in katere ne. Leskovec je s poskusi na velikih bazah podatkov pokazal, da je njegov pristop učinkovit in zelo obetaven v primerjavi z obstoječimi metodami.