На новембарском Семинару Друштва за језичке ресурсе и технологије ЈеРТех, који ће се одржати 23. новембра 2023. године од 18 часова на Рударско-геолошком факултету (Ђушина 7), предавање
„Теоријско-методолошки оквир за изградњу електронског корпуса српских средњовековних повеља и писама“
одржаће проф. др Владимир Поломац са Одсека за филологију (Катедра за српски језик) Филолошко-уметничког факултета Универзитета у Крагујевцу.
Сажетак:
У излагању ће бити представљени основни теоријско-методолошки принципи за изградњу електронског корпуса српских средњовековних повеља и писама, најобимнијег и најзначајнијег поткорпуса будућег историјског електронског корпуса српског језика. Након дефинисања историјског корпуса српског језика и места средњовековних повеља и писама у њему, посебно с обзиром на принципе репрезентативности, поузданости и балансираности историјских корпуса, биће представљени и основни принципи за припрему и приређивање текстова за корпус (израда регистра текстова, дефинисање метаподатака, принципи преношења текстова у електронски облик), као и основни принципи лематизације и морфосинтаксичке анотације текстова. Посебна пажња биће посвећена коришћењу информационих технологија заснованих на принципима вештачке интелигенције и машинског учења у аутоматском препознавању и аутоматској морфосинтаксичкој анотацији текстова.