У оквиру акредитованог семинара „Језички модели у служби проучавања српског културног наслеђа“, одржаног у Научно-културно-образовном центру „Вук Караџић“ у Тршићу, у периоду од 8. до 12. децембра 2025. године, реализован је програм усмерен на представљање савремених приступа дигиталне хуманистике и примене језичких технологија у истраживању, анализи и презентацији српског културног наслеђа. Семинар је окупио стручњаке из области библиотекарства, рачунарске лингвистике и дигиталне хуманистике, са циљем јачања компетенција учесника за рад са дигитализованом текстуалном грађом и напредним алатима за њену обраду.
У уводном делу семинара, др Василије Милновић из Универзитетске библиотеке „Светозар Марковић“ представио је основне концепте дигиталне хуманистике, са посебним освртом на циљеве, задатке и прве резултате актуелних пројеката усмерених на дигитализацију и аналитичку обраду културног наслеђа,посебно се осврћући на пројекат ПИСАН (Платформа за истраживање дигитализованог садржаја новинских колекција). Посебан нагласак стављен је на улогу библиотека као кључних актера у процесу дигиталне трансформације хуманистичких истраживања.
Наставак програма обухватио је видео предавање др Александре Тртовaц, која је из угла библиотекара представила процес дигитализације и аутоматске транскрипције текстова, уз демонстрацију алата Transkribus, чиме су учесници упознати са практичним аспектима претварања скениране грађе у машински читљив текст, као и са изазовима и могућностима примене ових технологија у раду са историјским изворима.
Посебан сегмент семинара био је посвећен корпусима, пре свега корпусу SrpELTeC, који је представљен кроз корак-по-корак приступ изградњи и обради корпуса. Проф. др Цветана Крстев је на примеру колекције „Нова искра“ (део пројекта ПИСАН), приказала поступке припреме, структурирања и аналитичке употребе дигитализованих текстова, а потом је др Михаило Шкорић, приказао ресурсе, моделе и алате развијене у оквиру пројекта ТЕСЛА. Приказана је и нова генерација модела за оптичко препознавање карактера (OCR).
Практични део семинара обухватио је рад са алатом TXM, где је кроз интерактивне сесије приказана инсталација система, учитавање корпуса, дефинисање својстава и партиција корпуса, као и основне и напредне могућности за лексичку и текстометријску анализу. Кроз примере TXM издања корпуса Бране Ћосића, проф. др Душко Витас је учесницима илустровао неке од могућности савремених аналата за изградњу и анализу корпус писца.
Проф. др Ранка Станковић је приближила рад у алату TXM кроз рад са речником текста, конкорданцама, индексима и специфичностима корпуса, као и кроз креирање различитих упита над колекцијама текстова. У наставку програма, представљени су повезани подаци о корпусима српских романа у бази знања Википодаци, као и поступци препознавања именованих ентитета и њиховог повезивања са спољним изворима знања. Даље је било речи о класификацији романа применом великих језичких модела, при чему су истакнуте могућности аутоматске тематске и жанровске анализе књижевних текстова.
Током целокупног семинара, значајна пажња посвећена је практичном раду и подршци полазницима, коју су пружали Саша Петалинкар и Јована Рађеновић. Захваљујући комбиновању теоријских предавања и практичних вежби, учесници су стекли целовит увид у савремене методе и алате за рад са дигитализованим културним наслеђем, као и конкретна знања применљива у даљем истраживачком и стручном раду.

