Чланови друштва Јертех су се представили са два рада на Осмом међународном конгресу примењене лингвистике данас – савремени приступи старим и новим изазовима, који је од 23. до 25. маја 2025. године одржан на Филолошком факултету Универзитета у Београду https://alt8.fil.bg.ac.rs/
Др Александра Марковић је презентовала рад Примена великих језичких модела у српској описној лескикографији – студија случаја, настао у коауторству с проф. др Ранком Станковић. Представљена су три експеримента. Први експеримент је подразумевао захтев да одабрани језички модели (Gemini 2.5 Flash Preview и ChatGPT 4.5) генеришу дефиниције за 346 одабраних вишечланих лексичких јединица, које припадају разним врстама речи. Дефинисање и значења вишечланих лексичких јединица, као и њихово препознавање у тексту, представљају велики изазов у обради природних језика, због сложене природе (специфичне морфолошке појаве, могућа дисконтинуираност чланова и др.). Због тога је правилно препознавање њиховог значења веома важно. Дефиниције које су модели понудили анализиране су са садржајног и формалног аспекта, и резултати те анализе су представљени. Друга два експеримента тицала су се вишечланих лексичких јединица са идиоматизованим, али и неидиоматизованим значењем. Од модела (Gemini 2.5 pro, ChatGPT 4.5 i ChatGPT 4o) у другом експерименту се тражило да генеришу идиоме српског језика који имају и неидиоматизовано значење, да издвоје њихова значења и понуде дефиниције и илустративне примере. У трећем експерименту захтев је био да се за одабраних 10 идиома српског језика издвоје значења, генеришу дефиниције и илустративни примери. Апстракт и презентацију доступни на https://zenodo.org/records/15516399
Др Милица Динић Маринковић је презентовала рад Примена језичких технологија у издвајању вишечланих лексичких јединица из текста уџбеника, настао у коауторству с проф. др Ранком Станковић и мр Милицом Иконић Нешић. Корпус за ово истраживање су чинили уџбеници Географије од петог до осмог разреда основне школе. За екстракцију терминологије је коришћен скуп алата заснован на електронским речницима српског језика и трансдукторима (Крстев, Витас) и алату Лексимир и други алати које развија Друштво за језичке ресурсе и технологије ЈеРТех. Препознавање, обележавање и екстракција именованих ентитета се заснивају на примени модела и алата развијених у оквиру пројекта ТЕСЛА. Више на: https://doi.org/10.5281/zenodo.15518009