Семинари Друштва за језичке ресурсе и технологије

Поштоване колегинице и колеге,

Срдачно Вас позивамо да присуствујете Семинарима Друштва за језичке ресурсе и технологије – ЈеРТех.

Први Семинар ће бити одржан у четвртак, 9. маја 2019. године од 18.15 у свечаној сали Рударско-геолошког факултета, Ђушина 7. Том приликом ће бити представљена излагања:

Јелена Јаћимовић, Универзитет у Београду, Стоматолошки факултет – „Могућности употребе ТXМ софтвера за анализу и визуелно представљање дигиталних текстуалних корпуса

Електронски корпуси представљају веома важне и практичне изворе емпиријских података неопходних за спровођење лингвистичких истраживања. Достигнућа у развоју језичких технологија омогућавају аутоматску обраду и анализу многих језичких чињеница, као и њихове стварне обрасце употребе у природним текстовима. Заснован на текстометрији, методологији која омогућава квантитативну и квалитативну анализу текстуалних корпуса, ТXМ је софтвер отвореног кода, веома коришћен у истраживањима различитих области хуманистичких наука (историја, књижевност, географија, лингвистика, социологија, политичке науке). ТXМ окружење нуди могућност проучавања за статистичке потребе задовољавајући обимне грађе, употребу различитих алата за обраду улазних текстова природних језика (нпр. аутоматских лематизатора), велики број улазних формата теста, изградњу поткорпуса или партиција на основу метаподатака (датум, аутор, жанр итд.) или структурних јединица корпуса (текст, одељак итд.), постављање упита (помоћу CQP претраживача) и сложенију аутоматску обраду резултата упита засновану на квантитативним методама, као и извоз резултата у табеларном или графичком облику.

Саша Петалникар, Медијски архив Ебарт, Бeoград – „Медијски архив Ебарт као извор за писане и говорне корпусе

Ебарт медијски архив основан је у фебруару 2000. године, током режима Слободана Милошевића, како би била сачувана грађа штампаних медија у оквиру независне организације, прве такве врсте у Србији. Од јануара 2003. до данас, Ебарт архивира текстове из дневних новина и периодичних штампаних издања, која се дистрибуирају на националном нивоу. Други део архива, од значаја за ову презентацију је видео архив.
Ебартов медијски архив може бити коришћен као извор за стварање корпуса текстова и из тог разлога ће ова дискусија у највећој мери бити фокусирана на дигитални архив штампаних медија: на процес уношења нових новинских текстова, на начин на који се подаци чувају и организују и на начин на који се може приступити подацима. Такође, биће представљено и неколико примера како је архив коришћен у прошлости и како може бити значајно унапређен.
Овај архив може бити коришћен и као извор за стварање говорног корпуса, који потиче од централних информативних емисија ТВ станица са националном покривенишћу и локалне ТВ Студио Б.

Други Семинар ће бити одржан у четвртак, 30. маја 2019. године, од 18.15 у свечаној сали Рударско-геолошког факултета, Ђушина 7.

Јелена Андоновски ће одржати излагање на тему „Мрежа отворених података и језички ресурси у процесу изградње српско-немачког литерарног корпуса“.

Паралелни вишејезични корпуси представљају врсту језичких ресурса који су последњих деценија постали изузетно значајни у области обраде природних језика и један од важнијих ресурса за истраживаче у различитим областима лингвистике и сродним језичким дисциплинама. Српско-немачки књижевни корпус, СрпНемКор, садржи четрнаест романа написаних у другој половини 20. и првој половини 21. века, седам романа оригинално написаних на српском и њихови еквиваленти на немачком језику и седам романа оригинално написаних на немачком (четири припадају аустријској књижевности, три припадају немачкој књижевности) и њихови еквиваленти на српском језику. Како би биле истражене могућности двојезичне претраге СрпНемКор је постао део дигиталне библиотеке Библиша. Овом приликом анализиране су могућности морфолошких и семантичких проширења упита на српском и немачком језику позивањем расположивиј лексичких ресурса. Посебно је анализирана могућност проширења упита заснована на синонимим позивањем терминолошке базе Терми која је овом приликом допуњена листом немачко-српских преводних парова лексичких јединица eкстраховане из самог корпуса. Добијена листа преводних парова је, такође, послужила и за генерисање двојезичног речника општег типа као скуп повезаних података при чему су тестиране и неке технологије семантичког веба и поступак публиковања у облаку „отворени повезани подаци”.

Name of author

Name: admin

replique montre suisse replique montres de luxe
Fussball hallenschuhe detské kopačky voetbalschoenen sale fotbollsskor webshop Scarpe calcio scontate chaussure de football pas cher billige fotballsko på nett på Fotbalove Dresy futbalove dresy na predaj billige fotballdrakter maglie calcio online maillot de foot personnalisé billige fodboldtrøjer replica uhren kaufen fussball trikots kaufen koszulki nba sklep køb billige nba trøjer