ELG ресурси и алати

Следе језички ресурси и алати развијени под окриљем Друштва ЈеРТех а доступних путем портала ELG. Услове коришћења можете проверити на страни ELG кликом на назив ресурса или алата.

Корпуси

  • SrpELTeC-gold – Named Entity Recognition Training corpus for SerbianКорпус за тернирање препознавања именованих ентитета је поткорпус књижевног корпуса српског језика који садржи 11 романа у пуном тексту и исечке 15 романа написаних пре више од једног века. У првој фази припреме је обележен системом SrpNER.
  • SrpKor4Tagging – Корпус је формиран комбинацијом књижевних (⅓) и административних (⅔) текстова на српском језику. Обележен је са два скупа ознака за врсте речи: Universal POS и SrpLemKor (скуп креиран на основу традиционалне, дескриптивне граматике српског језика) и лематован.
  • RudKorP – Српски јавни корпус текстова из области рударства и обраде минералних сировина настао на Универзитету у Београду, Рударско-геолошком факултету.

Модели

  • SrpCNNERNamed Entity Recognizer for Serbian (7 classes) – Препознавач именованих ентитета обучен да препознаје 7 типова именованих ентитета, са архитектуром Конволуцијске неуронске мреже (Convolutional Neural Network – CNN), са скором F1 од око 91% на тестном скупу података. 
  • SrpKor4Tagging-TreeTagger – TreeTagger модел за обележавање скуповима ознака Universal POS и SrpLemKor, обучен коришћењем анотираног корпуса SrpKor4Tagging и речника SrpMD4Tagging.
  • SrpKor4Tagging-spaCy – Модели spaCy за обележавање врстама речи коришћењем скупа ознака Universal POS и SrpLemKor, обучени коришћењем анотираног корпуса SrpKor4Tagging.

Речници

  • SrpMD – Serbian Morphological Dictionaries – Морфолошки речници за српски језик следе методологију и формат (познат као DELAS/DELAF) који су развијени у Лабораторији LADL (Laboratoire d’Automatique Documentaire et Linguistique).
  • SrpMD4Tagging – Serbian Morphological Dictionaries for Tagging – Морфолошки речници српског језика за обележавање изведени из Морфолошких речника српског језика (Krstev & Vitas)  као референтни речници за придруживање леме и ознаке врсте речи облику речи пронађеном у тексту. Доступне су две датотеке са скупом ознака за обележавање врстама речи: Univesal Dependencies и традиционални скуп ознака Serbian POS.
  • GeolISSTerm – Речник геолошких термина је електронски речник у виду таксономије посебне намене основних геолошких појмова и термина. GeolISSTerm је део Геолошког информационог система Србије (GeolISS) и користи се за валидацију, класификовање и спецификовање уочених и интерпретираних геолошких атрибута.

Алати

  • Bibliša – Алат за вишејезичне дигиталне библиотеке Библиша је јавно доступна дигитална библиотека развијена за управљање, претрагу и прелиставање поравнатих двојезичних текстуалних колекција. Заснована је на бази података MongoDB (NoSQL).
  • LeximirkaЛексичка база података и апликација на вебу која служи за развој, управљање и истраживање лексичких података. Омогућава контролу лексичких записа, аутоматску допуну речника, вишекориснички рад и успостављање веза међу лексичким записима.

ELG сервиси

  • SrpCNNER service – Веб-сервис који омогућава обележавање текста коришћењем SrpCNNER следећим скуповима ознака: PERS, ROLE, LOC, DEMO, ORG, WORK & EVENT. 

replique montre suisse replique montres de luxe
Fussball hallenschuhe detské kopačky voetbalschoenen sale fotbollsskor webshop Scarpe calcio scontate chaussure de football pas cher billige fotballsko på nett på Fotbalove Dresy futbalove dresy na predaj billige fotballdrakter maglie calcio online maillot de foot personnalisé billige fodboldtrøjer replica uhren kaufen fussball trikots kaufen koszulki nba sklep køb billige nba trøjer