На Универзитету Paris-Saclay 16. и 17. марта одржан је скуп у оквиру COST акције UniDive
CA21167: Universality, diversity and idiosyncrasy in language technology. На скупу су одржани
различити састанци и сесије: заједнички и они посвећени појединим радним групама (WG
1–4), као и састанак водећег тима (core group).
На скупу је, на постер сесији, представљен и постер проф. др Цветане Крстев (проф. УБ ФФ
у пензији, ЈЕРТЕХ), проф. др Ранке Станковић (УБ РГФ), др Александре Марковић (ИСЈ
САНУ), под насловом Multiword Expressions – Comparative Analysis Based on Aligned
Corpora.
Циљ рада је истраживање унутарјезичких и међујезичких сличности и разлика у употреби
симила. Трагало се за разликама у изворном појму у различитим језицима, као и за
различитим начинима за изражавање поређења (симили, суперлатив, сложеница и сл.).
Истраживање је засновано на четири двојезична паралелизована корпуса углавном
књижевних текстова, и то енглеског, француског, немачког, италијанског као првог и
српског као другог језика (корпуси су претраживи и доступни регистрованим
корисницима; више о томе в. у самом апстракту, фуснота 1).
Симили имају препознатљиву структуру: субјекат и објекат поређења, поредбени везник и
основ поређења. У претходним радовима (Mitrović et al., 2020; Krstev 2021) сакупљено је
558 симила у српским књижевним текстовима и представљена њихова структура у виду
коначних аутомата. Сваки од њих описује могуће лексичко-синтаксичке варијанте симила.
У раду је пажња усмерена на начин на који се симили преводе. Поређење које је у једном
језику изражено у форми симила на други језик може и не мора бити преведено у истој
форми. Тако се у италијанском често користи супералтив (…mi parve palidissimo :
…изгледао ми је блед као крпа (Pirandello), у немачком сложенице (Zu einem schneeweiẞen
Hemd… : Поред као снег беле кошуље… (Dor) итд.
За будуће истраживање предвиђено је проналажење још неких начина за изражавање
поређења, као и додатна анотација корпуса (синтаксичка) у складу са препорукама Акције
(Universal Dependencies, Parseme). Уочено је да превођење симила представља изазов за
преводиоце, јер различити језици и културе могу имати разне начине за изражавање исте
идеје, а уз то, неки симили могу бити одраз културно-историјских специфичности.
Вишејезички лексикон с паралелизованим симилима, потврђен примерима, могао би да
олакша превођење и машинско превођење.
Заинтересовани могу погледати програм скупа на линку:
https://unidive.lisn.upsaclay.fr/doku.php?id=meetings:general_meetings:1st_unidive_general_
meeting#program ).
Апстракт, постер и слајд налазе се на линку:
https://unidive.lisn.upsaclay.fr/doku.php?id=meetings:2023-saclay:abstracts#session_a}