RADIONICE
TESLA
OBRADA SRPSKOG JEZIKA KAO POMOĆ U LEKSIKOGRAFSKOM RADU
Predavač: Ranka Stanković (ranka.stankovic@rgf.bg.ac.rs )
⚠️ Prijavljivanje ⚠️
[ PRIJAVNI OBRAZAC ]
Radionica je namenjena svima koje interesuju savremene tehnike i metode u obradi prirodnih jezika, posebno one koje mogu pomoći u lingvističkim istraživanjima i leksikografskom radu. Kako je radionica je prvenstveno namenjena obradi srpskog jezika, polaznici će se prvo upoznati s resursima i alatima koje je za srpski jezik razvilo Društvo za jezičke resurse i tehnologije JeRTeh, uključujući one koji se zasnivaju na vektorskoj reprezentaciji reči a koji nastaju u sklopu projekta TESLA Fonda za nauku Republike Srbije.
Cilj radionice je da pokaže polaznicima kako mogu da koriste jednojezične i dvojezične korpuse Jerteh-a, a potom i da kreiraju sopstvene korpuse. Praktične vežbe obuhvatiće postavljanje upita nad korpusima, pretragu obeleženih entiteta, kao i višejezičnu pretragu paralelnih korpusa. Drugi deo radionice biće posvećen kreiranju i tekstometrijskoj analizi sopstvenih korpusa korišćenjem alata TXM. Za vežbe će biti pripremljeni tekstovi iz korpusa srpskih romana (1840–1920) SrpELTeC i italijansko-srpskog korpusa književnih tekstova It-Sr-NER.
Polaznicima će biti potreban računar za aktivan rad tokom radionice.
Organizatori:
Ranka Stanković (Univerzitet u Beogradu – Rudarsko-geološki fakultet)
Biljana Rujević (Univerzitet u Beogradu – Rudarsko-geološki fakultet)
Mihailo Škorić (Univerzitet u Beogradu – Rudarsko-geološki fakultet)
Cvetana Krstev (Društvo za jezičke resurse i tehnologije – JeRTeh)
Duško Vitas (Društvo za jezičke resurse i tehnologije – JeRTeh)
Datum:
27. 5. 2024. od 9.00 do 12.30
Mesto:
Filološki fakultet, Sala za sednice (prvi sprat)
Raspored:
09.00 — Korpusi JeRTeh-a i njihova pretraga
09.30 — Korišćenje modela i alata JeRTeh-a
10.00 — Vektorske reprezentacije reči
10.30 — pauza
11.30 — Kreiranje korpusa korišćenjem alata TXM
11.45 — Tekstometrijska analiza korpusa
CLASSLA-Express
UPOTREBA RAČUNALNIH KORPUSA U JEZIČNIM ISTRAŽIVANJIMA I LEKSIKOGRAFIJI
Voditeljica: Ivana Filipović Petrović (ifilipovic@hazu.hr)
⚠️ Prijavljivanje ⚠️
[ PRIJAVNI OBRAZAC ]
Radionica je namijenjena svima koje zanima upotreba računalnih korpusa u jezičnim istraživanjima i leksikografiji. Praktične vještine koje će sudionici steći mogu se primijeniti u nastavi jezika (i prvog i drugog jezika), izradi rječnika i gramatika utemeljenih na korpusima, kao i u digitalnim humanističkim istraživanjima.
Cilj je radionice pokazati sudionicima kako koristiti CLASSLA web korpuse u jezičnom istraživanju. Provest će se praktične vježbe koje pokazuju kako kreirati upite u korpusima za hrvatski, srpski i slovenski jezik kako bi se dobili podaci o značenjima i upotrebi riječi, oblicima riječi, kolokacijama i gramatičkim obrascima. Osim toga, vježbe će omogućiti sudionicima istraživanje upotrebe riječi i leksičko-gramatičkih konstrukcija u različitim vrstama tekstova.
Za sudjelovanje je potrebno imati prijenosno računalo.
Organizatori:
Ivana Filipović Petrović (Hrvatska akademija znanosti i umjetnosti, Zagreb)
Jelena Parizoska (Učiteljski fakultet, Zagreb)
Taja Kuzman (Institut Jožef Stefan, Ljubljana)
Nikola Ljubešić (Institut Jožef Stefan, Ljubljana)
Datum:
29. 5. 2024. од 14.30 до 18.30
Mjesto:
Filološki fakultet, Sala za sednice (prvi sprat)
Raspored:
14.30 — Uvod
CLARIN.SI i izrada korpusa CLASSLA
upotreba računalnih korpusa u jezičnim istraživanjima i leksikografiji
15.00 — praktični rad na korpusima CLASSLA
16.00 — stanka za kavu
16.30 — praktični rad na korpusima CLASSLA
18.00 — rasprava