Lietuviškas sinonimų žodynas – tūkstančiai žodžių našlaičių

Publikuota: 2011 m. lapkričio 21 d. pirmadienis

Pirmasis lietuvių kalbos elektroninis sinonimų žodynas „Sinonimai.lt“ pradėjo veikti 2010 m. Tai – visuomeninis projektas, kurio tikslas ­– įtraukti visuomenę ir ypatingai jaunimą į kalbos puoselėjimo ir turtinimo veiklą. Kuo gi ypatingas šis žodynas ir su kokiais iššūkiais susiduriama jį tobulinant?

Priešingai nuo daugumos žodynų (pvz., kalbinių ar terminų žodynų), sinonimų žodynas išsiskiria savo sudėtingumu. Jį sudarant, iškyla vartojimo pavyzdžių, kalbinių ypatybių priskyrimo, prasminių grupių įvardinimo bei morfologinės analizės užduotys.

Kaip šias užduotis išsprendė sinonimų žodynas?

Šiuo metu sinonimų žodyną sudaro daugiau nei 40 000 įrašų. Norint priskirti kiekvienam sinononimui vartojimo pavyzdį ir nustatyti jo prasminę grupę, vienas žmogus sugaištų ne vienerius metus.

Sinonimų žodynas naudojasi tekstine duombaze, kurią sudaro 18 000 psl. tekstų, paimtų iš įvairiausių lietuvių literatūros kampelių, pradedant 1650 m. parašytu Mažvydo katekizmu ir apimant daugmaž visą lietuvių literatūros klasiką (nors duomenų skaičius atrodo didelis, deja to užtenka tik apytiksliai 60 proc. atvejų).

Kai sistemos administratorius prisijungia prie valdymo pulto, sinonimų žodyno programa neria ieškoti pagalbos į anksčiau minėtą duomenų bazę. Žodyno programa naudoja algoritmą, kuris atlieka žodžio morfologinę analizę, sukuria visų jo įmanomų formų masyvą ir atlieka šimtus užklausų, kurios tikrina tekstus duomenų bazėje ir atrenka sakinius, kuriuose buvo pavartota viena iš užklausiamo žodžio formų. Kai programa baigia savo darbą, administratorius turi perskaityti visas pateiktas ištraukas kol suranda vieną, kurioje pavartotas žodis atitinka sinonimo prasminę grupę.

Kitas žingsnis reikalauja sutikrinti duomenis su LKŽ ir kitais autentiškais šaltiniais, surasti naujus sinonimus ir nustatyti antonimus. Įvestus duomenis dar kartą patikrina sistemos vyr. administratorius. Taip nauji duomenys atsiranda sinonimų žodyne.

Tūkstančiai žodžių našlaičių

Sinonimų žodynas yra nekomercinis projektas, tačiau žmonės, kurie palaiko projekto idėją, skiria nemažą savo laiko dalį tobulindami šitą įrankį.

Šiuo metu sinonimų žodyno duomenų bazėje yra apie 200 tūkstančių dar nesugrupuotų žodžių, kurie neturi sinonimų ir nėra sinonimai kitems žodžiams. Be abejo, dauguma jų yra tarmybės, kurios šiuolaikinėje kalboje yra menkai naudojamos.

Kiekvienas sinonimų žodyno naudotojas gali padėti sutvarkyti duomenų bazę, pasiūlydamas sinonimus, kurių kitų projekto dalyvių galvos dar nesugalvojo. Vartotojai skatinami prizais.

Sinonimų žodyno perspektyva

Kiekvieną dieną sinonimų žodyną aplanko apie 600 žmonių. Tai nedaug, tačiau vidutiniškai kiekvienas žmogus per dieną atlieka 20 užklausų. Iš to galime padaryti išvadą, kad sinonimų žodynas yra naudingas įrankis, tačiau dar nedaug žmonių apie jį žino. Tekste užsiminta apie antonimus – vieną dieną galbūt sinonimų žodyną papildys ir brolis antonimų žodynas.

Šaltinis: technologijos.lt
Kopijuoti, platinti, skelbti bet kokią portalo News.lt informaciją be raštiško redakcijos sutikimo draudžiama.

facebook komentarai

Naujas komentaras


Captcha

susiję straipsniai

Populiariausi straipsniai

Dilema nerandantiems darbo: laukti, kol pasikeis rinka, ar persikvalifikuoti?

Nors šių metų rugpjūčio 1 d. Lietuvos darbo biržoje buvo registruota 134,1 tūkst. darbo ieškančių žmonių, nesutampa darbdavių ir darbuotojų lūkesčiai dėl darbo pobūdžio. skaityti »

Rugsėjo stresas: kaip apsaugoti pirmokus ir abiturientus?

Pasak sveikatos specialistų, ruduo kai kuriems moksleiviams, ypač pradinukams ir gimnazistams, sukelia nervinę įtampą, o sergančių jaunuolių skaičiai šokteli kelis kartus. skaityti »

Geriausiems Lietuvos studentams – vardinės LR prezidentų stipendijos

Švietimo ir mokslo ministrė Jurgita Petrauskienė pasirašė įsakymą dėl prezidentų stipendijų 2017–2018 studijų metams skyrimo. skaityti »

Beveik pusė Lietuvos tėvų už vaikų lavinimą planuoja mokėti pinigus

Lietuvos tėvai vis daugiau dėmesio ir finansų skiria vaikų lavinimui bei ugdymui. skaityti »

Jaunieji geografai tarptautinėje olimpiadoje pasipuošė visų spalvų medaliais

Lietuvos jaunųjų geografų komanda iš Serbijoje vykusios tarptautinės geografijos olimpiados grįžo su visų spalvų medaliais. Lietuvos atstovai iškovojo vieną aukso, du sidabro ir vieną bronzos medalius. Tai geriausias Lietuvos komandos pasiekimas per visą geografijos olimpiadų istoriją. skaityti »

Skiriant valstybės finansavimą moksliniams tyrimams – orientacija į kokybę

Finansuojant mokslinius tyrimus ypatingas dėmesys bus skiriamas kokybei. 60 proc. lėšų moksliniams tyrimams bus skiriama pagal kokybinius parametrus, 40 proc. lėšų – pagal kiekybinius rodiklius. skaityti »

Į pagalbą mokytojams: parengtos rekomendacijos, padėsiančios atpažinti smurtą patyrusius vaikus ir jiems padėti

Mokytojai ir kiti mokyklos darbuotojai gali greičiausiai pastebėti skriaudžiamą vaiką ir jam padėti. skaityti »

Regionų bibliotekose – nemokama teisinė pagalba

Prieš kelis mėnesius pradėję teikti nemokamą teisinę pagalbą nuotoliniu būdu, Vilniaus universiteto (VU) Teisės klinikos konsultantai pastebi: teisinių paslaugų poreikis yra didžiulis, tačiau jos įkandamos ne visiems. skaityti »

Priimamos paraiškos dėl atnaujintos Vlado Jurgučio premijos ir naujos Lietuvos banko premijos už disertaciją

Visą rugpjūtį ir pirmąją rugsėjo pusę Lietuvos bankui galima teikti paraiškas dėl dviejų premijų, skiriamų už ekonomikos srities mokslinės veiklos pasiekimus. skaityti »

Irane vykusioje tarptautinėje informatikos olimpiadoje pelnytas bronzos medalis

Liepos 28–rugpjūčio 4 dienomis Teherane Irane vykusioje tarptautinėje informatikos olimpiadoje Kauno technologijos universiteto gimnazijos dešimtokas Gediminas Lelešius (mokytoja Kristina Serapinaitė) laimėjo bronzos medalį. skaityti »