Lietuviškas sinonimų žodynas – tūkstančiai žodžių našlaičių

Publikuota: 2011 m. lapkričio 21 d. pirmadienis

Pirmasis lietuvių kalbos elektroninis sinonimų žodynas „Sinonimai.lt“ pradėjo veikti 2010 m. Tai – visuomeninis projektas, kurio tikslas ­– įtraukti visuomenę ir ypatingai jaunimą į kalbos puoselėjimo ir turtinimo veiklą. Kuo gi ypatingas šis žodynas ir su kokiais iššūkiais susiduriama jį tobulinant?

Priešingai nuo daugumos žodynų (pvz., kalbinių ar terminų žodynų), sinonimų žodynas išsiskiria savo sudėtingumu. Jį sudarant, iškyla vartojimo pavyzdžių, kalbinių ypatybių priskyrimo, prasminių grupių įvardinimo bei morfologinės analizės užduotys.

Kaip šias užduotis išsprendė sinonimų žodynas?

Šiuo metu sinonimų žodyną sudaro daugiau nei 40 000 įrašų. Norint priskirti kiekvienam sinononimui vartojimo pavyzdį ir nustatyti jo prasminę grupę, vienas žmogus sugaištų ne vienerius metus.

Sinonimų žodynas naudojasi tekstine duombaze, kurią sudaro 18 000 psl. tekstų, paimtų iš įvairiausių lietuvių literatūros kampelių, pradedant 1650 m. parašytu Mažvydo katekizmu ir apimant daugmaž visą lietuvių literatūros klasiką (nors duomenų skaičius atrodo didelis, deja to užtenka tik apytiksliai 60 proc. atvejų).

Kai sistemos administratorius prisijungia prie valdymo pulto, sinonimų žodyno programa neria ieškoti pagalbos į anksčiau minėtą duomenų bazę. Žodyno programa naudoja algoritmą, kuris atlieka žodžio morfologinę analizę, sukuria visų jo įmanomų formų masyvą ir atlieka šimtus užklausų, kurios tikrina tekstus duomenų bazėje ir atrenka sakinius, kuriuose buvo pavartota viena iš užklausiamo žodžio formų. Kai programa baigia savo darbą, administratorius turi perskaityti visas pateiktas ištraukas kol suranda vieną, kurioje pavartotas žodis atitinka sinonimo prasminę grupę.

Kitas žingsnis reikalauja sutikrinti duomenis su LKŽ ir kitais autentiškais šaltiniais, surasti naujus sinonimus ir nustatyti antonimus. Įvestus duomenis dar kartą patikrina sistemos vyr. administratorius. Taip nauji duomenys atsiranda sinonimų žodyne.

Tūkstančiai žodžių našlaičių

Sinonimų žodynas yra nekomercinis projektas, tačiau žmonės, kurie palaiko projekto idėją, skiria nemažą savo laiko dalį tobulindami šitą įrankį.

Šiuo metu sinonimų žodyno duomenų bazėje yra apie 200 tūkstančių dar nesugrupuotų žodžių, kurie neturi sinonimų ir nėra sinonimai kitems žodžiams. Be abejo, dauguma jų yra tarmybės, kurios šiuolaikinėje kalboje yra menkai naudojamos.

Kiekvienas sinonimų žodyno naudotojas gali padėti sutvarkyti duomenų bazę, pasiūlydamas sinonimus, kurių kitų projekto dalyvių galvos dar nesugalvojo. Vartotojai skatinami prizais.

Sinonimų žodyno perspektyva

Kiekvieną dieną sinonimų žodyną aplanko apie 600 žmonių. Tai nedaug, tačiau vidutiniškai kiekvienas žmogus per dieną atlieka 20 užklausų. Iš to galime padaryti išvadą, kad sinonimų žodynas yra naudingas įrankis, tačiau dar nedaug žmonių apie jį žino. Tekste užsiminta apie antonimus – vieną dieną galbūt sinonimų žodyną papildys ir brolis antonimų žodynas.

Šaltinis: technologijos.lt
Kopijuoti, platinti, skelbti bet kokią portalo News.lt informaciją be raštiško redakcijos sutikimo draudžiama.

facebook komentarai

Naujas komentaras


Captcha

susiję straipsniai

Populiariausi straipsniai

Mokslo virusu vaikus užkrečia ne tik bandymai, bet ir šansas pademonstruoti išradimus viešai

Vienas iš būdų motyvuoti jaunuosius išradėjus kurti – didelio populiarumo JAV sulaukiančios išradimų mugės bei konkursai. Tokioje mokslo mugėje šių metų rugsėjį jaunimą kviečia sudalyvauti ir technologijų bei verslumo renginys #SWITCH! skaityti »

Mechatronikos ir robotikos specialistai – be jų neįsivaizduojama ateitis

Kompiuterio spausdintuvas, oro temperatūros termostatas, šaldytuvas su skaitmeniniu valdymu – visa tai yra mechatronikos įrenginiai. skaityti »

Šiemet – rekordinis skaičius stojančiųjų į pedagogikos krypties profesines studijas

Pedagogikos krypties profesinėms studijoms, sulaukusioms itin didelio aukštųjų mokyklų absolventų susidomėjimo, Švietimo ir mokslo ministerija papildomai skyrė 30 valstybės finansuojamų vietų. skaityti »

V. Sutkus: būsimų bedarbių rengimą stabdo rinka

Pristatome Lietuvos verslo konfederacijos prezidento Valdas Sutkaus mintis apie Lietuvos švietimo pertvarką. skaityti »

Tarptautiniai studentų mainai: investicija į save ir profesinę ateitį

Naujausi „Erasmus+“ poveikio tyrimo duomenys rodo, kad daugelyje šalių studentų mainų programos dalyviams po studijų baigimo įsidarbinti darbo rinkoje pavyksta net 14 proc. lengviau ir greičiau. skaityti »

Jaunimo susidomėjimas šalies aukštosiomis mokyklomis nemažėja

Stojančiųjų susidomėjimas Lietuvos aukštosiomis mokyklomis nemažėja. Kaip ir pernai, į universitetus ir kolegijas pretenduoja 68 proc. brandos atestatus turinčių bendrojo ugdymo mokyklų abiturientų. skaityti »

Trečdalis stojančiųjų į universitetus renkasi Vilniaus universitetą

5 230 visų stojančiųjų į Lietuvos universitetus pirmuoju prioritetu pageidavo studijuoti geriausiai tarptautiniuose reitinguose tarp Lietuvos aukštųjų mokyklų vertinamame Vilniaus universitete. skaityti »

„Baltoji žynė“ – įtraukianti maginė fantastika net ir tiems, kurie nemėgsta fantastikos

Australų kilmės rašytoją Trudi Canavan nuo pat mažumės domino senovės mitologija ir jos pritaikymas fantastikos pasaulyje. skaityti »

Švietimo ministrė: Lietuva turi visas sąlygas tapti informacinių technologijų centru

Europos komisijos teigimu, net 40% darbdavių Europoje neranda darbuotojų, kurių įgūdžiai įmonei leistų atsinaujinti ir sparčiai judėti į priekį. skaityti »

JTO dirbanti lietuvė: „Didžioji mano darbo dalis – įtikinti kitus, kad viskas yra įmanoma“

„Nelaikau savęs emigrante“, – šypsosi Ieva Lazarevičiūtė, jau 11 metų gyvenanti Brazilijoje. skaityti »