Lietuviškas sinonimų žodynas – tūkstančiai žodžių našlaičių

Publikuota: 2011 m. lapkričio 21 d. pirmadienis

Pirmasis lietuvių kalbos elektroninis sinonimų žodynas „Sinonimai.lt“ pradėjo veikti 2010 m. Tai – visuomeninis projektas, kurio tikslas ­– įtraukti visuomenę ir ypatingai jaunimą į kalbos puoselėjimo ir turtinimo veiklą. Kuo gi ypatingas šis žodynas ir su kokiais iššūkiais susiduriama jį tobulinant?

Priešingai nuo daugumos žodynų (pvz., kalbinių ar terminų žodynų), sinonimų žodynas išsiskiria savo sudėtingumu. Jį sudarant, iškyla vartojimo pavyzdžių, kalbinių ypatybių priskyrimo, prasminių grupių įvardinimo bei morfologinės analizės užduotys.

Kaip šias užduotis išsprendė sinonimų žodynas?

Šiuo metu sinonimų žodyną sudaro daugiau nei 40 000 įrašų. Norint priskirti kiekvienam sinononimui vartojimo pavyzdį ir nustatyti jo prasminę grupę, vienas žmogus sugaištų ne vienerius metus.

Sinonimų žodynas naudojasi tekstine duombaze, kurią sudaro 18 000 psl. tekstų, paimtų iš įvairiausių lietuvių literatūros kampelių, pradedant 1650 m. parašytu Mažvydo katekizmu ir apimant daugmaž visą lietuvių literatūros klasiką (nors duomenų skaičius atrodo didelis, deja to užtenka tik apytiksliai 60 proc. atvejų).

Kai sistemos administratorius prisijungia prie valdymo pulto, sinonimų žodyno programa neria ieškoti pagalbos į anksčiau minėtą duomenų bazę. Žodyno programa naudoja algoritmą, kuris atlieka žodžio morfologinę analizę, sukuria visų jo įmanomų formų masyvą ir atlieka šimtus užklausų, kurios tikrina tekstus duomenų bazėje ir atrenka sakinius, kuriuose buvo pavartota viena iš užklausiamo žodžio formų. Kai programa baigia savo darbą, administratorius turi perskaityti visas pateiktas ištraukas kol suranda vieną, kurioje pavartotas žodis atitinka sinonimo prasminę grupę.

Kitas žingsnis reikalauja sutikrinti duomenis su LKŽ ir kitais autentiškais šaltiniais, surasti naujus sinonimus ir nustatyti antonimus. Įvestus duomenis dar kartą patikrina sistemos vyr. administratorius. Taip nauji duomenys atsiranda sinonimų žodyne.

Tūkstančiai žodžių našlaičių

Sinonimų žodynas yra nekomercinis projektas, tačiau žmonės, kurie palaiko projekto idėją, skiria nemažą savo laiko dalį tobulindami šitą įrankį.

Šiuo metu sinonimų žodyno duomenų bazėje yra apie 200 tūkstančių dar nesugrupuotų žodžių, kurie neturi sinonimų ir nėra sinonimai kitems žodžiams. Be abejo, dauguma jų yra tarmybės, kurios šiuolaikinėje kalboje yra menkai naudojamos.

Kiekvienas sinonimų žodyno naudotojas gali padėti sutvarkyti duomenų bazę, pasiūlydamas sinonimus, kurių kitų projekto dalyvių galvos dar nesugalvojo. Vartotojai skatinami prizais.

Sinonimų žodyno perspektyva

Kiekvieną dieną sinonimų žodyną aplanko apie 600 žmonių. Tai nedaug, tačiau vidutiniškai kiekvienas žmogus per dieną atlieka 20 užklausų. Iš to galime padaryti išvadą, kad sinonimų žodynas yra naudingas įrankis, tačiau dar nedaug žmonių apie jį žino. Tekste užsiminta apie antonimus – vieną dieną galbūt sinonimų žodyną papildys ir brolis antonimų žodynas.

Šaltinis: technologijos.lt
Kopijuoti, platinti, skelbti bet kokią portalo News.lt informaciją be raštiško redakcijos sutikimo draudžiama.

facebook komentarai

Naujas komentaras


Captcha

susiję straipsniai

Populiariausi straipsniai

6 gyvenimo pamokos, kurių išmokstama po paskaitų

Nors gyvenimo aprašyme skiltis „kita veikla“ yra paskutinė ir atrodo nereikšminga, būtent ji suteikia darbdaviui informacijos apie tai, koks žmogus siekia prisijungti prie komandos. Neretai būtent šios, asmeninės savybės, nulemia sprendimą – atsivers ar užsitrenks svajonių karjeros durys. skaityti »

Stereotipai lūžta: programavimas – moterims vis patrauklesnė sritis

Tik ~30 proc. visų IT srityje dirbančių specialistų pasaulyje yra moterys. skaityti »

Kokių specialistų reikės ateities mados versle?

Mados verslas neatpažįstamai keičiasi, todėl keičiasi ir reikalavimai čia dirbantiems specialistams. skaityti »

Lietuvos inovacijų progresui skatinti – 2,5 mln. eurų

Inovatyvios įmonės, bendradarbiaujančios ar norinčios bendradarbiauti su mokslininkais, vėl gali teikti paraiškas gauti inovacinių čekių. skaityti »

Mokyklose siūloma išjungti skambutį

Aktorius, kuriantis praktikas mokykloje, mokytojas Paulius Tamolė sako – išjunkite mokyklose skambutį. skaityti »

Rašytojai Rutai Sepetys įteikta garbinga Jungtinės Karalystės literatūros premija

Birželio 19 d. Londone lietuvių kilmės rašytojai Rutai Sepetys įteiktas garbingiausias, 80-metį minintis Jungtinės Karalystės apdovanojimas už literatūrą vaikams ir jaunimui – Carnegie medalis. skaityti »

Vis daugiau studentų Lietuvos universitetuose nori studijuoti anglų kalba

Sunku įsivaizduoti sėkmingą verslininką, nekalbantį anglų kalba. Netolimoje ateityje anglų kalba taps privaloma visų profesijų atstovams. skaityti »

Informacinių technologijų egzaminą laiko rekordinis skaičius abiturientų

Specialistai teigia, kad po 10 – 15 metų visos verslo įmonės bus susijusios su informacinėmis technologijomis, taigi nebestebina tai, jog savo ateitį su šia sritimi sieja vis daugiau jaunuolių. skaityti »

Bibliotekos meta skaitymo iššūkį savo skaitytojams

Birželio 15 d. šalies bibliotekos pakvies knygų mėgėjus priimti skaitymo iššūkį ir leistis į vasaros nuotykį. skaityti »

VU rektorius Artūras Žukauskas susitikime su LEU bendruomene: „LEU turi stiprių dalyko didaktikos mokslininkų“

Lietuvos edukologijos universitete (LEU) vyko susitikimas dėl aukštųjų mokyklų tinklo pertvarkos. Diskusijoje dalyvavo LEU bendruomenės nariai, kurie galėjo užduoti jiems rūpimus klausimus Vilniaus universiteto (VU) rektoriui prof. Artūrui Žukauskui. skaityti »