Научная статья на тему 'KOMPYUTER LINGVISTIKASIDA OMONIMLIK HODISASI TADQIQI'

KOMPYUTER LINGVISTIKASIDA OMONIMLIK HODISASI TADQIQI Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

392
50
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Korpus / baza / model / token / lug„at / modellashtirish / algoritm / qidiruv interfeysi / Corpus / base / model / token / dictionary / modeling / algorithm / search interface

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — G„Iyosiddin Abduvahobov, Fayruza Alijonova

Maqolada o„zbek tili elektron korpusida omonimlar bilan ishlash jarayonida yuzaga keladigan muammo va kamchiliklarni aniqlash,ularning kelib chiqish sabablarini o„rganish,jahon va o„zbek kompyuter lingvistikasida omonimlar bilan bog„liq tadqiqotlar va ularning tahlili yoritilgan. O„zbek tili electron korpus menejeri uchun omonimlar bilan bog„liq masalalarni o„rgangan holda ularning dasturiy bazasini ishlab chiqish korpus menejeri uchun muhim masalalardan biri hisoblanadi. Korpus uchun omonimlarning dasturiy ta‟minotini ishlab chiqish jarayonida amalga oshirish lozim bo„lgan vazifalar va ularning yechimlari maqolada keltirib o„tilgan

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The article describes the problems and shortcomings in the process of working with homonyms in the electronic corpus of the Uzbek language, the study of their causes, research and analysis of homonyms in world and Uzbek computer linguistics. One of the most important issues for the Uzbek language electronic corpus manager is to develop their software base by studying the issues related to homonyms. The tasks to be performed in the process of developing homonymous software for the corpus and their solutions are given in the article

Текст научной работы на тему «KOMPYUTER LINGVISTIKASIDA OMONIMLIK HODISASI TADQIQI»

KOMPYUTER LINGVISTIKASIDA OMONIMLIK HODISASI TADQIQI

G'iyosiddin Abduvahobov

Farg'ona davlat universiteti o'qituvchisi

Fayruza Alijonova

Mirzo Ulug'bek nomidagi O'zbekiston Milliy universiteti magistraturanti

ANNOTATSIYA

Maqolada o'zbek tili elektron korpusida omonimlar bilan ishlash jarayonida yuzaga keladigan muammo va kamchiliklarni aniqlash,ularning kelib chiqish sabablarini o'rganish,jahon va o'zbek kompyuter lingvistikasida omonimlar bilan bog'liq tadqiqotlar va ularning tahlili yoritilgan. O'zbek tili electron korpus menejeri uchun omonimlar bilan bog'liq masalalarni o'rgangan holda ularning dasturiy bazasini ishlab chiqish korpus menejeri uchun muhim masalalardan biri hisoblanadi. Korpus uchun omonimlarning dasturiy ta'minotini ishlab chiqish jarayonida amalga oshirish lozim bo'lgan vazifalar va ularning yechimlari maqolada keltirib o'tilgan.

Kalit so'zlar: Korpus, baza, model, token, lug'at, modellashtirish, algoritm, qidiruv interfeysi

ABSTRACT

The article describes the problems and shortcomings in the process of working with homonyms in the electronic corpus of the Uzbek language, the study of their causes, research and analysis of homonyms in world and Uzbek computer linguistics. One of the most important issues for the Uzbek language electronic corpus manager is to develop their software base by studying the issues related to homonyms. The tasks to be performed in the process of developing homonymous software for the corpus and their solutions are given in the article.

Keywords: Corpus, base, model, token, dictionary, modeling, algorithm, search interface

KIRISH

Matnlar korpusi («corpus» - lotincha «tana» degan ma'noni anglatadi) elektron holda saqlanadigan ma'lum til birliklari bo'lib, ular tilshunoslar uchun turli xil muammolarni hal etish uchun tatbiq etishda va turli yo'nalishdagi tadqiqotlar uchun zaruriyatga qarab

May, 2022

416

turli shakllarda tuziladi. Til birliklarining qay tarzda saqlanishiga qarab maxsus dasturlar yordamida har bir kerakli so'z yoki so'z birikmasi uchun darhol uning qo'llanishi bo'yicha misollar topilishi, imlo bo'yicha variantlari, sinonimik qatorlari topilishi mumkin. Matnlar korpusiga oid ilmiy tadqiqotlar salmog'ining ko'payishi natijasida tilshunoslikda korpus lingvistikasi yo'nalishi shakllandi. Kompyuterda yaratilgan birinchi matnlar korpusi Braun korpusi (БК, inglizcha Brown Corpus, BC) hisoblanadi, u 1961-yilda Braun universitetida yaratilgan, har biri 2000 so'zli 500 ta matn fragmentini o'z ichiga oladi. 1970-yillarda 1 mln so'zni o'z ichiga olgan matnlar korpusi asosida rus tilining chastotali lug'ati yaratildi. 1980-yillarda Shvetsiyaning Upsala universitetida ham rus tilida matnlar korpusi yaratildi. Buyuk Britaniyada Ingliz tili Banki (Bank of English) hamda Britaniya Milliy Korpusi (British National Corpus, BNC), Rossiyada Rus tilining m ashina fondi (Машинный фонд русского языка) hamda Rus tilining Milliy korpusi (Национальный корпус русского языка) loyihalari ishlab chiqildi. Masalan,Rus tilining Milliy korpusi hajmi hozirgi kunda 149 mln so'zdan iborat. Keyingi yillarda Internet tizimining rivojlanishi virtual matnlar korpusining yuzaga kelishiga olib keldi. Ya'ni internetdagi qidiriv saytlari,elektron kutubxonalar, virtual ensiklopediyalar korpus vazifasini bajarmoqda. Korpusning janri va tematik rangbarangligi Internetdan foydalanuvchining qiziqishlariga bog'liq. Masalan, ilm-fan doirasida Wikipedia katta hajmdagi matnlar korpusi sifatida ishlatilmoqda

ADABIYOTLAR TAHLILI VA METODOLOGIYA

Tilshunoslikning ilk va o'rta bosqichlarida omonimiya hodisasining paydo bo'lishi, taraqqiyoti va yondosh hodisalarga munosabatlari o'rganilgan bo'lsa, zamonaviy lingvistikada uning korpusda berilishi masalasi kun tartibiga qo'yildi. Bu vazifani bajarish uchun mavjud lug'atlar axborot banki vazifasini o'taydi. Korpus lingvistikasida omonimlik muammosini yechish, omonim birliklarni teglash va matnni avtomatik o'qish jarayonida omonimiyani bartaraf etish masalasi ("snyatiye omonimii")ga oid qator tadqiqotlar vujudga kelgan. Jumladan, G. I. Kustova, O. N. Lyashevskaya, Ye. V. Paducheva, Ye. V. Raxilina, B. P. Kobritsov, T. I. Reznikova, V. V. Kukanova, A. A. Kretovlar shu masalalar yechimiga bag'ishlangan qator ishlarni e'lon qilishgan.

Hozirda 50 milliondan ortiq so'zni o'zida jamlagan,professor Nilufar Abdurahmanova va shogirdlari tomonidan tadqiqot ishlari olib borilayotgan http://uzbekcorpus. uz/ o'zbek tili uchun nisbatan

mukammal korpus hisoblanadi. 2018-yildan buyon ushbu korpus

May, 2022

ustida tadqiqot ishlari amalga oshirib borilmoqda. Korpus ustida olib borilayotgan tadqiqot ishlariga qaramay korpus hali ham o'zining kamchiliklariga ega, xususan, interfeysda omonimlar bog'liq muammolar hali to'laligicha o'z yechimini topmadi. Ushbu maqolada ayrim kamchiliklar va ularning yechimlari yuzasidan fikr yuritiladi.

Lug'atlar bilan ishlash, so'zlarni morfoanaliz qilish, tokenlarga ajratish jarayonida omonimlar bilan bog'liq muammolar yuzaga keladi. Masalan, qidiruv jarayonida foydalanuvchi qidiruv interfeysiga [soz]so'zini kiritsa, asosi soz bo'lgan barcha so'zlar topiladi. Ammo ushbu so'z turli xil ma'nolarni ifodalishini hisobga olsak, foydalanuvchi uchun bu holatda qiyinchilik tug'iladi.

Shularni hisobga oladigan bo'lsak, korpus menejeri uchun omonimlarning mukammal bazasini va to'g'ri ishlash algoritmini yaratish to'g'risida yechimlar xususida fikr yuritamiz.

Kompyuter intellectual sistemasidagi omonimiya masalasini tadqiq etish uchun quyidagi vazifalarni amalga oshirish lozim bo'ladi:

-o'zbek tilidagi badiiy asarlarda, izohli lug'atlarda va omonimlar lug'atidagi omonim so'zlarni ajratib olish;

- omonimlarning tarqalish darajasini aniqlash;

-omonimiyaning sistem xarakterini ochib berish;

-omonimlarning simmetriya/asimmetriya (disimmetriya) jihatlarini ko'rsatib berish;

-omonimlarni so'z turkumlariga ko'ra tasniflash;

-matnlarni qayta ishlashda omonimlarni saralash;

-omonimlar matritsasini tuzish;

- omonimlarni modellashtirish

Yuqoridagi vazifalarni amalga oshirish orqali, birinchidan, o'zbek tilshunosligidagi omonimiyaning ilmiy-nazariy masalasiga aniqlik kiritiladi, ikkinchidan, o'zbek tilining kompyuter sistemasidagi omonimiya bazasi yaratiladi. Uchinchidan,o'zbek tilini chet tili sifatida o'qitish, lug'atlar tuzishda metodik tavsiyalar ishlab chiqiladi. Avval barcha omonim so'zlar, keyin ularning izohi ro'yxatga kiritiladi. Anglatayotgan ma'nolari bo'yicha so'zlar tartiblab chiqiladi. Masalan: ot

1) ot (hayvon) -tulpor - horse;

2) ot (kishining nomi) - ism - name;

3) ot (ish-harakat) - uloqtirmoq - throw;

4) ot (so'z turkumi) - so'z turkumi - noun .

May, 2022

Matnlar bilan ishlaganda omonimlar izohli lug'atida qayd etilmagan ba'zi omonimlik hodisasi bilan bog'liq so'zlar ham muammoli holatlarni keltirib chiqaradi. So'zlarga morfemalarning qo'shiluvi bilan yuzaga chiqadigan omonimlik bu jihatdan fikrimizga isbot bo'ladi. Masalan,

qor + tushum kelishigi = qorni // qorin + egalik qo'shimchasi = qorni; yaralmoq + sifatdosh = yaralar// yara + ko'plik qo'shimchasi = yaralar. Bu holatda asosga qo'shimchalar qo'shilishi natijasida omonimlik yuzaga kelmoqda. Ushbu holatda so'zlarning turkumlarini va Grammatik shakllarini aniqlash orqali omonimlar bir-biridan farqlanadi.

Omonimlar bilan bog'liq keyingi holatni ko'rib chiqamiz: o'qi(fe'l) 0 grammmatik shaklda; o'qi=o'q(ot) +i (egalik qo'shimchasi).

Bu holatda omonimlik asos va qo'shimcha qo'shilishi natijasida yuzaga kelmoqda.

Matnning bosh harflar masalasi ham muayyan muammoni yuzaga keltiradi. Sen bilmaysan,Asal judayam ajoyib. (1)Biznikiga karimalar kelishdi (2). Bizga ma'lumki,Yer o'z o'qi atrofida aylanadi. Uyga kelib qarasam,dadam yerga bosh qo'yib yotgan ekan (3)

1-misolda asal so'zi ismni anglatyaptimi yoki shirinliknimi? 2-misoldagi karimalar so'zi Karima ismli qiz bilan birgalikdagi shaxslarni anglatyapti, ammo avtomatik tahrir dasturi ism kichik harf bilan yozilgan deya so'zni xato hisoblaydi. 3-misolning 1-gapida Yer sayyorasi, 2-gapda esa ona zamin haqida fikr yuritilgan. Lekin sintaktikoldi tahrir jarayonida 1-gapdagi Yer so'zi Yer sayyorasi tarzida yozilmagani uchun ushbu so'zni ona zamin haqida fikr yuritilayotganini inobatga olib, xato sifatida ko'rsatadi. Bu holda dasturning ma'lumotlar bazasiga quyidagi qoidalarni kiritish talab etiladi:

1. Turdosh otlar atoqli otlar vazifasida ham keladi yoki aksincha: turdosh ot atoqli ot. Ushbu qoidani muqim bo'lishi uchun morfologik tahrir modullarida o'zbek adabiy tilidagi turdosh va atoqli otlar guruhlari to'liq va aniq ko'rsatilishi lozim.

2. Atoqli otlarda shakl yasovchi qo'shimchasi -lar qo'shilganda atoqli otlar bosh harf bilan emas, kichik harf bilan yoziladi. Atoqli ot+lar= turdosh ot.

3. Har bir uslubning o'ziga xos xususiyatlari dastur ta'minotiga kiritiladi. Kiritilayotgan ma'lumotlar asosida yozilayotgan gap qaysi uslubga xosligi avtomatik tarzda aniqlanadi, natijada gapda qatnashayotgan so'zlar imlosi tekshiriladi.

Parallel korpus bilan ishlash jarayonida tarjimada omonimlar bilan bog'liq birmuncha xato va kamchiliklar ham

kuzatiladi. Birgina rus tilida ko'plab so'z shakllari grammatik

May, 2022

omonimlardir. Masalan, bake shakli infinitivda ham fe'l (bake pies) va nominative holatdagi ism(Russian bake). Omonimlarning qaysi biri ma'lum bir misolda ifodalanganini aniqlash uchun konteksni tahlil qilish kerak. Korpus so'z shakllarini grammatik belgilash avtomatik ravishda grammatik omonimiyani ajrata olmaydigan dastur yordamida amalga oshiriladi. Pechka shakllari dastur tomonidan omonim sifatida tavsiflanadi, ya'ni ularga bir vaqtning o'zida bir nechta grammatik xususiyatlar beriladi.

Pech shaklidan har qanday foydalanish bunday korpusda fe'l sifatida ham, ism sifatida ham ko'rib chiqiladi va ushbu so'rovda ham, boshqasida ham nashrga joylashtiriladi. Shunday qilib avtomatik ravishda etiketlangan korpusda ishlayotganda faqat so'zsiz so'zlarni o'z ichiga olgan pechka so'zi bilan misollar ro'yxatini olishning imkoni yo'q, garchi siz grammatik xarakteristikasini "fe'l" ni o'rnatgan bo'lsangiz ham. Foydalanuvchi misollar qatoridan infinitive bilan kerakli konteksni qo'lda tanlashi kerak bo'ladi.

Bundan tashqari, chiqarilmagan omonimiyaga ega korpusda lug'atda bo'lmagan so'zlar uchun grammatik farazlar avtomatik ravishda hosil bo'ladi. Shu sababli, RNC omonimiyasi olib tashlangan matnlardan misollarni izlash imkoniyatini beradi. Asosiy korpusning ushbu qismida har bir omonim shakl uchun tilshunos dasturiy tahlilga tegishli xususiyatlar to'plamidan faqat bittasini tanlaydi, ya'ni berilgan konteks uchun to'g'risini.

O'zbek tilidagi matnlarda omonimlarni farqlashda kodlardan, simvollardan, turkumni bildiruvchi teglardan foydalanish talab etiladi. Buning uchun izohli lug'atlarda foydalaniladigan rim raqamlaridan teg sifatida foydalanish mumkin. Faqat rim raqamlarini qat'iy tarzda belgilab olish kerak bo'ladi:

I - ot, II - fel, III - sifat, IV - ravish. O'zbek tilida ot-fe'l omonimligi ko'pligi darajasidaga ko'ra birinchi o'rinda turadi(tut I- daraxt, tut II - harakat). Ot-sifat omonimligi (chanqoq I "tashnalik" - chanqoq III "tashna") yoki fe'l-sifat omonimligi (yot II - harakat, yot III -"begona") keying o'rinta turadi. Ot-ravish omonimligi uchramaydi. Sifat-ravish-fe'l omonimligi kam uchraydi:tik II harakat, tik III "qiya", tik IV "to'ppa-to'g'ri) oshiq I - "ishq sohibi "; oshiq I - "tana qismi"; oshiq I - "o'yin nomi": oshiq II - "shoshmoq"; oshiq III - "ortiq".

May, 2022

Oshiq omonimlari ishtirok etgan matnlarni kompyuter matnlarni kompyuter dasturi (google translater) da tarjima qilib ko'ramiz:

1. Oyqiz bu qizga uzoq tikilgach, uni ashula va dutor oshig'i deb o'yladi.

Долгое время уставившись на девушку, медведь пщдумал, что она влюблена в пение и дутар.

Bu misolda "yoqtirmoq" ma'nosidagi oshiq bo'lmoq qo'shma fe'li tarjimon dasturning omonimni farqlamasligi natijasida "sevmoq" ma'nosidagi so'zga o'zgartirilgan.

2. Endi hovlilarning eshiklari ochilgan, bolalar cho'ntaklarini yong'oq, oshiqlarga to'ldirib , ko'chaga chiqa boshlagan edi.

Теперь двери дворов были открыты, и дети стали выходить на улицы, наполняя карманы орехами и любовниками.

Yuqoridagi misollardan ko'rinib turibdiki, avtomatik tarjima jarayonida ham omonimlar bilan bog'liq muammolar talaygina. Omonimlar modelini ishlab chiqish va uni tarjima jarayoniga o'zlashtirish hal qilinishi kerak bo'lgan masalalarni birmuncha kamaytiradi. Bu holatda omonimlar oladigan valentliklarni bazasini yig'ish bu masalani yechishga yordam beradi, ya'ni oshiq so'zi misolida ko'radigan bo'lsak, o'yin ma'nosida kelayotgan "oshiq" so'zi "o'yin" so'zini valentlik sifatida qabul qiladi, yoki tana a'zosi sifatidagi "oshiq" so'zi tana a'zolari bilan bog'liq bo'lgan so'zlarni valentlik sifatida qabul qiladi. Albatta, bu muammoni hal qilish bizning hali ham asosiy vazifalar qatorida turmoqda.

Oldin ta'kidlanganidek, semantik analizatorning omonimlarni farqlashi uchun dastlab ularning lingvistik filtri va modellari ishlab chiqilishi lozim. Bu esa lingvistik bilimni, yondashuvni talab etadi. Zotan, tabiiy tilni qayta ishlash (NLP) sun'iy aql sintezi va matematik tilshunoslikning eng muhim va dolzarb yo'nalishlaridan biridir. Bu o'rinda asosiy harakat insonning tabiiy tilida ifodalangan matnni tahlil qilishi va kompyuterning ushbu ma'lumotni "idrok etish", qayta ishlash qobiliyatini topish hamda takomillashtirishga qaratilgan. Tabiiy tilni qayta ishlash -bu sun'iy intellekt bilan bog'liq vazifa, chunki u atrofdagi dunyo va inson hissiyotlarini yuqori darajada tushunishni o'z ichiga oladi. Shubhasiz, ushbu muammolarni hal qilish tadqiqotchidan tilshunoslik hamda sun'iy intellekt sohasida yetarlicha bilimni talab qiladi. Tadqiqot uchun Sh. Rahmatullayevning "Omonimlarning izohli lug'ati" hamda "O'zbek tilining izohli lug'ati" (5 jildli)da mavjud omonimlar lingvistik baza bo'lib xizmat qildi. Ularni turkumiga asoslanib, quyidagicha guruhlab chiqdik: 1) bir so'z turkumi doirasidagi omonimlar; 2) ot // fe'l hamda sifat // fe'l

May, 2022

421

turkumi orasida kuzatiladigan omonimlar; 3) turli turkum doirasida vujudga keladigan omonimlar. Ot // fe'l hamda sifat // fe'l turkumi doirasida uchraydigan omonim so'zlar, asosan, morfologik omil asosida farqlanadi. MO bir qator morfologik vositalar orqali yuzaga chiqadi. Omonim so'zni farqlashda morfologik va sintaktik omillar muhim o'rin tutadi. Ot va fe'l orasidagi omonimlikda morfologik; sifat va fe'l orasidagi omonimlikda morfologik-sintaktik; faqat ot va faqat fe'l turkumi doirasidagi omonimlikda sintaktik-morfologik; faqat sifat turkumi doirasidagi omonimlikda sintaktik; turli turkum doirasidagi omonimlikda esa morfologik, sintaktik, morfologik-sintaktik va sintaktik-morfologik omil yetakchilik qilishi aniqlandi.

NATIJALAR VA MUHOKAMA

Yuqoridagi muammoli holatlarni hal etish uchun omonimlarning grammmatik bazasi va modeli ishlab chiqiladi, ya'ni omonimlarning turkumiga ko'ra ular oladigan grammmatik qo'shimlar bazasi yig'iladi. Yig'ilgan baza va model asosida algoritm tuziladi.

Ushbu algoritm quyidagicha ko'rinishda bo'ladi:

- foydalanuvchi qidirilayotgan so'zni interfeysga kiritadi;

- oynada maxsus so'rovlar chiqadi, ya'ni so'zning turkumi, agar so'z ot turkumida bo'lsa , sanaladigan yoki sanalmaydigan;fe'l bo'lsa, o'timli yoki o'timsiz;tub yoki yasama(bog'lama-bog'lama)

So'rovlar asosida qidirilganda foydalanuvchi aynan o'ziga kerakli bo'lgan so'zni topish va ajratib olish imkoniyatiga ega bo'ladi.

Access dasturi yordamida yig'ilgan omonimlar bazasi quyidagi jadvalda ko'rsatilgan. Jadvalda omonimlarning turkumi,izohi,badiiy asar va ilmiy matnlardan olingan misollari ko'rsatilgan (Ushbu jadval SH. Rahmatullayevning "Omonimlarning izohli lug'ati" asosida yig'ildi).

May, 2022

Koa Suz_uzbek - suz_turkum - izohi misol

233 devon Noun [arabcha >ko'pligi Devonda yonboshlab yotgan Abbosxon Saidiyning hurmal

234 devon Noun eski. Xon (amir) s Devond a hech kim yo'q.[Majdiddin] Abusaid Mirzo davric

235 dim Noun [<dam 13] ot. Suku Og'zingizni parshion qilmay sabr qilib tursangiz, shu hafta

236 dim Adj. Sernam va issiq (h Dimlamoq, dimikmoq.Bugun havo ertalabdan dim (dam).

237 dim Adv. folk. Mutlaqo, bul Dim ularga qaray ko'rma, chirog'im.«Ravshan».

238 differensial Noun [latyncha differer 1.

239 differensial Noun Matematika term

240 differensial Noun Texnika termini. /

241 differensial Adj. [< ruscha differen Differensial geometriya. Differensial tenglama.

242 dov Noun Qimorda katta tik Dov ketmoq (Qiyoslang: katta ketmok,).dov

243 dov Adj. [<dov 1] sifat.Qo'r Dov yurak.Ey qahramon, dov yurak, jasur ulug' xalq, Qudr.

244 dov Noun [<dov II] ot.Dadilli Yuragim dov bermadi.[Hojiya]anchagacha yuragi dov: ben

245 dov Noun Talab, da'vo (sh)moq.Unga hechqanday dovim yo'q. Menga nima dovir

246 dov Adj. Bo'ychan, katta Dov yigit bo'lib qolibsan.[Yo'lchi]sersoqol, dov askar bilar

247 dov Noun dov-daraxt(o'siml Hamroqul naridan-beri d o v-d astgohini yig'ishtirib jo'nat

248 dovul Noun Kuchli bo'ron Dovulda qolmoq. Dovul ko'pchilik imoratlamingtomini uc

249 dovul Noun [<tojikcha davkai Dovulchi (dovul chaluvchi shaxs). Dov ul har vaqt mirshat

250 doira Noun arabcha — «aylan; Doira chizmoq. Yarim doyra.Doirasini hisoblab chiqmoq.C

251 doira Noun Dumaloq gardishg Doirachi.Doira chalmoq. Doira chertmoq.Boloxonaningto

252 dol Noun Bolalarning o'yini .«Kim do 1?»—«Men dol».

253 dol Noun [arabcha a harfi]o Bu so'z dol bilan e mae, zol bilan yozida-di. Qaddim dol b(

254 dol Adv. ravish; eskirgan; s Nishonning dol o'rtasiga tegizmoq. Dol vaqtida kelmos.OI

Access dasturi asosida yaratilgan so'rovlar yordamida omonimlarni turkumlari bo'yicha ajratib olib, ularning modellari tuziladi.

Quyidagi jadvalda omonimlar modellar yaratish uchun ular oladigan qo'shimchalar bazasi ko'rsatilgan.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 egalik m,im,miz,imiz,ng,ing,ngiz,ingiz,i,si

2 kelishik ning,ni,da,dan,ga,ka,qa

3 ko'plik lar

4 xoslik dagi

5 qarashlilik niki

6 kichraytirish cha,chak,loq,choq

7 erkalash oy,xon,jon,gina,bek

8 chegara gacha

9 bog'lamalar man,san,miz,siz,dir

fe'lga xos qo'shimchalar

1 zamon a,y,di,gan,ar,ur,ajak

2 mayl ay,ayin,ylik,aylik,gin,ing,inglar,sin,sinlar,sa

3 shaxs-son m,man,k,miz,ng,san,siz,ngiz,siz,di,lar

4 sifatdosh gan,kan,qan,yotgan,ayotgan,adigan,ydigan,r,ar

5 ravishdosh b,ib,a,y,gancha,kancha,qancha,guncha,kuncha,quncha,gach,kach,qach,gani,may,mayir

6 harakat nomi sh,ish,v,uv,moq,mak_[_|_|_

7 nisbat n,in,l,il„t,tir,dir,ir,ar,iz,sat,gaz,kaz,qaz,giz,kiz,qiz,g'iz

8 bo'lishsizlik shal ma

May, 2022

423

XULOSA

Yuqoridagi vazifalar bajarilganda korpusda omonimlar bilan bog'liq muammolarning asosiy qismi bartaraf etiladi. Muammolar to'laqonli bartaraf etilishi uchun tilshunoslar va dasturchilar o'zaro hamkorlikda ish olib borishlari maqsadga muvofiq. Omonimlar bilan bog'liq masalalarni hal qilish kelajakda korpusning kamchiliklar va xatolarsiz ishlashini ta'minlaydi. Bu korpus, umuman kompyuter linvistikasi, sun'iy intelllekt rivoji uchun qo'yilgan eng muhim qadamlardan bo'lishi shubhasiz.

REFERENCES

1. Po'latov A. Q. Kompyuter lingvistikasi. - Toshkent: Akademnashr, (2011).

2. Rahimov. A. Kompyuter lingvistikasi asoslari. «Akademnashr» nashriyoti, (2011).

3. Gulyamova. Sh. O'zbek tili semantik analizatorining lingvistik asoslari. Avtoreferat. Farg'ona, (2022).

4. Rahmanova. A. O'zbek tili milliy korpusini yaratishda kompyuter usullari. Avtoreferat. Andijon, (2022).

5. N. Abdurakhmonova, U. Tuliyev and A. Gatiatullin, "Linguistic functionality of Uzbek Electron Corpus: uzbekcorpus. uz," 2021 International Conference on Information Science and Communications Technologies (ICISCT), 2021, pp. 1-4, doi: 10. 1109/ICISCT52966. 2021. 9670043. Aripov, M. , Sharipbay, A. , Abdurakhmonova, N. , Razakhova B. : Ontology of grammar rules as example of noun of Uzbek and Kazakh languages. In: Abstract of the VI International Conference "Modern Problems of Applied Mathematics and Information Technology - Al-Khorezmiy 2018", pp. 37-38, Tashkent, Uzbekistan (2018)

6. Abduraxmonova, N. Z. "Linguistic support of the program for translating English texts into Uzbek (on the example of simple sentences): Doctor of Philosophy (PhD) il dis. aftoref. " (2018).

7. Abdurakhmonova N. The bases of automatic morphological analysis for machine translation. Izvestiya Kyrgyzskogo gosudarstvennogo tekhnicheskogo universiteta. 2016;2 (38):12-7.

8. Abdurakhmonova N, Tuliyev U. Morphological analysis by finite state transducer for Uzbek-English machine translation/Foreign Philology: Language. Literature, Education. 2018(3):68.

9. Abdurakhmonova N, Urdishev K. Corpus based teaching Uzbek as a foreign language. Journal of Foreign Language

May, 2022

Teaching and Applied Linguistics (J-FLTAL). 2019;6(1-2019): 131-7.

10. Abdurakhmonov N. Modeling Analytic Forms of Verb in Uzbek as Stage of Morphological Analysis in Machine Translation. Journal of Social Sciences and Humanities Research. 2017;5(03):89-100.

11. Kubedinova L. Khusainov A. , Suleymanov D. , Gilmullin R. , Abdurakhmonova N. First Results of the TurkLang-7 Project: Creating Russian-Turkic Parallel Corpora and MT Systems. Proceedings of the Computational Models in Language and Speech Workshop (CMLS 2020) co-located with 16th International Conference on Computational and Cognitive Linguistics (TEL 2020). 2020/11: 90101

12. Abdurakhmonova N. Dependency parsing based on Uzbek Corpus. InProceedings of the International Conference on Language Technologies for All (LT4All) 2019.

May, 2022

i Надоели баннеры? Вы всегда можете отключить рекламу.