Научная статья на тему 'TILSHUNOSLIKDA KORPUS LINGVISTKASI SOHASINING O’RGANILISH HOLATI'

TILSHUNOSLIKDA KORPUS LINGVISTKASI SOHASINING O’RGANILISH HOLATI Текст научной статьи по специальности «Искусствоведение»

CC BY
6
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Science and innovation
Область наук

Аннотация научной статьи по искусствоведению, автор научной работы — Mavlanova Nargiza Rustam Qizi

Komyuter texnologiyalari va til rivojlanib borgani sari tilshunoslik va komyuter lingvistkasi sohalari oldida yana bir global muammo – tabiiy tillarning milliy xususiyatlarini saqlab qolish, milliy til korpusini yaratish, rivojlantirish, til va til dasturlariga oid texnalogiyalarrni, ilmiy tadqiqotlarni izchil olib borish yuqori darajaga olib chiqish vazifaso paydo bo’ladi. Korpus tilshunosligida olib borilgan ilmiy izlanishlar, tadqiqotlar, shaklantirilgan ko’nikmalar nafaqat tilshunoslik sohasi uchun balki millat taraqqiyoti uchun ham zarur. Dunyoda hukm surgani kabi bizda ham milliy til korpusini yaratish davlat siyosati darajasiga ko’tarilgan masalalardan biridir. Quyida, O’zbekiston Respublikasi Prezidentining 2019-yil 21-oktabrdagi “O’zbek tilining davlat tili sifatidagi nufuzi va mavqeyini tubdan oshirish choratadbirlari to’g’risida”gi PF-5850-sonidan keltirilgan iqtibos til korpusini yaratishga bo’lgan e’tiborning muhimligini ko’rsatadi:

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «TILSHUNOSLIKDA KORPUS LINGVISTKASI SOHASINING O’RGANILISH HOLATI»

TILSHUNOSLIKDA KORPUS LINGVISTKASI SOHASINING O'RGANILISH

HOLATI Mavlanova Nargiza Rustam qizi

Samarqand Davlat Chet tillar instituti, Sharq tillar fakulteti, Kompyuter lingvistikasi yo'nalishi

2-kurs magistr talabasi. https://doi.org/10.5281/zenodo.10897264 Komyuter texnologiyalari va til rivojlanib borgani sari tilshunoslik va komyuter lingvistkasi sohalari oldida yana bir global muammo - tabiiy tillarning milliy xususiyatlarini saqlab qolish, milliy til korpusini yaratish, rivojlantirish, til va til dasturlariga oid texnalogiyalarrni, ilmiy tadqiqotlarni izchil olib borish yuqori darajaga olib chiqish vazifaso paydo bo'ladi. Korpus tilshunosligida olib borilgan ilmiy izlanishlar, tadqiqotlar, shaklantirilgan ko'nikmalar nafaqat tilshunoslik sohasi uchun balki millat taraqqiyoti uchun ham zarur. Dunyoda hukm surgani kabi bizda ham milliy til korpusini yaratish davlat siyosati darajasiga ko'tarilgan masalalardan biridir. Quyida, O'zbekiston Respublikasi Prezidentining 2019-yil 21-oktabrdagi "O'zbek tilining davlat tili sifatidagi nufuzi va mavqeyini tubdan oshirish choratadbirlari to'g'risida"gi PF-5850-sonidan keltirilgan iqtibos til korpusini yaratishga bo'lgan e'tiborning muhimligini ko'rsatadi: ''Xususan, o'zbek tilini jamiyat hayotida hamda xalqaro miqyosda obro'-etiborini oshirish maqsadida, o'zbek tiliga oid barcha ilmiy, nazariy va amaliy ma'lumotlarni o'zida jamlagan elektron ko'rinishdagi o'zbek tili milliy korpusini yaratish, o'zbek tilini - internet jahon axborot tarmog'ida ommalashtirish, unda munosib o'rin egallashini ta'minlash, dasturiy mahsulotlarning o'zbekcha ilovalarini yaratish, o'zbek tilini o'rgatuvchi kompyuter dasturlarini keng miqyosda amaliyotga tatbiq qilish, o'zbek tilidagi matnlar tahririga mo'ljallangan kompyuter dasturlarini yaratish ishlari tilshunoslik oldida turgan muhim vazifalar etib belgilab olindi". Milliy korpus milliy til xazinasi demakdir. Undan lingvist, leksikograf, kompyuter lingvistlari, dasturchi, muharrir, tarjimon, jurnalist, noshirlar, olim, o'qituvchi, talim oluvchilar va boshqa har qanday soha mutaxassisi keng foydalanadi.

Tilshunoslikda korpus lingvistkasining o'rnini tahlil qilishdan oldin komyuter lingvistkasi qanday vazifalarga javob berishini, uning tarixi va milliy tilshunosligimizdagi o'rnni ko'rib chiqsak. Korpus lingvistikasi - tilshunoslikda nisbatan yangi, biroq tez rivojlanib borayotgan bir soha sifatida e'tirof etilgan. Ushbu soha tildagi lug'aviy birliklar va ularning ishlatilishi haqidagi ma'lumotlarni yig'ish, saralash va tahlil qilish bilan shug'ullanadi. Bunda til materiallari katta miqdordagi elektron korpuslar shaklida o'rganiladi. Korpus lingvistikasining so'nggi yillardagi o'sishi, kompyuter texnologiyalari va ma'lumotlar bazalarining rivojlanishi bilan bevosita bog'liqdir.Korpus bu ifodalash uchun tizimli ravishda to'planagan matnlar yoki tarjima qilingan nutqlar to'plami lingvistik tahlili uchun asos bo'lib xizmat qiladigan muayyan bir tilning funksiyasi va tavsifidir. Korpus lingvistkasi asosan strukturani ifodolovchi manbaadir. Shuningdek, turli til dasturlarida, ilovalarida, informatika fanida qayta ishlash, til o'rgatish va til ta'limini o'rganishda muhim rol o'ynaydi. Korpus lingvistikasi - o'z materiallarini o'zi yaratadi, aniqrog'I, uni o'zi mustaqil ravishda yaratadi. Komyuter tilshunosligi esa korpus tilshunosligi uchun vositalarni ya'ni tilshunoslikka doir daturlarni yaratib beradi.

Korpus lingvistikasi tilshunoslikning boshqa sohalaridan farqli o'laroq, empirik yondashuvni qo'llaydi va real til foydalanish holatlariga suyanadi. Bu sohaga oid ilk ishlar 20-asrning o'rtalarida paydo bo'lgan bo'lib, to'liq ravishda kompyuterlashtirilgan tekstlar bazasidan foydalanishni o'z ichiga olgan. Shu tarzda, til haqidagi o'rganishlar chindan ham ko'lam va aniqlik jihatidan yangi bosqichga ko'tarilgan. Korpuslar turli xil til materiallaridan ta'lim, adabiyot,

axborot texnologiyalari va boshqa ko'plab sohalar uchun yig'ilgan matnlar to'plami hisoblanadi. Ularning tuzilishi va hajmi turlicha bo'lishi mumkin, boshqariladigan va boshqarilmaydigan korpuslarga ajratiladi. Boshqarilgan korpuslarda matnlar qat'iy mezonlar asosida tanlab olinadi, bu esa o'rganilayotgan til birliklarining xilma-xilligini va ishlatilish chastotasini chuqur tahlil qilish imkonini beradi. Korpus lingvistikasi o'rganilishi til o'rganish, tarjima, leksikografiya, til modellashtirish va sintaktik tahlil kabi turli xil sohalarda qo'llaniladi. Til o'qitishda asosiy til materiallarini to'plash va o'quvchilarga sunish maqsadida ham korpuslar keng qo'llanilmoqda. Tarjima va leksikografiyada korpuslar leksik ma'lumotlarni tahlil qilish va til birliklarining turli kontekstlardagi ishlatilishini o'rgatishda asosiy vositadir. Amaliy tadqiqotlar doirasida esa korpus lingvistikasi, ayniqsa, katta hajmdagi ma'lumotlarni process qilishda muhim ahamiyat kasb etadi. Masalan, so'z birikmalarining korpus asosida tahlili, tilshunoslikdagi "big data" tahlillari, va til o'rganishda yuzaga keladigan tendentsiyalarni aniqlash uchun qo'llaniladi. Korpus lingvistkasi keng jabhalarda qo'llaniladi. Korpus lingvistikasining asosiy vazifalari quyidagilardan iborat:

1. Til materiallarini yig'ish va tizimlashtirish: tilning yozma va og'zaki shakllaridan foydalaniladigan keng qamrovli matnlar to'plamini shakllantirish, ularni yirik bir bazaga jamlash.

2. Til birliklarini va ular orasidagi muvofiqlikni o'rganish: so'zlar, qo'shimchalar, iboralar va jumla tuzilishlari kabi til birliklarining turlli kontekstlarda qanday ishlatilishini kuzatish va tahlil qilish.

3. Tilning ishlatilish chastotasini tahlil qilish: so'zlar va iboralar ishlatilishining chastotasi va tarqalishini statistik jihatdan o'rganish, tadqiq qilish.

4. Tilning tabiiylik darajasini o'rganish: tilning haqiqiy hayotda qanday ishlatilishini kuzatib, sun'iy til namunalari va tilning tabiiy ishlatilishini solishtirish.

5. Til qonuniyatlarini aniqlash: til tuzilishidagi takroriy qonuniyatlar va andozalarni aniqlash hamda ularning lingvistik tahlili.

6. Lingvistik nazariyalarni sinovdan o'tkazish: lingvistik nazariyalar va qoidalar haqiqiy til materiallari yordamida sinovdan o'tkazilishi, ularning talabga javob berish yoki bermasligi.

7. Til tarixini va o'zgarishlarini kuzatib borish: har xil davrlardagi yoki mintaqalardagi lingvistik korpuslar orqali tilning rivojlanishi va o'zgarish jarayonlarini tahlil qilish, muammoli jihatlarini aniqlash, ularga yechim topish.

8. Leksikografiya va so'zlar chiqarish: lug'atlar va ma'lumotnomalar uchun ma'lumot to'plash, lug'at bazasini tashkil etish, til bilan ishlaydigan mutaxassislar uchun ishonchli manbalarni yaratish.

9. Til o'qitishda qo'llab-quvvatlash: asosiy til materiallarini to'plash va o'qitish materiallari sifatida foydalanish, til ta'limini osonlashtirish.

10. Texnik tarjima va til texnologiyalarida qo'llash: texnik tarjima va avtomatlashtirilgan til tahlil qilish dasturlarining ishlanishida asosiy ma'lumotlar bazasi sifatida foydalanish.

Korpus lingvistikasi zamonaviy tilshunoslikda katta ahamiyatga ega bo'lib, til tadqiqotlarida keng foydalaniladigan bir metodologiyadir. Korpus lingvistikasining zamonaviy tilshunoslikdagi ahamiyati juda katta va ko'p qirralidir. Ushbu soha tilni real ishlatilish sharoitlarida tahlil qilish imkonini beruvchi keng qamrovli ma'lumotlar to'plamini taqdim etish bilan muhim o'rin tutadi. Korpus lingvistikasi tilshunoslikka haqiqiy til foydalanish holatlarini empirik tarzda tahlil qilish imkonini berib, nazariy qarashlarni amaliy dalillar bilan mustahkamlashga yordam beradi. Til birliklari va tuzilmalari ishlatilishining aniqligini va chastotasini o'rganish esa leksik va grammatik tadqiqotlarni aniq ma'lumotlar asosida bajarish imkonini beradi.

Korpus lingvistikasi lingvistik nazariyalar va grammatik qonuniyatlar haqiqatdan kelib chiqqan holda tekshirilishini, shuningdek yangi nazariyalar yaratilishini ta'minlaydi. Tilning tarixiy o'zgarishlarini va variantlarini kuzatib borish uchun korpus lingvistikasi katta hajmdagi diakronik ma'lumotlar to'plamini taqdim etadi. Lingvistika bilan bog'liq bo'lgan boshqa fan sohalarida, masalan sotsiolingvistika, psixolingvistika, va forensik lingvistika kabi sohalarda korpus lingvistikasidan foydalanish, tilga oid murakkab savollar bo'yicha yanada chuqurroq tushuncha beradi. Korpus lingvistikasi kompyuterga asoslangan til texnologiyalari, masalan, so'z tanish, nutqni tanib olish, avtomatlashtirilgan tarjima dasturlari va nutqni tahlil qilish algoritmlarini takomillashtirishda katta ahamiyat kasb etadi. Zamonaviy tilshunoslikda korpuslingvistikasi yondashuvlari yangi tilshunoslik metodologiyalarining rivojlanishiga olib keladi, bu esa tilshunoslik tadqiqotlarini yanada pragmatik va natijaga yo'naltirilgan qiladi. Xulosa qilib aytganda, korpus lingvistikasi tilning haqiqiy ishlatilishini tahlil qilish, tilshunoslik nazariyalarini amaliyot bilan bog'lash, hamda tilshunoslikka qo'shimcha aniqlik va chuqurlik kiritish orqali zamonaviy tilshunoslikni boyitishda muhim rol o'ynaydi. Korpus lingvistikasi bir qator zamonaviy til texnologiyalarini rivojlantirishda asosiy yordamchi vosita sifatida xizmat qiladi. Bu texnologiyalar tilni qayta ishlash va uning turli dasturiy mahsulotlarda qo'llanilishini optimallashtirishga yordam beradi. Korpus lingvistikasi bilan bog'liq til texnologiyalari quyidagilarni o'z ichiga oladi. So'z tanib olish sistemalari: NLP dasturlari, masalan, matn muharriridagi imlo tekshirishdan tortib, qidiruv tizimlarigacha so'zlarni va ularning ishlatilishini tanib olishda korpus lingvistikasini qo'llaydi. Sun'iy intellektga asoslangan algoritmlar, masalan, so'zlar va so'z birikmalarining ma'nolarini tushunishda va tilni tabiiy ishlatilishini model qilishda ham til korpuslari katta miqdordagi o'rganish materiali sifatida qo'llaniladi. Korpus lingvistikasi katta hajmdagi ikki til o'rtasidagi tarjimalar to'plamini taqdim etadi, bu mashinani tarjima qilish algoritmlarini o'qitish va takomillashtirishda ishlatiladi. Nutqni tanib olish tizimlari va virtual assistentlar nutqning fonetik va intonatsion xususiyatlarini tushunish uchun keng hajmdagi nutq korpuslaridan foydalanadilar. Til o'rganuvchilar uchun mo'ljallangan dasturlar esa real til materiallarini korpuslardan olib, tildan interaktiv tarzda o'qitishni amalga oshiradilar. Korpus lingvistikasi yuqoridagi va boshqa ko'plab texnologiyalarni takomillashtirishda fundamental ma'lumotlar bazasi sifatida xizmat qilib, ularning samaradorligini va aniqligini oshiradi, shuningdek yangi tilshunoslik texnologiyalarining rivojlanishiga turtki bo'ladi. Tilshunoslikda korpus lingvistikasi sohasi, tilning amaliy ishlanilishi va tilning foydalanishiga oid ma'lumotlar bazasi (korpus) yordamida izlanishi va tahlili bilan shug'ullanadi. Bu soha, korpuslardan olgan ma'lumotlar orqali tilning o'zining qonuniyligi, grammatikasi, leksikasi, va tilning aholi tomonidan foydalanilishi haqida muammosiz va yaxshi ma'lumotlarga ega bo'lishga yordam beradi. Tilshunoslikda korpus lingvistikasi sohasi o'rganilish holati o'zaro aloqalarni yoyish, tilning amaliy foydalanilishini tushunish va boshqalar kabi ko'plab jihatlarda o'rganishni talab qiladi. Xulosa qilsak, korpus lingvistikasi yukoridagi va boshqa ko'plab texnologiyalarni takomillashtirishda fundamental ma'lumotlar bazasi sifatida xizmat qilib, ularning samaradorligini va aniqligini oshiradi, shuningdek yangi tilshunoslik texnologiyalarining rivojlanishiga turtki bo'ladi. Hozirda amalga tadqiqotlar samarasi o'laroq yaqin kelajakda til korpusiga doir muammolarni hal qilish va milliy til korpusimizga ega bo'lishimiz kutilmoqda.

REFERENCES

1. Abduraxmonova N. Kompyuter lingvistikasi.Toshkent: Nodirabegim, 2021

2. Богданова С. Ю, Захаров В. П., Корпусная лингвистика. Учебное пособие -

1. Санкт-Петербург, 2020

2. HamroyevaSH. M. Korpuslingvistikasiatamalariningqisqachaizohlilug'ati. -

3. Buxoro - 2018

4. Xolmanova Z. Kompyuter lingvistikasi. - Toshkent - 2019

5. https://uz.rn.wikipedia.org

6. https://uzkorpus.uz/

i Надоели баннеры? Вы всегда можете отключить рекламу.