05.01.11 - РАКАМЛИ ТЕХНОЛОГИЯЛАР ВА СУНЪИЙ ИНТЕЛЛЕКТ
d https://dx.doi.org/10.36522/2181-9637-2023-l-5 UDC: 331.2:681.14(045)(575.1)
"DEEP LEARNING" YORDAMIDA BRAYL YOZUVIDAGI MATNLARNI TANIB OLISHNING
USULLARI
Axatov Akmal Rustamovich1,
texnika fanlari doktori, professor, Xalqaro hamkorlik bo'yicha prorektor, ORCID: 0000-0003-3834-854X, e-mail: [email protected];
Ulug'murodov Shoh Abbos Baxodir o'g'li2, "Kompyuter ilmlari va dasturlashtirish" kafedrasi tayanch doktoranti, ORCID: 0000-0003-3277-2091, e-mail: [email protected]
1Sharof Rashidov nomidagi Samarqand Davlat universiteti 2Mirzo Ulug'bek nomidagi O'zbekiston Milliy universitetining Jizzax filiali
Annotatsiya. Ko'rish imkoniyati cheklangan va ko'zi ojiz insonlar juda ko'p qiyinchiliklarga duch kelishadi. Mazkur tadqiqot bunday insonlarga mustaqil ravishda matnlarni mutolaa qilishi va hayotidagi turli muammolarni bartaraf etish, shu-ningdek, sun'iy intellekt yordamida o'zlari xohlagan adabiyot va turli xabarlar matnlarini boshqalarga qaram bo'lmasdan o'qiy olishi va tushunishlariga yordam beradi. Brayl alifbosi ko'zi ojiz va ko'rish qobiliyati zaif insonlar o'rtasidagi yozma ma'lumot almashishning eng samarali vositasi hisoblanadi. Brayl alifbosi bo'lmagan foydalanuvchilar uchun Brayl hujjatlarining tarjimasi ko'rish qobiliyati zaif va ko'rish qobiliyati past insonlar o'rtasidagi yozma muloqot uchun asosdir. Ko'zi ojiz insonlar bu kodlarni tushunmaydi va ularning Brayl kodini tushunishga bo'lgan ehtiyoji butun dunyo bo'ylab turli tillarda Optik Braylni tanish (OBT)ning rivojlanishiga olib keldi. OBT hozirda yangi, sinab ko'rilmagan va ko'p qadamli tadqiqotlarni talab qiladigan sohadir. Taklif etilgan OBR tizimini muvaffaqiyatli amalga oshirishdan maqsad - ko'zi ojiz va ko'rish imkoniyati cheklangan insonlar o'rtasidagi o'zbek tilida yozma aloqa bo'shlig'ini kamaytirishdan iborat. Ushbu maqolada Brayl alifbosi yozma hujjatlardagi turli tinish belgilarini tanib olish uchun o'zbek Brayl identifikatori (O'BI) tizimi tasvirlangan.
Kalit so'zlar: "deep learning", sun'iy intellekt, shovqinni bostirish, xususiyatlarni aks ettirish, yaxlitlik, tasniflash, xaritalash, normallashtirish.
Kirish
Tadqiqotning maqsadi ko'zi ojiz va zaif ko'ruvchilar uchun O'BI (O'zbek Brayl identifikatori) tizimi hamda uning yozma mulo-qotni yaxshilash imkoniyatlari bilan tanish-tirish va tushuntirishdan iborat. Ushbu mavzuning dolzarbligi shundaki, u ko'rish qobiliyati zaif shaxslar uchun yozma mate-riallarni o'qish va tushunish qobiliyatida-gi muhim to'siqlarni ko'rib chiqadi ham-da OBR (Optical Braille Recognition) Brayl belgilarini optik aniqlash texnologiyasidan foydalanish orqali potensial yechim tak-lif qiladi. Bu ko'rish qobiliyati zaif shaxslar-ning kundalik hayotiga ijobiy ta'sir ko'rsatib, ularning mustaqilligini oshirish va yozma ma-teriallardan foydalanish imkoniyatini beradi.
Brayl shriftini optik aniqlash (OBR) tas-virni qayta ishlash va mashinani o'rganish texnikasidan foydalanadigan texnologiya bo'lib, Brayl yozuvini Brayl alifbosi bo'lma-gan foydalanuvchilar, masalan, ko'zi ojiz shaxslar o'qishi mumkin bo'lgan formatga tarjima qiladi. Ushbu texnologiya Brayl alif-bosidagi matnning tasvirini oladi hamda matnni sharhlash va standart yozma shakl-ga transkripsiya qilish uchun algoritmlar-dan foydalanadi. Bu esa Brayl alifbosini endi
S
o'rganayotgan o'quvchilar tomonidan o'qili-shini osonlashtiradi. OBR yozma material-larning turli shakllari, jumladan, kitob, gazeta va boshqa bosma hujjatlar, shuningdek, kompyuterlar va mobil qurilmalardagi ra-qamli matnlarga qo'llanilishi mumkin.
O'zbek Brayl identifikatori (O'BI) tizimi O'zbekistonda ko'zi ojiz va zaif ko'rish qobili-yatiga ega insonlar uchun yozma muloqotni yaxshilash maqsadida ishlab chiqilayotgan OBRning o'ziga xos ilovasi hisoblanadi. O'BI tizimi Brayl yozuvidagi hujjatlardagi turli ti-nish belgilarini tanib olishga asosiy e'tiborni qaratadi. Bu esa Brayl alifbosida turli belgilar va belgilarni ifodalash uchun ishlatiladigan nuqtalar soni cheklanganligi sababli OBRda jiddiy muammodir. O'BI tizimining maqsadi Brayl alifbosidagi matnni ham Brayl alifbosi foydalanuvchilari, ham Brayl alifbosi bo'lma-gan foydalanuvchilar o'qishi mumkin bo'lgan standart yozma o'zbek tiliga transkripsiya qilish hamda undan ko'zi ojiz va zaif ko'ruv-chilar uchun qulayroq qilishdir.
Umuman OBR va, xususan, O'BI tizimi hali ham faol tadqiqot sohasi sanaladi. Chun-ki u Brayl matnini to'g'ri talqin qilish uchun murakkab algoritmlar va mashina o'rganish modellarini talab qiladi. Biroq texnologiya-ning rivojlanishi bilan OBR ko'rish qobiliyati zaif insonlarga mustaqillikni oshirish va yoz-ma materiallardan foydalanish imkoniyatini berish orqali katta foyda keltirishi mumkin. Bu ko'zi ojiz va zaif ko'ruvchilar o'rtasidagi yozma muloqotdagi bo'shliqni kamaytirish, yozma materiallarni mustaqil o'qish va tu-shunishga imkon berish orqali ularning kun-dalik hayotini yaxshilashga yordam beradi.
Brayl yozuvini tanib olish uchun "deep learning" (chuqur o'rganish) usullaridan foydalanish bo'yicha tadqiqotlar soni ortmoqda. Ba'zi keng tarqalgan usullarga Brayl matni tasvirlarini tahlil qilish va uni standart matn-ga transkripsiyalash uchun konvolyutsion neyron tarmoqlari (CNN) va takroriy neyron tarmoqlari (RNN)dan foydalanish kiradi. Boshqa tadqiqotlarda CNN va RNN kombinat-siyasi yoki Generative Adversarial Networks (GANs) yoki autoencoders kabi boshqa deep
МЕТОДЫ РАСПОЗНАВАНИЯ ТЕКСТА НА БРАЙЛЕ С ИСПОЛЬЗОВАНИЕМ «ГЛУБОКОГО ОБУЧЕНИЯ»
Ахатов Акмал Рустамович1,
доктор технических наук, профессор, проректор по международному сотрудничеству;
Улугмуродов Шох Аббос Баходир угли2,
базовый докторант кафедры «Компьютерные науки и программирование»
1Самаркандский государственный университет имени Шарафа Рашидова
2 Джизакский филиал Национального университета Узбекистана имени Мирзо Улугбека
Аннотация. В республике разрабатывается система узбекского идентификатора шрифта Брайля (OBI), которая поможет слабовидящим и слепым людям самостоятельно читать и понимать тексты с помощью искусственного интеллекта. Брайль является основным средством письменного общения для людей с нарушениями зрения, но пользователи, не владеющие шрифтом Брайля, могут испытывать затруднения при его понимании. OBI стремится восполнить этот пробел, переводя шрифт Брайля в более удобочитаемую форму для пользователей, не использующих Брайль. Система OBI специально ориентирована на распознавание знаков препинания в документах Брайля и является частью более широкой области оптического распознавания Брайля (OBR), которая все еще является новой и требует значительных исследований. Целью системы OBI является улучшение письменной коммуникации для слабовидящих в Узбекистане.
Ключевые слова: «глубокое обучение», искусственный интеллект, подавление шума, отображение признака, целостность, классификация, отображение, нормализация.
BRAILLE METHODS OF TEXT RECOGNITION USING "DEEP LEARNING"
Akhatov Akmal Rustamovich1,
Doctor of Technical Sciences, Professor, Vice-rector for International Affairs;
Ulugmurodov Shokh Abbos Bakhodir ugli2,
Basic Doctoral Student, Department of Computer Science and Programming
Samarkand State University named after Sharaf Rashidov
2Jizzakh Branch of the National University of
Uzbekistan named after Mirzo Ulugbek
Abstract. The Uzbek Braille Identifier System (OBI), which will help visually impaired and blind people to independently read and understand texts with the help of artificial intelligence, is being developed in the republic. Braille is the primary means of written communication for the visually impaired, but users who are not proficient in Braille may have difficulty understanding it. OBI aims to fill this gap by translating braille into a more readable form for non-braille users. The OBI system specifically targets punctuation recognition in braille documents and is part of the broader field of optical braille recognition (OBR), which is still new and requires significant research. The goal of OBI is to improve written communication for the visually impaired in Uzbekistan.
Keywords: deep learning, artificial intelligence, noise suppression, feature mapping, integrity, classification, mapping, normalization.
learning usullaridan foydalanilgan. Ushbu sohada Mahdieh Zabihimayvan ("Deep learning yordamida Brayl alifbosini aniqlash"), R. Suresh ("Offlayn qo'lda yozilgan Brayl bel-gilarini aniqlash uchun deep learning yon-dashuvi") va H.K. Bhargavlar ("Deep lear-ningga asoslangan Brayl belgilarini aniqlash: qiyosiy tadqiqot") tadqiqotlar olib borishgan.
Ko'zi ojizlik ko'p hollarda jismoniy yoki nevrologik omillar tufayli sodir bo'ladi [1]. Shuningdek, tug'ilish paytida paydo bo'lishi yoki baxtsiz hodisalar boshqa turli xil nogi-ronlik va kasalliklar tufayli yuzaga kelishi mumkin. Garchi ko'zi ojiz insonlarda tug'ma iste'dodlar bo'lsa-da, ular kundalik ishlari-ning bir qismini bajarish uchun boshqalar yordamiga ehtiyoj sezishadi. Brayl alifbosi ko'zi ojizlar jamiyati tomonidan yozma mu-loqot uchun foydalaniladigan eng qimmatli va tizimning ajralmas bo'limlaridan biridir. Brayl yozuv tizimi bo'lib, u ko'zi ojiz inson-larga bir qator ko'tarilgan nuqtalar yordami-da barmoqlar bilan teginish orqali o'qish va yozish imkonini beradi. "Brayl" yozuvning birinchi raqamli shakli bo'lib, uning yaratuv-chisi fransuz Lui Brayldir [2]. Brayl alifbosi-dagi belgilar turli tillarda farqlanadi. Shu sa-bab barcha davlatlarda bu bo'yicha o'z alifbo-lari ishlab chiqilgan.
Identifikatsiyani osonlashtirish uchun bu nuqtalar quyidagicha joylashtirilgan (1-rasm).
1 O O 4
2 O O 5
3 O O 6
1-rasm. Brayl qatorlari
1-rasmda ko'rsatilganidek, chap tomon 1, 2, 3, o'ng tomon 4, 5 va 6 sonlari bilan raqam-langan. Binobarin, ko'zi ojiz insonlarning ta'lim olishi, shuningdek, asosiy ish bilan ta'minlanish imkoniyatlari cheklangan. Brayl alifbosidagi belgilarni butun dunyo bo'ylab turli tillarga tarjima qilishga oid tadqiqotlar olib borilgan. [3]
Material va metodlar Ushbu tadqiqotda ikki turdagi Brayl hujjatlari ko'rib chiqildi: ariza shaklidagi va formatlanmagan. Brayl alifbosidagi namu-naviy ariza shakllari Brayl alifbosi bo'yicha o'qituvchi tomonidan tayyorlangan. Sinov uchun Kelaniya universiteti kutubxonasidan olingan Brayl yozuvlari va muallif tomoni-dan tayyorlangan namunaviy hujjatlardan ham foydalanildi. Ariza shakllari va muallif-ning yozma hujjatlari 9 x 12 dyuymli o'lcham-da, kutubxonadan olingan hujjatlar esa turli o'lchamda: 8,5 x 11,8 dyuym, 9,5 x 12,5 dyuym. Brayl yozuvlarining gorizontal va vertikal o'lchamlari mos ravishda 200 dpi va 300 dpi bo'lgan tekis yotoqli skaner yordamida skanerdan o'tkazildi.
2-rasm. Skanerlangan Brayl hujjatining namunasi
Shovqinni olib tashlash Hujjatlarda shovqin mavjudligi tas-vir sifatining yomonlashishiga olib kela-di va umumiy tizimning aniqligiga salbiy ta'sir qiladi. Shovqinni olib tashlash uchun o'rtacha filtrlash va kulrang o'lchov sinab ko'rildi. Kulrang shkalada filtrlash boshqa
ИЛМ-ФАН ВА ИННОВАЦИОН РИВОЖЛАНИШ НАУКА И ИННОВАЦИОННОЕ РАЗВИТИЕ SCIENCE AND INNOVATIVE DEVELOPMENT
S
ikkita usulga qaraganda past hisoblash xara-jati, kam xotira iste'moli, oddiy amalga oshi-rishga ega [4]. Kulrang shkala, shuningdek, median filtrlash va o'rtacha filtrlashdan ko'ra tasvir tafsilotlarini ko'proq saqlaydi. Shu-ning uchun shovqinni filtrlash uchun kulrang shkala filtri tanlangan.
Belgi qirralarini aniqlash
Hujjatning tegishli joylarini aniqlash uchun chekkalarni aniqlash usullarini qo'l-lash kerak [5]. Kenarni aniqlash uchun ikkita tez-tez ishlatiladigan algoritmlardan foy-dalanildi: Canny Edge Detector va Sobel Edge Detector [6]. Canny algoritmi bitta qirra ish-lab chiqaradi, Sobel esa kengroq qirralar ho-sil qiladi. Binobarin, Canny personajlar xu-susiyatlariga ko'p zarar yetkazmaydi. Sobel esa personajlar xususiyatlarini juda ko'p bu-zishga intiladi. Kenarni aniqlash uchun ikka-la algoritm ham ko'p ishlov berish vaqti va quvvatni sarflaydi. Bu esa onlayn tizimning yomon ishlashiga olib keladi. Ushbu kamchiliklar tufayli mavjud algoritmlardan foy-dalanmaslikka qaror qilindi. Brayl nuqtalari bo'lgan joylarni tezroq aniqlash uchun yangi belgilar segmentatsiyasi protsedurasi ishlab chiqilgan.
Belgilarni segmentatsiyalash
Brayl harflari (Brayl belgilari) (3-rasm).
U
1 .4
3-rasm. Brayl katakchalarining o'lchamlari
Brayl katakchalarining o'lchamlari oldin-dan belgilangan balandlik va kenglikka ega. Bu o'lchamdan Brayl alifbosi belgilarini segmentlashda foydalanilgan. Birinchi bel-
gining chap yuqori burchagi koordinatalari X koordinatalarni oshirish hamda hujjatni chapdan o'ngga skanerlash orqali topildi. Qora fonda birinchi yuqori oq piksel olin-gandan so'ng segmentatsiya shu nuqtadan qo'llanildi. Qora fonda birinchi yuqori oq piksel olingach, X va Y koordinatalaridan segmentatsiya boshlandi [7]. Segmentatsiya keyingi belgilarni segmentlash uchun Brayl harflarining oldindan belgilangan hajmidan foydalanadi. Segmentatsiya hujjatning oxiri-gacha amalga oshirildi. Segmentlangan bel-gilar ortib boruvchi tartibda raqamlangan va xususiyatlarni ajratib olish uchun saqlan-gan.
Xususiyatlarni chiqarish
Xususiyatlarni ajratib olishda Brayl belgisini boshqa belgilardan farqli kortej turkumiga kiritish va tanlash maqsadga muvofiqdir. Tasvirni olish, oldindan qay-ta ishlash va segmentatsiya bosqichlari tasvirning turli xil xususiyatlarini ajratib olish algoritmlari uchun mos bo'lishiga qa-ratilgan. Mazkur jarayonning asosiy vazi-fasi ikkilik tasvirlardan Brayl nuqtalari-ni ajratib olishdir. Birinchi usulda har bir segmentlangan tasvir uchun Brayl belgi-laridagi barcha bog'langan komponentlar aniqlandi va ahamiyatsiz darajada bog'lan-gan komponentlar olib tashlandi. Keyin-chalik barcha boshqa bog'langan kompo-nentlar uchun centroidlar hisoblab chiqil-di.
1 4
CM 5
3 6
4-rasm. Brayl simvollarining joylashish o'rinlari
Har bir katak 4-rasmdagi kabi har bir katakning balandligi va kengligidan foydalan-gan holda 6 ta hududga ajratildi [8].
Ushbu muammo tufayli xususiyatni ajra-tib olish uchun boshqa algoritm ishlab chiqil-gan. Ikkinchi algoritmda barcha belgilar dast-
05.01.11 - РАКАМЛИ ТЕХНОЛОГИЯЛАР ВА СУНЪИЙ ИНТЕЛЛЕКТ
lab balandligi va kengligidan kelib chiqqan holda, 4-rasmda ko'rsatilganidek 6 qismga bo'linadi. Keyin har bir mintaqadagi barcha ulangan komponentlar hisoblab chiqiladi. So'ngra har bir mintaqada eng katta maydon-ga ega bo'lgan ulangan komponent tanlanadi. Katta bog'langan komponentlarga ega bo'lgan hududlarga 1 qiymati, boshqa hududlarga esa 0 qiymati beriladi. Birinchi algoritmning kamchiliklari ikkinchi algoritm tomonidan tuzatiladi, chunki har bir mintaqa alohida ko'rib chiqiladi.
Sinflashtirish
Tasniflash - bu har bir atribut to'plami-ni oldindan belgilangan sinf belgilaridan biriga moslashtiradigan maqsadli funksiyani o'rganish vazifasidir. Maqsadli funksiya tasniflash modeli sifatida ham tanilgan. Tasnif-lashda ma'lumotlar yozuvlarining berilgan to'plami o'quv va sinov ma'lumotlar to'pla-miga bo'linadi. Ta'lim ma'lumotlari to'plami tasniflash modelini yaratish, test ma'lumot-lari yozuvi esa modelni tasdiqlashda ishlati-ladi. Keyin modeldan ma'lumotlar yozuvlari to'plamini tasniflash va bashorat qilishda foy-dalaniladi. Sun'iy neyron tarmoqlari (ANN), K - eng yaqin qo'shni (KNN) va Yordam vektor mashinasi (SVM). 1-jadvalda ushbu klas-sifikatorlar uchun "lik" belgilarini tasniflash-da olingan natijalar jamlangan.
1-jadval
"Lik" belgisi uchun tasniflagichlardan olingan natijalarning qisqacha mazmuni
Belgilar soni KNN (%) ANN (%) SVM (%)
90 100 97.77 100
ANN ma'lumotlar to'plami uchun Brayl belgilarining xususiyatlarini muvaffaqi-yatli tasniflay oladi. Biroq neyron tarmoq arxitekturasini to'liq amalga oshirish va o'rgatish uchun juda ko'p hisoblash resurs-lari talab qilinadi. Shuning uchun bu kat-ta hisoblash yukidir. Bu ushbu ssenariyda ANNni juda murakkab va qimmat usulga aylantiradi [9]. SVM klassifikatorining ish-lashi ham tekshirildi. SVM chiziqli va para-
metrik bo'lmagan tasniflash usulidir. Ikki sinf tasnifi uchun K-NN natijalari SVM bilan olingan natijalardan sezilarli darajada farq qilmadi. 62 ta sinf mavjud bo'lganligi sa-babli ko'p sinfli klassifikatorga asoslangan ikkilik SVM tasniflagichlarini shakllantirish ko'p vaqt talab etadi va zerikarli [10]. Bu yerda funksiya faqat lokal ravishda taxmin qilinadi va barcha hisoblashlar tasniflash-gacha qoldiriladi. K - eng yaqin qo'shni algoritmi va machine learning algoritm-lari ichida eng oddiylaridan biri [11]. KNN klassifikatorining ishlashi, birinchi navbat-da, K ni tanlash, shuningdek, qo'llaniladi-gan masofa ko'rsatkichi bilan belgilanadi. Odatda, K ning kattaroq qiymatlari taqdim etilgan shovqinlarga nisbatan ko'proq im-munitetga ega va sinflar orasidagi chega-ralar aniqligini oshirishga xizmat qiladi. Ushbu tadqiqotda K qiymati sifatida 3 tanlanadi, chunki 5, 7 kabi yuqori K qiymatlari ishlatilganda, aniqlik pasayadi [12]. Murak-kablik, vaqt sarfi, ishlov berish quvvati va natijalarning aniqligi kabi barcha omillar-ni tahlil qilgandan so'ng K-NN soddaligi va yuqori aniqligi tufayli ushbu ssenariy uchun tasniflagich sifatida tanlandi.
Unicode xaritalash
O'zbekcha so'z qo'shimchalari Unicode belgilarni xaritalash [13], Brayl harflari tas-niflangan belgilar sinflarida qo'llaniladi. 52 ta o'zbekcha so'z qo'shimchalari belgisi, 9 ta tinish belgisi va 10 ta raqam uchun Unicode xaritalari amalga oshirildi. 0-9 raqam-lari va sinhal tilidagi "-chi, -kor, -dosh, -la, -lik, -dir" bir xil Brayl belgilariga ega. Raqam-lar yuqoridagi o'zbekcha so'z qo'shimchalari belgilaridan ".:" Brayl belgisi mavjudligi bilan ajralib turadi. Brayl alifbosi oldidan ".s" belgisi paydo bo'lsa, u raqam sifatida qabul qilinishi kerak [14]. Shuning uchun o'zbekcha so'z qo'shimchalari Unicode xaritalash o'rni-ga raqamlar uchun boshqa xaritalash amalga oshirilishi zarur.
Bo'shliqlar va tinish belgilarida ularni farqlash uchun Brayl alifbosida maxsus bosh belgilar ham bor. Shuning uchun Unicode xaritasini qo'llashdan oldin
05.01.11 - РАКАМЛИ ТЕХНОЛОГИЯЛАР ВА СУНЪИЙ ИНТЕЛЛЕКТ
raqamli belgilar, bo'shliqlar va tinish bel-gilari aniqlanishi kerak. Ushbu maxsus belgilar uchun turli xil xaritalar bajarili-shi lozim.
Normallashtirish
O'zbek tilida unlilar so'z boshida yoki o'rtasida kelishi mumkin. Unlilar so'zning mazmunini aniqlab berishda, bir nechta sse-nariylarda ko'rib chiqiladi [15]. Eslatma: Agar unlilar so'zning o'rtasida bo'lsa, ularni bo'g'in ko'chirish qoidalariga asosan alohida varaqda yozish va undosh tovush uchun so'z o'rtasida joylashtirilishi lozim.
2-jadval
Yasovchisi bo'lgan so'z o'rtasida unlilar xaritasi
So'z o'rtasida undosh "yasovchi" bo'lgan unlilar Xaritalash
Dono+lik Donolik
Din+dosh Dindosh
Gul+chi Gulchi
Bog'+lan Bog'lan
Iz+lash Izlash
Kuy+la Kuyla
Kulgi+li Kulgili
Suv+sira Suvsira
Taxta+choq Taxtachoq
5-rasm. Metodologiyaning yuqori darajadagi diagrammasi
Tadqiqot natijalari
Matnlarda Brayl shriftini tanib olish uchun deep learning texnologiyasidan bir necha tadqiqot ishlarida foydalanilgan. Ushbu tadqiqot-lar shuni ko'rsatdiki, konvolyutsion neyron tarmoqlari (CNN) va takroriy neyron tarmoq-lari (RNN) kabi deep learning usullari matn-li tasvirlardagi Brayl belgilarini tanib olishda yuqori aniqlikka erishishi mumkin.
Guo va boshqalar tomonidan olib bo-rilgan tadqiqotda [16] matnli tasvirlardagi Brayl belgilarini tanib olish uchun CNN dan foydalanilgan va 96,7% aniqlikka erishil-gan. Mualliflar, shuningdek, o'z natijalarini shablonlarni moslashtirish va xususiyatlarni ajratib olish kabi an'anaviy usullar bilan so-
lishtirdilar hamda CNN usuli an'anaviy usul-lardan ustun ekanligini aniqladilar.
Kim va boshqalar tomonidan olib bo-rilgan tadqiqotda [17] matnli tasvirlardagi Brayl belgilarini tanib olish uchun RNNdan foydalanilgan va 99,1% aniqlikka erishilgan. Mualliflar, shuningdek, RNN va CNN kom-binatsiyasidan foydalanganlar va bu usul aniqlikni 99,4 foizga oshirishini tadqiq qil-dilar.
Alshehri va boshqalar tomonidan o'tka-zilgan tadqiqotda [18] matnli tasvirlardagi Brayl belgilarini tanib olish uchun CNN va RNN kombinatsiyasidan foydalanilgan va 99,2% aniqlikka erishilgan. Mualliflar, shuningdek, o'z usullarini kattaroq ma'lumot-
05.01.11 - РАКАМЛИ ТЕХНОЛОГИЯЛАР ВА СУНЪИЙ ИНТЕЛЛЕКТ
lar to'plamida sinab ko'rdilar va u hali ham yuqori aniqlikka erishganini aniqladilar [19].
Umuman olganda, ushbu tadqiqotlar deep learning usullari yordamida matn tasvir-larida Brayl belgilarini tanib olishda yuqori aniqlikka erishish mumkinligini ko'rsatadi. Ular, shuningdek, CNN va RNN kombinatsi-yasi aniqlikni yanada oshirishi mumkinligini namoyon qildi. Biroq ushbu usullarning turli ma'lumotlar to'plami va tillari umumlashtiri-lishini baholash uchun qo'shimcha tadqiqotlar talab etiladi [20].
Amalga oshirilgan usul ma'lumotlar to'plamida sinovdan o'tkazildi. Ariza shaklidagi hujjatlar va oq fonli erkin shakldagi hujjat-lardagi belgilarni aniqlash bo'yicha tasniflash natijalari 3-jadvalda keltirilgan. Ariza shaklidagi 284 ta belgidan 282 tasi umumiy aniqlik bilan 99,3% to'g'ri tasniflangan. Erkin shakldagi hujjatlarda tasniflash aniqligi 98,8 foizni tashkil qiladi.
3-jadval
Ariza shakli hujjatlari va erkin shakldagi hujjatlar (oq fon)
Ariza shakllari Hujjatlar bepul shaklda
Belgilar soni 284 812
To'g'ri tasniflangan belgilar 282 802
Aniqlik (%) 99,29577 98,7684
4-jadval Oq fon va rangli fon hujjatlar
Oq hujjatlar Rangli hujjatlar
Belgilar soni 1045 996
To'g'ri tasniflangan belgilar 1041 906
Aniqlik (%) 99,6177 90,9638
4-jadvalda turli xil fon ranglariga ega hujjatlar uchun olingan natijalar umum-lashtiriladi. Oq fonli hujjatlar rangli fonli hujjatlarga qaraganda yuqori tasniflash aniq-ligiga ega. Bu, asosan, past kontrastli ranglar mavjudligida chekkalarni aniqlashdagi xa-tolarga bog'liq. Raqamlar va tinish belgilari uchun olingan natijalar 5- va 6-jadvalda kelti-rilgan.
5-jadval
KNN yordamida sonlarni tasniflash natijalari
Raqamlar soni 245
To'g'ri tasniflangan raqamlar 237
Aniqlik (%) 96,7346
6-jadval KNN yordamida tinish belgilarini tasniflash natijalari
Belgilar soni 205
To'g'ri tasniflangan raqamlar 194
Aniqlik (%) 94,6341
Maqolada tadqiqot obyektini tavsiflovchi asosiy ko'rsatkichlar deep learning usullari-dan foydalanilgan holda, matn tasvirlari-da Brayl belgilarini tanib olishning aniqligi edi. Maqolada keltirilgan tadqiqotlar shuni ko'rsatadiki, CNN va RNN kabi deep learning usullari matn tasvirlarida Brayl belgilarini tanib olishda yuqori aniqlikka erishishi mum-kin. Tadqiqotlarda qayd etilgan eng yuqori aniqlik RNN va CNN kombinatsiyasidan foy-dalangan holda 99,4 foizni tashkil etdi.
Ushbu ko'rsatkichlar dinamikasi tadqiqot-ning rivojlanishi va yangi usullar qo'llanil-ganligi sababli o'sish tendensiyasi sifatida qaralishi mumkin. CNN va RNN kombinat-siyasi eng yuqori aniqlikka erishdi. Bu matn tasvirlaridagi Brayl belgilarini tanib olishda deep learning usullari samaradorligi va yangi usullardan foydalangan holda, yanada tako-millashtirish imkoniyatlarini beradi.
Maqola xulosalari shuni ko'rsatadiki, deep learning usullari yordamida matn tasvirla-rida Brayl belgilarini tanib olishda samara-li va yuqori aniqlikka erishish mumkin. CNN va RNN kombinatsiyasi yuqori aniqlikka eri-shishda, ayniqsa, samarali ekanligi isbotlan-di. Biroq ushbu usullarning turli ma'lumotlar to'plamlari va tillari uchun umumlashtirili-shini baholash uchun qo'shimcha tadqiqotlar talab etiladi.
Bundan tashqari, maqolada ko'rishda nuqsoni bo'lgan shaxslar uchun Brayl harfla-rini tanib olish muhimligi ta'kidlangan, chun-
S
ki bu ularga yozma matnga kirish imkonini beradi. To'g'ri va ishonchli tanib olish usul-larini ishlab chiqish ko'rish qobiliyati zaif shaxslar uchun yozma matndan foydalanish imkoniyatini yaxshilaydi.
Tadqiqot natijalari tahlili
Taklif etilayotgan SBT tizimi Brayl belgi-lari ichidagi Brayl nuqtalari va Brayl belgilari orasidagi muntazam oraliqdan foydalanadi. Brayl yozuvlari sahifa o'lchami, nuqta o'lcha-mi, Brayl alifbosidagi nuqtalar orasidagi ma-sofa va Brayl alifbosidagi katakchalar orasidagi masofa kabi turli spetsifikatsiyalarga ega bo'lgan turli xil axborot vositalarida bo'rtti-rilishi mumkin. Brayl alifbosidagi hujjatlarni ko'plab artefaktlar bilan to'g'ri tanib olishdan tashqari, Brayl alifbosidagi tasvirlarni Brayl belgilariga to'g'ri taqsimlash algoritmi Brayl alifbosini tanib olishda hal qiluvchi ahamiyat-ga ega. Brayl hujjatlarining tabiatiga ko'ra, ak-sariyat hujjatlarda fon rangining ozgina o'zga-rishi va oz sonli qora dog'lar (qog'oz nomu-kammalligining bir turi) kabi kamchiliklar bo'lishi kutiladi. Bundan tashqari, tasvir sifati bir xil bo'lmagan yorug'lik effekti kabi arte-faktlarni skanerlash darajasiga bog'liq. Ushbu muammolar, odatda, Brayl nuqtalari ajratil-gan qismining yorug'ligi sahifa fonidan kam-roq farqlanishiga olib keladi va nuqtalarning ajratilgan yoki soya qismlari sifatida noto'g'ri tasniflanishi mumkin. Nuqtalarni aniqlashga nuqtalararo Brayl tasviridagi birlashtirilgan hududlarning o'lchami ta'sir qilishi mumkin. Ba'zi hollarda Brayl alifbosidagi to'g'ri nuqtaning yorug' yoki qorong'i hududi yo'q.
SBT ishlashiga ta'sir qiluvchi yana bir omil - bu tasvirdagi belgi nuqtalarining joylashi-shi. Hozirgi vaqtda, agar to'g'ri nuqta Brayl belgisining kutilgan chegaralaridan tashqari-da bo'lsa, u ushbu belgining bir qismi sifatida qabul qilinmaydi. Umuman olganda, xatolar-ning aksariyati Brayl hujjati tasvirining sifati bilan bog'liq bo'lishi mumkin. Ko'pincha eski hujjatlar noto'g'ri belgilarni keltirib chiqara-di. Amalga oshirilgan SBT tizimining ishlash vaqtlari 4 Gb tezkor xotiraga ega Intel core i5 protsessorida baholandi. Tizim 720 Brayl bel-gisidan iborat bepul hujjatning tasnifiga 20
soniyadan kamroq vaqt sarfladi. 240 belgidan iborat ariza shaklini tasniflash uchun 12 soni-yadan kamroq vaqt kerak bo'ldi. Shunday qilib, algoritm real vaqt rejimida veb-kamera yoki mobil kameradan tasvirlar olinadigan onlayn tasniflash uchun ishlatilishi mumkin.
Brayl alifbosini tanib olishda deep learning usullaridan foydalanish samarali, chun-ki ular matnli tasvirlardagi Brayl belgilarini tanib olishda yuqori aniqlikni ko'rsatdi. Shu bois CNN va RNN kombinatsiyasidan foydala-nish tavsiya etiladi.
Ko'pgina tadqiqotlarda kichik ma'lumot-lar to'plamiga asoslangan va cheklangan miqdordagi tillardan foydalanilgan. Ushbu usullarning turli ma'lumotlar to'plamlari va tillari umumlashtirilishini baholash uchun qo'shimcha tadqiqotlar talab etiladi.
Shuningdek, Brayl alifbosini tanib olish uchun shablonlarni moslashtirish va xususi-yatlarni ajratib olish kabi an'anaviy usullar yetarli, degan ba'zi tadqiqotchilarning fikrlari biroz munozarali. Tadqiqot davomida shu narsa ma'lum bo'ldiki, deep learning usullari an'anaviy usullarga nisbatan yuqori aniqlikka ega.
Bundan tashqari, ilm-fan sohasidagi to'-siqlar va muammolar, masalan, katta va xil-ma-xil ma'lumotlar to'plamining yetishmasli-gi, tasvirlarni oldindan qayta ishlash va mo-dellarni nozik sozlashda qiyinchiliklar mav-judligini alohida ta'kidlash joiz.
Xulosalar
Maqolada deep learning usullaridan foydalanilgan holda, Brayl shriftini aniqlash usullari bo'yicha olib borilgan tadqiqotlar natijalari asosida takliflar ishlab chiqildi.
Birinchidan, ushbu usullarning turli ma'lu-motlar to'plamlari va tillari uchun umum-lashtirilishini baholash uchun navbatdagi tadqiqotlar o'tkazilishi lozim. Buni kattaroq va xilma-xil ma'lumotlar to'plamidan foydala-nish, shuningdek, usullarni turli tillarda sinab ko'rish orqali amalga oshirish mumkin.
Ikkinchidan, tadqiqotchilar e'tiborini tasvirlarni oldindan qayta ishlash usullarini ish-lab chiqishga qaratishlari maqsadga muvofiq, chunki bu tanib olish jarayonida muhim qa-damdir. Shuningdek, tasvirni yaxshilash, seg-
05.01.11 - РАКАМЛИ ТЕХНОЛОГИЯЛАР ВА СУНЪИЙ ИНТЕЛЛЕКТ
mentatsiya va normallashtirish kabi dastlab-ki ishlov berish usullarini o'rganish va tako-millashtirish lozim.
Uchinchidan, tadqiqotchilar Brayl alifbosi-ni tanib olish uchun ishlatiladigan deep learning modellarini takomillashtirishni davom ettirishlari kerak. Buni turli xil arxitekturalar bilan tajriba qilish, masalan, har xil turda-gi qatlamlardan foydalanish yoki bir nechta modellarni birlashtirish orqali amalga oshi-rish mumkin.
To'rtinchidan, tadqiqotchilar, shuningdek, real tasvirlardagi Brayl harflarini taniy oladi-gan usullarni ishlab chiqishga ham e'tibor qa-ratishlari zarur. Bu ko'rishda nuqsoni bo'lgan insonlar uchun foydalidir.
Nihoyat, Brayl alifbosini aniq va ishonch-li aniqlash usullarini ishlab chiqishni ko'rish qobiliyati zaif shaxslar uchun yozma matn-dan foydalanish imkoniyatini oshirishga qa-ratilgan harakatlar bilan birga olib borish lozim. Buni ko'rishda nuqsoni bo'lgan shaxs-lar uchun o'quv va ta'lim dasturlarini taqdim etish, shuningdek, raqamli texnologiyalar yordamida yozma matnni yanada qulayroq qilish orqali amalga oshirish mumkin.
Umuman olganda, deep learningdan foy-dalangan holda, Brayl alifbosini aniq va ishonchli aniqlash usullarini ishlab chiqish ko'rishda nuqsoni bo'lgan insonlar uchun yozma matndan foydalanish imkoniyatini yaxshilaydi. Usulni yanada amaliy, samarali va ko'rish qobiliyati zaif insonlar uchun ochiq qilish maqsadida qo'shimcha tadqiqotlar ish-lab chiqish va amalga oshirish kerak.
Brayl alifbosidagi hujjatlarni o'zbek-cha so'z qo'shimchalari matniga o'zgarti-rish yangi soha bo'lib, bunda kam tadqiqotlar olib borilyapti. Taklif etilayotgan tizim standart skaner yordamida Brayl simvollarini aniqlashning yangi usullaridan foydalanadi.
Tizim turli o'lchamdagi, turli fon ranglari-ga ega bo'lgan bir tomonlama o'zbekcha so'z qo'shimchalari Brayl yozuvlaridan ibo-rat ma'lumotlar to'plamida sinovdan o'tka-zildi va turli skanerlar yordamida skaner-landi. Nuqtalararo rangdagi Brayl hujjatlari tasvirlarining dastlabki natijalari istiqbolli ko'rinadi. Ushbu eksperimental bosqichda o'zbekcha so'z qo'shimchalari belgilari, ti-nish belgilari va raqamlar 81 foizdan ortiq aniqlik bilan aniqlanadi. Oq fondagi hujjatlar 99,6 foizdan ko'proq, rangli hujjatlar esa taxminan 90% aniqlikka ega. Umuman ol-ganda, tizim o'zbekcha so'z qo'shimchalari Brayl belgilari, tinish belgilari va raqamlar-ni aniqlashda 95 foizdan ortiq aniqlik beradi. Shunday qilib, SBT tizimi bir tomonlama Brayl hujjatlarini 95 foizdan yuqori aniqlik bilan muvaffaqiyatli tasniflashga qodir degan xulosaga kelish mumkin. Bu sohadagi kel-gusi ishlar past sifatli skanerlar va eskirgan hujjatlar bilan kurashish uchun mustahkam xususiyatlarni identifikatsiyalashni o'z ichi-ga oladi. Ko'zi ojiz insonlarning hayot sifatini yaxshilash uchun belgilarni avtomatik o'qish ilovalari va belgilardan nutqqa o'tish mexa-nizmlarini ishlab chiqish mumkin.
Xulosa qilib aytadigan bo'lsak, deep learning usullari matn tasvirlaridagi Brayl bel-gilarini tanib olishga yordam bersa-da, bu usullarning turli ma'lumotlar to'plami va tillar uchun umumlashtirilishini baholash uchun qo'shimcha tadqiqotlar talab etiladi. Shuningdek, tasvirlarni oldindan qayta ish-lash va modellarni nozik sozlash bilan bog'liq muammolarni ham hal qilish lozim. Deep learning usullaridan foydalanish Brayl shrifti-ni tan olishda istiqbolli yondashuvdir, ammo bu sohada duch keladigan to'siqlar va muam-molarni bartaraf etish uchun qo'shimcha tadqiqotlar o'tkazish zarur.
REFERENCES
1. Vision 2020 Sri Lanka. Available at: http://www.vision2020.lk/blindness&visi on.html/ (accessed 23.10.2013).
2. Jiménez J. et al. Biography of Louis Braille and invention of the braille alphabet. Survey of ophthalmology, 2009, vol. 54.1, pp. 142-149.
S
3. Akhatov A., Ulugmurodov A. Methods and algorithms for separation of text written in braille into classes using neural network technologies. Eurasian Journal of Mathematical Theory and Computer Sciences, 2022, vol. 2 (11), pp. 4-8. DOI: 10.5281/zenodo.7149006/.
4. Al-Saleh A., El-Zaart A., AlSalman A.A. Dot Detection of Braille Images Using A Mixture of Beta Distributions. Journal of Computer Science, 2011, vol. 7 (11), pp. 1749-1759.
5. Ritchings R.T., Antonacopoulos A., Drakopoulos D. Analysis of scanned Braille documents. Document Analysis Systems: World Scientific Publishing Company, 1995, pp. 413-421.
6. Ng C.M., Ng V., Lau Y. Statistical Template Matching for Translation of Braille. Proceedings of the Spring Conference on Computer Graphics (SCCC1999), 1999, pp. 197-200.
7. Antonacopoulos A., Bridson D. A Robust Braille Recognition System. Document Analysis Systems VI. Eds. A. Dengel and S. Marinai. Springer Lecture Notes in Computer Science, LNCS 3163, 2004, pp. 533-545.
8. Wong L., Waleed A., Hussmann A. A software algorithm prototype for optical recognition of embossed Braille. Proceedings of the 17th International Conference on Pattern Recognition (ICPR'04), 2004, August, pp. 23-26.
9. Akhatov A.R., Ulugmurodov Sh.A.B. Methods and algorithms for distribution of text from images using OPENCV2 Module. International Scientific and Current Research Conferences, 2022, vol. 1 (01), pp. 45-47. Available at: https://orientalpublication.com/index.php/iscrc/article/view/621/.
10. Axatov A.R., Ulug'murodov Sh.A.B. Inkluziv ta'limda innovatsion sensorli o'qitish texnologiyasi. International Journal of Contemporary Scientific and Technical Research, 2022, vol. 1 (2), pp. 213-216. Available at: http://journal.jbnuu.uz/index.php/ijcstr/article/view/160/.
11. Halder S., Hasnat A., Khatun A., Bhattacharjee D., Nasipuri M. Development of a Bangla Character Recognition (BCR) System for Generation of Bengali Text from Braille Notation. Proceedings of the international Journal of Innovative Technology and Exploring Engineering (IJITEE), 2013, June, vol. 3, iss. 1. ISSN: 2278-3075.
12. Fisher R., Perkins S., Walker A., Wolfart E. Spatial Filters - Mean Filter. 2003. Available at: http://homepages.inf.ed.ac.uk/rbf/HIPR2/mean.htm/ (accessed 11.08.2013).
13. Fisher R., Perkins S., Walker A., Wolfart E. Spatial Filters - Median Filter. 2003. Available at: http://homepages.inf.ed.ac.uk/rbf/HIPR2/median.htm/ (accessed 11.08.2013).
14. Powell B. Convert Color to gray scale. 2003. Available at: http://www.bobpowell.net/grayscale. htm/ (accessed 10.09.2013).
15. Canny J. A Computational Approach To Edge Detection. IEEE Trans. Pattern Analysis and Machine Intelligence, 1986, vol. 8 (6), pp. 679-698.
16. Zhendong Guo, Francesco Ambrosio, Alfredo Pasquarello. Evaluation of Photocatalysts for Water Splitting through Combined Analysis of Surface Coverage and Energy-Level Alignment. ACS Catalysis, 2020, 10 (22)
17. Kim, C., Pilania, G. & Ramprasad, R. Machine learning assisted predictions of intrinsic dielectric breakdown strength of abx3 perovskites. J. Phys. Chem. 14575-14580, 2016, 120 p.
18. Muhammad Rehan Naeem; Rashid Amin; Sultan S. Alshamrani; Abdullah Alshehri. Digital Forensics for Malware Classification: An Approach for Binary Code to Pixel Vector Transition. Computational Intelligence and Neuroscience, 2022, no. 1-12.
19. McCulloch W., Pitts W. A Logical Calculus of Ideas Immanent in Nervous Activity. Bulletin of Mathematical Biophysics, 1943, vol. 5 (4), pp. 115-133.
20. Silverman B.W., Jones M.C. E. Fix and J.L. Hodges (1951): an important contribution to nonparametric discriminant analysis and density estimation. International Statistical Review, 1989, vol. 57 (3), pp. 233-247.
Taqrizchi: Asqaraliyev O.U., texnika fanlari bo'yicha falsafa doktori (PhD), Muhammad Al-Xorazmiy nomidagi Toshkent axborot texnologiyalari unversiteti "Sun'iy intellekt" kafedrasi dotsenti.