Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 2 | 2024-yil
"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 2 | 2024 year
Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 2 | 2024 год
QO'LYOZMA TASVIR BELGILARINIG NEYRON TARMOQLAR ORQALI TAQQOSLANISHI
Asrayev Muhammadmullo Abdullajon o'g'li
Muhammad al-Xorazmiy nomidagi Toshkent axborot texnologiyalari universiteti Farg'ona filiali katta o'qituvchisi.
G'oipova Xumora Qobiljon qizi
Muhammad al-Xorazmiy nomidagi Toshkent axborot texnologiyalari universiteti Farg'ona filiali assistent o'qituvchisi
xumora.goipova1996@gmail .com
Abdurasulova Dilnoza Botirali qizi
Muhammad al-Xorazmiy nomidagi Toshkent axborot texnologiyalari universiteti Farg'ona filiali assistent o'qituvchisi
Annotasiya. Jahonda qo'lyozma matni tasvirlarini qayta ishlash va tahlil qilishning avtomatlashtirilgan tizimlarini yaratish uchun mavjud usul va algoritmlarni takomillashtirishga, shuningdek yangi hisoblash algoritmlarini ishlab chiqishga qaratilgan keng ko'lamli ilmiy tadqiqotlar olib borilmoqda.
IKalit so'zlar: tasvir, NIST, piksellar, konvolyutsion NN, piramidal NN, takomillashtirilgan piramidal NN, LeNet-1
I.Kirish
Jahonda kompyuter ko'rish tizimlarini ishlab chiqishga alohida e'tibor qaratilmoqda. Ushbu sohada tasvirdagi ob'yektlarni tahlil qilish, tanib olish usullari va algoritmlarini ishlab chiqish, takomillashtirish va amalga oshirish dolzarb masalalardan biri hisoblanadi. Xorijiy mamlakatlarda, jumladan AQSH, Rossiya Federatsiyasi, Fransiya, Shveysariya, Gresiya, Eron, Hindiston va boshqa mamlakatlarda qo'lyozma matn tasvirlarini tahlil qilish va uni tanib olishning nazariy hamda amaliy muammolarini hal qilishga katta e'tibor berilmoqda.
Ushbu maqolaning amaliy tajriba bosqichi ma'lumotlar bazasi Milliy standartlar va texnologiyalar instituti (NIST) maxsus ma'lumotlar bazasi 19 (SD-19) dan tuzilgan bo'lib, unda 128 * 128 piksel o'lchamdagi qo'lda yozilgan belgilarning ikkilik tasvirlari mavjud. SD-19 turli xil yozuvchilar guruhlarining alohida belgilar va to'liq shakllari bilan qo'lda yozilgan namuna shakllarining etti seriyasiga ega. O'quv to'plami 7О ООО ta o'quv tasvirlarining to'liq to'plamini yaratish uchun har bir seriyadan 1О ООО ta
misol bilan to'la. Sinov to'plami xuddi shu tarzda tuzilgan va 1О ООО ta test namunalarini o'z ichiga oladi.
II. Metodologiya
Asl qora va oq (ikkilik), 128 * 128, NIST SD-19 dan olingan tasvirlar anti-aliasing texnikasi yordamida kichikroq hajmga o'zgartiriladi. Olingan tasvirlarning kulrang darajalari ma'lum bir hududda qora va oq piksellar egallagan nisbiy qismdan kelib chiqadi.
1-rasmda kichik to'rtburchak hosil bo'lgan kichikroq tasvirdagi bitta pikselni ifodalaydi. To'rtburchakdagi qora piksellar soni (ehtimol, fraksiyonel) umumiy piksellar soniga bo'linadi, mos keladigan kulrang darajadagi qiymatni beradi. Ushbu jarayonda piksel qutbliligi NIST tomonidan belgilangan standartga muvofiq qora uchun 255 va oq uchun G deb belgilanadi.
158
Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 2 | 2024-yil
"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 2 | 2024 year
Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 2 | 2024 год
black = 32% white = 68%
1-rasm Ikki darajali tasvirni kichraytirishda kulrang daraja qiymatlarini qanday belgilash mumkin
Tanib olish tezligini oshirish uchun qo'lda yozilgan belgilarning massa markazini aniqlash muhim ahamiyatga ega. Ba'zi odamlar ma'lum harflarni tugatish uchun uzun quyruq chizishga moyildirlar. Belgilarni uzun quyruq bilan normallashtirish foydali ma'lumotlarni siqib chiqaradi va noto'g'ri joylashtiradi. Shuning uchun massa markazini aniqlash va bu nuqtani maqsad maydonining markaziga joylashtirish yaxshilangan yechimdir.
III. Masalani yechish jarayoni.
Avvalo, asl tasvirlarni 20 * 20 kichikroq o'ichamdagi hududga sig'dirish uchun nisbatlarini saqlab qolgan holda normallashtirish kerak. Keyin massa markazi quyidagi formula bilan aniqlanadi.
Z
R =
miri
Z
m
(1)
Bu tenglamada r pozitsiya juftligi, m esa kulrang darajadir. O'quv yoki sinov tasvirlarini qurishda normallashtirilgan belgilarning massa markazlari qo'shilishi yoki tasvirlarning markaziga iloji boricha yaqinroq bo'lishi kerak. Tasvir o'lchami 28 * 28 bo'lib qoladi, ya'ni massa markazi istalgan yo'nalishda geometriya markazidan 4 pikselgacha uzoqda bo'lishi mumkin.
Ba'zi ma'lumotlar 20 * 20 gacha masshtablash tufayli yo'qolgan bo'lsada, massa markazini muvozanatlash bir xil xarakterdagi foydali xususiyatlar tasvirlar orasida deyarli bir xil holatda joylashtirilishini ta'minlaydi. Natijalar tahlili shuni ko'rsatadiki, bu jarayondan keyin umumiy ko'rsatkich yaxshilangani ajablanarli emas.
Ushbu bo'limda uch xil neyron tarmoqlar tasvirlangan va taqqoslanadi: konvolyutsion NN, piramidal NN va takomillashtirilgan piramidal NN.
Konvolyutsion neyron tarmoqlari bir nechta farqlarga ega. LeNet-1 tarmog'i [LeCun va boshq., 1992], 2-rasmda ko'rsatilganidek, eng samarali tizimlardan biri hisoblanadi. Asosiy yangi jihat shundaki, muqobil ravishda ikki turdagi qatlamlar va bir qatlamda bir nechta xaritalar mavjud. Xaritalar bir xil tarzda ishlab chiqilgan, ammo har xil boshlang'ich og'irliklari va noto'g'riligi tufayli tasvirning turli xususiyatlarini saqlaydi. Eng katta afzallik - bu vaznni taqsimlash siyosati, bu mustaqil vaznlar sonini sezilarli darajada kamaytiradi va o'rganish va o'qitish jarayonini ancha osonlashtiradi.
2-rasm LeNet-1 arxitekturasi besh qavatli neyron tarmoq sifatida
Piramidal neyron tarmog'i birinchi marta [Phung va Bouzerdoum, 2007] tomonidan taqdim etilgan. Har bir qatlamda faqat bitta xarita mavjud va quyi namuna olish qatlami yo'q. Barcha 2-D qatlamlari piramidal qatlamlardir. Hech qanday konvolyutsiya kerak emasligi sababli, tarmoq ulanishlari sodda va o'qitish va sinov jarayonlari juda tez. Tarmoq konvolyutsion neyron tarmog'i kabi yaxshi natija bermasa ham, tezroq tanib olish tezligi diqqatni tortadi, ayniqsa vaqtga sezgir. Ushbu turdagi arxitektura 3-rasmda ko'rsatilgan.
3-rasm Piramidal NN arxitekturasi
159
Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 I Son: 2 I 2G24-yil
"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 2 | 2024 year
Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 2 | 2024 год
(a) tarmoq qatlamlari va (b) bir-biriga mos keladigan qabul qiluvchi maydonlar.
Yaxshilangan Piramidal Neyron Tarmoq (IPNN) bo'yicha tadqiqotlar birinchi marta [Han va boshq., 2009] tomonidan nashr etilgan. IPNN ikki turdagi ishlov berish qatlamlariga ega bo'lgan ierarxik ko'p qatlamli arxitekturaga ega: xususiyatlarni ajratib olish va o'lchamlarni kamaytirish uchun 2 o'lchovli qatlamlar va 2.7-rasmda ko'rsatilganidek tasniflash uchun 1 o'lchovli qatlamlar. 2 o'lchamli qatlamlar muqobil piramidal va pastki namuna olish qatlamlaridan iborat. Birinchi piramidal qatlam kirish tasviriga ulanadi, so'ngra takroriy namuna olish va piramidal qatlamlar. Oxirgi namuna olish qatlami piramidal qatlamlar tomonidan ishlab chiqarilgan xususiyatlarni qayta ishlovchi 1-D qatlamlariga to'liq bog'langan. Ushbu tavsiya etilgan usulda to'rtta 2-D qatlam va ikkita 1-D qatlam mavjud. Quyi namuna olish qatlamlarini kiritish samaradorlikni oshirishi va xususiyat xaritalarining ko'payishi aniqlikni oshirishi kutilmoqda. Oxirgi 1-D qatlamning chiqishi 26 birlikdan tashkil topgan naqsh toifasi sifatida qabul qilinadi: har bir harf uchun bittadan. i sinfiga tegishli naqsh taqdim etilganda, kerakli chiqish i-chi chiqish birligi uchun 1 va boshqa chiqish birliklari uchun 0 bo'ladi.
IPNN arxitekturasi 4-rasmda ko'rsatilganidek. Bu konvolyutsion neyron tarmog'iga o'xshaydi, lekin qatlamlar orasidagi bog'lanishlar konvolyutsion emas, balki piramidaldir.
Kiri5b:28"28 Ll::4'!:4':4 L2:12«12«4 L?:S"5:>:6 L4: 4*4*16 Li: 10 LS: 26
4-rasm Olti qatlamli neyron tarmoq IPNN arxitekturasi
Natijalar.
Tadqiqotning ushbu dastlabki bosqichida uchta ANN arxitekturasi qiyosiy maqsadlarda va har birining afzalliklarini baholash uchun amalga oshirildi.
1-jadvalda uchta neyron tarmoq uchun tanib olish natijalari, shuningdek, o'qitish va sinov vaqtlari keltirilgan. Katta va kichik harflarni tanib olish o'rtasida katta farq borligi sababli, natijalar alohida beriladi.
Neyron tarmoq nomi Convolut ional NN Pyramid al NN IPNN
Error Rate (Upper Case) 3.2% 7.G% 5.5%
Error Rate (Lower Case) 8.5% 15.9% 9.3%
Training Time (50 cycles) 6G min 12 min 25min
Testing Time (10,000 patterns) 4.G s G.8 s 1.6 s
1-jadval. Uch xil neyron tarmoqlarni solishtirish natijalari
1-jadvalda keltirilgan natijalardan shuni ko'rish mumkinki, konvolyutsion neyron tarmog'i eng past xatolik darajasiga ega, piramidal neyron tarmoqlar esa eng tez o'rgatiladi. Boshqa tomondan, IPNN piramidal neyron tarmog'i kabi samarali va konvolyutsion neyron tarmog'i kabi aniq bo'lishi uchun mo'ljallangan. Biroq, vaqt samaradorligi va tanib olish aniqligi hali ham ba'zi yaxshilanishlarni talab qiladi.
Xulosa.
Ushbu maqolada qo'lyozma belgilarni aniqlash jarayonini boshlashdan oldin ikkita foydali dastlabki ishlov berish usullarini taqdim etadi, turli xil kiritish hajmining xato tezligi va o'qitish vaqtiga ta'sirini muhokamasi qilindi va mumkin bo'lgan kichik to'plamni bashorat qilish uchun oddiy xususiyatlarni ajratib olish strategiyasini qurish va uch xil neyron tarmoqlarni solishtirish natijalari keltirildi.
16G
Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 2 | 2024-yil
"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 2 | 2024 year
Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 2 | 2024 год
Foydananilgan adabiyotlar.
1. Changan Han. Neural Network Based Off-line Handwritten Text Recognition System. Florida International University. 4-1-2011.
2. Changan Han, Malek Adjouadi, Armando Barreto, Naphtali Rishe, Jean Andrian: Improved Pyramidal Neural Network for Segmented Handwritten Characters Recognition. IPCV 2009: 695-699
3. Yu Chen, Malek Adjouadi, Changan Han, Armando Barreto: A New Unconstrained Iris Image Analysis and Segmentation Method in Biometrics. ISBI 2009: 13-16
4. Yu Chen, Jin Wang, Changan Han, Lu Wang, Malek Adjouadi: A robust segmentation approach to iris recognition based on video. AIPR 2008: 18
5. Yu Chen, Malek Adjouadi, Changan Han, Jin Wang, Armando Barreto, Naphtali Rishe, Jean Andrian: A highly accurate and computationally efficient approach for unconstrained iris segmentation. Image Vision Comput. 28(2): 261-269(2010)
161