Научная статья на тему 'АЛГОРИТМ И ПРОГРАММА РАСПОЗНАВАНИЯ РУКОПИСЕЙ НА ОСНОВЕ НЕЙРОННОЙ МОДЕЛИ'

АЛГОРИТМ И ПРОГРАММА РАСПОЗНАВАНИЯ РУКОПИСЕЙ НА ОСНОВЕ НЕЙРОННОЙ МОДЕЛИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
12
3
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЕСОВОЙ КОЭФФИЦИЕНТ / НЕЙРОННАЯ МОДЕЛЬ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Искандарова С.Н., Хурсандова Р.

В этой статье определены и проанализированные весовые коэффициенты слоев нейронной модели для распознавания рукописей и на основе этих данных составлена программа распознавания изображения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

NEYRON MODELI ASOSIDA QO’LYOZMALARNI TANISHNING ALGORITMI VA DASTURIY VOSITASI

In this article also the analyzed weight factors of layers of neural model for recognition of manuscripts are defined and on the basis of these data the program of recognition of the image is made.

Текст научной работы на тему «АЛГОРИТМ И ПРОГРАММА РАСПОЗНАВАНИЯ РУКОПИСЕЙ НА ОСНОВЕ НЕЙРОННОЙ МОДЕЛИ»

Lecture Notes in Computer Science, number 276, Springer-Verlad 1987 УДК 004.386

Искандарова С.Н. ассистент

кафедра «Программный инжиниринг»

Хурсандова Р. студент Самаркандский филиал Ташкентский университет Информационных Технологий

им.Мухаммад Аль Хорезмий Республика Узбекистан, г. Самарканд АЛГОРИТМ И ПРОГРАММА РАСПОЗНАВАНИЯ РУКОПИСЕЙ НА

ОСНОВЕ НЕЙРОННОЙ МОДЕЛИ Аннотация: В этой статье определены и проанализированные весовые коэффициенты слоев нейронной модели для распознавания рукописей и на основе этих данных составлена программа распознавания изображения.

Ключевые слова: весовой коэффициент, нейронная модель, распознавание образов.

Iskandarova S.N.

Samarkand branch of the Tashkent University of Information Technologies named after Muhammad Al Khorezmiy, assistant of the Department "Software Engineering" Iskandarova S.N., Republic of Uzbekistan

the city of Samarkand

In order to determine manuscripts of neuron model algorithm and

software

NEYRON MODELI ASOSIDA QO'LYOZMALARNI TANISHNING

ALGORITMI VA DASTURIY VOSITASI Annotatsiya:Ushbu maqolada qo'lyozmalarni tanish uchun neyron model qatlamlari o'rganilgan belgilarning parametrlariga mos ravishda tahlil qilib chiqilgan vazn koeffitsentlari aniqlangan va shular asosida dasturiy vosita yaratilib, ishlashi keltirilgan. Ushbu dastur orqali tasvirlarni standart chegaralangan holatga keltirilib, model tasvirlar bilan solishtiriladi va vazn koeffisentlari aniqlanadi. Berilgan modelga o'xshashlik vazn koeffisenti maksimumi tanlanadi.

Tasvirlarni tanishning neyron model asosida dasturiy vositasi yaratildi. Kalit so'zlar: vazn koeffisenti, neyron model,model

Abstract: In this article also the analyzed weight factors of layers of neural model for recognition of manuscripts are defined and on the basis of these data the program of recognition of the image is made.

Keywords: weight factor, neural model, image identification.

l.Kirish

Ko'pgina tashkilotlarda mijozlar tomonidan to'ldiriladigan hujjatlarning aksariyati qo'lda bosma harflar bilan to'ldirish talab etiladi. Bu hujjatlarni elektron variantini yaratish esa ma'lum darajada ko'p vaqtni sarflaydi. Ishining maqsadi yuqoridagi kabi to'ldirilgan hujjatlarni elektron variantini yaratishni tezlashtiruvchi algoritm va dasturiy vositani ishlab chiqish.

Sun'iy neyron tarmoqlari belgilarni tanishda yetarli darajada keng qo'llaniladi. Belgilarni tanish uchun neyron tarmoqlarining ishlatilish algoritmi ko'pincha quyidagicha hosil qilinadi. Tanish ishga tushganda belgi tasviri ayrim standart o'lchamlarga keltirilidi. Qoida bo'yicha rastr 16x16 piksel o'lchamda ishlatiladi. Bunday normallashtirilgan misollar 1-rasmda ko'rsatilgan.

Tanish ishonchliligi va hisoblash resurslaridagi dastur ehtiyoji ko'pincha neyron tarmog'i parametrlari va strukturasini tanlashga ham bog'liq bo'ladi. Raqamli pochtali kodlar (ZIP-kodlar) ni tanish uchun ishlab chiqilgan neyron tarmoqlarida ifodalangan. Raqam tasviri umumiy o'lchamga (16x16 piksel) keltiriladi. Olingan tasvir uchta ichki darajaga va yuqori darajadagi 10 ta tugunga ega bo'lgan neyron tarmog'i kirishiga uzatiladi. Tarmoq ichki qatlami to'liq bog'liqlikka ega bo'lmaydi. Quyi darajadagi tugunlar birgalikda umumiy vazn to'plamini ishlatadi. Mutaxassis maqsadiga ko'ra, bular hammasi tasvirdagi dastlabki belgilangan tarmoqning quyi darajadagi layoqatini oshirish kerak. Bunday ko'rinishda olingan neyron tarmog'ida 1256 ta tugun va 9760 ta mustaqil parametrlari bo'ladi. Tarmoqning layoqatliligini oshirishda xotira va kerakli hisoblash natijasi umumlashtirilgan va kichiklashtirilgan bo'lishi uchun kam ishlatiladigan vaznlar uzoqlashtirilgan bo'ladi. Natijada mustaqil parametrlar soni to'rt baravarga kamayadi. Neyron tarmoqlarini o'rganish 7300 ta belgilar ichidagi to'plamda, testlash 2000 ta belgilar ichidagi to'plamda o'tkazildi. Tanish xatoligi o'rganilayotgan to'plamda taxminan 1% ni va tekshirilayotganda 5% ni tashkil qiladi.

Normallashtirilgan rastr tugunlaridagi yorug'lik qiymati o'rniga neyron tarmoqlarining kiruvchi parametrlari sifatida yorug'lik darajalar farqi qiymati ishlatiladi. Bunday kiruvchi parametrlar harf uchini yaxshiroq belgilashga imkon beradi. Bunday kiruvchi parametrlardan foydalanadiga qo'lyozma raqamlarni tanish tizimida ko'rsatilgan. Tanishga kirishishganda tasvir 16x16 piksel o'lchamga keltiriladi. Bundan keyin ular yuqori yorug'lik darajalar farqi qiymati bilan sohani belgilash maqsadida qo'shimcha qayta ishlanadi. Ishlatiladigan neyron tarmog'i faqat bitta ichki sathga ega boladi, lekin boshqa algoritmlar bilan birga qo'llaniladi. O'rganish testlash uchta mustaqil ma'lumotlar bazasidan

0<f Rk>1p5/J

1-rasm.

о1^ап Ье^Пш^а o'tkazilgan. Наг bir таТитойаг bazasida o'rganish uchun 4000 ёап 6000 tagacha belgi, 1еБ11аБЬ иеЬип 2000 ёап 4000 tagacha ishlatiladi. Xatolik foizi testlash o'tkaziladigan ma'lumotlaг bazasiga bog'liq holda jiddiy гavishda o'zgaгadi va 0.60%-2.2% т tashki1 qi1adi[1-3].

Tanish aniqligini oshiгishda keng qo'llaniladigan usu11ardan biгi - Ыг vaqtda bir necha 1игН tanuvchi modu11ardan foyda1anish va keyingi o1ingan natija1arni bir1ashtirish hisob1anadi. Bunda Ьи modu11ardan foyda1anadigan algoгitm yanada mustaqil bo'lishi juda muhim. Bunga o'гganilayotgan ma'lumotlaг maxsus to'plami каЫ tuгli tanish algoгitmlaгidan foydalanayotgan tanish modu11arini ish1atish hisobiga erishi1ishi mumkin.

Bunday metod1ardan biri bir necha yi1 i1gari tak1if qi1ingan edi va uch tanuvchi modu1dan foyda1anishga asos so1ingan. Birinchi mashina oddiy shak1da o'гgatiladi. Ikkinchi mashina ЫгтсЫ mashina yoгdamida filtгlangan belgilaгda о'^ай^^ shuningdek, ikkinchi mashina biгinchi mashina tanigan 50% to'g'гi va 50% noto'g'гi tanigan belgilaг aгalashmasini ko'гadi.

Nihoyat, uchinchi mashina 1- va 2- manina1ar tanish natija1ari farqidagi belgilaгda o'гgatiladi. Testlashda taniladigan Ье^Паг uch ta mashina kiгishiga уиЬоп^ь Uch ta mashina chiqishidan olinayotgan baholaг qo'shiladi. Eng katta umum1ashgan baho o1gan be1gi tanish natijasi sifatida chiqari1adi.

2.Masalaning qo'yilishi

Sun'iy neyгon taгmog'i kiгishiga tanilishi kerak bo'lgan belgi beгilayapti. Sun'iy ^угоп taгmog'i o'zining koeffisientlaгi hisobini ishlab chiqadi va natijani chiqaгadi. Sun'iy neyгon taгmog'ini faqat unga yaqin (buzi1gan va shovqin1i) yoki о'^ай^ап Ье^Паг 1а1шЫ титкт.

2-гasm. №угоп taгmog'ining ishlatilish sxemasi.

Kichik kvadrat usuliga binoan neyгon taгmog'ining kichiklashadigan maqsad funksiyasi miqdori quyidagicha:

*М=1 5-N -.р1

]. р

У")

лР

- j chiqish qat1ami rea1 chiqish ^Мт^ N neyron а.

Bu yerda

taгmog'i p-kirish tasviriga uzatishi; а■р - bu ^угопп^ idea1 chiqish ho1ati.

Yig'indi tasviгning hamma neyгon chiqish qatlamlaгiga va hamma qayta ish1anadigan taгmog'iga ИпШай. Kichiklashtiгish vaznlaг koeffisientini bi1diruvchi quyidagi pasayish gradienti usu1i bi1an ЫпйМ^

= -ц ■

дБ

Bu yerda и - п-1 qatlamning i-neyronini ]-пеугоп п qatlamiga bog'lovchi vaznlar koeffisienti, Ь - o'rgatish tezligi koeffisienti, 0<Ь<1[4-6]. 3.Та8у1гт 1апиуеЫ dastur 1^егГеу81

ТаБути 1апиусЫ ёаБйгг т1^еу81,1а8уггш1а1ш11т ата^а 08Ыгас11.

3-rasm. Dasturning пай]а chiqgandagi oynasi

Shuningdek, tasvirni tanishda modelning asl nusxasi ham keltiradi. Dasturning panelida "ModeГ, qismining "Натта o'xshashliklarni ко^^' bo'limida kiritilgan belgiga o'xshash belgilar vazni o'xshashliklari ham ko'rsatiladi.

4-rasm. Interfeys menyusi.

У^п o'xshashlik koeffisentlarini hisoblashda qanchalik qaysi harfga o'xshashliklari keltirilgan son qiymatlaridan iborat bo'ladi. Eng katta qiymatga egasi 1ат^ап па1:ца в1Гайёа ЬегПасН.

Ве1д1 В 12400

В.у 1 II

11, 11 1 II II ,1 1

i-I.ii 1 1 .

и,-..... В48Б

Н,-1и1 1 | II

||"|'|| 1 1 11 м .1 и |

11,-1111 1 II

Вэ1д1 .1 11 м 111,

1" + п 1 1 7 ¡75

Пл1а1 1 11

||,.|,„ м н

N III' ,111

Ве|д| I I и

11"|, || 1 1 .......

Ил1а1 и 11

ВвЮ1 1 1 1 /. ЯII1

II. и, I В5Э0

н,.1и> 1 11

........ н

>

4-rasm. Dasturning natijasida kiritilgan belgining vazni. Bundan tashqari Ьи dasturda belgini chizishdan оМт и qanday koordinatalarda va qay tarzda joylashishini ko'rish mumkin. Вип^ uchun

dasturning panelida "Model" qismining "Modelni ko'rish" bo'limida istalgan harfni kiritib ko'ramiz:

^ SurTry neyronto'nyordamida harfni tanish

Tanish

Modelni ko'rish

Haninna o'xshashlikni ko'rish

5-rasm.Interfeys menyusi.

6-rasm. Modelni ko'rishun belgini kiritish

7-rasm. Dastur penelidagi "Model" qismining "Modelni ko'rish" bo'limi. 4.Xulosa

Ishning natijasi qo'lyozma shaklida to'ldirilgan hujjatlarni elektron ko'rinishga o'girib berishda qo'llanilishi mumkin. Ulardan ko'p hujjat talab qiladigan tashkilotlarda ishning samaradorligini oshirish va vaqtni tejash uchun foydalanish mumkin.

Foydalangan adabiyotlar:

1. Y. LeCun, O.Matan, B.Boser, J.S.Denker, D.Henderson, R.E.Howard, W.Hubbard, L.D.Jackel, H.S.Baird. "Handwritten Zipcode Recognition With Multilayer Networks," Proc. of International Conference on Pattern Recognition, Atlantic City, 1990.

2. A. Krzyzak, W. Dai, C.Y.Suen. "Unconstrained Handwritten Character Classification Using Modified Backpropagation Model," Proc. 1st Int. Workshop on Frontiers in Handwriting Recognition, Montreal, Canada, Стр.155-166, 1990.

3. Seong-Wang Lee, Young Joon Kim. "Off-line Recognition of Totally Unconstrained Handwritten Numerals Using Multilayer Cluster Neural Network." Proc. Of the 12th IAPR International Conference on Pattern Recognition. Jerusalem, Israel. 1994. Стр. 507-509.

4. R. Schapire, "The Strength of Weak Learnability," Machine Learning. 5 197227 (1990).

5. H.Drucker, R.Schapire, P.Simard. "Boosting Performance in Neural Networks." International Journal of Pattern Recognition and Artificial Intelligence. 7 705-720 (1993).

6. Fukushima, K. (1988). Neocognition: a hierarchical neural network capable of visual pattern recognition. Neural Networks 1 (2), Стр. 119-130.

УДК 004.386

Искандарова С.Н. ассистент

кафедра «Программный инжиниринг»

Хурсандова Р. студент Самаркандский филиал Ташкентский университет Информационных Технологий им.Мухаммад Аль Хорезмий Республика Узбекистан, г. Самарканд

МЕТОДЫ УЛУЧШЕНИЯ РАСПОЗНАВАНИЯ СИМВОЛОВ

Аннотация: В данном тезисе рассматриваются методы и процессы улучшения распознавания символов. Для отсканированных данных используются методы удаления шума, потери изображения, фильтрации и разделения символов, а так же их правильная интерпритация.

Ключевые слова: весовой коэффициент, рандомизация, распознавание образов.

Tasvirni tanish aniqligini oshirish usullari ТА^Samarqandfiliali Iskandarova S.N.,talaba Xursandova R.

METHODS FOR IMPROVING CHARACTER RECOGNITION

Annotatsiya: Ushbu tezisda tasvirni tanishda aniq metodlarni qo'llashdan oldingi jarayonlar va usullar keltirilgan. Skaner qilingan ma'lumotni tasvir xiraligini yo'qotish, ya'ni filtrlash va harflarni ajratib olish metodlari izohlangan.

Abstract: In this thesis, methods and processes for improving character recognition are discussed. For scanned data, the methods of noise removal, image loss, filtering and character separation are used, as well as their correct interpretation.

Key words: weight coefficient, randomization, pattern recognition.

Arab bosma matnini tanish tizimi bir necha bosqichdan iborat.Birinchi navbatda matn tahlil qilinadi va aloxida blokka olinadi,undan keyin skaner qilinadi va xuddi Bit-map tasviri kabi xotiraga saqlanadi.Arab tilida yozilgan so'zlarda bir xil ko'rinishlarda unli harf bor,bir xil ko'rinishlarda esa unli harf yo'q.Matnda unli harflarni qanday tanishi va qanday tuzilishga ega ekanligi haqida davom etamiz.

i Надоели баннеры? Вы всегда можете отключить рекламу.