Muxamadiyev A.Sh.
Muhammad al-Xorazmiy nomidagi Toshkent axborot texnologiyalar universiteti, audiovizual texnologiyalar kafedrasi dotsenti, f-mf.d.
Abdullayev Y. Y.
Muhammad al-Xorazmiy nomidagi Toshkent axborot texnologiyalar universiteti, audiovizual texnologiyalar kafedrasi assistenti
TASVIRDAGI OB'EKTLARNI ANIQLASH USULLARI
Annotatsiya: Rangli tasvirdagi ob 'ektlarning chegaralarini aniqlash algoritmlari (ob 'ekt rangini segmentatsiya qilish algoritmlari) rangli tasvirlarni ularni tahrirlash, tahlil qilish, sintez qilish, qayta tiklash va siqish bilan bog'liq sohada turli xil amaliy muammolarni hal qilish uchun zarur vositadir. Hozirda bunday algoritmlarning ko pligi avtomatik va operator tomonidan boshqariladigan segmentatsiya uchun ishlab chiqilgan bo'lsa ham, ularning ko pchiligidan foydalanish qoniqarli natijani bermaydi.
Kalit so'zlar: Kompyuter ko'rish, tasvir, konturlarni aniqlash, maritsa, chegaralar, chegara detektori.
Mukhamadiyev A.Sh., doctor of physics and mathematics
associate professor Department of Audiovisual Technologies Tashkent University of Information Technologies named after Muhammad
al-Khorazmi Abdullayev Y. Y. assistant
department of audiovisual technologies Tashkent University of Information Technologies named after Muhammad
al-Khwarizmi
METHODS OF IDENTIFYING OBJECTS IN THE IMAGE
Abstract: Algorithms for determining the boundaries of objects in color images (object color segmentation algorithms) are a necessary tool for solving various practical problems in the field of editing, analyzing, synthesizing, restoring and compressing color images. Currently, many such algorithms have been developed for automatic and operator-controlled segmentation, but most of them do not provide satisfactory results.
Keywords: Computer vision, image, edge detection, matrix, edges, edge detector.
Kompyuter ko'rish (CV) ob'ektlami aniqlash, kuzatish va tasniflash qobiliyatiga ega mashinalarni yaratish texnologiyasi. Ma'lumotlarni qayta
ishlash uchun u statistik usullardan, shuningdek, geometriya, fizika va tadqiqotlar yordamida yaratilgan modellardan foydalaniladi. Kompyuterni ko'rish mobil robotlarni boshqarishda, kuzatuv vositalarida, tibbiy tasvirlarni tahlil qilishda, shuningdek, inson-kompyuter interfeysida keng qo'llaniladi. Kompyuter ko'rishning asosiy tarmog'i tasvirlardan yoki tasvirlar ketma-ketligidan ma'lumot olishdir.
Ushbu muammoni hal qilishning ko'plab usullari mavjud: konturlarni qidirish, deskriptorlar va asosiy nuqtalarni qidirish, neyron tarmoqlardan foydalanish va boshqalar. Ushbu maqolada konturlarni qidirishdan foydalangan holda ob'ektni aniqlash usullari qisqacha ko'rib chiqiladi.
Konturlarni qidirish orqali ob'ektni aniqlash
Konturlarni aniqlash - bu raqamli tasvirning yorqinligi keskin o'zgargan nuqtalarni aniqlashga qaratilgan matematik usullar to'plamini bildiradi. Ushbu nuqtalar, odatda egri chiziqlar to'plami sifatida tashkil qilinadi va ular qirralar, chegaralar yoki konturlar deb ataladi. Tasvirning yorqinligini o'zgartirish quyidagilarga bog'liq: turli materiallar, sohaning turli qismlarida yorug'likdagi farqlar, chuqurlikdagi farqlar yoki sirt yo'nalishidagi o'zgarishlar. Tabiiy holatda, chegaralarni aniqlash, ob'ektning chegaralari va shaklini aniqlashga yordam beradi. Tanlangan chegaralar ikki xil bo'lishi mumkin: cheklangan va mustaqil cheklanmagan nazariyaga bog'liq. Cheklangan chegaralar sirtning rangi va shakli kabi xususiyatlarni ko'rsatadi. Cheklanmagan chegaralar turli nuqtalar o'zgarishi va soha geometriyasini ko'rsatadi. Eng ko'p ishlatiladigan chegaraalarni aniqlash usullaridan biri Sobel operatoridir. Bu tasvir yorqinligi gradientining taxminiy qiymatini hisoblaydigan diskret differentsial operator hisoblanadi. Sobel operatorini har bir nuqtada qo'llash yorqinlik gradienti vektori yoki uning normal holati natijalarini beradi. Sobel operatori tasvirni vertikal va gorizontal yo'nalishlardagi kichik butun sonli filtrlar bilan asoslangan.
"-1 0 1" "-1 - -1"
-2 0 2 * Ava Gy = 0 0 0
-1 0 1 1 2 1
Formula 1. Sobel matritsali yoyilmalari yordamida taxminiy gorizontal va vertikal hosilalarni aniqlash, bu yerda Gx va Gy taqribiy hosilalarni o'z ichiga olgan tasvir elementlari, A - asl tasvir, * - ikki o'lchovli yoyilma operatsiyasi.
Tasvirning har bir nuqtasida gradientning taqribiy qiymatini 2-formuladagi hosilalarning olingan taqribiy qiymatlarining elementi yordamida hisoblanadi.
G =V [ G2 + GlGG] g
Formula 2. Tasvirning i-elementining gradient qiymatini aniqlash, bu yerda Gi -gradient qiymatlarini o'z ichiga olgan tasvir elementi, Gxi va Gyi esa taqribiy hosilalarni o'z ichiga olgan tasvir elementlari. Gradient vektorining yo'nalishi 3-formula bilan hisoblanadi, u ham element tomonidan qo'llaniladi
6 = arctan
V Gxi j
Formula 3. Tasvirning i-elementining gradient qiymatini aniqlash, bunda Qi -gradient vektorining yo'nalishini o'z ichiga olgan tasvir elementi, Gxi va Gyi esa taqribiy hosilalarni o'z ichiga olgan tasvir elementlari.
Ushbu operatorning katta afzalligi uning soddaligidir. Ammo u hisoblagan gradient yaqinlashuvi juda qo'pol. Muammo shundaki, har qanday nuqtada differensiallanuvchi yorqinlik funksiyasining hosilasi, tasvirning barcha nuqtalarining yorqinlik funksiyasida mavjuddir va Sobel operatori har bir pikselning faqat kichik sohalaridan foydalanadi. Bundan tashqari, filtrning kichik o'lchamlari tufayli Sobel operatori tasvirdagi shovqinga juda sezgir. Shuning uchun, bu gradientning noto'g'ri yondashuvini hosil qilishi mumkin, ammo u ko'plab masalalarda amaliy qo'llash uchun yetarli darajada sifatga ega.
Sobel operatoridan tashqari, Pruitt operatori, Sharra operatori va Roberts operatori kabi boshqa matritsali chegara detektorlardan ham foydalanish mumkin. Bu usullar Sobel operatoriga o'xshaydi, lekin turli matritsali yoyilmalardan foydalaniladi.
G,
"-1 0 1" "-1 -1 -1"
-1 0 1 * A va Gy = 0 0 0
-1 0 1 1 1 1
-A
" -3 0 3 " "-3 -10 -3"
-10 0 10 * A va Gy = 0 0 0
-3 0 3 3 10 3
Formula 4. Pruitt matritsali yoyilmalar yordamida taxminiy gorizontal va vertikal hosilalarni aniqlash, bu yerda Gx va Gy taqribiy hosilalarni o'z ichiga olgan tasvirlar, A - asl tasvir, * - ikki o'lchovli yoyilma operatsiyasi.
-A
Formula 5. Sharra matritsali yoyilmalar yordamida taqribiy gorizontal va vertikal hosilalarni aniqlash, bu yerda Gx va Gy taqribiy hosilalarni o'z ichiga olgan tasvirlar, A - asl tasvir, * - ikki o'lchovli yoyilma operatsiyasi.
Gx =
Formula 6. Roberts matritsali yoyilmalar yordamida taqribiy gorizontal va vertikal hosilalarni aniqlash, bu erda Gx va Gy taqribiy hosilalarni o'z ichiga olgan tasvirlar, A - asl tasvir, * - ikki o'lchovli yoyilma operatsiyasi.
Yuqori sifatli va aniq usul-Kanni detektori usulidir. 1986 yilda Jon Kenni uchta mezon uchun maqbul bo'lgan chegara detektorini ishlab chiqdi: past darajadagi xatolar, to'g'ri lokalizatsiya va bitta chegaradagi javoblarni minimallashtirish.
Batafsil qilib aytganda, bu detektor noto'g'ri chegaralarni aniqlamasligi kerak (masalan, shovqinlarni), chegara chizig'ini to'g'ri va qismlarga
"1 0 " " 0 1"
* A va G =
0 -1 y -1 0
ajratmasligi kerak va keng chiziqlar paydo bo'lishining oldini olish uchun har bir chegaraga faqat bir marta javob berishi kerak.
Kenni detektori algoritmi 5 bosqichdan iborat. Birinchi qadam silliqlashdir. Noaniq chegaralarning paydo bo'lishini oldini olish uchun tasvirdagi shovqin miqdorini kamaytirish kerak bo'lganda ishlatiladi. Buning uchun ko'pincha Gauss filtri yoki qaysidir xiralashtiruvchi matritsa filtri bilan xiralashtirish qo'llaniladi.
Keyingi ikki qadamda gradientlarni topish va maksimal bo'lmaganlarini xiralashtirish ya'ni maska qoplash qo'llaniladi. Buning uchun barcha yorqinlik gradientlari topiladi, va bunga misol qilib yuqorida tavsiflangan Sobel operatoridan foydalanish mumkin, ammo chegara aniq va tushunarli bo'lishi uchun u ingichka chiziq bilan ifodalanishi kerak. Shuning uchun chegara gradient vektori yo'nalishi bo'yicha mahalliy (local) maksimal gradientga erishilgan piksellar bo'ladi. Agar, gradientdagi deyarli barcha piksellar yuqoriga yo'naltirilgan bo'lsa, ulardagi gradient qiymati pastda va yuqorida joylashgan piksellar bilan taqqoslanadi. Eng yuqori qiymatga ega bo'lgan piksellar olingan tasvirda qoladi, qolganlari esa maska bilan qoplanadi.
Oxirgi bosqichlar - bu ikki tomolama filtrlash va noaniqlik sohalarni izlashdan iborat. Ushbu bosqichda noaniq chegaralarni yana bir filtrlash amalga oshiriladi. Kenni chegara detektori ikkita diapazonda foydalanadi: pastki va yuqori. Qiymati yuqori chegaradan yuqori bo'lgan pikselning maksimal qiymatni oladi, ya'ni bunda kontur ishonchli hisoblanadi. Agar piksel qiymati pastki chegaraga yetib bormasa, piksel maska bilan qoplanadi. Agar uning qiymati chegaralar orasidagi diapazonga to'g'ri kelsa, u o'rtacha qiymatni oladi va chegara nuqtasi bo'ladimi-yo'qmi, noaniqlik sohasini kuzatish jarayonida qaror qabul qilinadi.
Tasvirdagi ob'ektlarni aniqlashda ishlatiladigan usullardan va algoritmlardan foydalangan holda tuzilgan dasturlarning natijalariga quyidagilarni misol qilib olsa bo'ladi:
Classification Detection Segmentation
Cat Cat, Duck Cat, Duck
Single Object Multiple Objects
Foydalanilgan adabiyotlar:
1. Алгоритмы выделения контуров изображений // Хабрахабр. URL: https://habrahabr.ru/post/114452/
2. Canny Edge Detection // OpenCV. URL: https://docs.opencv.org
3. The SUSAN Principle for Feature Detection // Oxford University. Wellcome Centre for Integrative Imaging.
4. The SUSAN Edge Detector in Detail // Oxford University. Wellcome Centre for Integrative Imaging.
5. Ансамблевый метод машинного обучения, основанный на рекомендации классификаторов // Бесплатная электронная библиотека — электронные матриалы.
6. Интегральное представление изображений // Studfles. URL: https://studfles.net/preview/6234768/page:3/
7. AdaBoost в OpenCV // Recog.ru — Распознавание образов для программистов. URL: http://recog.ru/blog/opencv/page2/