Научная статья на тему 'BIBLIOGRAFIK YOZUVLARNI TAQQOSLASH'

BIBLIOGRAFIK YOZUVLARNI TAQQOSLASH Текст научной статьи по специальности «Физика»

208
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
bibliografik yozuv / elektron katalog / axborot-kutubxona tizimlari / axborot-resurs markazlari / to’liq matn / elektron kutubxona / avtomatlashtirilgan axborot-kutubxona tizimlari / bibliografik tavsif.

Аннотация научной статьи по физике, автор научной работы — O. O. Ishniyazov

Ushbu maqolada bibliografik ma’lumotlar bazasidagi ma’lumotlarni qidirish jarayoni haqida so’z yuritilgan. Bunda qidirilayotgan yozuvga tegishli ma’lumotlarni ma’lum bir xususiyatlariga ko’ra natija olish uchun algoritm ishlab chiqilgan.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «BIBLIOGRAFIK YOZUVLARNI TAQQOSLASH»

Zamonaviy ta'limda matematika, fizika va raqamli texnologiyalarning dolzarb muammolari va yutuqlari

Toshkent viloyati Chirchiq davlat pedagogika instituti

5-myEA. TA^HM^A 3AMOHABHH PA^AM^H TEXHO^OrHH^APH^AH OOH^A^AHHmHHHr HA3APHH

ACOCtfAPH

BIBLIOGRAFIK YOZUVLARNI TAQQOSLASH O. O. Ishniyazov

Muhammad al-Xorazmiy nomidagi Toshkent axborot texnologiyalari universiteti,

Toshkent, Uzbekiston oishniyazov@gmail.com

ANNOTATSIYA

Ushbu maqolada bibliografik ma'lumotlar bazasidagi ma'lumotlarni qidirish jarayoni haqida so'z yuritilgan. Bunda qidirilayotgan yozuvga tegishli ma'lumotlarni ma'lum bir xususiyatlariga ko'ra natija olish uchun algoritm ishlab chiqilgan. Kalit so'zlar: bibliografik yozuv, elektron katalog, axborot-kutubxona tizimlari, axborot-resurs markazlari, to'liq matn, elektron kutubxona, avtomatlashtirilgan axborot-kutubxona tizimlari, bibliografik tavsif.

Maydondagi yozuvlarni taqqoslash

Axborot kommunikatsiya texnologiyalari tobora rivojlanishi elektron axborotlarning yaratilishiga zamin bo'lmoqda. Shunday ekan keng doiradagi foydalanuvchilar uchun mavjud bo'lgan axborot miqdori juda tez o'sib borishidan dalolat beradi. Bunday ma'lumotlarni saqlash, tizimlashtirish va tashkil qilish juda muhim hisoblanadi. Xususan bunday ma'lumotlar axborot resurs markazlarida bo'lsa. Albatta ma'lumotlarni ma'lum bir xususiyatlari asosida tizimlashtirilgandan so'ng, ma'lumotlar bazasidagi maydonlarni taqqoslash uchun alohida blok tashkil qilinadi. Alohida maydonlarni taqqoslash blokining maqsadi, yozuvlar har bir maydon uchun qanchalik mos kelishini baholashdir. Blokning natijasi vektor hisoblanadi. Ushbu vektor tegishli maydonlarning qiymatlari bo'lgan ikki satrning yaqinligini baholashdan iborat. O'xshashlikning turli tomonlarini hisobga oladigan juda ko'p turli xil satrlarni solishtirish usullari mavjud [1, 2, 3]. Ushbu usullar ular nimaga asoslanganligi, ularning parametrlari qanday aniqlanganligi va taqqoslash natijalari qanday shaklda oldindan belgilanishi bo'yicha tasniflanishi mumkin.

Zamonaviy ta'limda matematika, fizika va raqamli texnologiyalarning dolzarb muammolari va yutuqlari

Toshkent viloyati Chirchiq davlat pedagogika instituti

Satrlarni moslashtirish belgilar yoki tokenlarga asoslangan bo'lishi mumkin. Belgilar yakka holda va ketma-ket ishlatilishi mumkin (q-grammdan foydalaniladi - q satr uzunliklar to'plamlari).

Belgi(Token) larga asoslangan usul(metod)ga misol qilib Jakkard metrikasini yoki vektor kosmosidagi o'xshashlikning kosinus o'lchovini keltiramiz. Muayyan uzunlikdagi satrlar to'plami bilan ishlaydigan usul(metod)lar so'zlarni emas, balki kombinatsiyani taqqoslash imkonini beradi, bu imlo xatolari mavjudligida foydali bo'lishi mumkin. Levenstein masofa [4] va uning turli xil variantlari kabi belgilar o'lchovlari satrlar orasidagi o'xshashlikni hisoblab, bir qatorni boshqasiga o'tkazish uchun etarli bo'lgan o'zgarishlarning minimal sonini hisoblab chiqadi. Agar ma'lumotlar bir xil, ammo har xil yozilgan so'zlarni o'z ichiga olgan nisbatan qisqa chiziqlar bilan berilgan bo'lsa, ramziy choralar afzalroqdir, chunki ular chiziqlar orasidagi farqni batafsilroq hisoblab chiqishi mumkin [1].

Bundan tashqari, usullar o'z parametrlari qanday hisoblanganligi, masalan, tartibga solish operatsiyasining "qiymati" yoki belgining og'irligi bo'yicha tasniflanishi mumkin. Parametrlar ma'lumotlar bazasining xarakteristikalari asosida hisoblangan yoki o'qituvchi (kontekstga bog'liq) bilan o'qitish natijasida olingan, tadqiqotchi tomonidan qo'lda tanlangan (kontekst-mustaqil usullar) bo'lishi mumkin. Agar o'qituvchi bilan o'rganishni o'z ichiga olgan kontekstga bog'liq usullar qo'llanilsa, o'quv namunasini aniqlash kerak.

Satrlarni taqqoslash natijalari bir usuldan boshqasiga farq qilishi mumkin, ular ikkilik, aniq, tartibli yoki doimiy qiymatlar sifatida yozilishi mumkin. Misol uchun, klassik usuli Levenshtein, qo'shimchalar minimal soni sifatida masofani aniqlash, olib tashlash yoki almashtirish, boshqa bir chiziq tarjima qilish uchun zarur bo'lgan, belgilangan parametrlar bilan belgi usullari anglatadi (binobarin, kontekst-mustaqil) va uzluksiz o'zgarmaydigan natija.

Maydonlarni taqqoslash doirasida Porter stemmeridan foydalanib aniqlanadigan aniq taqqoslash va kesish orqali taqqoslash kombinatsiyasi qo'llashni amalga oshirish ham maqsadga muvofiq bo'ladi [4].

REFERENCES

[1] Bilenko M. Learnable similarity functions and their application to record linkage and clustering [Electronic resource] : diss. . . . for the degree of DPh / Mikhail Yuryevich Bilenko ; Univ. of Texas. - Austin, 2006. - 136 p.

[2] Monge A. E. The field matching problem: Algorithms and applications / A. E. Monge, C. P. Elkan // Proc. 2nd Int. conf. on knowledge discovery and data mining

Zamonaviv ta'limda matematika, fizika va raqamli texnologiyalarning dolzarb muammolari va vutuqlari

Toshkent viloyati Chirchiq davlat pedagogika instituti

(KDD-96), Portland, OR, USA, Aug 2-4, 1996. - Portland : AAAI Press, 1996. - P. 267-270.

[3] Tejada S. Learning domain-independent string transformation for high accuracy object identification [Electronic resource] / S. Tejada, C. Knoblock, S. Minton.// Proc. 8th ACM SIGKDD int. conf. on knowledge discovery and data mining, Edmonton, AB, Canada, July 23-26, 2002. - [N.Y. : ACM, 2002]. - 10 p.

[4] Левенштейн В. И. Двоичные коды с исправлением выпадений, вставок и замещений символов / В. И. Левенштейн // Докл. Акад. наук СССР. - 1965. - Т. 163, № 4. - С. 845-848.

[5] Snowball [Electronic resource] : [offic. site] / Dr. Martin Porter - Cambridge, 2001-2012.

i Надоели баннеры? Вы всегда можете отключить рекламу.