Научная статья на тему 'ИЛМИЙ ВА АКАДЕМИК МАЪЛУМОТЛАРНИ ИЗЛАШ ВА БАЗАСИНИ ЯРАТИШДА МЕТАМАЪЛУМОТЛАРНИНГ РАЦИОНАЛ ТУЗИЛМАЛАРИНИ ШАКЛЛАНТИРИШНИНГ АҲАМИЯТИ'

ИЛМИЙ ВА АКАДЕМИК МАЪЛУМОТЛАРНИ ИЗЛАШ ВА БАЗАСИНИ ЯРАТИШДА МЕТАМАЪЛУМОТЛАРНИНГ РАЦИОНАЛ ТУЗИЛМАЛАРИНИ ШАКЛЛАНТИРИШНИНГ АҲАМИЯТИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
217
33
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
қидирув тизимлари / динамик контент / веб ресурс / индекслаш дастурлари / метамаълумотлар

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Р. Тургунбаев

Хозирги кунда интернет тармоғида маълумотлар асосан қидирув тизимлари орқали топилиб мурожаат қилинмоқда. Фойдаланувчига қидирув натижаларини тезкорлик билан тақдим этиш мақсадида қидирув тизимларининг индекслаш дастурлари тармоқ ресурсларини мунтазам равишда индекслаб келади. Интернет тармоғида динамик кўринишда хосил қилинадиган контент индекслаш алгоритмларига кўринмаслигини хисобга олинса бир томондан қидирув тизимлари томонидан фойдаланувчига тақдим этилаётган қидирув натижаларининг тўлиқ эмаслиги, иккинчи томондан динамик контент провайдерларининг маълумотлари кўриниш даражасини пастлиги масаласини кўтаради. Мазкур мақолада рақамли мухитда маълумот топишда метамаълумотлардан фойдаланиш, веб ресурсларни тавсифлаш учун қўлланиладиган метамаълумот стандартлари, жумладан, Dublin Core Metadata ва Element Set, Resource Description Framework, Open Archives Initiative Protocol for Metadata Harvesting метамаълумотларга мурожаат қилиш протоколи, метамаълумотларнинг ишончлилик даражасини оширишга хизмат қиладиган фольксономиялар тўғрисида маълумот бериб ўтилган.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ИЛМИЙ ВА АКАДЕМИК МАЪЛУМОТЛАРНИ ИЗЛАШ ВА БАЗАСИНИ ЯРАТИШДА МЕТАМАЪЛУМОТЛАРНИНГ РАЦИОНАЛ ТУЗИЛМАЛАРИНИ ШАКЛЛАНТИРИШНИНГ АҲАМИЯТИ»

https://www.uow.edu.au/student/learning-co-op/finding-and-using-information/evaluating-the-quality-of-online-information/ - English.

6. Flanagin, A.J. Digital Media and Youth: Unparalleled Opportunity and Unprecedented Responsibility [Text] / A. J. Flanagin, M. J. Metzger // Digital Media, Youth, and Credibility -Cambridge: The MIT Press, 2008. -5-27pp.

7. Gillett, A. Successful Academic Writing [Text] / A. Gillett, A. Hammond, M. Martala - Harlow: Pearson Education Limited, 2009. - 334p.

8. Lankes, R. D. Trusting the Internet: New Approaches to Credibility Tools [Text] / R. D. Lankes // Digital Media, Youth, and Credibility -Cambridge: The MIT Press, 2008. - 101 -122pp.

9. Мукашева, Л. Ускорение инновационного развития через доступ к информации, знаниям и технологиям [электронный ресурс] / Мукашева, Л. - Mininnovation, 2019. -

https://mininnovation.uz/uploads/mininno/news/Лязиза_Мукашева_Презен тация_для_Форума_Qarivate_Amlytics.pdf

10.Perry, F.L. Research in Applied Linguistics: Becoming a discerning consumer. [Text] / F.L. Perry - 3rd ed. - New York and London: Routledge, 2017. - 260p.

11.Purdue Writing Lab: Evaluating Digital Sources [Electronic resource] / Purdue University - 2021. - Accessed from

https ://owl. purdue. edu/owl/research_and_citation/conducting_research/evalu ating_sources_of_information7evaluating_digital_sources.html - English.

12.Williams, A. Research: Improve your reading and referencing skills [Text] / A. Williams - London: HarperCollins Publishers, 2013. - 191p.

ИЛМИЙ ВА АКАДЕМИК МАЪЛУМОТЛАРНИ ИЗЛАШ ВА БАЗАСИНИ ЯРАТИШДА МЕТАМАЪЛУМОТЛАРНИНГ РАЦИОНАЛ ТУЗИЛМАЛАРИНИ ШАКЛЛАНТИРИШНИНГ АХДМИЯТИ

Тургунбаев Р.

Аннотация: Хозирги кунда интернет тармогида маълумотлар асосан кидирув тизимлари оркали топилиб мурожаат килинмокда. Фойдаланувчига кидирув натижаларини тезкорлик билан такдим этиш максадида кидирув тизимларининг индекслаш дастурлари тармок ресурсларини мунтазам

равишда индекслаб келади. Интернет тармогида динамик куринишда хосил килинадиган контент индекслаш алгоритмларига куринмаслигини хисобга олинса бир томондан кидирув тизимлари томонидан фойдаланувчига такдим этилаётган кидирув натижаларининг тулик эмаслиги, иккинчи томондан динамик контент провайдерларининг маълумотлари куриниш даражасини пастлиги масаласини кутаради. Мазкур маколада ракамли мухитда маълумот топишда метамаълумотлардан фойдаланиш, веб ресурсларни тавсифлаш учун кулланиладиган метамаълумот стандартлари, жумладан, Dublin Core Metadata ва Element Set, Resource Description Framework, Open Archives Initiative Protocol for Metadata Harvesting метамаълумотларга мурожаат килиш протоколи, метамаълумотларнинг ишончлилик даражасини оширишга хизмат киладиган фольксономиялар тугрисида маълумот бериб утилган.

Калит сузлар: кидирув тизимлари, динамик контент, веб ресурс, индекслаш дастурлари, метамаълумотлар

IMPORTANCE OF FORMATION OF RATIONAL STRUCTURES OF METADATA IN THE SEARCH AND CREATION OF SCIENTIFIC AND

EDUCATIONAL DATA

Rashid Turgunbaev

Abstract: Currently, information on the Internet is found mainly through search engines. Search engines' indexing algorithms regularly index web resources to quickly provide search results to the user. Considering that dynamically generated content is not visible for indexing algorithms, on the one hand, there is a problem of incompleteness of search results provided by search engines, on the other hand, low visibility of these dynamic contents. This article discusses the use of metadata to find information in the digital environment, metadata standards used to describe web resources, including the Dublin Core Metadata and Element Set, Resource Description Framework, Open Archives Initiative Protocol for Metadata Harvesting protocol for metadata access, and provided by information about folksonomy for improving the reliability of metadata.

Keywords: search engines, dynamic content, web resource, indexing programs, metadata.

КИРИШ

Тадкикотчилар нашр жараёнидан олдин келадиган гоя ва маълумотларни яратади. Тадкикотчилар метамаълумотларни яратилишининг бошлангич боскичида булиб тадкикот натижаларини нашриётга

топшираётганида метамаълумотларни юклаш учун масъул хисобланади. Илмий нашриётлар илмий изланиш натижаларини журнал маколалари, китоблар, тезислар ва бошка маълумотларни онлайн ёки когоз куринишда такдим этиш оркали таркатади. Нашриётлар томонидан метамаълумотларга киритиладиган инвестиция уз самарасини беришини тан олиниши ортиб бораётганлиги уларни сифатли метамаълумотларга купрок сармоя киритишга ундайди. Бундан ташкари нашриётлар метамаълумотларни автоматик генерация килиш технологияларни тадбик килишда пешкадам булиб келмокда. Илмий алока хизмат провайдерлари илмий изланиш натижаларидан фойдаланиш ва таркатишни осонлаштириш учун восита ва платформаларни яратади. Буларга кутубхона, интернет-дукон, нашриёт ва метрика тизимлари киради. Курсатилаётган хизмат турига караб хизмат провайдери ишлатадиган метамаълумотлар бир биридан кескин фарк килади. Бундай номувофиклик ресурсларни топиш ва мурожаат килишда муаммолар келтириб чикаради. Кутубхоналар охирги фойдаланувчилар ресурсларни излайдиган ва метамаълумотларни учратадиган жой хисобланади. Кутубхоналар уз ресурсларига мурожаат килишни осонлаштиришдаги кийинчиликларидан бири бу метамаълумотлар билан таъминлашнинг умумий муаммоси билан богликдир [1].

АДАБИЁТЛАР ТАХДИЛИ

Илмий изланиш ва илмий хужжатларни нашр этиш фаолиятининг ортиб бориши илмий маколаларнинг сонини ортиб боришига олиб келмокда. Илмий изланувчиларнинг билим излаш харакатларини куллаб кувватлаш учун матнни анализ килиш воситалари ва кидирув тизимлари керак булади. Метамаълумотларни автоматик экстракция килиш ракамли кутубхоналар тупламларининг оммалашиши ва кенг фойдаланиш имкониятини яратишни таъминлайди [2].

Prasath & Ozturk [3] веб сахифалардан илмий маколаларнинг мазмунини экстракция килиш ёндашувини таклиф килади. Ушбу ёндашув кейсга асосланган фикрлаш [19] усулларидан фойдаланиб ухшаш муаммолар ухшаш ечимларга эга фикрга асосланган ва мавжуд тажрибалардан янги муаммоларни ечишда фойдаланилади. Илмий маколаларнинг мазмунини экстракция килишда асосий вазифалардан бири бу HTML теглар кетма кетлигини таснифлаш булиб бошкарув хаволалари, реклама ва асосий мазмунга алокадор булмаган бошка контентни акс эттрувчи теглар кетма кетлиги инобатга олинмайди, илмий мазмунга эга теглар кетма кетлиги экстракция килинади. Мазкур ёндашув теглар кетма кетлигини таснифлашнинг хар бир тажрибадан урганади ва ушбу тажрибаларни кейслар базасида саклайди. Янги теглар кетма кетлиги таснифланиши керак булганида кейслар базасида ухшаш кетма кетлик таснифлаш тажрибаси

мавжуд булса ушбу тажрибадан контентни экстракция килишда кайта фойдаланилади. Агар теглар кетма кетлиги янги булса веб сахифада учрайдиган турли теглар кетма кетликларнинг таксимланиши ва теглар кетма кетликларининг ухшашлиги буйича таклиф этилаётган алгоритмдан фойдаланилади. Умумий ёндашув учта асосий кисмдан иборат: макола танасини олиш, андозани экстракция килиш ва контентни экстракция киши. Макола танасини олиш жараёнида илмий маълумот жойлашган веб сахифанинг HTML куринишини сахифадаги блокларга тугри келадиган теглар кетма кетлиги туплами куринишига узгартирилади. Андоза экстракция килиш жараёнида теглар кетма кетлиги тегишли ёки тегишли эмаслилиги буйича таснифланади. Контентни экстракция килиш жараёнида веб сахифанинг блокларидан ярокли андозалар ёрдамида ифодаланувчи контент экстракция килинади. Мазкур жараёнларда асосий масалалардан бири бу ярокли контентга мос келадиган теглар кетма кетлигини аниклаш хисобланади. Таклиф этилаётган ёндашув теглар кетма кетлигини тегишли маълумотларни сакловчи ва тегишли булмаган маълумотларни сакловчи турларига таснифлайдиган алгоритмни уз ичига олади. Таклиф этилаётган ёндашувнинг мухим хусусиятларидан бири теглар кетма кетлигини таснифлашда аввалги тажрибадан унумли фойдаланилади.

Khankasikam [4] кейсга асосланган фикрлашдан фойдаланиб хужжатлардан метамаълумотларни экстракция килиш ёндашувини таклиф этади. Таклиф этилган тизим учта асосий таркибий кисмдан иборат: янги кейсни мавжуд кейслар билан таккослаш учун кейсни чакириб олиш модули, хужжатлардан метамаълумотларни автоматик экстракция килиш учун метамаълумотларни генерациялаш модули хамда экстракция килиб олинган метамаълумотлардаги хатоликларни топиш ва тугирлаш учун метамаълумотларни текшириш модули. Кейсни чакириб олиш модули янги кейсни мавжуд кейслар билан энг якин кушнини чакириб олиш техникаси ёрдамида таккослаш учун ишлатилади. Энг якин кушнини чакириб олиш нишон кейсни манба кейси билан таккослаганда ухшашликни улчайдиган техника хисобланади. Ушбу техника нишон кейснинг вазнли аттрибутларининг тупламини кейслар базасидаги манба кейсларга таккослаш оркали кейсларни чакириб олади. Агар кейслар базасида тугри келадиган кейс булмаса базадан энг якин тугри келадиган манба кейс кайтарилади. Метамаълумот генерация киладиган модуль хужжатлардан метамаълумотларни экстракция килиш учун масъул хисобланади. Илмий маколалардаги метамаълумотлар Dublin Core тавсифифи буйича экстракция килинади. Метамаълумотлар экстракция килинганидан сунг метамаълумотларни текшириш модули юкори сифатли метамаълумотларни

олиш учун фойдаланувчиларга экстракция килиб олинган метамаълумотлардан хатоликларни топиш ва тугирлашда ёрдам беради.

Hui Han ва б. [5] таянч вектор машиналаридан фойдаланадиган хужжатлардан метамаълумотларни автоматик экстракция килиш усулини таклиф килади. Академик маколаларнинг бош кисмидан метамаълумотларни экстракция килишни таянч вектор машиналари таснифлашга асосланган усул бошка усуллардан самаралилиги курсатилган. Ушбу усул ёрдамида хужжат бош кисмининг хар бир катори бир ёки бир нечта синфларга таснифланади. Аввалги итерацияда кушни каторларнинг башорат килинган синф белгиларидан фойдаланиб итератив конвергенция процедураси каторларни таснифлашни яхшилаш учун ишлатилади. Кейинги метамаълумотларни экстракцияси хар бир кторнинг энг яхши булак чегараларини излаш оркали амалга оширилади. Маълумотларнинг тузилиш андозалари ва сохага асосланган суз кластерлаш метамаълумотларни экстракцияси унумдорлигини ошириши мумкин. Бундан ташкари тугри хусусиятларни нормаллаштириш хам таснифлаш унумдорлигини кескин оширади.

Tkaczyk ва б. [6] CERMINE илмий адабиётлардан тузилмали метамаълумотларни автоматик экстракция килиш тизимини таклиф килади. Мазкур тизим электрон илмий маколалардан тузилмали метамаълумотларни экстракция килувчи кенг камровли очик кодли тизим хисобланади. Тизим модулли иш окимига асосланган булиб, унинг эркин богланган архитектураси индивидуал компоненталарни бахолаш ва созлаш, алгоритмнинг мустакил кисмларини осон такомиллаштириш ва алмаштириш имкониятларини беради ва келажакда архитектурани кенгайтиришга ёрдам беради. Тизимни тадбик этишнинг куп боскичлари назорат остидаги ва назоратсиз машинани урганиш техникасига асосланган, бу уз навбатида тизимни янги хужжат тузилиши ва стилларига мослаштирилишини осонлаштиради. Катта микдордаги маълумотлардан фойдаланиб амалга оширилган экстракция жараёнини бахолаш аксарият метамаълумотлар турлари учун яхши самарадорликни курсатган.

Safder ва б. [7] тулик матнли академик хужжатлардан алгоритмик метамаълумотларни чукур урганишга асосланган экстракция килиш усули таклиф килган. Кидириш тизимларининг ривожланиши катта хажмдаги матнли маълумотларни самарали олиш имкониятини беради. Аммо, бундай анъанавий излаш услублари аксарият холатларда олинган маълумотларнинг аникдилик даражаси пастлигини курсатади. Алгоритмлар учун мулжалланган AlgorithmSeer кидирув тизими илмий нашрлардан псевдокодлар ва юзаки матнли метамаълумтларни экстракция килиб улар учун кидириш тизимларининг умумий услублрини тадбик этиш учун анъанавий хужжат сифатида куради. Машина урганиши техникалари тупламидан фойдаланиб

алгоритмик псевдокодлар ва боглик алгоритмик метамаълумотларни уз ичига олувчи жумлаларни автоматик аниклаш ва экстракция килиш усуллари таклиф этилган.

Skluzacek ва б. [8] Skluma: тартибсиз маълумотлар учун кенгайтириладиган метамаълумотларни экстракция килиш тизими таклиф килинган. Маълумотларни юкори тезликда кенгайиш эффектини юмшатиш ва маълумот репозиторийларини ташкил этишни автоматлаштириш учун Scluma тизими таклиф этилган. Ушбу тизим максад репозиторийни автоматик кайта ишлаб метамаълумотларни экстракция килади. Skluma тизими турли метамаълумотларни шу жумладан, урнатилган тузилишга эга маълумотлардан олинган жамланган кийматларни, матнли маълумотлар ичидаги номли объектлар ва яширин мавзуларни, расмлар ичидаги контентни экстракция килиш имкониятига эга. Skluma тизими файллардан метамаълумотларни экстракция килишда кенгкамровли тахминий манбани амалга оширади. Файл турини аниклашда машина урганиш усулларини куллайди, метамаълумот экстрактори тупламини динаммик равишда устуворлигини белгилайди ва амалда куллайди, файллар уртасидаги богликдикларга асосланиб метамаълумотларни урганади. Олинган метамаълумотлар хар бир файл тугрисида тахминий билимни тасвирлайди ва кейинчалик излаш ва ташкил этиш жараёнларида кулланилиши мумкин.

МЕТОДЛАР

Интернет тармоги дунёда мавжуд булган энг улкан хужжатлар коллекцияси булиб вакт утган сари унинг хажми ошиб бормокда. Бу уз урнида интернет тармоги оркали мувофик, ишончли ва сифатли маълумотларни олишда кийинчилик тугдиради. Интернет тармогида маълумотлар базасидан фойдаланувчининг суровига мувофик динамик куринишда контент такдим этиш микдори ошиб бормокда. Кидирув тизимларининг индекслаш дастурлари бундай турдаги контентларни индекслай олмайди. Натижада динамик хосил килинадиган контент кидирув тизимларига куринмайди ва тизим томонидан бундай маълумотлар фойлаланувчига такдим эта олинмайди. Хозирги вакта фойдаланувчилар интернет тармогидаги маълумотларни асосан кидирув тизимлари оркали топиб мурожаат килмокда. Интернет тармогидаги траффикнинг асосий кисми кидирув тизимлар оркали келиши хисобга олинса уларнинг индекслаш дастурлари мурожаат кила олмайдиган веб сахифаларни яратиш ушбу сахифаларда жойлашган контентни куриниш имконияти жиддий чегараланади [9]. Динамик хосил килинадиган маълумотларга мурожаат килиш имкониятини кенгайтириш учун кидирув тизимларининг индекслаш дастурларига дустона сайтларни яратиш ёки мавжуд маълумотларни бирлашган каталог ёки агрегаторларга такдим этиш оркали эришиш мумкин.

Интернет тармогида маълумотларни топиш муаммосиёнинг ечимларидан бири сифатида метамаълумотларни куриш мумкин [20]. Бунинг асосий сабабларидан бири сифатида метамаълумотлар кутубхона каталоги куринишида улкан библиографик тупламларга мурожаат килишни таъминлаш ва уларни бошкаришда уз самарасини исботлаганлиги [10]. Худди шундай тамойилни интернет тармогига хам куллаш мумкинми деган савол хам уринли. Бунда, китобларни каталоглаш жараёнининг веб ресурсларни каталоглашдан тубдан фарк килади. Стандарт каталоглаш коидаларига мувофик яратилган ва одатда жуда киммат булган MARC ёзувини яратиш анъанавий библиографик тизимда узини оклаши мумкин, чунки мазкур ёзув бошка кутубхоналар томонидан узок вакт давомида фойдаланилади. Веб ресурслар эса анъанавий чоп этилган материалларга нисбатан динамик ва вактинчалик хусусиятларга эга. Шу сабабли интернет ресурсларини тавсифлаш учун метамаълумот стандартлари пайдо була бошлаган. Буларга, мета теглар, Dublin Core ва Resource Description Framework мисол килиш мумкин [11].

Илк кидирув тизимлари уз алгоритмларида веб сахифанинг <head> тегига мета теглар ёрдамида киритиладиган иккита метамаълумот элементлари, "тавсиф" ва "калит сузлар"дан фойдаланилган [12]. Тавсифловчи метамаълумотлар кидирув тизимлари томонидан акс эттириладиган натижаларида топилган ресурслар тугрисида аник, киска ва ишончли маълумот беришга мулжалланган. Уларга асосланиб фойдаланувчи керакли ресурсга утиши мумкин булади. Калит сузлар теги кидирув натижаларини самаралилиги ва аниклилигини таъминлаш максадида соха, номлар ва бошка калит сузларни сакловчи контейнер хисобланади. Замонавий кидирув тизимлари мазкур теглардани маълумотлардан асосий манба сифатида фойдаланмайди.

Соха ва тизимлараро ресурс топиш максадида турли ресурсларни тавсифлаш имконияти мавжуд булган Dublin Core Metadata Element Set тупламининг ун бешта элементларидан фойдаланиш мумкин [13]. Дастлаб, тармок ресурсларининг электрон каталог карточкаси сифатида фойдаланиш учун мулжалланган булсада хозирда исталган ахборот объектини тавсифлаш учун кулланилмокда. Dublin Core Metadata Element Set туплами куйидаги элементлардан ташкил топган: contributor (хиссадор), coverage (камров), creator (яратувчи), date (санаси), description (тавсифи), format (формати), identifier (идентификатор), language (тили), publisher (нашриёт), relation (алокаси), rights (хукуклари), source (манбаси), subject (соха), title (номи), type (тури). Dublin Core элементлари ва уларнинг маънолари кутубхоначилар, ахборот мутахассислари ва соха вакилларининг халкаро гурухи томонидан

ишлаб чикилган булиб ISO 15836:2009 халкаро стандартлари асосида стандартлаштирилган.

Resource Description Framework World Wide Web консорциуми томонидан ишлаб чикилган стандарт булиб ресурс тавсифларини машина укий оладиган куринишда кодлаш учун мулжалланган. RDF метамаълумотлари одатда XML синтакси ёрдамида кодланади. RDF стандарти ресурсни тавсифлаш учун асосни таъминлайди, яъни, ресурсни тавсифлаш учун синтакс ва структурани таъминлайди. Кодланган метамаълумотлар компьютер томонидан тушинилиши учун унинг семантикаси маълум соха учун белгиланган булиши керак. Семантика метамаълумотнинг хар бир элементи кандай маънога эга эканлиги ва бошка элементлар билан богликлилигини аник курсатиб берувчи метамаълумотнинг модели булиб RDF лугати томонидан белгиланади [14].

Богланган маълумотлар нашр этиш ва RDF синтаксиси ва HTTP URI куллайдиган тузилмали маълумотларни боглаш коидалари туплами асосида семанетик муносабатларни кодловчи маълумотлар хисобланади. Богланган маълумотлар очик ёки хисояланган тармокдарга жойлаштирилиши мумкин. Агар богланган маълумотлар очик тармокда жойлаштирилса улар богланган очик маълумотлар дейилади. Богланган очик маълумотлар тупламига Library of Congress Subject Headings ва Virtual International Authority File мисол килиш мумкин. Богланган очик маълумотлар метамаълумотлар ёзувларини ва ушбу ёзувларини тулдириш ва ресурслар уртасида мазмунли алокаларни таъминлаш учун ишлатиладиган метамаълумотлар ёзувларини ва бошкариладиган лугатларини семантик жихатдан бойрок, осонрок ва кенгрок фойдаланиш ва алмашиш имкониятини яратади [15]. Богланган очик маълумотлар маълумотларнинг таркалиши ва интеграциялашуви жараёнида маълумот ва ресурсларни излаш ва фойдаланиш жараёнини яхшилаш салохиятига эга.

Маълумот йигиш бу интернет тармогидан метамаълумотларни ёки маълумотларни турли максадларда фойдаланиш учун йигиш жараёнидир. Одатда, метамаълумотлар турли репозиторийлардан кидириш имкониятига эга марказий индексларини яратиш учун йигилади. Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) протоколи метамаълумотларга мурожаат килишни осонлаштириш усулларини таъминлайди [16]. Метамаълумотларни HTML сахифаларга бириктириш урнига OAI-PMH протоколи метамаълумот ёзувларини шундай усулда очиклайдики OAI-PMH протоколини куллайдиган бошка компьютер тизимлар уларга мурожаат килиш имконияти пайдо булади. OAI-PMH протоколи икки турдаги компьютер тизимларининг, OAI маълумот манбаси ва OAI маълумот йигувчи, мослигини таъминлайди. OAI маълумот манбаси метамаълумот

ёзувларининг манбаси, OAI маълумот йигувчи ёзувларни бир ёки бир нечта манбалардан йигади. Маълумот манбаси ва маълумот йигувчи бир хил турдаги маълумот алмашиш протоколини куллаши керак булади. Метамаълумот ёзувлари тугри форматланган такдирда маълумот йигувчи томонидан маълумот манбасидан йигиб олиниши мумкин. OAI-PMH протоколи OAI маълумот манбаси метамаълумот ёзувларини Dublin Core XML схемаси асосида етказиб бериш талабини куяди. Шу йул оркали турли тизимлардан келиб чикадиган метамаълумотларнинг мослиги таъминланади.

Интернет тармогидаги метамаълумотларнинг ишончлилик даражасини оширувчи янги омиллардан бири фольксономиялар хисобланади. Фольксономия бошкарилмайдиган лугат тури булиб фойдаланувчилар веб сахдфа ёки расм каби онлайн контентни тавсифий номлар, яъни, таглар билан белгилайдиган умумий тизимдан фойдаланганида хосил булади [17]. Куп фойдаланувчилар веб контентни белгилашдан манфаатдор булиб у контентни тартиблаш ва топиш хдмда бу оркали шахсий онлайн контент каталогини яратиш имконияти яратилади. Фольксономияда синоним атама ва сузлар бир бири билан аник богланган, тушунчалар уларнинг иерархик структурасини акс эттирадиган хрлда тартибланадиган, элементни тавсифлаш учун атама ва номлар учун аник коидалар мавжуд таксономик классификациялаш тизимлари ва бошкариладиган лугатлардан фаркли уларок барча атама ва номлар ишлатилиши мумкин.

Бир нечта фойдаланувчилар томонидан маълум бир ресурсга татбик этилган барча теглар бирлаштирилиб тартибланганида бошкарилмайдиган тагларнинг фольксономия жихдти кучга киради. Масалан, агар бирор бир фойдаланувчи расмни "куз" таги билан белгиласа бу маълумот излаш жараёнига катта таъсир утказмайди. Агар куплаб фойдаланувчилар бу атамани кулласа ва у мазкур расм учун энг куп кулланиладиган таг булса бу расм куз мавзусига тегишлилиги тугрисидаги эхтимолни оширади.

Мацсад ва вазифалар

Кутубхона метамаълумотларини ривожлантириш биринчи навбатда ресурслар тупламига физик мурожаат килиш имкониятини таъминлашга каратилган. Кутубхона метамаълумотлари индекс, аннотация ва Anglo-American Cataloguing Rules (AACR), Resource Description and Access (RDA) каталоглаш коидалари ва MARC (Machine-Readable Cataloging) ва BIBFRAME (Bibliographic Framework) маълумотлар тузилиши стандартлари хдмда Library of Congress Subject Headings (LCSH) каби маълумотлар киймати стандартларига мувофик яратилган библиографик ёзувларни уз ичига олади. [22] Хозирги кунда метамаълумотлар нафакат инсон балки метамаълумотларни казиб олиш, йигиш ва веб сканерлаш автоматлаштирилган тизимлари томонидан хдм яратилиб келинмокда.

Метамаълумотларни автоматлаштириш жараёни кенгайиб бориши Resource Description Framework (RDF), богланган очик маълумотлар ва Semantic Web технололгияларни амалга тадбик этилиши билан мукаррардир.

Метамаълумотлар факатгина ресурсларни тавсифлаш ва аниклашда фойдаланилмайди. Репозиторийлар тупламларни бошкариш, кушиш, саклаш ва фойдаланиш билан боглик метамаълумотларни яратади. Мавжуд ресурслар тугрисидаги ёзувлар, кургазма каталоглар, лицензион келишувлар ва таълим метамаълумотлари шундай турдаги метамаълумотлар сирасига киради. Виртуал музейлар, электрон кутубхоналар ва архив ахборот тизимлари каби бирлашган ахборот ресурслари хакикий тупламнинг ракамли куринишини ва унинг тавсифини уз ичига олади. Ресурслар таркибига бундай турдаги метамаълумотларни киритиш метамаълумотларнинг тупламларни бошкариш ва уларнинг интеллектуал якдиллигини таъминлашда мухимлигини тасдиклайди.

Метамаълумот тушунчаси репозиторийлардан ташкарида кулланилганда янада кенг маънога эга булади. Интернет ресурс провайдери метамаълумот тушунчаси сифатида веб-сайтни осон топилишини таъминлаш максадида HTML мета тегларига киритиладиган маълумотларга мурожаат килиши мумкин. Расмларни ракамлаштирувчилар эса метамаълумот сифатида ракамли файлнинг сарлавха кисмига расм файли тугрисидаги маълумот, кайта ишлаш жараёни, расмнинг муаллифлик хукуклари тугрисида маълумотларни тушуниши мумкин. Ракамли маълумотларни архивловчилар метамаълумот тушунчаси сифатида ракамли маълумотни саклаш ва кулами, хакикийлиги хамда яхлитлигини хужжатлаштириш учун керак буладиган мазмун, кайта ишлаш, саклаш ва фойдаланишга доир маълумотларни тушунади. Метамаълумотлар маълумотларни самарали излаш ва саклаш ишончлилигини таъминлаш учун шахсий маълумотларни бошкариш ва ракамли архивлашда мухим хисобланади. Юкоридаги турли куринишларда метамаълумот ахборот объектини нафакат аниклаш ва тавсифлаш учун хизмат килади балки объект ишлаши, функциялари ва фойдаланиши, бошка ахборот объектлари билан алокалари, вакт оралигида бошкарилишини хужжатлаштиришга хизмат килади.

Музейлар, архивлар, кутубхоналар ва бошка ахборот сакловчи ресурсларнинг профессионал ва маданий вазифалари турлича булганлиги сабабли метамаълумотлар тугрисидаги назарий ва амалий тушунчалар сезиларли даражада фарк килади. Ахборотлар билан ишловчилар учун жуда катта микдордаги метамаълумотлар стандартлари ва ёндашувлари мавжуд. Тор доирадаги жамиятлар томонидан жуда батафсил метамаълумотлар стандартлари ишлаб чикилган булиб уларнинг хар бири узига хос булган максадига хамда умумий маълумот элементларини боглашга хизмат килади.

Масалан, MARC, BIBFRAME, EAD, LIDO, Australian Recordkeeping Metadata Schema. Агар ушбу стандартлардан тугри ва тулик фойдаланилса улар ёрдамида маълумотларни саклаш ва фойдаланишни батафсил хужжатлаштиришни таъминловчи жуда бой метамаълумотларни яратиш имконияти мавжуд. Бундай метамаълумотларни яратиш ва уларга хизмат курсатиш жараёни комплекс булиб куп вакт ва ресурсларни талаб этади. Аксинча, Dublin Core Metadata Element Set (DCMES) стандарти исталган соха вакилари томонидан ахборот ресурсларини тавсифлаш ва излаш мумкин булган нисбатан кичик ва умумий куринишдаги метамаълумот элементларини белгилайди. [21] Бундай турдаги стандартлар турли хил тавсифловчи метамаълумотларни узаро фаолиятини таъминлаш учун керак. Нисбатан сийрак элементларига эга, DCMES каби стандарт ёрдамида яратилган метамаълумотлар яратиш ва хизмат курсатишда арзонлиги билан афзаллидир.

НАТИЖА ВА МУХРКАМА

Метамаълумот ракамли мухитда ресурс топиш учун универсал ечим була олмайди. Веб сахифалар учун структураланган, стандартларга асосланган метамаълумотларни кенг кулланилишига асосий тусиклардан бири бу ишонч, хакикийлик ва ваколатлилик масалалари хисобланади. Бу холат кидирув тизимлари фойдаланувчилар эхтиёжларини жорий усуллар (веб сахифанинг <title> теги, веб сахифадаги сузлар хамда сахифага хаволалар сони асосида улчанадиган сахифанинг машхурлигини индекслаш) ёрдамида кондиришни давом эттириши билан узгармайди [18].

Аммо, инсон томонидан яратилган метамаълумотлар маълум сохаларда мухим ахамиятга эга. Масалан, кутубхона, архив ва музей сохаларида метамаълумот каталоглашга тенглаштирилади. Ресурсларни топиш, маълумот алмашиш ва таркатишни осонлаштиришга каратилган куплаб стандартлар ва технологик компонентлар мавжуд булиб уларнинг асосийлари куйидагилар:

- турли ресурс тавсифлари учун маълумот структура ва формат стандартлари (MARC, Dublin Core, MODS, EAD, VRA Core, LIDO);

- маълумот киймат стандартлари (Library of Congress authority files, Getty vocabularies, Medical Subject Headings);

- метамаълумотларни машина укий оладиган куринишда кодлаш учун восита ва усуллар (XML, RDF, SKOS, CIDOC CRM);

- метамаълумотларни йигиш ва излаш протоколлари (Z39.50, SOAP, REST, OAI-PHM).

ХУЛОСА

Кутубхоналар, архивлар ва музейлар томонидан яратилаётган бой контентларга мурожаат килишни таъминлаш максадида юкоридаги

компонентлардан окилона ва тугри куринишда фойдаланиш оркали ракамли маданий контент ва интеграллашган излаш воситаларининг глобал семантик тармогини яратиш имконияти пайдо булади. Кутубхона каталогларида метамаълумотлар аник объектларни кидириш, топиш ва олиш учун шаффоф тил сифатида кулланилиши мумкин. Илмий изланувчиларнинг билим излаш харакатларини куллаб кувватлаш учун матнни анализ килиш воситалари ва кидирув тизимлари мухим ахамиятга эга. Хозирги кунда кенг таркалган ва юкори самарадорликка эга деб хисобланадиган кейсга асосланган фикрлаш ва машина урганиши алгоритмларига асосланган тизимлар ёрдамида академик маколалардан метамаълумотларни автоматик экстракция килиш ва шу оркали илмий манбаларни излаш жараёнини осонлаштириш хдмда куламини кенгайтириш имконияти пайдо булади. Кейсга асосланган фикрлаш мавжуд ечимларни янги талабларга мос келишига мослаштириш, мавжуд кейслардан фойдаланиб янги холатларни тушунтириб бериш, мавжуд кейслардан фойдаланиб янги ечимларни танкид килиш ёки янги хрлатларни талкин килиш тушинилиши мумкин. Ухшаш муаммолар ухшаш ечимга эга деган фикрга таянган кейсга асосланган фикрлаш ёндашуви академик маколаларнинг контентини экстракция килишда фойдаланилади. Кейсга асосланган фикрлаш ёндашувига таянган тизимлар янги кейсни мавжуд кейслар билан таккослаш учун кейсни кейслар базасидан чакириб олиш, академик маколалардан метамаълумотларни автоматик экстракция килиш учун метамаълумотларни генерациялаш х,амда экстракция килиб олинган метамаълумотларни текшириш кисмларидан иборат булади. Машина урганишининг асосий натижаси умулаштириш даражаси, яъни, модельнинг аввалги ухшаш маълумотлар асосида урганилган коидаларга асосланиб янги маълумотлар учун тугри башорат килиш даражаси хисобланади. Янги маълумотлар асосида аник башорат кила оладиган модельларни тузиш машина урганишининг асосий максади хисобланади. Тушунтиришдан умумлаштиришгача булган утиш машина урганишини статистикага асосланган анъанавий изланишлардан фарк килади. Машина урганиши маълумотларда тегишли конуниятларни урганади, сунг, улардан башорат килишда фойдаланилади. Машина урганиши маълумотларни тахлил килиш ва маълумотлар базаларида билим излаш; эксперт тизимлари учун билимлар базасини автоматик яратиш; режалаш, уйин уйнаш, сонли ва сифат моделларини тузишни урганиш; матнларни таснифлаш ва олиш; динамик жараёнларни бошкариш учун билимларни автоматик олиш; расм, кулёзма ва нуткни автоматик таниб олиш ва бошка сох,аларда кулланилади. Уз навбатида, метамаълумотларни автоматик экстракция килиш ракамли кутубхоналар тупламларининг оммалашиши ва кенг фойдаланиш имкониятини яратади.

Oonga^aHH^raH agaÔHëTiap

[1] Bascones, M., & Staniforth, A. (2018). What is all this fuss about? Is wrong metadata really bad for libraries and their end-users?. Insights, 31.

[2] Gregg, W., Erdmann, C., Paglione, L., Schneider, J., & Dean, C. (2019). A literature review of scholarly communications metadata. Research Ideas and Outcomes, 5, e38698.

[3] Prasath, R. R., & Ôzturk, P. (2016). An Approach to Content Extraction from Scientific Articles using Case-Based Reasoning. Res. Comput. Sci., 117, 8596.

[4] Khankasikam, K. (2011). Metadata Extraction Using Case-basedReasoning for Heterogeneous Thai Documents. International Journal of Computer and Electrical Engineering, 3(1), 60.

[5] Han, H., Giles, C. L., Manavoglu, E., Zha, H., Zhang, Z., & Fox, E. A. (2003, May). Automatic document metadata extraction using support vector machines. In 2003 Joint Conference on Digital Libraries, 2003. Proceedings. (pp. 37-48). IEEE.

[6] Tkaczyk, D., Szostek, P., Fedoryszak, M., Dendek, P. J., & Bolikowski, L. (2015). CERMINE: automatic extraction of structured metadata from scientific literature. International Journal on Document Analysis and Recognition (IJDAR), 18(4), 317-335.

[7] Safder, I., Hassan, S. U., Visvizi, A., Noraset, T., Nawaz, R., & Tuarob, S. (2020). Deep learning-based extraction of algorithmic metadata in full-text scholarly documents. Information processing & management, 57(6), 102269.

[8] Skluzacek, T. J., Kumar, R., Chard, R., Harrison, G., Beckman, P., Chard, K., & Foster, I. T. (2018, October). Skluma: An extensible metadata extraction pipeline for disorganized data. In 2018 IEEE 14th International Conference on e-Science (e-Science) (pp. 256-266). IEEE.

[9] Koszewski, K. (2020). Web Search Engine of Scientific Journals (Doctoral dissertation, Instytut Elektrotechniki Teoretycznej i Systemow Informacyj no-Pomiarowych).

[10] McDonald, C., & Burkhardt, H. (2021). Web Content Strategy in Practice within Academic Libraries. Information Technology and Libraries, 40(1).

[11] Caplan, P., & Guenther, R. (2020). Metadata for Internet resources: The Dublin Core metadata elements set and its mapping to USMARC (pp. 43-58). CRC Press.

[12] Sharma, S., & Rana, V. (2020). Web search personalization using semantic similarity measure. In Proceedings of ICRIC 2019 (pp. 273-288). Springer, Cham.

[13] Phillips, M. E., Zavalina, O. L., & Tarver, H. (2020, March). Using metadata record graphs to understand digital library metadata. In International Conference on Dublin Core and Metadata Applications (pp. 49-58).

[14] Necula, S. C. (2020). Semantic Web Applications: Current Trends in Datasets, Tools and Technologiesa€™ Development for Linked Open Data. Informatica Economica, 24(4), 72-84.

[15] Candela, G., Escobar, P., Carrasco, R. C., & Marco-Such, M. (2020). Evaluating the quality of linked open data in digital libraries. Journal of Information Science, 0165551520930951.

[16] Luna, R. V., Luna, L. G. G., Mancilla, P. C. S., Mariscal, R. B., Morales, J. R. H., & Guillermo, A. Harvesting academic metadata through the OAI-PMH protocol to measure the impact of scientific publications.

[17] Yu, W., & Chen, J. (2020). Enriching the library subject headings with folksonomy. The Electronic Library.

[18] Kubek, M. (2020). Contemporary Web Search. In Concepts and Methods for a Librarian of the Web (pp. 15-34). Springer, Cham.

[19] Turgunbaev, R. (2021). Keysga asoslangan fikrlash va uni akademik metama'lumotlarni avtomatik ekstraksiya qilishda tadbiq qilinishi. Science and Education, 2(9), 129-144.

[20] Turgunbaev, R. (2021, September). Metadata in Data Search. In " ONLINE-CONFERENCES" PLATFORM (pp. 93-96).

[21] Kononova O. V., Prokudin D. E. The Approach to the Meta-description of the Interdisciplinary Research Terminological Landscape //CEUR Workshop Proceedings. - 2020. - T. 2543. - C. 234-246.

[22] Hoffman G. L. Organizing Library Collections: Theory and Practice. -Rowman & Littlefield, 2019.

i Надоели баннеры? Вы всегда можете отключить рекламу.