Научная статья на тему 'QIDIRUV TIZIMLARI ALGORITMLARINING TAHLILI'

QIDIRUV TIZIMLARI ALGORITMLARINING TAHLILI Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
524
71
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
qidiruv tizimlari / PageRank / TF-IDF / web-sahifa / semantik qidiruv

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Narziyev Nosir Baxshilloyevich, Xolmatov Asilbek, Almatov Samandar

Qidiruvning tizimlarining ahamiyati va ushbu tizimlarda qidiruvni amalga oshirish uchun qo’llaniladigan algoritmlar haqida batafsil ma'lumot keltirilgan

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «QIDIRUV TIZIMLARI ALGORITMLARINING TAHLILI»

RAQAMLI TEXNOLOGIYALAR DAVRIDA TILLARNI INTENSIV O'QITISHNING PSIXOLOGIK-

PEDAGOGIK JIHATLARI RESPUBLIKA ILMIY-AMALIY ANJUMANI 2023-yil 2-iyun

QIDIRUV TIZIMLARI ALGORITMLARINING TAHLILI 1Narziyev Nosir Baxshilloyevich, 2Xolmatov Asilbek, 3Almatov Samandar

1Toshkent axborot texnologiyalari universiteti, katta o'qtuvchi 2,3Toshkent axborot texnologiyalari universiteti talabalari https://doi.org/10.5281/zenodo.7993938

Annotatsiya. Qidiruvning tizimlarining ahamiyati va ushbu tizimlarda qidiruvni amalga oshirish uchun qo'llaniladigan algoritmlar haqida batafsil ma'lumot keltirilgan.

Kalit so'zlar: qidiruv tizimlari, PageRank, TF-IDF, web-sahifa, semantik qidiruv.

Qidiruv tizimlari algoritmi - qidiruv tizimi foydalanuvchining qidiruv so'roviga javoban qaysi veb-sahifalarni qaytarishi kerakligini aniqlash uchun foydalanadigan qoidalar, ko'rsatmalar yoki murakkab hisoblar to'plamidir. Misol uchun, Google qidiruv tizimining algoritmi qidiruv natijalarida qanday veb-sahifalar paydo bo'lishi kerakligini aniqlash uchun veb-sahifadagi kontentning dolzarbligi va unga qancha boshqa veb-saytlar bog'lanishi kabi yuzlab omillarni hisobga oladi. Shu tarzda, u foydalanuvchilarga eng mos va maqbul natijalarni topishga yordam beradi. Qidiruv tizimlari algoritmlari murakkab va doimiy ravishda rivojlanib boradi, lekin umumiy g'oya oddiy : qidiruv so'zini google kabi qidiruv tizimlariga kiritganingizda, u o'zi biladigan barcha veb-sahifalarni ko'rib chiqadi va keyin ularni saralaydi va natijalarning qidiruvingizga mos kelishi ehtimoli yuqori bo'ladi. Qidiruv tizimi dastlab qidiruvingizdagi so'zlarga qaraydi va asosiy tushunchalarni aniqlaydi. Qidiruvingizga eng yaqin bo'lgan veb-saytlar yoki ma'lumotlar qidiruv natijalarining yuqori qismida joylashadi. Qidiruv tizimi har bir veb-sahifaning dolzarbligini aniqlash uchun bir nechta omillarni ko'rib chiqadi. U sahifadagi so'zlarning chastotasi, sahifaning mashhurligi (qancha odam va qanchalik tez-tez tashrif buyurishi) va ishlatiladigan kalit so'zlarning turlarini hisobga oladi. Shuningdek, sahifa qanchalik tez-tez yangilanishi va boshqa veb-saytlar unga qanchalik tez-tez bog'lanishini ko'rib chiqadi. Qidiruv tizimi veb-saytning umumiy konteksti va kontent sifatiga ham qaraydi. U aniq ma'lumot va sifatli tasvirlar kabi ma'lumotlarni qidiradi. Qidiruv tizimlari algoritmlari sizga eng yaxshi qidiruv natijalarini berish uchun yuqorida keltirilgan omillardan foydalangan holda milliardlab veb-sahifalarni tez va aniq saralashi mumkin.

Qidiruv tizimining algoritmlari hamma uchun ochiq emas. Qidiruv tizimlari algoritmlari Google, Bing va Yahoo kabi qidiruv tizimlari tomonidan qo'llaniladigan maxfiy retseptlardir! Ushbu algoritmlar doimiy ravishda o'zgartiriladi va foydalanuvchiga eng dolzarb, foydali ma'lumotlar taqdim etilishini ta'minlash uchun sozlanadi. Qidiruv tizimlari algoritmlari ommaviy ravishda mavjud emasligining sababi shundaki, bu veb-sayt egalariga adolatsiz ustunlik beradi, ular keyinchalik qidiruv tizimi reytinglarini o'zgartirishi mumkin. Bu esa foydalanuvchilarga noto'g'ri ma'lumotlar taqdim etilishiga olib kelishi mumkin va shuningdek, nomaqbul kontentga ega veb-saytlar kerak bo'lganidan yuqoriroq reytingga ko'tarilib olishi mumkin. Bundan tashqari, ommaviy foydalanish mumkin bo'lgan algoritmlardan xakerlar foydalanishi osonroq bo'ladi, bu esa xavfsizlik muammolariga olib kelishi mumkin. Shuningdek, bu veb-saytlar reytingini sun'iy ravishda oshirishning oldini olish orqali ularning yaxlitligini saqlashga yordam beradi.

RAQAMLI TEXNOLOGIYALAR DAVRIDA TILLARNI INTENSIV O'QITISHNING PSIXOLOGIK-

PEDAGOGIK JIHATLARI RESPUBLIKA ILMIY-AMALIY ANJUMANI _2023-yil 2-iyun_

PR{u) = J2veBu ™

Rasm. Qidiruv tizimlarining ishlash sxemasi.

Mashhur qidiruv tizimi algoritmlari

1. PageRank algoritmi: Ushbu algoritm Google tomonidan ishlab chiqilgan va sahifaga kiruvchi havolalar soniga qarab qidiruv natijalarini ustuvorlashtirish uchun mo'ljallangan. U sahifani boshqa sahifalarga nisbatan ahamiyatini aniqlash uchun sahifaga bo'lgan havolalar miqdori va sifatini o'lchaydi. PageRank ma'lum bir qidiruv so'rovida eng mos va maqbul saytlarni aniqlashga yordam beradi.

Umumiy holda, har qanday sahifa "u" uchun PageRank qiymatini quyidagicha ifodalash mumkin:

PR(v)

» 1) ya'ni "u" sahifasi uchun PageRank qiymati: Bu to'plamidagi har bir 'V' sahifaning PageRank qiymatini shu sahifadagi havolalarning L(^) soniga bo'linadi va har bir bo'linma qo'shib chiqiladi.

2. TF-IDF algoritmi : Bu algoritm Term Frequency-Inverse Document Frequency so'zlarining qisqartmasidan ushbu nomga ega bo'lgan va berilgan so'rov bo'yicha hujjatning dolzarbligini aniqlash uchun ishlatiladi. U hujjatdagi atamaning chastotasini o'lchaydi va keyin ma'lum hujjatlar to'plamidagi atamaning ahamiyatini tortish uchun teskari hujjat chastotasidan foydalanadi. Ushbu algoritm ko'pincha veb-saytning ma'lum bir so'rov uchun mosligini o'lchash uchun ishlatiladi.

TF-IDF statistik o'lchovi ortidagi oddiy formulani ko'rib chiqaylik. Dastlab ba'zi belgilarni aniqlaymiz:

N - bizning ma'lumotlar to'plamimizdagi hujjatlar soni d - bizning ma'lumotlar to'plamimizdan berilgan hujjat D - barcha hujjatlar to'plami w - hujjatdagi berilgan so'z

Birinchi qadamda hujjat chastotasi tf(w,d) hisoblanadi.

tf(w,d) = log( 1 + f(w,d))

2)

Bu yerda f(w, d) - d hujjatidagi w so'zining chastotasi.

RAQAMLI TEXNOLOGIYALAR DAVRIDA TILLARNI INTENSIV O'QITISHNING PSIXOLOGIK-

PEDAGOGIK JIHATLARI RESPUBLIKA ILMIY-AMALIY ANJUMANI 2023-yil 2-iyun

Ikkinchi qadamda teskari hujjat chastotasi hisoblanadi.

( N \

Ma'lumotlar to'plamida N ta hujjat va f(w, D) butun ma'lumotlar to'plamidagi w so'zining chastotasi bilan bu raqam butun ma'lumotlar to'plamida so'zning ko'proq ko'rinishi bilan kamroq bo'ladi.

Yakuniy qadam TF-IDF ballini quyidagi formula bo'yicha hisoblanadi: tfidf(w,d,D) = tf(w,d) * idf(w,D)

4)

3. Semantik qidiruv algoritmi: Bu algoritm qidiruv so'rovi ortidagi ma'noni tushunish va foydalanuvchi so'roviga ko'proq mos keladigan qidiruv natijalarini taqdim etish uchun mo'ljallangan. U foydalanuvchi so'rovini tushunish va ularga eng mos qidiruv natijalarini taqdim etish uchun tabiiy tilni qayta ishlash va sun'iy intellekt usullaridan foydalanadi.

REFERENCES

1. "A Comprehensive Review of Search Engine Optimization Algorithms" by S. M. Shafiul Alam and Muhammad Mahbubur Rahman.

2. "A Survey on Query Processing Techniques for Big Data" by Noman Islam and Nasrullah Sheikh.

3. "An Overview of Recommendation Algorithms in E-commerce" by M. B. Khan and Md. Nuruddin Islam.

4. "A Comparative Study of Machine Learning Approaches for Image Retrieval" by Raja Naeem Akhtar, Muhammad Arif, and Imran Ali Khan.

5. "A Review of Clustering Algorithms for Big Data Analysis" by Aditya Sharma and Anshul Garg.

6. G. Kudratov, D. Eshmuradov, M. Yadgarova ОБЩИЕ ВОПРОСЫ ЗАЩИТЫ МАГИСТРАЛЬНЫХ КОМПЬЮТЕРНЫХ СЕТЕЙ // SAI. 2022. №A8. URL: https://cyberleninka.ru/article/n7obschie-voprosy-zaschity-magistralnyh-kompyuternyh-setey (дата обращения: 04.04.2023).

7. Исмаилов О.М., Мирзахалилов С., Исмаилов М.О. Исследование методов и алгоритмов репликации в системах с распределенной базой данных // Проблемы вычислительной и прикладной математики. - 2023. - №1(46). - С. 116-122.

8. Исмаилов, О. М., А. Ф. Исаков, and Р. К. Маллаев. "Алгоритм быстрого строкового сопоставления сетевых систем обнаружения вторжений." Актуальные проблемы оптимизации и автоматизации технологических процессов и производств 1.1 (2017): 132-137.

9. Ibragimov, X., & Sh, A. (2008). Pedagogika nazariyasi (darslik). T.: Fan va texnologiya, 288.

10. Ибраимов, Х. И. (2018). Креативность как одна из характеристик личности будущего педагога. Наука, образование и культура, (3 (27)), 44-46.

11. Хонимкулова, М. Х. К., & Ибраимов, Х. И. (2018). Необходимость изучения иностранных языков: теория и практика. Вопросы науки и образования, (27 (39)), 8083.

RAQAMLI TEXNOLOGIYALAR DAVRIDA TILLARNI INTENSIV O'QITISHNING PSIXOLOGIK-

PEDAGOGIK JIHATLARI RESPUBLIKAILMIY-AMALIY ANJUMANI 2023-yil 2-iyun

12. Ibragimovich, I. K. (2020). Theoretical and methodological basis of quality control and evaluation of education in higher education system. International journal of discourse on innovation, integration and education, 1, 6-15.

13. Ибраимов, Х. И. (2019). Теоретические аспекты социально-психологической адаптации студентов-первокурсников к обучению в вузе. Вопросы науки и образования, (26 (75)), 12-16.

14. Ибраимов, Х. И. (2018). Коммуникативная компетентность как механизм профессионального саморазвития будущего педагога. Проблемы педагогики, (2 (34)), 7-10.

15. Ibragimov, X., & Abdullaeva, S. H. (2008). Theory of pedagogy. Science and Technology.

16. Ибрагимов, Х. И. (2020). Организация самостоятельной работы студентов в условиях цифровизации вузовского образования. Наука и образование сегодня, (7 (54)), 74-75.

17. Ibragimovich, X. I. (2021). O 'ZBEKISTON OLIY TA'LIM TIZIMIDA KREDIT-MODUL TEXNOLOGIYALARINI QO 'LLASHNING O 'ZIGA XOS XUSUSIYATLARI. INTEGRATION OF SCIENCE, EDUCATION AND PRACTICE. SCIENTIFIC-METHODICAL JOURNAL, 209-214.

18. Ibragimov, X. I., Yo'ldoshev, U. A., & Bobomirzayev, X. (2009). " Pedagogik Psixologiya" O'quv qo'llanma. O'zbekiston faylasuflari milliy jamiyati nashiriyoti Toshkent.

19. Ибраимов, Х. И. (2019). Педагогические и психологические особенности обучения взрослых. Academy, (10 (49)), 39-41.

20. Атауллаев, Ф. Ф. У., & Ибраимов, Х. И. (2019). Понятие профессионально-коммуникативной компетентности будущих учителей в психолого-педагогических исследованиях. Вопросы науки и образования, (1 (42)), 70-74.

21. Ibragimovich, I. K. (2018). Intensive methods of teaching foreign languages at university. Вопросы науки и образования, (27 (39)), 78-80.

22. Ibragimovich, I. K., Kholboevna, I. F., Amrilloevich, I. A., & Rakhmonovich, U. S. (2021). PEDAGOGICAL ABILITIES OF A TEACHER, STRUCTURE AND

DEVELOPMENT. (48(12).

23. Ибрагимов, Х. И. (2021). ПЕДАГОГИКА И ВОСПИТАНИЕ. Экономика и социум, (1-1 (80)), 608-611.

24. Ibragimov, X. I., & Salimova, Z. K. (2021). Relevance of english language science and teaching structure. ASIAN JOURNAL OF MULTIDIMENSIONAL RESEARCH, 10(4), 883887.

25. Ibragimov, X. I., & Salimova, Z. K. (2021). Intensive in teaching english characteristics of application of methods. ACADEMICIA: An International Multidisciplinary Research Journal, 11(4), 1588-1594.

26. Rahmanovich, O. A., Yusufovich, E. H., Dilshodqizi, S. S., Almasovna, S. A., & Ibragimovich, H. I. (2020). Linguistic features of compound words in english and Uzbek languages. European Journal of Molecular and Clinical Medicine, 7(2), 925-932.

27. Bahtiyorova, F. Н. USING FOLK LITERATURE IN THE PRIMARY ENGLISH AS A FOREIGN LANGUAGE CLASSROOMS.

28. Ибраимов, Х. И. (2018). НЕЙРОПЕДАГОГИКА КАК НОВОЕ ПРИКЛАДНОЕ НАПРАВЛЕНИЕ В ПЕДАГОГИКЕ. In INTERNATIONAL SCIENTIFIC REVIEW OF THE PROBLEMS OF PHILISOPHY, PSYCHOLOGY AND PEDAGOGY (pp. 6-10).

29. Ibragimovich, I. H., & Ghazzali, I. Increasing the Classical Activity of Future Teachers as a Pedagogical and Psychological Problem. JournalNX, 98-102.

i Надоели баннеры? Вы всегда можете отключить рекламу.