7. Ефимова М.Р. Рябцев В.М. Общая теория статистики. - Москва: Финансы и статистика, 1991 - 304с.
8. Боровиков, В. STATISTIC A. Искусство анализа данных на компьютере: Для профессионалов / В. Боровиков. - СПб.: Питер, 2003.- 688 с.
9. UNECE [Электронный ресурс] http://w3 .unece.org/pxweb/. (дата обращения: 05.10.2013)
Аннотации:
Статья посвящена изучению перспектив дальнейшего развития технологий
широкополосного доступа и анализу взаимосвязей с другими показателями, такими как: количество и плотность населения.
Ключевые слова: широкополосный доступ, меры рассеяния, корреляционная зависимость, критерии Колмогорова-Смирнова и Лилиефорса.
Стаття присвячена вивченню перспектив подальшого розвитку технологш
широкосмугового доступу та аналiзу взаемозв'язшв з шшими показниками, такими як: кшьшсть i щшьтстъ населения.
Ключовi слова широкосмуговий доступ, мiри розсшвання, кореляцшна залежшсть, критерп Колмогорова-Смирнова i Лiлiефорса.
Article is devoted to study the perspectives of broadband access development and analyze the relationships with the other indexes such as number and density of population are described in this article.
Keywords: Broadband access, scattering measures, correlation dependence, Kolmogorov-Smirnov and Lilliefors criteria.
УДК 6081.518:004.451.6
ТКАЧЕНКО Н.О., астрант (Донецький нацюнальний техшчний ушверситет) ВОРОПАСВА В.Я., к.т.н., доцент (Донецький нацюнальний техшчний ушверситет) ДУЧЕНКО М.М., к.е.н., доцент (Нацюнальний техшчний ушверситет Укра'ни «Кшвський полгтехшчний iнститут»)
Принципи функщонування адаптивноУ шформацшно-пошуковоУ системи 3i зворотним зв'язком
Вступ
Останнiм часом мережа 1нтернет та електроннi бiблiотеки вiдкривають великi перспективи перед окремими авторами та органiзацiями . Всесвггня мережа 1нтернет дозволила користувачам отримувати рiзноманiтну iнформацiю у будь-який час, але це призвело до виникнення ново!' проблеми, а саме отримання релевантно!' шформацп, що вщповщае потребам користувача. Вiдомо, що неймовiрно важко знайти шформацш в 1нтернет, що задовольняе iндивiдуальнi потреби окремо!' людини, особливо в ресурсах WWW, кшькють яких продовжуе зростати. Для виршення цього завдання
B^OMi всесвiтнi оргашзацп створюють спецiальнi пошуковi системи (Google, Yandex), що використовують персональнi алгоритми для пошуку релевантно!' шформацп [1]. Але незважаючи на усi переваги таких алгорш^в, всi цi системи мають один великий недолiк — вони не враховують iндивiдуальнiсть конкретного користувача. Тобто, рiзнi люди отримують однаковi результати при вводi однакового запиту, незважаючи на !'х особист потреби та iнтереси. Однак, в реальному свт окремий користувач мае власш iнформацiйнi iнтереси щодо свого запиту. Тому, актуальним залишаеться завдання адаптацп пошукових систем до
потреб KopTOTyBa4ÍB з рiзними iнформацiйними потребами.
Постановка проблеми
Персональний Web-пошук виступае актуальною темою дослщження останшх кшька рок1в. Ключовим моментом персонального пошуку е зб1р шформаци щодо потреб окремого користувача. На сьогодшшнш день кнуе декшька метод1в [2-4] штелектуального анал1зу даних, що використовують Web log користyвачiв. На жаль, цi методи не е досконалими при Web персоналiзащi. Персональний PageRank та HITS алгоритм [5, 6] частково тдвищують релевантнють пошуку, але зi зростанням кшькосп ресyрсiв
пiдвищyеться складнiсть ix обчислення,
що не дозволяе ix використання у великому пошуковому просторi.
Вир1шення задач!
Класифжащя шформацшно-
пошукових систем.
Для усунення недолiкiв iснyючиx методiв було розроблено декiлька нових систем, що дозволяють полшшити результати пошуку шформаци згiдно потреб користувача. Пропонуеться здiйснювати класифiкацiю шформацшно-пошукових систем наступним чином: системи зi зворотнiм зв'язком, рекомендyючi системи та персоналiзованi системи (рисунок 1).
Рис. 1. Класифшащя iнформацiйно-пошyковиx систем
Системи, що використовують зворотний зв'язок, засноваш на залученш користyвачiв до вщбору релевантно'!' шформаци. Тобто, для отримання необхщних ресyрсiв система виконуе декшька гтерацш: користувач робить свш запит, система повертае список знайдених докуменлв. Пiсля цього користувач уточнюе свш запит, вщзначаючи деякi документи як релевантш або
1
нерелевантш. Використовуючи цей зворотний зв'язок з користувачем, система уточнюе набiр релевантних ресyрсiв та повертае !'х користувачевь Використання алгоритму Роккiо е класичним для систем зi зворотнiм зв'язком. Для модифжаци початкового запиту використовуеться наступна формула:
= а {% + в ^-f Е dj - y i Z
\Dr\d eD \Dnr\d eD
(1)
m
де qm - модифшований вектор, q0 - початковий вектор запиту, Dr -релевантш документи, Dnr - не релевантш документи та а, в,у - ваговi множники.
У роботах Яковлево'! Ю.В. [7] пропонуеться метод модифшаци запиту, що базуеться на оргашзацп зворотного зв'язку та використанш статистичних даних для оцiнки релевантностi
,0
результат пошуку. В роботi зворотний зв'язок запропоновано оргашзовувати двома способами: 1) стати стичний аналiз запитiв користувачiв та 2) багатокритерiальна оцiнка
iнформативностi видань, що базуеться на трьох критерiях (старшня лiтератури, значущiсть автора та попит джерела у бiблiотецi):
0
СГ = А,СУ+ в С2 + вз (в СГ + в С
(2)
Але запропоноваш критери не в повнш м1р1 вщповщають потребам користувача при пошуку у всесвггньому павутинш, оскшьки ор1ентоваш передуам на друкований фонд конкретно! б1блютеки.
¡итегральний критер1й оцшки електронних ресурсiв.
Поступовий розвиток електронних публшацш, як окремого наукового ресурсу, та розмщення !х в мереж1 1нтернет дозволяе науковим оргашзащям, зокрема ушверситетам вийти на новий р1вень сшвпращ [13]. Але поява таких ресурав призвела до виникнення ново! проблеми - коректно! оцшки цих ресурав. 1снуюч1 критерп оцшки електронних матер1ал1в мають декшька недолшв, тому авторами [1] у попередшх дослщженнях був запропонований штегральний критерш оцшки
електронних наукових шформацшних ресурав в мереж1 1нтернет, що дозволяе користувачев1 самому керувати процесом
призначення вагових коефщешив та вибору часткових критерив. Загальний критерiй об'еднуе у своему складi декiлька критерив (оцiнка автора, оцшка оргашзацп та оцiнка журналу), що мають власш ваговi множники.
Ресурси вщкритого доступу, що розмщуються у вiдповiдних журналах або шституцшних репозитаряiх стали потужним конкурентом передплаченим ресурсам. У [14] зроблено висновок щодо безпосереднього впливу таких ресурав на наукометричш показники авторiв чи органiзацiй. Тому при розробщ iнтегрального критерiю об'еднувалися декшька iснуючих критерив оцiнки одночасно.
При оцшщ автора враховувалися показники як передплачених
наукометричних баз (Scopus), так i баз у вшьному доступi (GoogleScholar), що дозволить повноцшно оцiнити науковий вклад автора:
A = ^jaiai = a1 a1 +a2 a 2 +a3 a3 +a4 a4
(3),
де ai - ваговий множник, автора в GoogleScholar, a автора в GoogleScholar, <
a
j - h-ндекс - i10-iндекс - h-шдекс
автора в Scopus, a4 - кiлькiсть робiт автора в GoogleScholar.
Оцiнка сайту ушверситету складаеться з наступних критерив:
U = X biui = 2 +@3и3
(4),
де Д - ваговий множник,
и,
мюце оцiнка сайту системою Google, u3 -оцiнка
унiверситету у рейтингу Webometrics, и2 - сайту системою Yandex.
0
3
Загальна оцшка журналу враховуватиме наступш чотири критерп:
G = Z У g = gi gi +У2 g 2+У3 g 3 + У 4 g 4 (5),
де g - ваговии множник, gj - присутнють журналу у директори вiдкритого доступу DOAJ, g2 - присутнiсть журналу у директора вщкритого доступу DOAJ, g3 -iмпакт-фактор журналу, g4 - мiсце у нащональнш наукометричнiИ базi даних.
Обчислення загального критерш здiИснюeться шляхом поеднання
загальних оцшок перерахованих вище критерив з врахуванням внеску кожного з них. Для цього використовусться один з методiв багатокритерiальноi оптимiзащi, а саме метод зважених сум. Таким чином, остаточна формула матиме вид:
max
j(X) = max ^ = 1 j (X) +^2^2 (X) + Kj (X)
(6),
де X - ваговий множник, j (X) - загальна оцшка автора, j2 (X) - загальна оцшка оргашзацп, j3 (X) - загальна оцшка журналу.
Принципи роботи систем з неявним зворотним зв'язком.
Останшм часом все бшьшу популярнють завойовують модифiкованi системи зi зворотним зв'язком, а саме системи з неявним зворотним зв'язком (systems with implicit relevance feedback) [8]. Таю системи базуються на аналiзi поведшки користувача у всесвггнш мережi (клiкiв, часу, витраченого на сторшщ, вiдстеження очей та шше). Впровадження таких систем частково тдвищуе загальну релевантнiсть отриманих результатiв, але не виршуе проблему 1'х адаптаци пiд iнтереси конкретного користувача.
Рекомендуючi системи. Ц системи забезпечують пiдвищення релевантностi результат завдяки перевагам
користувача. Рекомендуючi системи тдтримують зворотний зв'язок з користувачами за допомогою оцiнок ресурсiв. 1снуе два поширених пiдходи до побудови цих систем — система на основi спшьно'1' фшьтраци та системи рекомендаци контенту:
- система на основi спшьно'1' фшьтраци призначена для передбачення релевантности окремого ресурсу для конкретного користувача на основi
попередшх симпатiи та думок iнших користувачiв.
- система рекомендаци контенту висувае рекомендаци шляхом порiвняння змiсту, що представлений в ресурсi з контентом, який щкавить конкретного користувача. Описаш системи дають позитивнi результати лише у випадку добровольного оцiнювання користувачами запропонованих ресурав. Проте насправдi бшьшють користувачiв не бажають оцiнювати ресурси, тому точнють рекомендацiИ може бути поганою, бо саме таю рекомендаци виступають ключовим елементом формування рейтингу ресурав.
Персональнi веб-сайти. Цi системи умовно подшяють на "Link Personalization" та "Content
Personalization".
- Link Personalization базуеться на виборi посилань, що е найбшьш релевантними до потреб конкретного користувача та змЫ початкового навiгацiИного простору шляхом зниження або пщвищення вiдносин мiж веб-сторiнками. Вiдповiднiсть документу до штереав користувача обчислюеться за допомогою метрики подiбностi (cosine similarity metric):
cos(!)
а ■ b
a ь
(7),
де а - вектор штереав користувача, b - вектор знайденого документу, а || ||
означав Евклiдову норму.
- Content Personalization. Даний метод використовують, коли рiзнi сторiнки надають рiзноманiтну iнформацiю для рiзних користувачiв. Цей метод дозволяв фшьтрувати iнформацiю: користувач вказуе сво'1 iнтереси на персональному сайп, що дозволяв системi надавати лише релевантну iнформацiю. Використання таких систем потребув вiд користувачiв ix прямо'1 участi у пошуку шформацп (зазначення персональних переваг), що призводить одразу до кшькох проблем: 1) навантаження на користувачiв збiльшувться, оскшьки такi системи покладаються на даш користувацького профiлю та 2) системи не можуть автоматично пристосуватися до змш користувацьких iнтересiв, якщо вони особисто не вказаш користувачем.
Адаптивш шформацшно-
пошуков1 системи.
Можливiсть змiнюватися в залежностi вiд окремоi ситуацп або iнтересiв конкретноi людини дозволили адаптивним системам стати гщним аналогом традицшних систем. Цi системи
де Ррег - iсторiя вiдвiданих
тъЪг
сторiнок за декiлька днiв, Р - iсторiя вiдвiданих сторiнок за поточний день та Рсиг - поточна сеая пошуку шформацп.
В останш роки широку популярнiсть почали завойовувати системи, що використовують онтологп для пошуку релевантно'' шформацп. Онтологп виступають ефективним засобом моделювання контенту користувача, бо вони представляють опис окремо'' областi знань та можуть бути використаш для перегляду та уточнення запиту. У загальному виглядi онтолопя являе собою наступну тршку О = (К, Ь, ^, де К —
множина понять предметно!.' областi в онтологп, Ь — множина зв'язюв мiж цими
поступово впроваджуються в рiзнi напрямки шформацшно'' дiяльностi. Наприклад, авторами в робот [9] розроблено штелектуальну систему дистанцiйного навчання, що дозволяе тдвищити рiвень навчання за допомогою адаптацп пiд конкретного учня. Використання адаптивних систем характерно й для Web-пошуку, К^ипап Sugiyama та iн. [10] був запропонований новий метод отримання релевантно'' шформацп в веб, що враховуе штереси користувачiв. Цей метод заснований на адаптацп результатiв пошуку до потреб користувачiв: система адаптуеться до змш в перевагах користувача, що дозволяе виконати бшьш точний пошук. Запропонована система вiдстежуе iсторiю вщвщаних сторiнок користувачiв та оновлюе його профшь, коли веб-сторiнки змiнюються. При побудовi профiлю користувача враховуються не тшьки довгострокова iсторiя веб-браузера (тобто iсторiя за декiлька днiв), але й iсторiя вiдвiданих сторiнок за поточний день. Таким чином, враховуючи ус аспекти, остаточна формула побудови профшю користувача матиме наступний вигляд:
(8),
поняттями, F — множина функцш штерпретацп понять та вщношень. Таким чином, будь-яка онтологiя може виступати у виглядi графу з наявнютю визначено'' кiлькостi вершин та дуг.
Таю онтологп активно
застосовуються в рiзноманiтних iнформацiйних областях таких, як web-пошук та шформацшний менеджмент. Для пошуку релевантно'' шформацп в Web Gauch та ствавтори [11] запропонували систему, що автоматично створюе профiль конкретного користувача, враховуючи його штереси, завдяки оцшщ конкретних понять в документ Такий профшь являе собою онтологш, у якш кожне поняття мае свою персональну вагу, що призначаеться вiдповiдно до штереав
P = aPper + ßP
) today
aPper + ßxPbr + ßyP
cur
користувача до цього поняття. Bïh створюеться на ochobï аналiзу пошукового характеру користувача, а саме врахуванням контенту, довжини та часу, витраченого на конкретну вщвщувану сторшку.
Оцiнкою онтологiй при
шформацшному пошуку займаються не лише шоземш автори, вiтчизняними авторами також розроблено декшька
метод1в оцшки онтологш для тдвищення релевантности пошуку шформаци. Наприклад, в робот Р. Даревича [12] розроблено метод адаптаци онтологш при побудов! метапошукових систем. Онтолопя мае вигляд ор1ентованого зваженого мультиграфу, що складаеться з вершин та ребер, що мають сво! конкретш ваги (рис.2).
Рис. 2. Мультиграф онтологи
Принципи роботи адаптивних шформацшно-пошукових систем 3i зворотним зв'язком.
Але вщсутнють зворотного зв'язку з користувачем призводить до проблеми точносп оцiнки знайденого документу. Тому в данш робот пропонуються принципи функцiонування
штелектуально! адаптивно! системи пошуку релевантно! iнформацГï в 1нтернет на основi онтологiй зi зворотним зв'язком. Використання онтологш дозволить враховувати штереси користувача (за допомогою створення його онтологiчного профiлю), а доповнення системи адаптивним iнтерфейсом (наявнють зворотнього зв'язку), що дозволить користувачевi приймати участь у вiдборi релевантно! iнформацГï, пiдвищить якiсть iнформацiйного пошуку. Створення онтолопчного профiлю користувача вщбуватиметься за допомогою аналiзу iсторГï вщвщаних сторiнок веб-браузеру та позначенням цим користувачем сво!х iнтересiв. В зазначеному профiлi кожна онтологiя матиме iерархiчну структуру, в
як1й кожному поняттю присвоюеться шдивщуальна вага. Загальна вага окремо! онтологи повинна враховувати ваги уах понять, що входять до !! складу та важливють зв'язюв м1ж цими поняттями. Таким чином, вага окремо! онтологи розраховуеться за формулою:
Ж = £с*ф (9),
де со - вага окремого поняття онтологи, ф - вага зв'язюв м1ж цими поняттями.
Для вщбору релевантних документв з1 списку знайдених кожен такий документ представляеться в якосп вектору (а>1,т2,...,тп), де со — вага окремого поняття у цьому документ!. Вага кожного поняття в документ! розраховуеться з використанням вщомо! * ¿ёГ схеми:
W„ = tftj * Wi
де tf =
m
(10),
I
m
частота слова, idf = log S
- зворотна частота документу.
Для порiвняння текстових документiв мiж собою на практищ використовуеться декiлька методiв: Евклiдова вщстань, косинус мiра, манхетенська вiдстань, вщстань Чебишева та iн. Вiдносно високу точнють показав саме метод косинус мiри, тому доцiльне його використання:
cos(<9) =
2 D * R
(11),
Е Ф)2 Ч Е
де Б - вектор понять в онтолопчному профiлi користувача, Я - вектор понять у знайденому документ.
Таким чином, запропонована система виконуватиме наступнi два етапи: створюватиме онтологiчний профiль окремого користувача з врахуванням його iнформацiйних iнтересiв та надаватиме релевантш документи згiдно цих штереЫв.
Висновки
У статтi запропонований пщхщ до класифшацп iнформацiйно-пошукових систем, на базi якого видiляються системи зi зворотнiм зв'язком, рекомендуючi системи та персоналiзованi системи. Сформульовано штегральний критерiй оцiнки електронних наукових
шформацшних ресурсiв в мережi 1нтернет, що дозволяе користувачевi самому керувати процесом. Авторами розроблено принципи функщонування адаптивних шформацшно-пошукових систем зi зворотним зв'язком, що враховувують iнтереси користувача при пошуку iнформацГi в 1нтернет.
Лггература
1. Ткаченко Н.О. Розробка критерпв для оцiнки iнформацiйних наукових ресурав в 1нтернет / Н.О. Ткаченко// Науковi працi Донецького нацiонального техшчного унiверситету. Серiя: Обчислювальна технiка та автоматизащя. - 2013. - Вип. 2 (25). - С.
136-143
2. Cooley R. Data Preparation for Mining World Wide Web Browsing Patterns / R. Cooley, B. Mobasher, and J. Srivastava // Knowledge and Information Systems. -1999. - 1(1):5-32. - С. 237-244
3. Spiliopoulou M.WUM-A Tool for WWW Utilization Analysis. / M. Spiliopoulou, L. Faulstich // Proceedings of the International Workshop on the World Wide Web and Databases. - 1998. С. 184203.
4. Wang J. Ranking User's Relevance to a Topic through Link Analysis on Web Logs. / J. Wang, Z. Chen, L. Tao, W.-Y. Ma, L. Wenyin // Proceedings of the 4th ACM CIKM International Workshop on Web Information and Data Management. -2002. - С. 49-54
5. Haveliwala T. H. Topic-Sensitive PageRank / T. H. Haveliwala // Proceedings of the 11th International World Wide Web Conference. - 2002. - С. 517-526
6. Kleinberg. J. M. Authoritative Sources in a Hyperlinked Environment. / J. M. Kleinberg // Journal of the ACM. - 1999. - 46(5). - С. 604-632
7. Хаджинов В.В. Адаптивний пошук як напрям розвитку шформацшно-пошукових систем наукових бiблiотек / В.В. Хаджинов, Ю.В. Яковлева // Реестращя, збер^ання i обробка даних. -2006. - Т. 8, № 2. - С. 53-60
8. Eugene Agichtein Improving Web Search Ranking by Incorporating User Behavior Information / Eugene Agichtein, Eric Brill, Susan Dumais // SIGIR '06 Proceedings of the 29th annual international ACM SIGIR conference on Research and development in information retrieval. — 2006. - С. 19-26
9. Воропаева В.Я., Криворучко Д.В. Математичне моделювання процеав дистанцшного навчання // Научно-технический журнал «Автоматика. Автоматизация. Электротехнические комплексы и системы» № 2(14) 2004, стр. 11-15
10. Kazunari Sugiyama Adaptive Web Search Based on User Profile
Constructed without Any Effort from Users / Kazunari Sugiyama, Kenji Hatano, Masatoshi Yoshikawa // Proceedings of the 13th international conference on World Wide Web. - 2004. - С. 675 - 684
11. Susan Gauch Ontology-Based User Profiles for Search and Browsing / Susan Gauch, Jason Chaffee, Alexander Pretschner // Journal Web Intelligence and Agent Systems . - 2003. - С. 219-234
12. Р. Даревич Пщвищення ефективносп штелектуального аналiзу тексту шляхом зважування понять у моделi онтологл / Р. Даревич // Штучний штелект. - 2005. - № 3. - С. 571-577
13. Аноприенко А.Я. Новое познание в новом мире: научные исследования и высшее образование в условиях информационной супермагистрали // TEMPUS/TACIS Conference „Computer Networks in Higher Education", 26-28 May 1997, National Technical University of Ukraine, Kyiv.
14. Воропаева В. Я., Ткаченко Н.О. Вплив електронного архiву ВНЗ на науко-метричш показники // Бiблiотеки та шформацшш ресурси у сучасному свт науки, освгти та культури : Матерiали наук. - практ. конф., м. Севастополь, 7-10 жовтня 2013 р. Севастополь: Купол , 2013
. - 192 с, С. 13-15
Анотацн:
У робот здшснено аналiз юнуючих систем пошуку шформацп в 1нтернет. Запропоновано класифшацш шформацшно-пошукових систем. Розроблено принципи функцюнування адаптивно! шформащйно-пошуково! системи 3i зворотним зв'язком.
Ключовi слова: шформащйно-пошукова система, зворотний зв'язок, адаптившсть, релевантнiсть, шформацшш потреби користувача
В работе осуществлен анализ существующих систем поиска информации в Интернет. Предложена классификация информационно-поисковых систем. Разработаны принципы функционирования адаптивной информационно-поисковой системы с обратной связью.
Ключевые слова: информационно -поисковая система, обратная связь, адаптивность, релевантность, информационные потребности пользователя
Analysis of existing information retrieval systems on the Internet was given in the article. Classification of information retrieval systems was offered. Principles of adaptive information retrieval system with feedback working was developed.
Keywords: information retrieval system, feedback, adaptability, relevance, information needs of the user
УДК 681.391
МОЛОКОВСКИЙ И.А., астрант (ДонНТУ)
Исследование особенностей проектирования систем связи с использованием излучающего кабеля
Актуальность проблемы
В подземной части угледобывающего предприятия, как и на многих других промышленных предприятиях, используются различные технологические системы связи. Соответствующие сис-
темы в пределах подземных выработок, на поверхности угледобывающего предприятия, а также между подземными рабочими станциями являются жизненно важной частью правильного функционирования любого подземного средства связи. Отлаженная работа технологических сис-