Научная статья на тему 'Структурний підхід до пошуку природно-мовної інформації'

Структурний підхід до пошуку природно-мовної інформації Текст научной статьи по специальности «Математика»

CC BY
129
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
база знань / пошук / інтернет / базова семантико-синтаксична структура / природно-мовна інформація / квант знань / knowledge base / search / Internet / basic semanticsyntactic structure / natural language information / quantum of knowledge

Аннотация научной статьи по математике, автор научной работы — Кисленко Юрій Іванович, Сергеєв Данило Сергійович

Розглядаються можливості використання структурованого представлення природно-мовної інформації для покращення якості роботи пошуку у великому корпусі текстових даних, яким зокрема є мережа Інтернет. Як квант знань пропонується використовувати базову семантико-синтаксичну структуру, що постає похідною від структурно-функціонального рівня нейроорганізації зорового тракту. Теоретично обґрунтовуються переваги використання такої бази знань та приклади деяких прикладних проблем, вирішення яких може бути полегшене.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A structural approach to natural-language search

This article considers the possibility of using a structured representation of natural language information to improve the quality of text search in large corpora of natural language data, one of them being the Internet. The second part of the article uses classical search systems to demonstrate improper work of the statistical search algorithms that result in incomplete, inaccurate or irrelevant response to some types of queries. The feasibility of using the proposed structure of natural language knowledge base is estimated for each of these cases. The errors that can be fixed via attaching of any structure to the natural language data are considered separately.

Текст научной работы на тему «Структурний підхід до пошуку природно-мовної інформації»

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

УДК004.822

СТРУКТУРНИЙ П1ДХ1Д ДО ПОШУКУ ПРИРОДНО-МОВНОÏ IНФОРМАЦIÏ

КИСЛЕНКО Ю.1, СЕРГЕСВ Д.С._

Розглядаються можливост використання структурова-ного представлення природно-MOBHOï iнформацiï для по-кращення якостi роботи пошуку у великому корпуш текстових даних, яким зокрема е мережа 1нтернет. Як квант знань пропонуеться використовувати базову се-мантико-синтаксичну структуру, що постае похщною вiд структурно-функщональнош рiвня нейроорганiзацiï зо-рового тракту. Теоретично обгрунтовуються переваги використання тако1 бази знань та приклади деяких при-кладних проблем, виршення яких може бути полегшене.

Ключовi слова: база знань, пошук, iнтернет, базова се-мантико-синтаксична структура, природно-мовна шфор-мащя, квант знань.

Keywords: knowledge base, search, Internet, basic semantic-syntactic structure, natural language information, quantum of knowledge.

1. Вступ

Питания текстового пошуку в мережi 1нтернет вже не перший рш залишаеться одшею з иайбiльш популярных тем для теоретичних до^джень та постiйиим об 'ектом втшення прикладних iииовацiй. Це не дивно, враховуючи, що 1итериет бурхливо розвиваеться, а перед розробииками пошукових систем кожиого дня постають иовi виклики. Але, иезважаючи иа величезиi зусилля та ресурси, що витрачаються иа покращення релевантиостi пошуку, результати цих витрат иаразi складио иазвати задовшьними [8]. На жаль, переваж-иа бшьшють рiшеиь щодо вдоскоиалеиия роботи пошукових систем дають досить невеликий прирют якосп, оскшьки приймають 1'х, в основному, через вщсутшсть кращих пропозицiï [5]. Основною причиною такого стану справ можемо справедливо иазвати вщносно молодий вш як самоï мережi 1итериет, так i вiдповiдиих техиологiй пошуку. Хоча розвиток все-свiтиьоï мережi розпочався близько 30 роив тому, доа ие можемо вважати його закшченим — а тдхо-ди, зпдно з якими воиа працюе, ие змшювалися з самого початку ïï iсиуваиня. Ситуащя дещо усклад-нюеться ще й тим, що технологи веб-пошуку сильно залежать вiд досягнень у багатьох иезалежиих галу-зях науки, як за всi щ роки теж ие стояли иа мющ. Як приклад иаведемо представления природно-мовного тексту як iзольованого об'екта, без урахування про-цесiв його синтезу — у наш час такий тдх1д вже вважаеться дещо на1'вним, все частше зустрiчаеться

подання природно! мови як самостийно! структури збереження i передачi даних. I якщо так розбгжност були допустимими на початку юторн комп'ютерних технологш, то зараз, коли обсяг даних сягае сотень петабайт, вони е досить помiтною перешкодою на шляху подальшого розвитку пошукових систем.

2. Постановка задачi

Для початку окреслимо т задачi, як лежали в основi вдеологп класичних пошукових систем (КПС) i як не вирiшуються в повнш мiрi 1х сучасними представни-ками.

Перше й найбiльш очевидне, що спадае на думку - це можливють обробки природно-мовних (ПМ) запипв. Замiсть передбачених фантастами й теоретиками XX сторiччя пошукових систем, з якими користувач спiлкуеться як з живою людиною — маемо користу-вача, що формуе свш запит згiдно з формальними системами правил пошуково! системи.

Друга, не менш важлива, задача - це формування «загально! бази знань», тобто тако! системи, яка б давала можливють знайти вiдповiдь на будь-яке пи-тання, або впевнитися, що ця вiдповiдь людству не вщома. На жаль, характерною рисою КПС е неминуча втрата шформаци - риса, що е неввд'емною частиною будь-яких систем, як оперують не точними числами, а статистичними даними. Навiть якщо на кожному етат роботи системи втрачаеться лише невелика час-тка шформаци, це вже позбавляе усю систему детер-мшованосп, тобто зменшуе И надiйнiсть та попршуе яюсть результата пошуку. Адже немае шяко! гарантл, що саме той результат, який шукав користувач, не було пропущено через недосконалють системи.

Можемо впевнено казати, що щ двi проблеми мають спiльний корiнь, а саме - ввдсутнють моделi структу-рованого представлення природно-мовного поввдом-лення. Така модель автоматично виршила б як проблему детермшованост результатiв пошуку, так i проблему синтезу-аналiзу природно-мовного повiдом-лення.

Дiйсно, виршенню ще! проблеми присвячено багато дослiджень, i в результатi деяких з них навгть з'явили-ся дiездатнi продукти - в тому числi таю пганти як Wordnet та Wolfram Alpha. Були i спроби im-егрувати структурованi дан у результати текстового пошуку КПС [7, 10]. Ц системи працюють в певнш мiрi успiшно, але в основi !х лежать виключно штучн структури, що не розрахован на всеосяжне охоплен-ня в«е! множини ПМ структур. Вщповвдно, яшсть !х роботи з наповненням бази катастрофiчно падае, що сильно обмежуе сферу !х можливого використання. Бiльш того, деяк з проблем КПС так само актуальш i для структурованих БЗ на основi штучних структур, у чому зможемо переконатися пiзнiше.

У роботах [2,6] запропоновано новий iнтегральний тдхвд до моделювання мовленнево! дiяльностi, в ос-новi якого лежать сучасн досягнення у багатьох сумiжних напрямах, зокрема нейрофiзiологil, психо-

логп та кибернетики. Дана стаття присвячена аналiзу можливост використання цього тдходу для покра-щення якост роботи текстового пошуку у мережi 1нтернет.

3. Теоретичний аспект

Почнемо з визначення термшологи, що буде викори-стовуватись надалi в цьому текст!

Iндивiдуальна мовна система (1МС) — це модель мовленнево! дiяльностi людини, побудована на принципах, запропонованих Л. Щербою [3]. Модель 1МС (рис. 1) складаеться з двох структурних частин — лiнгвiстичного процесора (ЛП), який виконуе функци синтезу та анатзу природно-мовних повiдомлень, та бази знань (БЗ), яка мютить дан про навколишнiй свiт у впорядкованому виглядi.

IMC

ЛП БЗ.........................

1 ,БСССЛ____________

| _ '-^'бССС

Рис. 1. Iндивiдуальна мовна система та !! складовi

Найменшою частиною (квантом знань) у моделi БЗ е БССС - структуроване представлення одше! ситуаци зовшшнього свiту, що iснуе в триедност часу, простору та ди. Кожна така структура формуеться з елеменпв: об'екти (Obj), суб'екти (Subj) та дiя (Mov), що доповнюються атрибутами Attr та мiрою атрибута Attr (Attr) (рис. 2).

(ДпКДиг) (Attr —|

I

Рис. 2. Структура БССС

Структура БССС не суперечить канонам класично! лшгвютики; бтьш того, спираючись на досягнення дослiджень нейрофiзiологiв, узагальнених Семiром Зек1 [9], можемо засвiдчити, що структура окремого повiдомлення постае похщною вiд структурно-функ-цюнального рiвня нейрооргашзаци зорового тракту [2]. Головн етапи формування тако! структури гарно простежуються в дослiдженнях процесу опанування дитиною мовного ладу [1]. Головний висновок запро-

понованого бачення структурно! оргашзацп мовного повiдомлення досить чiткий та категоричний - довшь-ний текст, як множина окремих повiдомлень, формуеться з окремих стандартних структур, визначених на моно/полтредикатному р1внях, отже, окремим квантом знань на мовному рiвнi постае базова семантико-синтаксична структур а.

Таким чином, природно-мовна база знань (ПМБЗ) представлена ввдповщною частиною 1МС—БЗ, тобто сукупнiстю кванпв знань (окремих БССС), пов'яза-них мгж собою на семантичному рiвнi. Мережа БССС, у свою чергу, використовуе мережу слiв, що е тексто-вими ярликами об'екпв та процеив реального свiту. Зазначимо також, що запропонована модель даних викликае щлком обгрунтоваш асощаци зi способом збереження знань у нейромережi людини—нейронами (або !х ансамблями), пов'язаними системою асо-щативних зв'язшв.

Звiсно, для повноцiнного використання ще! моделi 1МС у пошукових системах необидно за допомогою ЛП заповнити ПМБЗ з бази вх1дних текспв. Така задача виглядае поки що досить складною, осшльки до реалiзацil ЛП ще далеко; упм, розробка повнощн-ного ЛП е окремою темою для до^дження. Для створення базового прототипу БЗ достатньо i досить просто1 емуляци ЛП. Наприклад, ЛП, здатний ввдок-ремлювати Obj/Subj та iдентифiкувати Attr, дозволить частково видщити моделi БССС на як завгодно великому корпус вхвдних даних. Крiм того, оскшьки складовi БССС добре розкладаються по майже неза-лежних рiвнях, подальше вдосконалення моделi може бути виконано на основi вже заповнено! бази, без спотворення або оновлення вже внесених даних.

Маючи уявлення про 1МС, ПМБЗ та БССС, можемо тепер приступити до розгляду конкретних проблем КПС — тих випадшв, коли штугтивно правильний запит обробляеться некоректно (не таким чином, як на нього реагував би живий стврозмовник). Задача полягае в тому, щоб визначити: по-перше, наскшьки цi проблеми актуальш — наскшьки яюсно вони вирь шуються на рiвнi КПС; по-друге, чи можливе !х вирiшення засобами ПМБЗ.

4. Структура речення та слова

Природно-мовна шформащя — це досить складний об'ект дослвдження; особливо сильно це впливае на задачi синтезу та аналiзу природно-мовного поввдом-лення. Оскшьки для пошуку необидно проаналiзу-вати запит користувача та порiвняти його з шформа-щею у БЗ, проблеми виникають уже на найнижчих рiвнях мовно! оргашзацп - абзац, речення, слово. Хоча в основi вдеологп КПС передбачена саме об-робка ПМ1 на структурному рiвнi, часто вони не можуть в достатнiй мiрi адекватно розтзнати структуру запиту. Розглянемо це на прикладах.

Так, якщо у пошуковому запитi представлено словоформу, яка е омоформом (належить до рiзних слiв з рiзним значенням — наприклад, «три» як чисель-

ник та «три» як форма дieслова «терти»), в вдеаль-ному випадку повинна вiдбуватись однозначна вден-тифшащя i словоформи, i слова, до якого вона в даному випадку належить (рис. 3). У КПС взагалi вiдсугня можливiсть вказати форму слова у запит!, тобто шформащя про частини мови може бути видше-на (з певною ймовiрнiстю) тiльки за допомогою анал-iзу запиту. Якщо запит складаеться з кшькох слiв, результати пошуку так само можуть бути спотворенi, навгть якщо запит - це повнощнна ПМ конструкцiя, частини яко! пов'язаш семантичними зв'язками.

У БЗ кожна словоформа входить у лексему — су-купнють усiх можливих словоформ даного слова. Це дае змогу не тшьки вказати, до якого саме слова ввдноситься дана словоформа у контекст! запиту (i, ввдповвдно, виконати пошук саме за цим словом), але й вказати и роль у реченнi. Приклад подабно! неодноз-начносл представлено на рис. 3. Звюно, так само можна й автоматично визначити роль слова, але це бшьше не е единим доступним способом. На класич-ному прикладi неоднозначности «души прекрасные порывы» визначити ролi слiв можливо виключно в ручному режима

Рис. 3. Нерiвнозначний перетин лексем на приклада словоформи «терти»

Власне, пошуковi запити, що складаються з кшькох слiв, варт окремого розгляду. Як правило, такi запити формують повнощнне ПМ повiдомлення, а отже, при ix обробщ мають значения не лише форми сл!в, але й ix порядок та знаки пунктуаци. У КПС для цих цшей повсюдно використовуеться оператор «лапки», що ввдповвдае пошуку за точним порядком слiв, але при цьому нiяк не враховуються знаки пунктуаци. Отри-манi таким чином результати, хоча й не е зовам некоректними, мютять велику кшькють нерелевант-них записiв.

Розглянемо пошук за запитом «зробити згодом» (слова у запил явно пов'язаш). У результатах присутш не лише релевантний «Його устх не тальки дозволив зробити згодом кшька тематичних продовжень», а й очевидно зайвi: «Однак, ми заборонили це зробити. Згодом виявилося, ... » та «Що i як ми можемо для цього зробити—згодом». Як бачимо, тут ^норують-ся не тшьки знаки пунктуаци, але й сама структура

речення взагалi («... зробити. Згодом ...» — два слова з запиту явно належать до рiзниx речень).

У ПМБЗ вхвдний текст зберiгаеться таким чином, що уа знаки пунктуаци (а також iншi елементи тексту, що не мютять смислового навантаження—вставн слова, вигуки тощо) збер^аються у !х початковому виглядi. Бшьш того, роздiленi за змiстом окремi речення транс-формуються у окремi БССС, тобто помилки з належ-нiстю рiзниx частин запиту до рiзниx БССС взагалi лiквiдуються.

Зазначимо, що Google повертае 830,000 документов, де зустрiчаються обидва слова «зробити» та «згодом». Це, за мiрками сучасних БЗ — порiвияно мала кшькють запитiв, тобто для подальшого уточнення результатов пошуку вже не е критичною швидкодiя аналiзатора.

5. Смисловi (семантичнi) зв'язки

Ввд структурних проблем, як вирiшуються на рiвнi структури об'екта, перейдемо до проблем семантики - бтьш складних випадюв обробки ПМ1. Цi проблеми за своею природою скорiше фшософсьш, шж теxиiчнi, але вони впливають на роботу пошукових систем в тш же - якщо не бшьшш - мiрi. В широкому сена семантичт проблеми -це проблеми неточного ввдоб-раження засобами природно! мови вiдповiдного яви-ща або об'екта реального св!ту. Бшьш формально, семантичт проблеми пошукових систем - це так! випадки, коли в запил не мютиться достатньо шфор-мацл для виконання якюного пошуку (тобто, для адекватноi' обробки запиту необхщно мати певний рiвень базових знань). Власне, задача зводиться до вибору окремо' БССС з усього лексично-семантич-ного оточення i'i' складових, як це показано на рис. 4.

БЗ

Рис. 4. Окрема БССС та семантичне оточення ii складових

Першим за популярнютю серед них е, безсумнiвно, питання обробки синошм!в — тобто тако! ситуаци, коли тд час пошуку необхщно враховувати не лише саме слово, але й можлив! варiанти його замiни (синошми). Тут слвд згадати розподш синошм!в на абсолютн (л, як завжди мають под1бш значення, як-то «обмана» та «омана») та коитекстнi (т!, як мають

спшьне значения тшьки за певних умов або обме-жень). З абсолютними сииоиiмами КПС наразО працю-ють з використанням статистичних методiв — хоча й не Одеально, але досить успiшио. Робота ж з контекст-ними синошмами у КПС представлена слабо. Це пояснюетъся тим, що для коректно! обробки контекст-них сииоиiмiв треба спочатку коректно враховувати контекст, а питання видшення контексту у КПС фак-тично не pеaлiзовaио.

У ПМБЗ контекстнО сииоиiми визначаються на piвиi субструктури або структури—через подабнють БССС. 1ншими словами, можемо вважати слова контекстни-ми сииоиiмaми, якщо вони з'являються в однОй й тОй сaмiй pолi у однОй й тОй сaмiй стpуктуpi. Такий пiдхiд дозволяе досить точно подтвердит, що деякО слова е синошмами в даному контекстО, або ж показати, що використання !х як сииоиiмiв за даних умов недопустимо. Також зазначимо, що такий шдаОд дозволяе використовувати иовi, набутО значення слiв—наприк-лад, сленг або усталенО помилки. Так, суто сленгове слово «гуглити», що означае «шукати в пошуковiй системО Google», або бiльш широко «шукати в штер-нетО», використовувалося задовго до першо! його появи у словниках. ОскОльки сценарп його використання переважно збiгaються з використанням «шукати» в контекст! «шукати в iитеpиетi», у ПМБЗ щ слова були б контекстними синошмами. Водночас, резуль-тати зi словом «нишпорити», яке також е синошмом до «шукати», були б серед останшх, оскОльки його сценари використання значно вiдpiзияються. 1нший приклад наведено на рис. 5, хоча слова «йти» та «крокувати е синошмами, замша !х допустима лише в одному випадку з двох представлених.

Рис. 5. Контекстна синонiмiя на приклада Miß «йти» та «крокувати»

Розкривши проблему сииоиiмiв, не можемо оминути й звоpотнiй випадок—проблему багатозначних слiв: одне й те ж саме слово, що може мати piзиi значення залежно вОд контексту. Зазначимо, що тут маються на увaзi не тшьки й не стiльки омографи (рОзн словофор-ми piзних слiв, що мають однакове написання), а саме слова, якО змiнюють смислове навантаження залежно вiд контексту !х використання. Прикладом цього е слово «поле» — «електромагштне поле» у фiзицi, «зaсiяие поле» у сiльському господарствО, «поле дос-лiджеиия» в наущ тощо.

Багато в чому ця ситуащя подiбиa до aиaлiзу запиту, що складаеться з кОлькох слОв. Так само в pезультaтi не враховуеться порядок та роль слОв у pечеииi, але до цього додаеться ще й спотворення значення слова.

Дшсно, при пошукку за запитом «поле до^дження» отримуемо як релевантний результат «Поиятiйио -тер-мшолопчне поле до^дження», так i нерелевантний «Укра!нськО офiсиi пращвники готовi змшити роботу в офiсi на город чи поле — до^дження ». На даному приклада ця проблема проявляеться так само, як i при звичайному складному запит—тшьки у появi зайвих результатов. Але, на вiдмiну вiд складного запиту, при семантичному спотвоpеннi набагато складшше визна-чити, наскОльки результат вадповвдае початковому за-думу користувача — адже в багатьох випадках, особливо коли це стосуеться спецОалОзовано! термшологп, piзнi значення слова можуть бути досить близью за смисловим навантаженням.

Як було вказано вище, у ПМБЗ в такому випадку можемо визначити контекст або вручну, або за допо-могою автоматичного aнaлiзу запиту. Саме у випадку багатозначних слОв дуже доречним виглядае використання такого потужного аспекту ПМ1 як когнтивний зворотнш зв 'язок. 1дея його використання полягае у тому, що за оточенням слова передбачаються мож-ливi вapiaнти закОнчення запиту; таким чином, використання правильно побудованого запиту дозволяе ютот-но зменшити кОлькОсть релевантних результатов. Так, пошук за запитом «король» поверне дуже велику кОлькОсть результатов, тобто практично не буде корис-ним. Уточнення «король ФранцИ'» не тальки додасть до запиту новий елемент «Франщя», але i визначить стpуктуpнi (члени речення, частини мови) й навОть семaнтичнi («король» як титул) зв'язки мОж ними. Уточнення «король Франци у XIV сторiччi» обме-жить поле пошуку декОлькома сутностями (королями Франци з 1400 до 1500 роков) i пов'язаними з ними результатами.

Ще раз окремо зазначимо, що обчислювальна складнють кожного уточнення буде падати зi зростан-ням складностО запиту, оскОльки фактично вiд пошуку слова у БЗ фокус буде переходити до пошуку струк-тури у ПМБЗ за повною вiдповiднiстю. Так, нaвiть на мaтеpiaлaх пошуку у Google бачимо, що при пеpеходi вiд запиту «поле» (майже 90 000 000 результапв) через «поле до^дження» (близько 3 000 000 результапв) до «поле наукового дослiдження» (1 000 000 результат1в) - всього за 3 гтеращ! - кшьшсть результатов зменшуеться майже на 2 порядки (у 90 paзiв).

В останню чергу розглянемо техшчш проблеми КПС -тобто тО проблеми, яш зумовленi не стОльки склaднiстю природно! мови як об'екта дослiджень, скОльки особ-ливостями реалОзащ! КПС у 1'х сучасному виглядО.

По-перше, ще раз пОдкреслимо характерний недолОк усОх систем, що працюють з ключовими словами: недостатне охоплення вхОдних матерОалОв. Очевидно, що при створеннО Ондексу над документом пошуковО роботи обробляють лише малий вОдсоток його змюту - це зумовлено самим визначенням Ондексу. Отже, велика частина вхОдних даних просто Огноруеться, в результат! чого при роботО з пошуковими системами

доводиться орiентуватися саме на популярно ключовi слова, а якость пошуку прямо залежить вiд якостi алгоритму побудови iндексу.

По-друге, КПС у бшьшостО випадков повертають ней-мовiрно велику кОлькость результатов, в той час як доля релевантних серед них дуже мала. Як правило, запит загального характеру повертае мiльйони результата, спецiалiзований запит - тисячi, а больша частина релевантних знаходиться на перших 10..20 сторiнках (ек-вiвалент 100-200 позицiй), i навоть з них лише 10-15% дшсно дають вiдповiдь на запит.

Цю проблему частково вирiшуе уточнення запиту, але, як правило, ця операцоя використовуеться досить рiдко — адже при уточненно кожного разу втрачаеться певна частина значущо! шформацо!, i ця втрата е муль-типлшативною. 1ншими словами, користувачi нама-гаються змiнити формулювання свого запиту замють використання функци пошуку у знайденому.

I, нарештО, знову повернемося до використання клю-чових слiв. Хоча сама по собi ця технолог не е чимось поганим, !! повсюдне використання у текстовому пошуку призвело до вкрай негативних наслiдкiв. Замiсть адаптацо! пошукових систем до природно-мовних запитов користувача бачимо адаптацiю корис-тувачiв до запропоновано! мови введення запитов; замють покращення рейтингу документа шляхом роз-мiщення ново! або актуально! шформаци бачимо «накрутку» штучних показников пошукових систем; замiсть використання потужно! мови пошукових запита бачимо спроби через довгi ланцюжки посеред-ников вийти до першоджерела шуканих даних [4]. Хоча пошуком у такому виглядi цолком можливо користуватись, питання про його якость та оптимальность, кажучи обережно, залишаеться вiдкритим.

6. Висновки

Незважаючи на те, що тематика текстового пошуку у великих базах природно-мовних даних (одшею з яких е мережа 1нтернет) вже багато роков е популярним напрямком дослiджень, якость вщповОдних систем залишаеться не дуже задовшьною. Бiльшiсть класич-них пошукових систем, так само як i найбольш популярно бази структуровано! природно-мовно! шформацо!, доа мають ютотно недолiки як на рОвно архотекту-ри, так i на рОвно реалОзацО!.

Використання запропонованого Л. Щербою пОдходу з чОткою ОдентифОкацоею функционального навантаження 1МС через складовО ЛП/ПМБЗ з формально визначе-ною структурною органозащею кванта знань - БССС дозволяе вже на етапО моделювання вирОшити деяко проблеми класичних пошукових систем. Хоча цей тдход все ще потребуе як бОльш детального теоретичного вивчення, так i експериментально! перевОрки, видаеться очевидним, що спроби надалО покращувати тОльки кОлькосно показники ро боти пошукових систем вичерпали свОй потенцОал, i поява докорОнно нових пОдходОв у цш галузО - це лише питання часу.

НаразО неможливо сказати, наскольки як1сно практична реалОзацоя 1МС буде вирОшувати усО освОтет у даной статтО проблеми, але вже можемо впевнено стверджувати, що використання навоть окремих l! елементОв у пошукових системах може позитивно вплинути на якость !х роботи, а сама модель 1МС е досить цокавим i перспективним полем для подальших дослОджень.

Литература: 1. Гвоздев А.Н. От первых слов до первого класса / Александр Гвоздев. Саратов: Изд-во Саратовского университета, 1981. 2. Кисленко Ю.1. Архотектура мови (шнгвОстичне забезпечення штелектуальних штегрованих систем) : Учбовий посОбник. К.: Вшол, 1998. 343 с. 3. Щер-ба Л.В. Языковая система и речевая деятельность. Л.: Наука, 1974. 4. H^scher C. Web search behavior of Internet experts and newbies / C. H^scher, G. Strube. // Computer Networks. 2000. №33. Р. 337-346. 5. Hsinchun C. Internet Categorization and Search: A Self-Organizing Approach / C. Hsinchun, C. Schuffels, R. Orwig // Journal of Visual Communication and Image Representation, Special Issue on Digital Libraries. 1996. №7. Р. 88-102. 6. Kyslenko Y. Cognitive architecture of speech activity and modelling thereof / Y. Kyslenko, D. Sergeiev // Biologically Inspired Cognitive Architectures. 2015. №12. Р. 134-143. 7. Kruse P. Clever Search: A WordNet Based Wrapper for Internet Search Engines / P.Kruse, A. Naujoks, M. Kunze, D. Roesner // Proceedings of 2nd GermaNet Workshop 2005. 2005. 8. Tirri H. Search in vain, challenges for Internet search / Tirri. // Computer. 2003. №36. Р. 115-116. 9. Zeki S. A visual image in mind and brain: Collection of papers / Semir Zeki. // The World of Science. 1992. №11. Р. 33-41. 10. Google Knowledge Graph [Електронний ресурс] // Wikipedia, the free encyclopedia. 2012. Режим доступу до ресурсу: https:// en.wikipedia.org/wiki/Knowledge_Graph.

Кисленко Юрш Иванович, канд. техн. наук, доцент кафед-ри техшчно! юбернетики ФЮТ НТУУ «КП1». НауковО штереси: сенсорика бюлопчних та техшчних систем, ро-бототехшка, штучний штелект, шформащйш природно-мовш технологи. Адреса: Укра!на, 03187, Ки!в, вул. Те-ремювська, 11, кв 13. Тел. +38(097)522-35-22, email: y.i.kislenko@gmail.com

Сергеев Данило Сергшович, астрант кафедри техшчно! юбернетики ФЮТ НТУУ «КП1». НауковО штереси: шфор-мацойш природно-мовш технологи, бази знань, обектно-орОентоваш бази даних. Адреса: Укра!на, 02192, Ки!в, вул. Космочна, 12, кв. 16. Тел. +38(095)402-97-40, email: d.sergeiev@gmail.com

Kyslenko Yuri Ivanovich, Ph.D., associate professor at the Department of Technical Cybernetics, FICT NTUU «KPI». Research interests: sensorics of biological and technical systems, robotics, artificial intelligence, natural language information technology. Address: Ukraine, 03187, Kiev, Teremkovskaya str. 11, apt. 13, tel. +38(097)522-35-22, email: y.i.kislenko@gmail.com

Sergeiev Danylo Sergiyovich, postgraduate student at the Department of Technical Cybernetics, FICT NTUU «KPI». Research interests: natural language information technology, knowledge bases, object-oriented databases. Address: Ukraine,02192, Kiev, Kosmichna str. 12 apt. 16. tel. +38(095)402-97-40, email: d. sergeiev@gmail.com

i Надоели баннеры? Вы всегда можете отключить рекламу.