Научная статья на тему 'Проблема контекстного поиска информации в информационно-поисковой системе'

Проблема контекстного поиска информации в информационно-поисковой системе Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
265
72
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Максакова Л. С.

В данной статье рассматривается проблема контекстного поиска информации в ИПС. Рассмотрены основные информационные потребности пользователей, состояние разработок систем контекстного поиска, сферы использования современных ИПС, а так же говориться в каких случаях применяется контекстный поиск. В конце статьи подведены промежуточные итоги исследования.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Проблема контекстного поиска информации в информационно-поисковой системе»

4. Maruster L., van Beest N.. Redesigning Business Processes: A Methodology Based on Simulation and Process Mining Techniques. Knowledge and Information Systems. - 2009.

5. Alves de Medeiros A.K., G'unther C.W. Process Mining: Using CPN Tools to Create Test Logs for Mining Algorithms // In K. Jensen, editor, Proceedings of the Sixth Workshop and Tutorial on Practical Use of Coloured Petri Nets and the CPN Tools. - 2005. - P. 177-190.

6. Ланцев Е.А. Агентный и дискретно-событийный подходы к имитационному моделированию бизнес-процессов в нотации eEPC // В мире научных открытий. - Красноярск, 2013. - С. 278-290.

7. J.C.A.M. Buijs. Mapping Data Sources to XES in a Generic Way. Master Thesis. - 2010. - P. 123.

8. De Medeiros A., van den Brand P., van der Aalst W., Weijters T., Gaaloul W., Pedrinaci C. Semantic Process Mining Tool - Final Implementation, Deliverable 6.11, Project IST 026850 SUPER (Sep 2008).

9. Alves de Medeiros A.K., Weijters A.J.M.M. and van der Aalst W.M.P. Data Mining and Knowledge Discovery. - 2007. - Vol. 14, Iss. 2. - P. 245-304.

ПРОБЛЕМА КОНТЕКСТНОГО ПОИСКА ИНФОРМАЦИИ В ИНФОРМАЦИОННО-ПОИСКОВОЙ СИСТЕМЕ

© Максакова Л.С.*

Московский государственный университет леса, г. Мытищи

В данной статье рассматривается проблема контекстного поиска информации в ИПС. Рассмотрены основные информационные потребности пользователей, состояние разработок систем контекстного поиска, сферы использования современных ИПС, а так же говориться в каких случаях применяется контекстный поиск. В конце статьи подведены промежуточные итоги исследования.

Информационно-поисковые системы появились на свет достаточно давно. Первые автоматизированные информационные системы начали разрабатываться еще в 50-х годах прошлого века, и главной их функцией был именно поиск информации. Поэтому их назвали информационно-поисковыми системами (ИПС). Информационно-поисковые системы (ИПС) появились в середине XX в., когда ученые предупредили о возможности возникновения проблемы информационного взрыва. Стало понятным, что контекстный поиск представляет отдельную задачу, имеющую свой предмет и свои методы решения. Но полностью автоматизировать интеллектуальные поисковые системы оказалось невозможным. В 70-е гг. с внедрением компьютеров в

* Магистрант кафедры Вычислительной техники.

работу библиотек началась автоматизация простых рутинных операций. Типичная ИПС тех лет - это человеко-машинная система, где анализ содержания документов и их индексирование выполнялись вручную, а компьютер использовался лишь для их поиска. Как правило, ИПС использовались в режиме избирательного распространения информации и функционировали как автономные системы. Далее, в конце 70-х гг.- середине 90-х гг. в развитии ИПС происходит переход от ручного интеллектуального индексирования к автоматизированному. Массовое распространение получили системы, названные бестезаурусными, или - системами поиска по свободному тексту free-text searching systems. Особенностью их является, с одной стороны, отказ от лексического контроля и тем самым отказ от учета парадигматики, с другой - широкое использование контекста и синтагматических связей.

Заключительный этап развития документальных ИПС начался с середины 1990-х гг. и длится по настоящее время.

Информационная потребность пользователя

Итак, в определенный момент времени у некоторого пользователя возникает информационная потребность в документах по той или иной нужной ему тематике, которая обычно достаточно узка.

В начальный момент эта потребность часто не может быть точно выражена словами. При этом любая поисковая система требует достаточно четких запросов.

Следовательно, пользователь должен представить свою информационную потребность в виде некоторого выражения, которое может быть воспринято поисковой системой.

Выделяют четыре этапа представления информационной потребности :

- реальная информационная потребность - это неосознанная истинная информационная потребность пользователя (потребность в некоторой новой информации при решении стоящей перед пользователем задачи);

- осознанная информационная потребность - появляется после осознания пользователем стоящей перед ним проблемы (осознанная потребность отличается от реальной, более того, пользователь может понимать имеющуюся проблему неправильно);

- выраженная информационная потребность - результат описания осознанной информационной потребности с помощью естественного языка;

- формализованная информационная потребность - это результат представления выраженной потребности средствами формального поискового языка ИПС.

Контекстный поиск

Контекстный поиск применяется в следующих случаях:

- Пользователь затрудняется точно сформулировать запрос;

- Пользователь не точно помнит термины, которыми характеризуется интересующая его проблема;

- Пользователь хочет получить в результате поиска максимум документов (материалов), пусть даже отдалённо относящихся к интересующей его проблеме;

- Проблема не достаточно конкретна.

По результатам поиска система выстраивает найденные документы по степени их близости к контексту заданного пользователем запроса.

Каждому документу присваивается «вес». Документы с наибольшим «весом» имеют большую вероятность содержать полезную информацию и будут располагаться вверху списка. По мере движения вниз вес документов и соответственно вероятность содержания полезной информации убывает.

Состояние разработок систем контекстного поиска Системы контекстного поиска в последние годы стали активно использоваться в самых различных областях деятельности. В то время как первоначально они разрабатывались главным образом как инструмент для библиотечного дела, в настоящее время они нашли применение в различных организациях для работы с их текстовыми информационными ресурсами. Особенно интенсивно технологии контекстного поиска начали развиваться с появлением глобального информационного пространства Веб.

Расширение функциональные возможности

Разработчики систем контекстного поиска уделяют большое внимание не только совершенствованию механизмов выполнения их базовых функций, но и развитию ряда дополнительных возможностей, позволяющих существенным образом увеличить эффективность поиска, повысить управляемость системы, обеспечить более комфортные условия для работы пользователя. Перечислим некоторые такие возможности.

Повышение точности поиска. В формулировке пользовательского запроса не все термы могут быть равнозначными. Некоторые системы контекстного поиска позволяют пользователю придать веса используемым в запросе термам с тем, чтобы охарактеризовать их значимость в запросе. Эта информация используется при вычислении оценок релевантности документов информационным потребностям пользователя, и тем самым существенно повышается точность поиска.

Ранжирование результирующих документов запроса. В силу рассмотренных ранее причин системы контекстного поиска не могут гарантировать строгого удовлетворения информационных потребностей пользователя в результате выполнения поисковых запросов. Количество результирующих документов обычно бывает значительным. Поэтому очень важно упорядочить документы, выдаваемые системой пользователю, таким образом, чтобы в начале списка находились документы, которые, вероятно, в большей мере пред-

ставляют интерес для пользователя. Операция такого рода называется ранжированием документов. Развитые системы контекстного поиска обладают механизмами, обеспечивающими такую возможность. В зависимости от реализуемой ими модели поиска, предусматривается упорядочение множества документов, выдаваемых в результате обработки пользовательского запроса, по некоторым оценкам степени их релевантности запросу или вероятности удовлетворения информационных потребностей пользователя.

Обратная связь релевантности - важная функция, позволяющая повысить эффективность поиска требуемых пользователю документов. Дело в том, что результаты обработки запроса могут не удовлетворять пользователя. В таких случаях во многих системах текстового поиска пользователю предоставляется возможность уточнить запрос. Для этого он может дать оценку релевантности полученных документов - указать, какие из них он считает релевантными или нерелевантными.

Поскольку количество результирующих документов может быть довольно большим, пользователю предлагается оценить хотя бы несколько первых документов в ранжированном списке, т.е. тех документов, которым система назначила наивысшие оценки степени релевантности. Система может использовать термы этих документов для формирования нового, расширенного запроса, который, скорее всего, будет точнее выражать информационные потребности пользователя.

Такой итерационный процесс обработки запроса и модификации его с помощью анализа данных, полученных на основе обратной связи пользователя с системой, может повторяться до тех пор, пока пользователь не будет удовлетворен результатами поиска. Обратная связь релевантности используется в системах, основанных на различных моделях поиска.

Сферы использования современных ИПС

Современные ИПС характерны для так называемой информационной индустрии - новейшей области экономики и социальной сферы, занятой обработкой, систематизацией, накоплением и распространением информации. Бурное развитие ИПС связано с успехами информатики. Предметами запроса в ИПС могут быть библиографические данные, управленческая и фактографическая информация, экспертные оценки, ретроспективный опыт, результаты исследования моделей и т.д. Такой широкий круг задач обусловливает большое разнообразие типов ИПС. Они различаются своими целями, объемом содержащихся сведений, видами информации, способами доведения ее до потребителя. Наряду с локальными ИПС, действующими в рамках одного учреждения (библиотека или музей) существуют национальные и интернациональные центры информационного обслуживания. Широкое распространение получили библиографические ИПС (например, содержащие библиографию по всем областям научной литературы). Массовое производство персональных ЭВМ, развитие средств коммуникаций, возможность

объединения ЭВМ в информационные сети и обращения со своего рабочего места к сведениям, находящимся в памяти других ЭВМ, существенно расширили диапазон применения информации, широту и глубину ее поиска. Качественно новый этап развития ИПС связан с формированием баз данных на машиночитаемых носителях. Такие базы данных позволяют обращаться к ним дистанционно, одновременно по многим запросам, получая результаты поиска оперативно и в удобном виде.

Именно комплексный характер сведений послужил причиной разработки единой концепции ИПС. Она включает поэтапное создание отдельных подсистем, объединение которых достигается как на уровне обмена базами данных, так и с помощью средств коммуникаций.

Заключение

В настоящее время проблематика поиска стала довольно обширной. Она охватывает различные области теории и разработки систем контекстного поиска, такие, как:

- развитие конкретных моделей поиска;

- методология проведения экспериментов, тестирования и оценки систем;

- методы реализации поиска;

- подходы к интеграции технологий текстового поиска и баз данных;

- методы сжатия данных;

- оценка эффективности обработки запросов;

- обработка естественного языка;

- методы классификации и кластеризации текстовых документов;

- приложения информационного поиска в электронных библиотеках;

- глубинный анализ текстов;

- технологии индексирования и поиска мультимедийной информации;

- интерфейсы «человек - компьютер» и т.д.

ОПТИМАЛЬНОЕ ПРОЕКТИРОВАНИЕ БИЗНЕС-ПРОЦЕССОВ НА ОСНОВЕ АППАРАТА ФУНКЦИОНАЛЬНЫХ СЕТЕЙ

© Сюняков С.А.*, Гриф М.Г.*

Новосибирский государственный технический университет, г. Новосибирск

Целью данной работы является рассмотрение и анализ принципов проектирования бизнес-процессов на основе аппарата функциональных сетей, описание процесса моделирования и создания классов для работ с ними.

* Магистрант кафедры Автоматизации систем управления.

* Заведущий кафедрой Автоматизации систем управления, доктор технических наук, профессор.

i Надоели баннеры? Вы всегда можете отключить рекламу.