Научная статья на тему 'Объем порции пошаговой подсказки и эффективность интерфейса пользователя системы поиска по ключевому слову'

Объем порции пошаговой подсказки и эффективность интерфейса пользователя системы поиска по ключевому слову Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
172
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНТЕРФЕЙС ПОЛЬЗОВАТЕЛЯ / ПОИСК ПО КЛЮЧЕВОМУ СЛОВУ / ПОШАГОВАЯ ПОДСКАЗКА / ТРУДОЕМКОСТЬ ИНТЕРФЕЙСА ПОЛЬЗОВАТЕЛЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Литвинов В. А., Майстренко С. Я., Оксанич И. Н.

Рассматривается влияние объема порции подсказки при вводе ключевого слова на эффективность интерфейса пользователя информационно-поисковой системы. Приводятся расчетные и экспериментальные данные зависимости трудоемкости интерфейса и ее составляющих от объема порции подсказки. Обсуждается потенциальная целесообразность уменьшения объема порции подсказки с учетом экспериментальных данных по вводу и синонимическому замещению ключевых слов

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Литвинов В. А., Майстренко С. Я., Оксанич И. Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The influence of portion volume of prompt while typing a keyword on the efficiency of user interface of information-retrieval system is discussed. Calculated and experimental data of interface manufacturing content dependence and its components from the portion volume of prompt are given. We discuss the potential practicability of reducing the portion volume of prompt taking into account the experimental data for writing and synonymous substitution of keywords

Текст научной работы на тему «Объем порции пошаговой подсказки и эффективность интерфейса пользователя системы поиска по ключевому слову»

ІНФОРМАЦІЙНІ І ТЕЛЕКОМУНІКАЦІЙНІ ТЕХНОЛОГІЇ

УДК 004.5

В.А. ЛИТВИНОВ, С.Я. МАЙСТРЕНКО, И.Н. ОКСАНИЧ

ОБЪЕМ ПОРЦИИ ПОШАГОВОЙ ПОДСКАЗКИ И ЭФФЕКТИВНОСТЬ ИНТЕРФЕЙСА ПОЛЬЗОВАТЕЛЯ СИСТЕМЫ ПОИСКА ПО КЛЮЧЕВОМУ СЛОВУ___________________________________

Анотація. Розглядається вплив об’єму порції підказки при вводі ключового слова на ефективність інтерфейсу користувача інформаційно-пошукової системи. Наводяться розрахункові та експериментальні дані залежності трудомісткості інтерфейсу та її складових від об ’єму порції підказки. Обговорюється потенційна доцільність зменшення об’єму порції підказки з урахуванням експериментальних даних по вводу і синонімічному заміщенню ключових слів.

Ключові слова: інтерфейс користувача, пошук за ключовим словом, покрокова підказка, трудомісткість інтерфейсу користувача.

Аннотация. Рассматривается влияние объема порции подсказки при вводе ключевого слова на эффективность интерфейса пользователя информационно-поисковой системы. Приводятся расчетные и экспериментальные данные зависимости трудоемкости интерфейса и ее составляющих от объема порции подсказки. Обсуждается потенциальная целесообразность уменьшения объема порции подсказки с учетом экспериментальных данных по вводу и синонимическому замещению ключевых слов.

Ключевые слова: интерфейс пользователя, поиск по ключевому слову, пошаговая подсказка, трудоемкость интерфейса пользователя.

Abstract. The influence of portion volume of prompt while typing a keyword on the efficiency of user interface of information-retrieval system is discussed. Calculated and experimental data of interface manufacturing content dependence and its components from the portion volume of prompt are given. We discuss the potential practicability of reducing the portion volume of prompt taking into account the experimental data^ for writing and synonymous substitution of keywords.

Keywords: user interface, a keyword retrieval, step by step prompt, user interface manufacturing content.

1. Введение

Один из наиболее распространенных быстрых способов доступа пользователя к разнообразным информационным ресурсам СППР заключается в задании ключевого слова (КС), с которым через некий базовый словарь (БС) связаны индексы и ресурсы (в простейшем случае ресурсом может быть сам словарь, дополненный атрибутами, характеризующими каждое слово). Типовым механизмом повышения эффективности (usability) интерфейса пользователя (ИП) таких систем поиска является пошаговая подсказка возможных вариантов ключевого слова, имеющих совпадающее начало с введенными символами.

Представляет интерес вопрос о выборе объема m «порции» (страницы) подсказки в контексте оценки влияния значения m на основные параметры, определяющие производительность ИП. В настоящее время общепринятых решений в этом отношении пока еще нет. Этот факт иллюстрируют данные табл. 1, отражающие используемые значения m в различных информационно-поисковых системах и браузерах.

Таблица 1. Объем порции подсказки в информационно-поисковых системах

Поисковик/m Браузер

IE CHROME OPERA

GOOGLE 10 4 4

© Литвинов В.А., Майстренко С.Я., Оксанич И.Н., 2012 ISSN 1028-9763. Математичні машини і системи, 2012, № 3

Продолж. табл. 1

YANDEX.ru 10 10 10

УАИОО 0 10 5

КАМБЬЕЯ 10 10 0

Ukr.net 10 10 10

Bigmir.net 0 0 0

Meta.ua 5 5 5

АПОРТ 0 0 0

mail.ru 7 7 7

Bing.com 8 8 8

YouTube.com 0 10 10

2. Теоретические оценки зависимостей значений параметров производительности ИП

Трудоемкость конкретного акта ввода, анализа подсказки и идентификации КС зависит от количества введенных символов V, достаточных для идентификации КС, и суммарного количества слов М, просмотренных пользователем в V порциях подсказки.

Таким образом, общее выражение, определяющее ожидаемое значение трудоемкости Н интерфейса, может быть представлено в следующем виде:

Н = са + рМ + у»ом + рМ

(1)

где V, М - средние значения V, М;

а - коэффициент удельной трудоемкости операций ввода символов КС; р - коэффициент удельной трудоемкости операций визуального анализа слов подсказки;

у - константа трудоемкости подтверждения выбора (у << а + рМ).

Для конкретизации (1) могут быть использованы результаты построения и исследования идеализированной логико-вероятностной модели пошаговой подсказки (ЬР - модели

[1]), устанавливающей зависимости между значениями V, М и первичными параметрами интерфейса в рамках исходных допущений: 1) о случайном характере распределения реальных значений N слов БС среди qn всевозможных значений комбинаций п символов в алфавите q; 2) об аппроксимации функции востребованности информационных ресурсов (упорядоченных вероятностей обращений к словам БС) непрерывной функцией р(х).

В частности,

2=1

2=1

2-1

Рг № -Р™ )

5=1

М » Т [(*' - 1)- т + АМ1 ] • Р(і )+ [(іт - 1)т + Ш2 ] • Р(іт )

(2)

(3)

2-1

N

где для — > т — 1 и т > 1

чг

рг = | р(х) ¿х х = $ т

N чг

+1

і

V

о

где Im - ближайшее целое, большее или равное logq------;

m -1

AMj, AM 2 - эмпирические поправки, зависящие от вида аппроксимирующей функции р{х ).

Значения a,b,g экспериментально обосновывают модель декомпозиции ментальных операторов GOMS KLM [2] применительно к задачам ввода и визуального анализа символьной информации [3].

На графике рис. 1 приведены

обобщенные расчетные зависимости (1),

(2), (3) значений

v,M, H от m применительно к экспо-т ненциальной функ-1 ции p(x) с параметром Л0 [2] (для

m = 1 проведен до-

полнительный анализ). По оси ординат отложены относительные значения v (m), M (m), H (m), отнесенные к «опорным» значениям v (4), M (4), H (4) . В пределах графической различимости в принятом масштабе представления график рис. 1 отражает обобщенные зависимости в широком диапазоне значений исходных параметров ( N = 104 ^108, параметр Л0 = 0 20, n = 8 16, q = 10 32). Для оценки конкретных трендов в табл. 2 приведены абсолютные «опорные» значения v,M,H для КС типа ТЕКСТ (q = 32 , N = 106,108) и КОД ( q = 10, N = 104,106).

Таблица 2. Опорные значения v, M, H Как видно из графика рис. 1 имеют

место следующие тенденции влияния выбора объема страницы подсказки m на существенные результатные параметры интерфейса. Увеличение значения m с минимально возможного (m = 1) до 4, 10 и далее вызывает уменьшение v и, соответственно, уменьшение значения первого слагаемого (1).

С другой стороны, при этом в относительно большей степени растут значения M и, соответственно, второго слагаемого (1). В результате значение H существенно увеличивается.

Отмеченные тенденции подтверждаются и выборочными экспериментальными данными. Так, для оценки влияния значения m на v, M был проведен эксперимент по

q N Л0 v (4) M (4) H (4)

32 106 0 3,86 13,24 7,8

10 3,23 10,6 6,58

108 0 4,96 17,59 9,89

10 4,64 16,30 9,28

10 104 0 3,56 12,25 10,34

10 2,62 8,37 7,62

106 0 5,56 20,26 16,01

10 4,61 16,37 13,27

Рис. 1. Обобщенные расчетные зависимости значений v,M, H от m

вводу 32-х произвольно взятых слов орфографического русского словаря [4] длиной 7-9 символов в поисковой системе GOOGLE и анализу текущих значений v,M.

Результаты эксперимента приведены в табл. 3 в сравнении с расчетными данными (ТЕКСТ, q = 32 , N = 108, l = 10, n = 8 ). Для эксперимента среднее значение n = 7,7 , а значение H оценено как «индикативное», путем подстановки экспериментальных значений V, М в (1).

Таблица 3. Результаты эксперимента в сравнении с

расчетными данными

Значения v(10V /V (4) M (10)/ /М (4) H (10)/ /н (4)

теор. эксп. теор. эксп. теор. эксп.

Абсолют. 4,30 4,64 4,47 4,8 37,34 16,31 38,7 17,2 16,7 9,28 16,74 9,44

Относит. 0,93 0,93 2,29 2,25 1,80 1,77

Минимальные значения M и H достигаются при м = 1 и близки к соответствующим значениям прицельной подсказки [5, 6]. Однако при этом уменьшаются до минимума возможности замещения ключевого слова неким потенциальным синонимом (ПС), который может появиться в порциях подсказки раньше, чем будет введен детерминант ключевого слова - минимальное количество начальных символов, однозначно его определяющих. В дополнение к более раннему появлению, ПС может и точнее передавать смысл запроса пользователя. Иными словами, в пошаговой подсказке заложены механизмы как подсказки набора символов КС, так и подсказки смысла КС.

Для простых информационно-поисковых систем с близким к однозначному соответствием «ключевое слово - ресурс» подсказка уточненного смысла если и возможна, то не имеет особого практического значения. Для ИПС, где это отношение имеет более сложный, многозначный характер (типа «многие ко многим»), ситуация оказывается иной, и возможность замещения КС синонимом должна давать ожидаемый двоякий эффект.

3. Экспериментальная проверка потенциальной эффективности синонимичного замещения КС на примере конкретной ИПС

Цель эксперимента состояла в натурном моделировании процесса подсказки в реальной ИПС с многозначными отношениями «ключевое слово - ресурс» для установления ориентировочных зависимостей и количественных соотношений между существенными (в контексте рассматриваемого вопроса) исходными и результатными параметрами пошаговой подсказки.

В глобальной ИПС GOOGLE (браузер 1Е-8) осуществлялся ввод 32-х произвольно выбранных из [7] КС, состоящих из одного слова длиной 7-10 символов, и 32-двукратных словосочетаний, разделенных пробелом (2-словосочетаний), суммарной длиной 15-20 символов.

Общения с GOOGLE проходило в двух режимах:

А - использование синонимического замещения.

Если в порциях подсказки появлялся ПС, он выбирался в качестве искомого ключевого слова. Если среди 10 первых ресурсов, предоставленных по запросу, не находилось удовлетворительного (в смысле приемлемой релевантности), ввод КС повторялся с игнорированием ПС.

В - игнорирование синонимического замещения.

Процесс ввода символов и анализа порций подсказки продолжался до появления в подсказке именно конкретного КС.

В качестве критериев оценки эффективности режимов, кроме реальных значений V,М и индикативных значений Н, дополнительно фиксировался порядковый номер к < 10 ресурса, предоставляемого системой и удовлетворяющего сделанному запросу. Смысл значения к = 5 иллюстрирует приведенный на рис. 2 скриншот для КС <индекс

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(БД)>.

инд в 1

индекс ] Мне гшп&ійі! »

иныекс киев-а

индия

индексы украины

| Все реЗ.'ЛьУЭТЬ Картинки Карты Видео Нсьости Еще

Киев, город Киев Изменить место

Интернет Топы® и а русском ТопькО Украины Перевод результата

Почтовый индекс по упицам и адресам. Украина. Справочник...

їпгіякіш г.ег

Спрэаоччн* по Почтовым индексам городов Украины. поиск го утицам, адресам и алфавиту

Индексы Киеаэ 1-9 Почтовые ицдексы Киева па - Буква Р

Ца?ір - Потовые Индексы Украины і

изгір-сот.'

Справочник почтовых индексов Украина Индексы по улицам крупны* городов ¡: населенных пунктов.

Киевская к Одесская і Харькове кая , Донецкая і

Почтовые индексы Украины „

икііпііех ті

Почтовые Индексы Украины, городов населенных пунктов

Поштові і^¡екси Україні!

5ЄМСЄ5 Ц^ІфО&ІІЇЗ С&|Гі/р(}5ТІІІЧ[ІЄХ_Г5Є^ - ГІЄрЄ0ЄЄТи Эту СТрЭНИцу НиіріІКЛаД м необхідності ЕНЭНТИ індекс вулиці ГІОЩГОВ.ОЇ у місті Донецьк, параметри мають бут*і вказані іак Для \-сіу ¡ншН^насеиеил* пунктів дгя ...

С Индекс — Викяпедия

Индекс (лз і іп()ех — список, р.оесф. указаны — число. ёу*йы ипп другая ігомоіищпл спмеопов ■.■кагыпаю'.цпп место зло мечта □ совокупности . і п 11

За ес^ время За час

Рис. 2. Скриншот для ключевого слова <индекс (БД)>

Общие результаты экспериментов следующие.

1. Одиночные слова. Из 32-х слов потенциальные синонимы нашлись для 12. Из них удовлетворительные результаты получены только для 5 замещений: <архивация> ^ <архиватор>, <бизнес-модель> ^ <бизнес-моделирование>, <браузер> ^ <браузеры>, <веб-квест> ^ <веб-квесты>, <драйвер> ^ <драйвера>.

Примеры неудачных замещений: <загрузчик> ^ <загрузки>, <запрос> ^ <запросы §оо§1е>, <канал (ТВ, радио) > ^ <канал футбол>.

2. Словосочетания. Из 32-х словосочетаний нашлись и были проверены 17 ПС; удовлетворительные результаты получены для 10 замещений: <векторное представление> ^ <векторная графика>, <виртуальное соединение> ^ <виртуальное сетевое подключение^ <динамический объект> ^ <динамический массив>, <императивный язык> ^ <императивное программирование>.

Остальные удачные замещения - подстановка множественного числа вместо единственного: <ключевое слово > ^ <ключевые слова> и т.п.

Примеры неудачных замещений: <витрина данных> ^ <витрина>, <искусственный интеллект> ^ <искусственный разум>.

Обобщенные количественные характеристики результатов проведенного натурного моделирования сведены в табл. 4.

Таблица 4. Обобщенные

результаты натурного моделирования

Ключ. слово n Режим m H (10) H (4) к

10 4

v M H v M H

1 8,7 А 5,22 44,87 21,24 5,53 21,81 12,35 1,72 3,09

В 4,84 41,84 19,89 5,16 18,53 10,9 1,82 1,69

2 18,3 А 8,91 83,53 54,25 10,66 41,00 30,14 1,80 3,28

В 9,25 87,69 56,81 10,65 40,94 30,10 1,88 1,16

О чем говорят данные табл. 4?

1. Подтверждены теоретические значения соотношений v (10)/ v (4), M(10/M(4), H (10)/ H (4), в частности, и для словосочетаний с длиной, почти втрое превышающей значение n в расчетных и экспериментальных данных табл. 3.

2. Использование потенциальных синонимов в проведенном эксперименте не привело к ожидаемому сокращению трудоемкости ввода КС: значения M и H режима А по сравнению с B оказались примерно равны для словосочетаний и даже выше для одиночных слов (21,81 и 18,53, 12,35 и 10,9). Более того, для режима A оказались и заметно выше значения к , характеризующие «вторичную» трудоемкость поиска наиболее подходящего ресурса из числа предоставленных поисковой системой.

4. Заключение

Представленные теоретические (рис. 1) и экспериментальные (табл. 3, 4) данные в силу разных причин не могут служить исчерпывающим обоснованием предпочтительности выбора малых значений m (3 4) по сравнению с m =10 при многозначном соответствии «КС-ресурс», однако они говорят в пользу такого выбора. Для систем поиска с однозначным соответствием КС (например, идентификационные коды) значение m может быть еще меньше, вплоть до 1 (или может использоваться прицельная подсказка).

Далее следует отметить, что теоретические соотношения (рис. 1) основаны на значениях коэффициентов а и /З, экспериментально установленных для неопытных пользователей (операторы m m [3]). Для опытных профессиональных пользователей эти значения могут быть иными, однако опытность сходным образом (в сторону уменьшения) влияет как на значения а , так и /. Поэтому характер соотношения а//, определяющего

относительный вклад переменных v , M в (1), не должен существенно изменяться. СПИСОК ЛИТЕРАТУРЫ

1. Литвинов В. А. Логико-вероятностная модель пошаговой подсказки в интерфейсе пользователя поисковой системы по ключевому слову / В.А. Литвинов, С.Я. Майстренко, И.Н. Оксанич // Математичні машини і системи. - 2011. - № 2. - С. 41 - 49.

2. Kieras D. Using the Keystroke-Level Model to Estimate Execution Times, University of Michigan [Електронний ресурс] / D. Kieras. - Режим доступу: ftp://www.eecs.umich/edu/people/rchong/ kieras/GOMS/KLM.pdf.

3. Оксанич И.Н. Модель декомпозиции ментальных операторов в проблемно-ориентированном интерфейсе пользователя и ее экспериментальное исследование / И.Н. Оксанич // Математичні машини і системи. - 2010. - № 1. - С. 105 - 112.

4. Ушаков Д.Н. Орфографический словарь / Д.Н. Ушаков, С.Е. Крючков. - Минск: Изд-во Академии наук БССР, 1950. - 197 с.

5. Интеллектуализованный интерфейс пользователя информационно-поисковой системы в задаче поиска по ключевому слову («образцу») с упреждающей подсказкой / Г.Е. Кузьменко, В.А. Литвинов, С.Я. Майстренко [и др.] // Математичні машини і системи. - 2011. - № 1. - С. 61 - 71.

6. Литвинов В.А. Модель прицельной подсказки в интерфейсе пользователя и некоторые особенности ее применения / В.А. Литвинов, С.Я. Майстренко, И.Н. Оксанич // «System Analysis and Information Technologies»: 12th International Conference, SAIT 2012. Proc. - Kyiv, 2012. - P. 372 - 373.

7. Тлумачний словник з інформатики / Г.Г. Півняк, Б.С. Бусигін, М.М. Дівізінюк [та ін.]. - Д.: Нац. гірнич. ун-т, 2008. - 599 с.

Стаття надійшла до редакції 18.01.2012

i Надоели баннеры? Вы всегда можете отключить рекламу.