Модели и методы интерактивного взаимодействия с вычислительными устройствами нового поколения

Манахов П.А.; Ковшов Е.Е.

№ 3 (39) 2012

П. А. Манахов, аспирант Московского государственного технологического университета «СТАНКИН»

Е. Е. Ковшов, докт. техн. наук, профессор Московского государственного

технологического университета «СТАНКИН»

Модели и методы интерактивного взаимодействия с вычислительными устройствами нового поколения

Несмотря на более чем 20-летнюю историю, вопрос разработки методов ввода текста для мобильных устройств не теряет своей актуальности. И, несомненно, требует решения задача сокращения финансовых издержек, связанных с решением данного вопроса.

Введение

На рынке мобильных терминалов с сенсорным управлением до сих пор не представлено эффективного способа ввода для людей с ограниченными возможностями зрения [3]. Процесс разработки нового и доработки существующего метода ввода завершается длительным и дорогостоящим юзабилити-тестировани-ем. Выявление недоработок на этом этапе влечет за собой значительные финансовые и временные затраты, поскольку весь процесс приходится повторять заново. Для того чтобы этого избежать, необходимо уже на этапе проектирования иметь под рукой инструмент, который позволит оценить эффективность тех или иных изменений. Применение квалитативных методов, равно как и привлечение экспертов, не позволяет достичь желаемого, поскольку на скорость набора (основной критерий эффективности способа ввода) влияет слишком большое количество параметров.

Можно заключить, что актуальной задачей является разработка модели оценки эффективности взаимодействия пользователя с мобильным устройством при вводе текстовой информации. Модель должна удовлетворять следующим требованиям:

• низкие временные затраты на расчет параметров;

• учет возможности использования различных вспомогательных (предикативных) систем;

• возможность оценки принципиально различных способов ввода текста (систем рукописного ввода, виртуальных клавиатур и пр.);

• возможность автоматизации процессов моделирования посредством создания программного решения;

• учет индивидуальных особенностей пользователя.

Обзор теоретических методов

Одной из первых метрик, используемых для сравнения различных способов ввода, является «количество нажатий клавиш на символ» [14] (КНКС)1. Физический смысл метрики заключается в оценке среднего количества взаимодействий, необходимого для набора данного текста с использованием конкретного метода ввода. Под взаимодействием понимается нажатие на клавишу, перемещение указателя типа «мышь», вычерчивание росчерка на сенсорном эк-

1 Общепринятым переводом слова keystroke является «нажатие клавиши», что не совсем удачно отражает смысл оригинального названия метрики «Keystroke per character». В более широком смысле под словом keystroke следует понимать любое взаимодействие.

№ 3 (39) 2012

ране и т. д. Медианным значением для описываемой метрики является 1, поскольку КНКС = 1 для обычной аппаратной либо виртуальной ЙЦУКЕН клавиатуры. Менее эффективными методами считаются те, у которых КНКС > 1, к примеру, стандартный способ ввода для сотовых телефонов (ISO/ IEC 9995-8), где для выбора символа необходимо нажать клавишу несколько раз. Более эффективные методы (КНКС < 1) используют различные предикативные системы с функцией завершения слов.

При расчете КНКС используется модель языка на основе корпусной лингвистики. В зависимости от анализируемого способа ввода применяются частоты отдельных символов, диграфов (комбинации, состоящей из двух символов) или слов. Теоретический § метод расчета КНКС подробно описан в ра-g боте [14], эмпирический — в работе [16]. g При всех своих достоинствах — про-| стоте расчета и наглядности — описанная g метрика обладает существенным недосев татком: уменьшение КНКС не всегда ве->1 дет к увеличению скорости набора текста. & Данное заключение является неочевид-s ным и поэтому требует пояснения. КНКС

I по своей сути учитывает только моторную %

г§ компоненту взаимодействия, упуская из ви-<5 да тот факт, что время ввода конкретного § символа складывается еще из двух компо-з нент: когнитивной и компоненты обратной £ связи. Под когнитивной компонентой пони-¡0 мается время подготовки действия, к примеру, для виртуальной клавиатуры ее зна-|| чение будет равняться времени визуаль-;§ ного поиска следующей клавиши. Компоте нента обратной связи представляет собой

0 время, необходимое для проверки коррект-§ ности набранного символа/слова. В работе те [13] наглядно показано, что применение | предикативной системы действительно вез дет за собой уменьшение времени физиче-<| ского перемещения указательного устрой-

1 ства (уменьшение КНКС), но в то же время J увеличивает время подготовки действия,

благодаря чему скорость набора остается прежней.

Кроме указанного недостатка стоит отметить тот факт, что сравнение принципиально различных методов ввода с использованием данной метрики нецелесообразно. Причина этого — разное время взаимодействия различных способов ввода. К примеру, КНКС = 1 для виртуальной QWERTY клавиатуры без предикативной системы и MDITIM [12] (при использовании сенсорного экрана MDITIM является способом рукописного ввода текста), однако скорости набора этих методов соответственно равны 30,1 слов/мин [17] и 6,8 слов/мин [2].

В работе [17] предложена модель оценки скорости набора текста на виртуальной клавиатуре. Моделирование возможно для двух групп пользователей: новичков и экспертов. Принципиальное различие между указанными группами заключается в том, что кроме моделирования перемещения указательного устройства (в данном случае стилуса) при помощи закона Фиттса [8] у новичков ко времени ввода символа также прибавляется время визуального поиска. Считается, что эксперты настолько хорошо знакомы с раскладкой, что для них время подготовки действия равно 0. Время визуального поиска рассчитывается по закону Хика [9]. Модель учитывает динамическую природу языка посредством использования вероятности диграфов.

Основное достоинство описываемой методики — простота расчета, однако модель обладает узкой направленностью (моделирование только виртуальных клавиатур без предикативных систем) и не учитывает компоненту обратной связи.

Группа методов, основанных на KLM-GOMS [6], включает в себя модели [7, 13, 15]. Указанные методы являются одними из самых точных (ошибка оценки абсолютного значения скорости набора не превышает 10% [13]), поскольку учитывают время проверки корректности ввода и применение различных предикативных систем. Параметрическая природа моделей позволяет оценивать принципиально различные способы ввода.

№ 3 (39) 2012

В работе [10] предложен эмпирический метод парных действий для расчета моторной компоненты (перемещения указательного устройства и взаимодействия). Его суть заключается в проведении опыта по замеру минимального времени, необходимого пользователю для ввода всех диграфов, и расчете, на основе результатов эксперимента, среднего времени ввода символа. Совокупность лингвистической модели (вероятности диграфов выбранного языка) и эмпирически получаемых данных делают этот метод самым точным способом оценки пиковой скорости набора текста [2].

Параметрическая модель ввода текста

Предлагаемый метод позволяет создать параметрическую модель практически любого способа ввода текста. Метод включает несколько техник, которые используются для моделирования:

1) человеко-машинного взаимодействия при наборе текста;

2) влияния предикативных систем на эффективность способа ввода;

3) влияния различий в поведении пользователей.

Применение техник первой группы позволяет создать модель простого способа ввода. Базовая формула расчета времени, необходимого для набора символа или слова, состоит из трех компонент:

Тввода Т'подготовки + Т'взаимодействия + Т'контроля' (1)

Рассмотрим компоненты на примере модели аппаратной клавиатуры сотового телефона. Время выбора клавиши вычисляется по следующей формуле:

Т

_ клавиши

Рдиграфаи,I ); 5 (/,} ) — время перемещения пальца с клавиши с /-м символом на клавишу с¡-м символом и нажатие на последнюю. Оператор 5 относится к моторной компоненте ((^взаимодействия в формуле (1)) и рассчитывается на основе обсуждавшегося выше метода парных действий.

Для выбора конкретного символа пользователю необходимо нажать клавишу определенное количество раз (соответствует позиции символа на кнопке):

Т„,

повторного _ нажатия

= 1Рсимвола (/) • П - 1) • 5(/,/) + V',

(3)

где Л — это алфавит языка ввода; РЖола (О — вероятность ввода /-го символа, полученная на основе корпуса С; п1 — позиция /-го символа на клавише; Усимвола — время, необходимое для визуального контроля символа без перевода взгляда. Оператор V относится к компоненте обратной связи (Тконтроля в формуле (1)).

Итоговое время ввода символа для пользователя, не знакомого с раскладкой, будет вычисляться по формуле:

Т

новичок

символа

+ V,.,,

= Н(к)+Тв

выбора _ клавиши

+ Т

повторного _нажатия'

(4)

= 1 РД,граФа (/, ¡) • ЭД ¡), (2)

где С — это корпус2 языка ввода; / и \ — соответственно, первый и второй символы диграфа, вероятность ввода которого равна

где Н (к) — время визуального поиска среди символов алфавита А, где к — длина этого алфавита; Vсиuвола — время, необходимое для переноса взгляда с клавиатуры в точку ввода, проверки корректности введенного символа и возврата взгляда обратно на клавиатуру. Оператор Н относится к компоненте подготовки действия (Т^^ки в формуле 1) и рассчитывается на основе закона Хика [9] по следующей формуле:

со о

а

со

5

со

I

<0

Н(к) = Ь • 1од2(к +1).

(5)

2 Лингвистическим корпусом называется совокупность текстов, объединенных по какому-либо признаку.

В данном контексте диграфы и их вероятности рассчитываются на основе указанного корпуса.

73

№ 3 (39) 2012

Тподготовки не всегда равно времени визуального поиска Н. Для некоторых способов ввода, к примеру MDITIM, визуальная подсказка доступна только в период обучения, в дальнейшем пользователь вводит росчерки по памяти. В таком случае Тподготовки равно оператору ментальной подготовки Тм модели KLM-GOMS.

Способы ввода текста, используемые незрячими, поддерживают обратную связь посредством автоматического синтеза голоса [3]. В этом случае время, необходимое для контроля набранного символа, будет вычисляться по формуле:

Т„

= 1 Ра

а (/) • Я(/),

(6)

1 I

о 1=

е

о

со §

§

I!

£

о

I £

е

I

I I

I

¡8

е

0

1

£

Й

I ?

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

I I

С Р (ы) • (Т

^ 1 слова"" > V ' В

ввода ~ +т

Ш + ' г

ввода_слова

дополнительных _ действии

(Ш)+ (Ш))'

(7)

где С — это не лемматизированный корпус языка ввода (лемматизированным называется корпус, содержащий только слова в нормальной форме); ш — словоформа из корпуса С.

Рассмотрим модель StrokeIM — способа ввода, предложенного в работе [1]. Предположим также, что он дополнен префиксной предикативной системой [19]. В отличие от предикативных систем со словарем, указанная вспомогательная система предлагает наиболее вероятный символ, основываясь на уже введенной части слова. В случае, когда предложенный символ не соответствует желаемому, пользователь должен, последовательно касаясь экрана, выбрать необходимый символ. Формула вычисления

времени ввода у-го символа после уже введенного блока символов Ь1 выглядит следующим образом:

S(b|, у) = S(i, У) + V 'символа +

■ + V' )

у \ повторного_касания символа'

(8)

где И (I) — время реакции системы, необходимое синтезатору речи для произношения /-го символа. Оператор И, так же как и V, относится к компоненте обратной связи (Тконтроля в формуле 1).

Когда метод ввода дополнен предикативной системой, необходимо учесть время выполнения дополнительных действий:

П • (Тпо у = агдтах Р(1 IЬ)

1 с

Зt е Ск : Р(11Ь) > Р(у IЬ1)'

где Ск — множество символов группы, в которой находится символ у; Р (у IЬ ) — условная вероятность ввода у-го символа после уже набранного префикса Ь; пу — позиция символа у в группе символов. Время ввода слова экспертом будет равно:

Тслова Р = ^ (Рсловоформы1( -1, С1)) "

+ Т

ввода _пробела '

(9)

где Ы — это длина словоформы ш; с1 — 1-й символ словоформы ы. Мы не рассматриваем событие Ш (ввод конкретной словоформы) как совокупность элементарных событий последовательного ввода символов, поэтому в формуле 9 вероятность ввода словоформы вычисляется следующим образом:

Рсловоформы (ш) ы ,

ы

N'

(10)

где ^ — это частота словоформы ы; N — общее количество словоупотреблений корпуса С.

В общем случае лингвистическая модель предикативной системы и словарный запас пользователя не соответствуют друг другу. Вне зависимости от размера корпуса (который ограничен аппаратными возможностями мобильного устройства) найдутся такие слова, которые в нем не содержатся. В предлагаемой модели обозначенная проблема решается за счет использования двух корпусов: первого — для моделирования преди-

74

0

+

ы

I=1

№ 3 (39) 2012

кативной системы; второго — для имитации словарного запаса пользователя. В приведенном выше примере с моделированием в^океМ условные вероятности в формуле 8 должны быть рассчитаны на основе большого корпуса, моделирующего префиксную предикативную систему. Корпус С в формуле 9, напротив, должен содержать слова разговорного стиля и иметь небольшой размер.

Некоторые методы ввода позволяют использовать их несколькими различными способами. К примеру, виртуальная ЙЦУКЕН клавиатура, дополненная предикативной системой с завершением слов, допускает следующие варианты поведения пользователя:

• набор каждого символа в слове, игнорируя список предлагаемых слов;

• поиск слова в списке после ввода первого символа;

• поиск слова в списке после ввода двух символов и т. д.

Порядок действий пользователя при наборе текста с использованием конкретного метода называется стратегией ввода. Рассмотрим модель ЙЦУКЕН клавиатуры с функцией завершения слов. Для начала необходимо вычислить время ввода одного символа:

С

ТсимвоЛРа _ ^ Рдиграфа (/'> ¡) • 5(/, А (11)

/, I

Далее определим стратегию ввода для случая поиска слова в списке из трех вариантов после набора d-го символа:

Общая формула вычисления времени на- §

бора слова с использованием выбранной ¡|

стратегии ввода записывается следующим ^

образом: ^

3

Т эксперт_

слова <5

С *

_Ур ф М) • ) + V + Т ,(13) 2

/ ' словоформы/ \ ' \ ' ' слова символа' 4 ' ^

М

где Тсимвола суммируется по причине ввода знака пробела после каждого слова.

До этого момента рассматривалась ситуация безошибочного набора текста, однако с определенной долей вероятности пользователь периодически вводит некорректный символ. Для большей точности оценки это обстоятельство должно быть учтено в предлагаемой модели. Рассмотрим случай набора текста экспертом на виртуальной QWERTY/ЙЦУКЕН клавиатуре без предикативной системы. Поскольку набор текста с использованием данного метода невозможен вслепую, пользователь контролирует ввод после каждого слова. Также предположим, что клавиатура имеет специальный способ для стирания слова целиком, а не по одному символу. В таком случае стратегия ввода будет записана как:

5Иы,Рошибки) _ Ы • Т +

символа символа

+ р^^(|р°0ибш) (в + у • т ), (14)

слова \| символа' \ удаления \ \ символа <" \ 1

рошибки ( I рошибки ) _ 1 _ (1 _ рошибки )1 (15)

слова V ' символа ' V символа ' ' V '

) _

М • Тси d • Тсим

d • Т„„

+ Н(3) + в(д), + Н(3) + (п _ d)(Tси

|м| < d |м| > d,п < d + Н(3)) + в(д), |м| > d,п > d,п < |м|

d • Тсимвола + (|М\ _ ^символа + Н(3))

м > d,п > м

(12)

где в(д) _ ^Рсимвола(/) • в(/,д) — это время выбора д-го слова из списка предложенных, д —

/

это номер слова в списке; п — номер набранного символа, после которого желаемое слово появляется в списке.

75

№ 3 (39) 2012

где Тсимвола вычисляется по формуле 11; вероятность опечатки в слове вычисляется по формуле 15, так как события «появление ошибки в п-ом символе» совместно независимы. Тогда общая формула вычисления времени набора слова:

тэксперт _

слова

CP,

словоформы

(w) • St(w,POUJибки)+

\ / Vv к »' символа '

(16)

I I

о с

е

о

со §

! §

£ о

i

¡§

е

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

I

1

is «

I

S

S3 5

0

1

£

is ?

i ss

S

I

где РИМба — константа для выбранного метода ввода [2], которая может быть получена в ходе короткой серии экспериментов.

Для всех перечисленных выше моделей итоговая скорость набора текста (обозначим ее через Е) будет рассчитываться по следующим формулам:

E = 60 • (Тси

1симв / мин,

E = 60 • l • (Тслова) 1симв / мин,

(17)

(18)

где I — средняя длина слова в корпусе С, рассчитанная с учетом вероятности употребления словоформ:

l = 1P

словоформы

(w) • Iwl

(19)

Верификация модели

Для определения точности оценки предлагаемой модели были проведены три серии экспериментов. Основная, третья, серия состояла в замере скорости набора текста с использованием трех принципиально различных методов ввода новичками и экспертами. Крайние случаи (новички и эксперты) выбраны по той причине, что найти достаточное количество людей с идентичным уровнем владения тем или иным методом ввода не представляется возможным. Замеру времени подготовки действия абсолютными новичками посвящен первый эксперимент. Второй эксперимент был проведен с целью замера парных действий для выбранных методов ввода текста.

Эксперимент 1:

определение коэффициента b в формуле Хика

Целью данного эксперимента явилось определение значения оператора H предлагаемой модели для случая абсолютно незнакомой пользователю раскладки. В эксперименте приняло участие 15 человек. Средний возраст составил 24,8 (а = 7,0) года, уровень знания английского испытуемых — не ниже среднего.

В качестве тестового оборудования использовался планшет Samsung Galaxy Tab 7 (P1000) на базе ОС Android с 7-дюймовым сенсорным экраном проекционно-емкостно-го типа. Программное обеспечение (ПО) было разработано с использованием Android SDK.

Эксперимент состоял в поиске символа на виртуальной клавиатуре со случайной раскладкой. Расположение клавиш соответствовало стандартной ЙЦУКЕН клавиатуре для русского языка (32 символа, без буквы ё) и QWERTY клавиатуре для английского (26 символов), в то время как расположение символов менялось с каждым новым опытом. В задачу пользователя входило запоминание символа, который нужно было найти (символ выбирался случайным образом), для начала поиска ему требовалось коснуться экрана. После нахождения символа испытуемый выбирал его, затем все повторялось сначала. Каждый участник эксперимента повторял опыт более 100 раз.

Среднее время визуального поиска среди 32 объектов составило 2,11 с, среди 26 объектов — 1,88 с. Оба результата получены с учетом компенсации времени на перемещение пальца. Коэффициент b в формуле Хика был получен методом наименьших квадратов и равен 0,41 (R2 = 0,75).

Эксперимент 2: замер парных действий

В эксперименте участвовало 7 человек, средний возраст которых составил 27,3 (а = 8,8) лет. Для замера времени парных действий было разработано специальное ПО с учетом рекомендаций работы [10]. Данные были собраны для следующих методов

76

w

№ 3 (39) 2012

ввода: виртуальные ИЦУКЕН и клавиатура Дворака [18], MDITIM и StrokeIM. Результаты эксперимента представляют собой таблицы парных действий, которые не включены в работу по причине ограниченного объема публикации.

Эксперимент 3:

замер скорости ввода текста новичков и экспертов

Условия проведения эксперимента соответствуют условиям выполнения эксперимента 1.

В процессе проведения опытов использовалось то же ПО, что и в работе [2] за исключением того, что предикативная система StrokeIM была изменена на префиксную. Лингвистическая модель указанного метода ввода была построена на базе Национального корпуса русского языка [4], а точнее на основе случайной выборки предложений объемом 180 тысяч словоупотреблений, которая доступна свободно.

Участникам требовалось как можно быстрее ввести предложенные тестовые фразы, которые они предварительно запомнили. Методы ввода были выбраны по следующему принципу. Первая серия опытов, в которой использовался MDITIM, ставила своей целью подтвердить целесообразность использования операторов Тм и V. Для оценки скорости набора использовались модели указанного метода ввода:

СГоГ = Н(27) + Тм +

Р„а (', У) • S(i,у) + ус_; (20)

IУ

с

Т эюперт = у р (/У) • S(| ¡) + V' (21)

симвопа / , диграфа^ ' 1 > V ' -/ > символа' V >

I, У

Время оператора визуального поиска Н рассчитано на основе данных эксперимента 1 и составило 1,97 с для символов английского алфавита, включая знак пробела, и 2,09 с для русского алфавита. Вероятность диграфов была рассчитана на основе тестовых фраз. Оператор ментальной под-

готовки Тм включен в формулу (20) по той причине, что вычерчивание росчерка из алфавита MDITIM не является элементарной задачей (как, например, нажатие на кнопку) для пользователя, с ним не знакомого. По сути, участники эксперимента перерисовывали росчерк с шаблона, что занимает больше времени, чем рисование объекта по памяти, как в случае с формулой 21. Время оператора ментальной подготовки взято из книги [6] и равно 1,1 с. Время визуального контроля рассчитано на основе данных из работы [15] и равно: Vсимвола (без перевода взгляда) = 0,14 с УсИШола = 0,42 с,

V слова (без перевода взгляда) = 0,4 с Услова =

= 0,68 с.

Использование второго метода ввода — переработанного StrokeIM — имело своей целью доказать целесообразность использования лингвистической модели на основе корпусной лингвистики. Модель метода, используемого экспертом, соответствует таковой в формулах 8 и 9. Для новичка время ввода символа после указанного префикса будет вычисляться по формуле:

S(b!, У) = Н(33) + S(i, У) + Усимвопа +

0,

ПУ ( Тповторного _ касания

у = агдтах Р(: IЬ)

+ V'.

з: е Ск : Р(: IЬ,) > Р(у I Ь,)

(22)

Раскладка для экспертов соответствовала стандарту ISO/EC 9995-8 (русский язык), для новичков расположение символов было задано случайным образом.

Опыты с двумя виртуальными клавиатурами проводились с целью доказательства необходимости включения понятия «стратегия ввода» в предлагаемую модель. При вводе с использованием клавиатур испытуемых просили придерживаться определенных правил, а именно: нельзя оставлять ни одной ошибки и для коррекции слова можно пользоваться только жестом «удалить слово целиком» (росчерк, начинающийся с любой клавиши влево). Модель ИЦУКЕН клавиатуры при вво-

о

а

со

5

со

I

<0

77

+

№ 3 (39) 2012

де текста экспертом отображена в формулах 14 и 16. Поскольку в настоящее время достаточно трудно найти людей, не знакомых с раскладками QWEЯTY/ЙЦУКЕН, в эксперименте использовалась раскладка Дворака. Стратегия ввода с ее использованием:

St(w,POUJибки)=\w\ ■ (H(27)+T

V ' символа ' | V V > си

а)+

+P

ошибки слова

(| w| PC

ошибки \ символа '

■(Tä

,+ W ■ т„.

(23)

1 I

о с

е

о

со §

! 8

£ о

i

¡§

Й I

1

ss «

I

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

S 1а

5

0

1

£

Й !

и

ü ss

S

I

где вероятность ошибки в символе была получена на основе реальных опечаток участников эксперимента.

Результаты эксперимента, а также оценки скорости набора, приведены в табл. 1.

Второй столбец в табл. 1 был рассчитан на основе методики, предложенной в работе [16]. Причем, для первых четырех строк процент ошибок соответствует показателю INF (неисправленных опечаток), в то время как для виртуальных клавиатур значение данного столбца получено на основе показателя F (количества коррекций).

Ошибка оценки (четвертый столбец табл. 1) рассчитана как разница между реальной скоростью набора и ее оценкой, деленная на реальную скорость ввода и умноженная на 100 для приведения к процентам.

Обсуждение результатов

Как видно из таблицы 1, ошибка оценки не превысила 8%, а среднее значение ошибки предлагаемого метода моделирования составило 5,4%, что ниже соответствующего показателя модели KLM-GOMS и наиболее точной на текущий момент модели, предложенной в работе [13].

Как уже было сказано, при моделировании метода StrokeIM в качестве второго корпуса использовался корпус, состоящий из тестовых фраз. Интересно взглянуть на оценку способа ввода с использованием только одного корпуса для моделирования предикативной системы (табл. 2).

Как видно из табл. 2, использование лингвистической модели на основе двух корпусов дает более точную оценку.

Таблица 1

Результаты эксперимента и оценки скорости ввода

Наименование метода Скорость ввода по результатам замера, симв./мин. Количество ошибок при наборе, % Оценка скорости ввода, симв./мин. Ошибка оценки, %

MDITIM (новички) 14,0 9,7 14,8 5,7

MDITIM (эксперты) 81,3 4,7 85,7 5,4

StrokelM (новички) 18,0 5,2 19,4 7,8

StrokelM (эксперты) 88,2 3,2 82,2 6,8

Клавиатура Дворака 26,9 3,3 25,8 4,1

Клавиатура ЙЦУКЕН 181,0 1,5 176,5 2,5

Таблица 2

Сравнение лингвистических моделей

Наименование метода 2 корпус 1 корпус

Оценка скорости ввода, симв./мин Ошибка оценки, % Оценка скорости ввода, симв./мин Ошибка оценки, %

StrokelM (новички) 19,4 7,8 20,3 12,8

StrokelM (эксперты) 82,2 6,8 101,7 15,3

78

ПРИКЛАДНАЯ ИНФОРМАТИКА /-

' № 3 (39) 2012

Оценка эффективности различных способов ввода не является единственной задачей, которая может быть решена при помощи предлагаемого метода моделирования. Но перед тем как перейти к обсуждению других возможностей, необходимо рассмотреть параметры модели, которые образуют следующие группы:

1) характеристики пользователей;

2) вероятности ошибок;

3) параметры способов ввода;

4) параметры предикативных систем.

К первой группе относятся параметры, которые зависят только от человека, использующего рассматриваемый метод ввода. К ним относятся оператор визуального поиска (Н), оператор ментальной подготовки (Тм) и оператор визуального контроля (V). Их значения можно варьировать в узких пределах с оглядкой на физические ограничения пользователя.

Вторая группа — это как бы промежуточное звено между параметрами человека и разрабатываемой системы, поскольку формально вероятность ошибок является характеристикой способа ввода, но ее значение можно определить только эмпирическим методом.

Третья и четвертая группы включают совокупность характеристик системы ввода. К ним относятся параметры, непосредственно влияющие на время взаимодействия в: характер взаимодействия (использование аппаратных клавиш или сенсорного экрана), форма росчерков для сенсорных методов ввода и расположение символов, а также такие характеристики, как время произношения фразы Я, тип предикативной системы и ее настройки (к примеру, количество предполагаемых слов, одновременно отображаемых на экране).

В зависимости от целей исследования при моделировании способа ввода необходимо варьировать различные группы параметров. Кроме уже обозначенной оценки скорости набора разрабатываемых методов ввода предлагаемая модель может использоваться:

• для оценки эффективности изменений § в дизайне способа ввода; ¡|

• поиска оптимальной стратегии исполь- ^ зования уже готового метода; ^

• настройки параметров предикативной § системы. Л

Первая ситуация подробно описана ^ во введении к данному материалу. Во вто- ■=: ром случае предлагаемая модель используется для выработки рекомендаций по применению уже созданного решения. Проиллюстрируем сказанное на примере.

Рассмотрим наиболее популярный сейчас метод сенсорного ввода текста — виртуальную клавиатуру, дополненную предикативной системой с завершением слов. В лучших реализациях используется фиксированное количество предлагаемых слов (примем его равным 3). Также примем параметр Ь в формуле Хика равным 0,41. Рассчитаем скорость ввода для модели ЙЦУКЕН клавиатуры (формулы 11-13) для различных стратегий ввода (поиска слова в списке из трех вариантов после набора d-го символа, где d е [0,10] и для случая ввода символов, когда пользователь не обращает внимания на список предлагаемых слов).

На рисунке 1 столбцы диаграммы, обозначенные БП, показывают скорость набора текста без использования предикативной системы (БП). Из графиков видно, что ее использование оправданно только для людей, не знакомых с раскладкой клавиатуры (новички), в то время как использование предикативной системы экспертами лишь замедляет скорость набора. Оптимальная стратегия ввода для новичков — контроль списка предлагаемых слов, начиная с ввода третьего символа.

Популярным направлением исследований в настоящее время является разработка достаточно сложных предикативных систем, которые учитывают вероятности не только отдельных слов, но и их последовательностей (так называемых М-грамм). Понятно, что такие системы имеют большое количество параметров, оценка изменений которых на основе метрики типа КНКС не всегда показательна,

-ч ПРИКЛАДНАЯ ИНФОРМАТИКА

№ 3 (39) 2012 ' -

23456789 10бп Стратегия ввода (d)

23456789 10 бп Стратегия ввода (d)

Рис. 1. Диаграмма зависимости скорости набора от стратегии ввода для новичков (слева) и экспертов (справа)

в то время как применение предложенного метода моделирования позволяет увидеть реальную картину происходящего. В приведен-

§ ном выше примере использование предика-

§ тивной системы при наборе текста на вирту-

| альной ЙЦУКЕН клавиатуре снижает КНКС

| до 0,56 (рассчитано на базе случайной вы-

| борки предложений Национального корпуса

| русского языка), однако увеличение скорости

>| происходит только для определенной группы

& пользователей (абсолютных новичков). |

£ Заключение

¡§

ё Возвращаясь к задаче, поставленной ¡в во введении, стоит отметить, что предло-з женный в статье метод моделирования от-£ вечает всем перечисленным выше требовало ниям. Для расчета вероятности ошибок достаточно провести несколько эксперимен-|| тов с небольшим количеством испытуемых, ;§ в то время как большинство характеристик * пользователей можно взять из существую-

0 щей литературы. Лингвистическая модель § на основе двух корпусов позволяет с высоко кой точностью оценить различные предика-| тивные системы, а использование метода з парных действий для замера моторной ком-<| поненты предложенной модели позволяет

1 работать с принципиально различными спо-^ собами ввода текста. Реализация модели

в виде компьютерной программы позволяет

?! увеличить удобство расчетов и может быть

выполнена на множестве языков программирования. Учет индивидуальных особенностей пользователя основан на применении понятия стратегии ввода.

Рассмотренный метод не применим в случае, когда время перемещения указательного устройства зависит от внешних параметров, к примеру, с его помощью нельзя оценить метод набора текста вслепую на виртуальной клавиатуре [3], применяемый в мобильной операционной системе iOS. Также нельзя оценить метод ввода Dasher [20] и системы распознавания слитного рукописного ввода, однако это не является проблемой, так как они не получили широкого распространения.

Предложенная модель комбинируется с другими моделями [5, 11]. С помощью метода, предложенного в работе [5], можно рассчитать время моторной компоненты для способов ввода, использующих росчерки, таких как SHARK [22], MDITIM, StrokelM и др. Для моделирования пользователей с определенным уровнем владения тем или иным методом ввода время подготовки действия может быть рассчитано с использованием кривой обучения [21].

Для оценки эффективности способа ввода текста в предложенном методе моделирования были впервые использованы:

• лингвистическая модель на основе двух корпусов;

• вероятностная модель опечаток пользователя.

80 у

№ 3 (39) 2012

Все это позволило создать наиболее точную модель для оценки эффективности взаимодействия пользователя с мобильным устройством в задаче ввода текстовой информации, что наглядно иллюстрируют результаты экспериментов.

Список литературы

1. Манахов П. А. Разработка слепого метода ввода текста для мобильных устройств с сенсорным экраном // Всероссийский конкурс научно-исследовательских работ студентов и аспирантов в области технических наук в рамках Всероссийского фестиваля науки: Сборник аннотаций научно-исследовательских работ победителей и призеров всероссийского конкурса. М.: РИО МГУДТ, 2011.

2. Манахов П. А, Ковшов Е. Е. Применение инновационных решений для слепого ввода информации посредством сенсорной поверхности // Современные проблемы науки и образования. № 2. 2012. URL: http://www.science-education.ru/102-5847.

3. Манахов П. А., Ковшов Е. Е. Совершенствование метода сенсорного ввода текста для людей с ограниченными возможностями зрения // Прикладная информатика. № 1. 2012. С. 75-84.

4. Национальный корпус русского языка. URL: http://www.ruscorpora.ru/index.html.

5. Cao X., Zhai S. Modeling human performance of pen stroke gestures // In CHI '07: Proc. ACM Conference on Human Factors in Computing Systems. 2007. P. 1495-1504.

6. Card S. K, Moran T. P., Newell A. The Psychology of Human Computer Interaction // Lawrence Er-Ibaum Associates. 1983.

7. Dunlop M. D, Crossan A. Predictive text entry method for mobile phones // Personal Technologies, 4 (2-3). 2000. P. 1-10.

8. Fitts P. M. The information capacity of the human motor system in controlling the amplitude of movement // Journal of Experimental Psychology, 47:6. June 1954. P. 381-391.

9. Hick W. E. On the rate of gain of information // Quarterly Journal of Experimental Psychology, 4:1. 1952. P. 11-26.

10. Hughes D, Warren J., Buyukkokten O. Empirical Bi-Action Tables: A Tool for the Evaluation and Optimization of Text-Input Systems. Application I: Stylus

Keyboards // Human-Computer Interaction. Vol. 17. 2002. P. 131-169.

11. Isokoski P. Model for Unistroke writing time // Proc. ACM CHI Conference on Human Factors in Computing Systems. 2001. P. 357-364.

12. Isokoski P., Raisamo R. Device independent text input: A rationale and an example // In Proc. AVI 2000. ACM, New York. 2000. P. 76-83.

13. Koester H. H, Levine S. P. Model Simulations of User Performance with Word Prediction // Augmentative and Alternative Communication, 14:1. 1998. P. 25-35.

14. MacKenzie I. S. KSPC (keystroke per character) as a characteristic of text entry techniques // Proceedings of the Fourth International Symposium on HumanComputer Interaction with Mobile Devices. Heidelberg, Germany: Springer-Verlag. 2002. P. 195-210.

15. Pavlovych A, Stuerzlinger W. Model for non-expert text entry speed on 12-button phone keypads // SIGCHI Conference on Human Factors in Computing Systems, Australia. 2004. P. 351-358.

16. Soukoreff R. W, MacKenzie I. S. Metrics for text entry research: An evaluation of MSD and KSPC, and a new unified error metric // Proceedings of the ACM Conference on Human Factors in Computing System — CHI 2003. New York: ACM. 2003. P. 113-120.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

17. Soukoreff R. W, MacKenzie I. S. Theoretical upper and lower bounds on typing speed using a stylus and soft keyboard // Behavior & Information Technology, 14. 1995. P. 370-379.

18. US2040248: Typewriter keyboard, 1936. URL: http://www.google.com/patents/about? id=WSNkAAAAEBAJ.

19. US6219731: Method and apparatus for improved multi-tap text input, 2001. URL: http://www.google.com/ patents?id=6M0GAAAAEBAJ.

20. Ward D. J., Blackwell A. F, MacKay D. J. C. Dasher: A data entry interface using continuous gestures and language model // Preceedings of the UIST 2000 Symposium on User Interface and Software Technology, CHI Letters 2 (2). New York: ACM. 2000. P. 129-137.

21. Wright T. P. Factors Affecting the Cost of Airplanes // Journal of Aeronautical Sciences, 3 (4). 1936. P. 122-128.

22. Zhai S., Kristensson P.-O. Shorthand writing on stylus keyboard // Proceedings of the CHI' 2003, ACM Conference on Human Factors in Computing Systems, CHI Letters 5 (1). 2003. P. 97-104.

о

a

CO

5

Co

I

iS

Ci

81

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Манахов П. А., Ковшов Е. Е.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Манахов П. А., Ковшов Е. Е.

Текст научной работы на тему «Модели и методы интерактивного взаимодействия с вычислительными устройствами нового поколения»