Научная статья на тему 'Анализ технологий и имеющегося на рынке программного обеспечения для людейс ограниченными физическими возможностями'

Анализ технологий и имеющегося на рынке программного обеспечения для людейс ограниченными физическими возможностями Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
159
37
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕХНОЛОГИИ СПЕЦИАЛЬНЫХ ВОЗМОЖНОСТЕЙ / ASSISTIVE TECHNOLOGY / ИНТЕРФЕЙС / INTERFACE / ОГРАНИЧЕННЫЕ ФИЗИЧЕСКИЕ ВОЗМОЖНОСТИ / PHYSICAL DISABILITIES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Алексеева Н. А., Емельченко А. Н., Емельченко Н. Г., Алексеев В. В., Алексеева Н. С.

Цель: Исследование рынка компьютерных систем и технологий, предназначенных для обеспечения эффективной работы на персональном компьютере лицам с ограниченными физическими возможностями.Материалы и методы: аналитический обзор публикаций, представленных на специализированных сайтах в интернете. Сопоставляются цена и качество предлагаемого продукта.Результаты: Проведен анализ технологий и программного обеспечения этих технологий, имеющихся на рынке и предназначенных для людей с ограниченными физическими возможностями пользование компьютером, либо желающими сделать работу более комфортабельной за счет смены интерфейса.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE TECHNOLOGY AND AVAILABLE IN THE MARKET SOFTWARE FOR PEOPLE WITH DISABILITIES

Purpose. Research of the market of computer systems and technologies, designed for efficient operation on a personal computer for persons with disabilities.Materials and methods.

Текст научной работы на тему «Анализ технологий и имеющегося на рынке программного обеспечения для людейс ограниченными физическими возможностями»

ОБЗОРЫ Журнал фундаментальной медицины и биологии

УДК 616-036.865:51-3

Н.А. Алексеева1, А.Н. Емельченко2, Н.Г. Емельченко2, В.В. Алексеев1, Н.С. Алексеева1

АНАЛИЗ ТЕХНОЛОГИЙ И ИМЕЮЩЕГОСЯ НА РЫНКЕ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ ЛЮДЕЙ С ОГРАНИЧЕННЫМИ ФИЗИЧЕСКИМИ ВОЗМОЖНОСТЯМИ

'Ростовский государственный медицинский университет 2Северо-Кавказский государственный университет

Цель: Исследование рынка компьютерных систем и технологий, предназначенных для обеспечения эффективной работы на персональном компьютере лицам с ограниченными физическими возможностями.

Материалы и методы: аналитический обзор публикаций, представленных на специализированных сайтах в интернете. Сопоставляются цена и качество предлагаемого продукта.

Результаты: Проведен анализ технологий и программного обеспечения этих технологий, имеющихся на рынке и предназначенных для людей с ограниченными физическими возможностями пользование компьютером, либо желающими сделать работу более комфортабельной за счет смены интерфейса.

Ключевые слова: технологии специальных возможностей, интерфейс, ограниченные физические возможности.

N.A. Alexeeva1, A.N. Emelchenko2, N.G. Emelchenko2, V.V. Alexeev1, N.S. Alexeeva1

THE TECHNOLOGY AND AVAILABLE IN THE MARKET SOFTWARE FOR PEOPLE WITH DISABILITIES

1Rostov State Medical University 2North-Caucasian State University

Purpose. Research of the market of computer systems and technologies, designed for efficient operation on a personal computer for persons with disabilities.

Materials and methods. Literature review presented at specialized sites on the Internet. The price and quality of the product are compared.

Results. The analysis of the available technology and the software market these technologies for people with disabilities using a computer, or want to make the work more comfortable by changing the interface is made.

Key words: assistive technology, interface, physical disabilities.

Цель работы. Исследование рынка компьютерных систем и технологий, предназначенных для обеспечения эффективной работы на персональном компьютере лицам с ограниченными физическими возможностями. Специальные возможности позволяют предоставлять доступ к продуктам и службам всем, кто в этом нуждается, а продукты, поддерживающие эти возможности, могут быть настроены в соответствии с потребностями и предпочтениями самых разных пользователей.

Методика. Методикой исследования является аналитический обзор публикаций, представленных на специализированных сайтах в интернете.

Результаты. Под «технологиями специальных возможностей» понимается любое программное, аппаратное или аппаратно-программное решение, призванное повысить, сохранить или оптимизировать функциональные способности людей с огра-

ниченными возможностями. Причем такое решение может быть встроенной функцией продукта, сторонним его расширением или вообще отдельным продуктом.

Поддержка специальных возможностей дает преимущества как пользователям с нарушениями моторной функции и рядом других патологических процессов, так и тем, у кого эти нарушения отсутствуют, поскольку повышение уровня удобства и безопасности делает работу всех пользователей более эффективной.

Технологии специальных возможностей — это компьютерные технологии, которые позволяют пользователям настраивать компьютеры в соответствии со своими физическими возможностями.

Например, пользователь в силу определенных проблем со здоровьем (нарушение подвижности и гибкости вследствие травм и ряда заболеваний,

Журнал фундаментальной медицины и биологии

ОБЗОРЫ

таких как церебральный паралич, рассеянный склероз, потеря пальцев и конечностей, повреждения спинного мозга, туннельный синдром и другие) не может работать с компьютером традиционным способом, используя клавиатуру и мышь. Такому пользователю работа с компьютером может быть обеспечена на основе технологии голосового управления. Несомненно, что данные технологии особенно важны в индивидуальном обучении учащихся [1].

Согласно [2], первыми бытовыми устройствами с голосовым управлением были сотовые телефоны и стиральные машины. В настоящее время голосовое управление имеют автомобили, музыкальные центры, кондиционеры, лифты и, конечно же, персональные компьютеры.

Речевые технологии - технологии 21-го века, благодаря которым появилась возможность управлять компьютером с помощью голоса, диктовать текст, слушать, а не читать книги, а в перспективе общаться с компьютером на интеллектуальном уровне. Основными направлениями исследований в этой области являются: распознавание речи, синтез речи, средства речевого управления, идентификация по образцу речи.

Системы распознавания речи, называемые также системами распознавания голоса, позволяют пользователям отдавать команды и вводить данные с помощью голоса, а не с помощью клавиатуры и мыши. Системы распознавания голоса используют подключенный к компьютеру микрофон и позволяют создавать текстовые документы и сообщения электронной почты, работать в Интернете и пользоваться системой навигации приложений с помощью голосовых команд.

Обычно в голосовое управление компьютером входят следующие функции: возможность включать и управлять режимами работы компьютера; запускать файлы и редактировать их; подключать голосовые интерфейсы различных программ (Skype, ICQ, видеоплееры); создавать (не во всех программах) небольшие заметки и управлять будильником и органайзером; запускать возможность чтения текстов с компьютера с выбором языка, голоса диктора и скорости чтения. Голосовое управление осуществляют как операционные системы компьютеров, так и специальные программы, которые можно установить отдельно.

Распознавание отдельных команд несколько проще, чем распознавание слитного текста, и не требует значительных вычислительных мощностей. Благодаря этому, сегодня существует богатый выбор программного обеспечения (ПО), имеющего небольшую стоимость и высокое качество распознавания команд. Хотя понятия «стоимость» и «качество» являются условными.

«Dragon Naturally Speaking 12». Компания Dragon Systems - лидер в области голосовых технологий - разработала программы, которые «со слуха» вводят в компьютер наговариваемый в микрофон текст на английском (в американском и британском варианте), итальянском, испанском, немецком, французском или шведском языке. Одной из лучших программ для голосового управления

компьютером считается Dragon Naturally Speaking. Эта программа понимает команды открытия/закрытия программ, выключения компьютера, под диктовку человека набирает текст в обычном текстовом редакторе и тому подобное. Эта программа также может распознавать голос и управлять звуковыми настройками компьютера. В ней также встроен учитель правильному произношению слов. Недостатки этой программы: бесплатных и trial-версий под Windows нет, а стоят они от 100 долларов. К тому же Dragon не понимает русского языка, зато с английским справляется на высоком уровне [3].

«DragonDictate for Windows» (розничная цена около $100) производства Dragon Systems, предоставляет возможности диктовки для Microsoft Windows XP и более новых версий Windows. Пакет позволяет виртуально поддерживать многие приложения Windows, включая Corel WordPerfect Suite, Lotus SmartSuite и Microsoft Office. Вы можете также осуществить поддержку других программ, использовав мощный редактор макросов. DragonDictate позволяет диктовать в любом приложении, а также поддерживать широкий набор голосовых команд редактирования и навигации [4]. Однако все это программа может делать только со словами на английском языке. Нужно отметить, что данный продукт действительно отличается высоким процентом точного определения слов, особенно если «натаскать» ее под свой тембр голоса. Только есть одно замечание: программа распознает слова, если четко и отдельно произносить каждое. Голосовое управление здесь также на высоте -поддались управлению все офисные программы Microsoft, интернет-браузеры и почтовые клиенты.

«VoiceNet VRS 2000 v 1.3». Особенность программы состоит в том, что она не анализирует произносимые слова, как это делают другие программы. Во время предварительной тренировки она запоминает ваши варианты произношения команд, причем на русском языке, после чего можно запускать приложения, работать с файлами, управлять окнами программ, "нажимать" кнопки на клавиатуре и даже управлять курсором мышки исключительно голосом. Плюсы: Проста в использовании, можно научить русскому языку. Поддержка разработчика, дальнейшее развитие. Минусы: Нет возможности подстроить структуру программы «под себя». Условия использования: Shareware. [5].

«Realize Voice 4». Данный продукт позиционируется на рынке как многофункциональное средство, позволяющее управлять приложениями и справляться с распознаванием речи. Однако, как показало тестирование, это слегка завышенные заявления. В плане распознавания речи данный продукт оказался очень слабым, чему соответствует очень низкий процент точного определения слов. А вот в плане управления голосовыми возможностями программа заслуживает оваций. Realize Voice 4 легко настраивается на запуск любой сторонней утилиты, будь то Microsoft Word или ICQ. Поддерживается даже работа с макросами. Все это обеспечивает безграничные возможности, даже голосовое управление компьютером на русском язы-

ОБЗОРЫ

Журнал фундаментальной медицины и биологии

ке возможно. А на одну голосовую команду можно установить сразу несколько задач, например: открыть почтовый клиент, подключить спам-фильтр, забрать с сервера все письма на русском языке и удалить письма с английскими заголовками [6].

Программа «Typle 2.0.» — это одна из лучших на сегодняшний день программ для голосового управления компьютером. На сайтах в комментариях к этой программе мнения сходятся. Typle без проблем справляется с командами на русском языке. Перед запуском программу необходимо настроить. Делается это просто и быстро: записываете через микрофон команду и выбираете приложение, к которому она будет привязана. К сожалению, Typle, в отличие от Dragon Naturally Speaking, не может писать тексты под диктовку, все её возможности ограничиваются открытием приложений. Также стоит отметить, что бесплатная версия позволяет записать только 15 голосовых команд, в то время как платная (Premium) — до 450, стоит она не так дорого — 12 долларов [7].

Американские исследователи из Вашингтонского университета разрабатывают новое программное обеспечение, предназначенное для управления компьютером при помощи голосовых команд. Проект носит название «Vocal Joystick». Система в текущей модификации позволяет перемещать курсор по экрану, а также нажимать на кнопки путем произношения в микрофон различных гласных звуков. Так, например, для сдвига стрелки влево достаточно проговорить протяжное «и», а для перемещения вниз - протяжное «у». Программное обеспечение Vocal Joystick ориентировано, прежде всего, на инвалидов или людей с ограниченной подвижностью, которые не могут воспользоваться более традиционными средствами ввода данных - мышью и клавиатурой. По утверждениям исследователей, система Vocal Joystick позволяет выполнять на ПК самые различные операции. При определенных навыках Vocal Joystick можно использовать не только для навигации по веб-страницам и прокрутки документов, но и для работы в графических редакторах, управления игровыми персонажами и так далее. Стоит добавить, что система Vocal Joystick для своей работы требует наличия в компьютере лишь микрофона и звуковой карты. Это выгодно отличает ее от других альтернативных средств ввода данных, отслеживающих движения головы или глаз и, соответственно, нуждающихся в камерах и сложном ПО [8].

Разработанная специально для ввода данных и команд контроля, программа компании Verbex «Voice Systems Listen 3.0 for Windows» ($80) не может быть использована для стандартной диктовки. Программа предоставляет список предусмотренных команд, который изменяется в зависимости от контекста речевой акции и приложения, в котором используется. Предусмотрена возможность добавлять новые команды. Следует отметить несколько сложный процесс тренировки, предусматривающий, в частности, голосовой контроль размера шрифта от 1 до 99. Утешением может служить то, что это придется делать лишь единожды [9].

Подобно DragonDictate, «Simply Speaking Gold» от IBM (розничная цена $75) - программа для голосового контроля, предусматривающая также возможность дискретной диктовки. Прежде чем дать голосовую команду, следует прекратить диктовку. Есть возможность использовать подсказку «Что я могу сказать?», открывающую окно со списком команд, работающим в данном приложении. Сопутствующая документация очень слаба, однако ее расширенный вариант доступен через Интернет

[9].

«Lernout & Hauspie Dictionary 2000» ($20) -прежде всего программа для голосовых команд. Вы можете использовать ее для диктовки в различных Windows-приложениях, а открыв специальное окно, произвести побуквенную транскрипцию слов. Программа компании L&H Now You're Talking Deluxe поддерживает режим непрерывной речи и полный набор голосовых команд. Программа компании Lernout & Hauspie Kurzweil Voice Commands разработана специально для Microsoft Word. Она не поддерживает режим диктовки вообще, однако имеет широкий набор команд редактирования и форматирования [10].

Многие крупные компании вводят поддержку голосовых команд в современные Web-браузеры, что является неплохим дополнением основной их функции. Наиболее яркими представителями являются голосовое управление в «Opera» [11] и Google Voice Search для браузера Google Chrome [12]. Данные модули совершенно бесплатны, но в настоящее время поддерживают только английский язык. Учитывая быстрые темпы развития мобильных систем — смартфонов и планшетных компьютеров - разработчики обратили внимание на возможность управления голосом. На операционной системе Android могут работать UC Browser 8.2.2, Dolphin Browser HD [13, 14], в системе iOC для iPhone и iPad так же встроена поддержка голосового управления[15].

Среди коммерческих программ, работающих с русским языком и дошедших до конечного пользователя, является система "Горыныч", разработанная российской компанией White Computers и фирмой VoiceLock. "Горыныч" состоит из ядра программы Dragon Dictate и русского модуля, разработанного программистами White; он обеспечивает ввод под диктовку русского текста и голосовое управление по-русски (и те же функции для английского языка). В готовой коммерческой версии объем словаря доведен до 10 000 слов, причем она существует в двух вариантах, в одном из которых есть функция пополнения, а в другом ее нет. "Го-рыныч" требует настройки на голос и произношение пользователя, которая в первом приближении занимает несколько часов. В дальнейшем программа и пользователь постепенно учатся все лучше и лучше понимать друг друга. Диктовка осуществляется строго по словам, т.е. после каждого слова нужно делать паузу. Длительность паузы может быть совсем небольшой, так что при достаточном опыте скорость ввода с голоса получается довольно высокая. Пожалуй, серьезнее всего задерживает ввод необходимость дожидаться, пока слово поя-

Журнал фундаментальной медицины и биологии

ОБЗОРЫ

вится на экране, - задержка, разумеется, тем заметнее, чем слабее машина. Качество выполнения функций у нее довольно среднее. Авторы обещают «полноценное управление файлами и документами посредством микрофона» и «полное отсутствие орфографических ошибок в набираемых текстах». На деле приложению может показаться, что было произнесено любое слово или набор слов даже в тихой комнате (посторонние шумы вроде того, что создаёт работающий кулер процессора, не учитывались). С записью текста под диктовку программа не справилась. Цена: 220 долл. для частных лиц, 650 долл. для организаций [9].

«RuVC» (русское голосовое управление) предназначена для управления компьютером с помощью голоса. Позволяет открывать программы, сайты, использовать быстрый поиск, вводить текст, узнавать погоду, новости и т.д. Существует на сегодняшний день в виде вета-версии [16].

«Диктограф» (версия 4.0). Программа распознавания речи "Диктограф" предназначена для управления некоторыми функциями компьютера с помощью голосовых команд и диктовки текста в любой текстовый редактор. Эта программа очень похожа на «Горыныча». Она имеет похожий интерфейс и, к сожалению, также не может похвастаться высоким качеством работы.

«Перпетуум М» (версия 3.0) [17]. Программа распознавания русской речи "Перпетуум М" предназначена для ввода текста голосом с возможностью последующей ручной правки, создания

игровых и обучающих программ с речевым вводом информации, использования в системах "умный дом", повышения скорости набора текстов, заполнения анкет. Из всех рассмотренных программ она справилась настолько плохо, что можно сказать «она вообще не справилась». Попытка надиктовать ей простую заметку для записи в текстовом редакторе оказалась почти невыполнимой задачей: «Перпетуум» слышал совсем не то, что было сказано в микрофон [18].

Тестирование большинства программ распознавания русской речи проведено специалистами лаборатории SLTV.RU [19].

Выводы. При подготовке данного материала были рассмотрены самые популярные программы голосового управления компьютером, но каждая имеет недостатки. Единственная программа, которую можно было бы назвать идеальной — Dragon Naturally Speaking 8. Она умеет достаточно много и со всеми задачами справляется на высоком уровне, имеет поддержку нескольких языков, но, к сожалению, в их число не входит русский. Typle прекрасно понимает русский язык, но умеет не так много, как Dragon. Отечественные же программы показали невысокий результат.

Однако все технологии голосового управления активно развиваются [20, 21], и в будущем мы, возможно, забудем о таких средствах управления компьютером, как мышь и клавиатура, и будем просто говорить компьютеру, что делать, сами при этом занимаясь каким-то другим делом.

ЛИТЕРАТУРА

1. www.microsoft.com/enable/education (дата обращения: 20.08.2012 г.)

2. Интернет-энциклопедия «Википедия». ww.ru.wikipedia.org (дата обращения: 23.09.2012 г.)

3. http://reviews.cnet.com/software/dragon-naturallyspeaking-pr ofessional-8/4505-3513_7-31228939.html (дата обращения: 10.08.2012 г.)

4. http://soft.mail.ru/pressrl_page.php?id=39209 (дата обращения: 24.07.2012 г.)

5. http://www.groverind.com/ (дата обращения: 19.08.2012 г.)

6. http://soft.mydiv.net/win/download-Realize-Voice.html (дата обращения: 27.08.2012 г.)

7. http://prisp.ru/it_servis/it_program/225-typle-20.html (дата обращения: 20.08.2012 г.)

8. http://www.science.compulenta.ru/367670/(дата обращения: 10.08.2012 г.)

9. http://speech-soft.ru (дата обращения: 27.08.2012 г.)

10. http://www.atp.nist.gov/eao/sp950-3/kaii.htm (дата обращения: 27.08.2012 г.)

11. http://bezogranicheniy.ru/news/golosovoe_upravlenie_ opera/2012-03-11-59 (дата обращения: 27.08.2012 г.)

12. http://www.cityblack.ru/popular_news/1617-golosovoj-poisk-google-teper-na-kompyutere.html (дата обращения: 24.07.2012 г.)

13. http://www.comss.info/page.php?al=UCBrowser822 (дата обращения: 30.09.2012 г.)

14. http://www.4tablet-pc.net/news/1178-dolphin-browser-adds-sonar-voice-control.html (дата обращения: 30.09.2012 г.)

15. http://www.ru-iphone.com/forum/index.php?showtopic=20734 (дата обращения: 30.09.2012 г.)

16. http://голос.ригс.рф (дата обращения: 20.08.2012 г.)

17. http://soft.mail.ru/pressrl_page.php?id=38602 (дата обращения: 27.08.2012 г.)

18. http://www.youtube.com/watch?v=InQynd6i_0k (дата обращения: 20.08.2012 г.)

19. http://www.sltv.ru/comments/clip-2077/?sphrase_id=27746 (дата обращения: 27.08.2012 г.)

20. http://www.naset.org/ (дата обращения: 23.09.2012 г.)

21. http://www.speechpro.ru/technologies/ (дата обращения: 23.09.2012 г.)

i Надоели баннеры? Вы всегда можете отключить рекламу.