Научная статья на тему 'Технологии речевого управления для автоматизации производственных процессов'

Технологии речевого управления для автоматизации производственных процессов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
305
61
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Изилов Я. Ю.

Рассматриваются новые технологии для автоматизации различных производственных процессов, которые позволяют осуществить ввод данных, контроль и обеспечить оперативное управление промышленными системами с помощью речевых команд.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Speech control technologies for industrial processes automation

This paper considers new technologies for various industrial processes automation which allows to input data, to carry out the checkup and to realize the operative control of industrial systems with the help of speech commands.

Текст научной работы на тему «Технологии речевого управления для автоматизации производственных процессов»

\ КРАТКИЕ СООБЩЕНИЯ

УДК 621-52:004.52

ТЕХНОЛОГИИ РЕЧЕВОГО УПРАВЛЕНИЯ ДЛЯ АВТОМАТИЗАЦИИ ПРОИЗВОДСТВЕННЫХ ПРОЦЕССОВ

Я. Ю. Изилов,

канд. техн. наук

Санкт-Петербургский государственный политехнический университет

Рассматриваются новые технологии для автоматизации различных производственных процессов, которые позволяют осуществить ввод данных, контроль и обеспечить оперативное управление промышленными системами с помощью речевых команд.

This paper considers new technologies for various industrial processes automation which allows to input data, to carry out the checkup and to realize the operative control of industrial systems with the help of speech commands.

Современное промышленное производство не может обойтись без внедрения высоких технологий. В частности, революционной тенденцией в промышленности стало появление автоматизированных систем, позволяющих осуществить речевое управление, сочетающее множество функциональных возможностей, легкость обучения и эксплуатации.

Одной из них является машиностроительная система автоматического проектирования (САПР) thinkdesign производства итальянской компании think3 S. р. А. На выставке Euromold-2000 впервые была представлена версия этой системы с возможностями речевого управления [12]. Данная САПР функционирует на IBM PC-совместимом компьютере под управлением операционной системы Microsoft Windows. В последней версии САПР полностью интегрирован речевой интерфейс, который предоставляет пользователю простой, быстрый и более естественный способ создания конструкции. Такой подход позволяет ему сосредоточить внимание именно на конструкции, а не на работе с многочисленными меню, командными строками и т. д. Это нововведение отразилось на стиле графического интерфейса пользователя (рис. 1).

Старый стиль (рис. 1, а) показывает традиционное диалоговое окно, которое содержит все опции управления, собранные в одном большом элементе графического интерфейса. Опции управления в диалоговом окне занимают значительную часть площади экрана и уменьшают обзорность проектируемой конструкции.

а)

б)

Рис. 1. Графический интерфейс пользователя: а — старый стиль; б — новый стиль, содержащий мини-диалоги

ЕГЗШ Л'

В отличие от старого, новый стиль (рис. 1, б) показывает элементы управления в графическом окне. При этом используются новые элементы графического интерфейса, так называемые мини-диалоги, которые не скрывают графическое поле конструкции. Команды управления, входные параметры и геометрические атрибуты конструкции, представленные в мини-диалогах, распределены в стратегических точках графического окна. Это позволяет увеличить обзорность проектируемой конструкции.

Все мини-диалоги имеют соответствующие голосовые команды или ключевые слова, которые отображены в графическом окне, например, «угол 10», «глубина 20», «длина 345,76», «толщина 0,52» и т. д. Кроме мини-диалогов, данная САПР имеет много других новых элементов графического интерфейса с соответствующими голосовыми командами.

Более подробно с возможностями САПР think-design можно ознакомиться на официальном ин-тернет-сайте компании think3 [12].

В дополнение к сказанному отметим, что речевой интерфейс (РИ) предоставляет огромные возможности не только для оперативного управления САПРом, но и для ввода данных, например, прецизионных чисел. В качестве примера рассмотрим два сценария рисования окружности с радиусом 24 мм и координатами центраХ= 134,26, Y= 120,15, которые могут быть реализованы в САПР thinkdesign. Один сценарий традиционно использует клавиатуру и «мышку», а другой — речевой интерфейс.

Сценарий 1.

1. Подвести «мышкой» курсор к меню «Insert».

2. Нажать левую кнопку «мышки».

3. В меню «Insert» с помощью «мышки» выбрать подменю «Drafting».

4. Нажать левую кнопку «мышки».

5. В подменю «Drafting» с помощью «мышки» выбрать вложенное меню «Circle and Arc».

6. Нажать левую кнопку «мышки».

7. Во вложенном меню «Circle and Arc» с помощью «мышки» выбрать команду «Center».

8. Нажать левую кнопку «мышки».

9. Подвести «мышкой» курсор к меню «Tools».

10. Нажать левую кнопку «мышки».

11. В меню «Tools» с помощью «мышки» выбрать подменю «Snap».

12. Нажать левую кнопку «мышки».

13. В подменю «Snap» с помощью «мышки» выбрать команду «Enable Point coordinates».

14. Нажать левую кнопку «мышки».

15. В появившемся окне «Point coordinates» подвести «мышкой» курсор к полю X.

16. Нажать левую кнопку «мышки».

17. С помощью клавиатуры ввести число 134,26.

18. В окне «Point coordinates» подвести «мышкой» курсор к полю Y.

19. Нажать левую кнопку «мышки».

20. С помощью клавиатуры ввести число 120,15.

21. В окне «Point coordinates» подвести «мышкой» курсор к кнопке «ОК».

22. Нажать левую кнопку «мышки».

23. С помощью «мышки», перемещая курсор в поле чертежа, выбрать значение радиуса окружности «Radius 24».

Сценарий 2.

1. Произнести «Center circle».

2. Произнести «Coordinate input».

3. Произнести «Ех one hundred thirty four point twenty six».

4. Произнести «Wai one hundred twenty point fifteen».

5. Произнести «Radius twenty four».

Продемонстрированные сценарии показывают,

что РИ значительно упрощает использование данной САПР. При этом действительно обеспечивается более быстрый и более естественный способ создания конструкции. Для выполнения сценария 1 автору потребовалось около 40 с, для сценария 2 — около 15 с. В целом, по опыту автора, спроектировать новую конструкцию с использованием РИ можно как минимум на 20-30 % быстрее по сравнению с традиционными САПР. Однако использование РИ в данной САПР возможно только на английском языке. Вместе с этим, в работах [6-9] проводились исследования по эффективности использования РИ в сравнении с клавиатурой и «мышкой» при работе с графическими приложениями. Отмечается, что использование РИ позволяет ускорить процесс создания изображений в зависимости от их сложности до 50 %.

В нашей стране ежегодно доля изделий маши-но- и приборостроения в общем объеме продукции неуклонно увеличивается. Эти изделия становятся все более сложными и точными. Следовательно, усложняется их разработка и изготовление, увеличивается цикл и сложность подготовки их производства.

Общеизвестно, что за последние два десятилетия период производства изделия значительно сократился, а средняя продолжительность цикла технической подготовки увеличилась. В условиях многономенклатурного мелкосерийного и единичного производства продолжительность цикла технической подготовки стала соизмеримой с продолжительностью производства изделия, а во многих случаях превышает ее. Это обусловлено ростом трудоемкости и сложности процессов конструкторской и технологической подготовки, а также технологической наладки автоматизированного оборудования.

Упростить и ускорить процесс технологической наладки станка позволяет использование новой системы управления iLENIA (рис. 2), разработанной итальянской компанией CNi Informatica в 2001 году [10]. Данная система относится к классу Industrial PC и может использоваться для управления различным промышленным оборудованием, таким, как станки или промышленные роботы, а также осуществлять их групповое управление.

Среди множества функциональных возможностей системы iLENIA особого внимания заслуживает новый способ взаимодействия с пользователем, а именно при помощи речевых команд. Это достигается посредством использования встроенного программно-аппаратного речевого интерфейса «Voice Master». Он позволяет дублировать нажатие клавиш на клавиатуре системы, запрограммировать

■ Рис. 2. Общий вид системы управления iLenia

необходимые команды по желанию пользователя и осуществлять оперативное управление технологическим оборудованием непосредственно голосом. Однако возможность ввода речевых команд управления на русском языке в данной системе отсутствует.

Другим решением для ускорения процесса технологической наладки станка является использование новой системы iPRO. Она разработана в 2001 году английской компанией Newall Electronics [11]. В основу системы заложен фундаментальный принцип: если что-нибудь отвлекает квалифицированного наладчика или оператора станка от работы, то это, вероятно, снижает производительность его труда.

Новая разработка представляет собой беспроводную персональную систему, которая крепится на голове и на поясе пользователя. На пояс натягивается ремень, к которому присоединен микрокомпьютер, на голову надевается устройство со встроенными микрофоном, наушником и подвесным проекционным мини-экраном (рис. 3). Радиус действия системы составляет несколько сотен метров.

Такое нововведение позволяет пользователю свободно передвигаться вокруг станка, осуществлять контроль и обеспечивать оперативное управление станком с помощью речевых команд.

По заявлению президента компании Newall Electronics Д. Донэлдсона, система iPRO предлагает беспрецедентную безопасность, удобство и производительность. Она была разработана специально для того, чтобы помочь наладчикам и операторам станков лучше выполнять их задания, намного быстрее, с увеличенной точностью и комфортом [11].

Система iPRO позволяет наладчику или оператору станка всегда иметь необходимую информацию прямо перед глазами, не отвлекаясь от работы. Это стало возможным благодаря использованию расположенного на уровне глаз подвесного проекционного мини-экрана. Он сделан из специальной оптики и вмонтированного в нее 1,1" полупрозрачного микродисплея. Габариты подвесного экрана в два раза меньше пластиковой кредитной карточки. За счет применения специальной оптики проектируемое изображение кажется достаточно больших размеров и таким, как на полноцветном 15-дюймовом мониторе.

На подвесной мини-экран с помощью речевых команд может быть выведена информация, например, о значениях координат положения исполнительных механизмов станка, числа оборотов вращения шпинделя, скорости подачи, глубины резания без нарушения обзорности зоны обработки. На рис. 4 представлен фрагмент подобной информации.

Несмотря на очевидные достоинства системы iPRO, осуществлять в ней речевое управление представляется возможным только на английском языке.

С учетом вышеизложенного, можно заключить, что способ речевого управления и ввода данных позволяет избавить технологов и наладчиков оборудования с УЧПУ от рутинной работы при создании математических моделей новых деталей, технологической наладке станков с УЧПУ, робототехнических систем и другого автоматизированного оборудования. Речевой диалог является легким в использовании интерфейсом. Он предусматривает увеличение эффективности взаимодействия с автоматизированными системами посредством

■ Рис. 3. Использование системы /РИО при технологической наладке металлообрабатывающих станков

U Рис. 4. Фрагмент видеоинформации, выводимой на экран системы iPRO

ускорения ввода данных при выполнении задач, когда глаза и руки оператора заняты. В последнем случае речевая форма управления является наиболее оптимальной по сравнению, например, с клавиатурой, джойстиком, световым пером, сенсорным экраном или манипулятором курсора типа «мышь». Подсистема речевого управления не будет полностью заменять указанные устройства. Однако она может быть общим компонентом следующего поколения автоматизированных систем различного назначения.

Практическая ценность в организации новой технологии человеко-машинного интерфейса с использованием речевого ввода заключается в том, что она обеспечивает прямой доступ к управлению современными высокопроизводительными системами специалистам с невысокой квалификацией. Использование систем программного управления с вводом данных голосом повышает производительность операций, так как уменьшается время работы с клавишной панелью [2, 3].

Таким образом, проведенный автором в данной работе и в работе [3] обзор устройств и систем с речевым вводом информации показывает, что их номенклатура и сфера применения постоянно расширяется. В то же время, серийных устройств и систем отечественного производства, способных воспринимать русский язык, автором не обнаружено. В этой связи, актуальной остается проблема улучшения характеристик существующих [1, 5] и создания новых речевых систем, которые могли бы функционировать без УЧПУ. Это особенно важно для автоматизированных тяжелых крупногабаритных станков, функционирующих без УЧПУ (например, с цифровой индикацией). Необходимость и своевременность проведения научно-исследователь-

ских работ в данном направлении обусловлены объективными требованиями совершенствования человеко-машинного интерфейса.

Условием для широкого использования речевых технологий является повышение вероятности автоматической идентификации произносимых слов и увеличение быстродействия систем речевого взаимодействия. Для решения данной задачи необходимо проведение научных исследований, направленных на создание новых методов и систем автоматического анализа русской речи с улучшенными характеристиками и интеграции их в современные системы управления. Вместе с этим вопросы расширения функциональных возможностей существующих систем управления на основе технологии речевого управления остаются открытыми.

1. Изилов Я. Ю. Новые возможности оперативного управления металлообрабатывающими станками с ЧПУ // Металлообработка. — 2003 — № 1 (13). — С. 41-43.

2. Изилов Я. Ю. Совершенствование процесса технологической подготовки оборудования с ЧПУ // Проблемы машиноведения и машиностроения: Межвуз. сб. — Вып. 30. — СПб.: Изд-во СЗТУ, 2003.

3. Изилов Я. Ю. Некоторые аспекты моделирования речевых сигналов. — СПб.: Изд-во СПбГТУ, 2001.

4. Изилов Я. Ю., Федотов А. И. Расширение функциональных возможностей робототехнических систем // Научно-технические ведомости СПбГТУ 1899-1999. — № 3. — СПб.: Изд-во СПбГТУ, 1999.

5. Изилов Я. Ю. и др. Система речевого ввода информации в ЭВМ на естественном языке // Тезисы докл. и сообщ. научн. военно-техн. конф. «Автоматизация процессов управления соединениями и частями ПВО, информационные технологии. Состояние и перспективы создания единой автоматизированной радиолокационной системы» 15-16 мая 1996 г. — СПб.: СПВУРЭ ПВО, 1996.

6. Bolt R. Put-That-There: Voice & Gesture at the Graphics Interface // Computer Graphics. — 1980. — 14.—

3. — P. 262-270.

7. Hauptmann A. Speech and Gestures for Graphic Image Manipulation // Human Factors in Computer Systems (SIGCHI). — 1989. — P. 241-245.

8. Martin G. F. The Utility of Speech Input in User-Com-puter Interfaces // International Journal of Man-Ma-chine Studies. — 1989. — Vol. 30. — P. 355-375.

9. Pausch R., Leatherby J. H. A Study Comparing Mouse-Only Input vs. Mouse Plus-Voice Input for a Graphical Editor // Proceedings of the AVIOS '90 Voice I/O Systems Applications Conference, September 1990. — P. 227-231.

10. http://www.cniinformatica.it

11. http://www.newall.co.uk

12. http://www.think3.com

i Надоели баннеры? Вы всегда можете отключить рекламу.