Научная статья на тему 'Определение степени алкогольной интоксикации человека на основе автоматического анализа речи'

Определение степени алкогольной интоксикации человека на основе автоматического анализа речи Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
185
30
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АЛКОГОЛЬНАЯ ИНТОКСИКАЦИЯ / ALCOHOL INTOXICATION / АВТОМАТИЧЕСКОЕ РАСПОЗНАВАНИЕ РЕЧИ / AUTOMATIC SPEECH RECOGNITION / ОШИБКА РАСПОЗНАВАНИЯ / RECOGNITION ERROR RATE / СЕМАНТИКО-СИНТАКСИЧЕСКИЙ АНАЛИЗ / SEMANTIC-SYNTACTIC ANALYSIS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ронжин Андрей Леонидович., Басов Олег Олегович.

На основе автоматического распознавания речи человека предложен подход к определению алкогольной интоксикации, влияющей на изменение параметров его голосового тракта и семантико-синтаксическую связность устной речи. Проведенные эксперименты подтвердили зависимость ошибок распознавания от степени алкогольной интоксикации и позволили сделать вывод о возможности мониторинга опьянения лиц, состоящих на профилактическом учете, на основе существующих инфокоммуникационных технологий.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Detection of alcohol intoxication degree based on automatic speech analysis

Automatic speech recognition approach is developed for detection of alcohol intoxication, which changes features of vocal tract and semantic-syntactic fluency of conversational speech. Preliminary experiments confirmed the relation between recognition error rate and alcohol intoxication degree. This approach in combination with modern infotelecommunication technologies is useful for monitoring and prevention of person intoxication.

Текст научной работы на тему «Определение степени алкогольной интоксикации человека на основе автоматического анализа речи»

ТЕХНИЧЕСКИЕ НАУКИ

6. Zoidov K.H. Lessons transformational crisis // Economics of modern-day Russia. 2005. № 4. Pp. 44-56.

7. Loginov V.E. Problems of transition of the Russian economy to a new technological basis through the development of NIS Russia // Actual problems of Arts and Sciences, 2013, №8. Pp.114-116.

8. Lukin V.K. Development of the regional segment of the Russian financial system in the context of globalization // Economy. Right. Print. Bulletin KSEI. 2013. № 4. Pp. 241-245.

9. Lukin V.K. Formation of an interconnected complex of organizational maintenance tools of financial programs // Economy. Right. Print. Bulletin KSEI. 2013. № 4. Pp. 245-249.

10. Petrov D.V World economy adaptation of institutional mechanisms to stimulate investment modernization programs // Economy. Right. Print. Bulletin KSEI. 2014. № 1 (61). Pp. 226-231.

11. The problems of monitoring the operation of distributed information systems. Monograph. M .: UNITY-DANA, 2005. 294 p.

12. Problems in the management of the national economy through strategic investment of operating factors. Krasnodar Kuban Social and Economic Institute, 2004. 251 p.

13. RaikovA.N. Convergent management and decision support. - M .: Publishing house IKAR, 2009. - 245 c.

14. Sayfieva S.N. Financial and real investment in the Russian economy: from-sectoral aspect // Financial business. 2013. № 5 (166). Pp. 12-23.

15. Tsvetkov V.A., Bortalevich S.I., Loginov E.L. Strategic approaches to the development of energy infrastructure in Russia in terms of integration of national energy systems and energy markets. M.: IPR RAS, 2014. 511 p.

16. Shevchenko I.V., Litvinsky K.O. Sustainable development: international experience and problems of Russia // Regional economy: theory and practice. 2007. № 13. Pp. 3-10.

17. Shevchenko I.V Financial regulation of the Russian economy as makrokogerental system in terms of nonlinear economic dynamics // Finances and Credit. 2013. № 22. Pp. 17-22.

УДК 811.161.1 ББК 32.965+81.1

ОПРЕДЕЛЕНИЕ СТЕПЕНИ АЛКОГОЛЬНОЙ ИНТОКСИКАЦИИ ЧЕЛОВЕКА НА ОСНОВЕ АВТОМАТИЧЕСКОГО АНАЛИЗА РЕЧИ

АНДРЕЙ ЛЕОНИДОВИЧ РОНЖИН,

заместитель директора по научной работе Санкт-Петербургского института информатики и автоматизации Российской академии наук, профессор, доктор технических наук E-mail: ronzhin@iias.spb.su; ОЛЕГ ОЛЕГОВИЧ БАСОВ, докторант Академии Федеральной службы охраны Российской Федерации,

кандидат технических наук E-mail: oobasov@mail.ru

Научная специальность 05.13.11 - математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей Научный консультант: доктор технических наук И.А. Саитов Рецензент: доктор технических наук А.А. Карпов

Citation-индекс в электронной библиотеке НИИОН

Аннотация. На основе автоматического распознавания речи человека предложен подход к определению алкогольной интоксикации, влияющей на изменение параметров его голосового тракта и семантико-синтаксическую связность устной речи. Проведенные эксперименты подтвердили зависимость ошибок распознавания от степени алкогольной интоксикации и позволили сделать вывод о возможности мониторинга опьянения лиц, состоящих на профилактическом учете, на основе существующих инфокоммуникационных технологий.

Ключевые слова: алкогольная интоксикация, автоматическое распознавание речи, ошибка распознавания, семантико-синтаксический анализ.

ТЕХНИЧЕСКИЕ НАУКИ

Annotation. Automatic speech recognition approach is developed for detection of alcohol intoxication, which changes features of vocal tract and semantic-syntactic fluency of conversational speech. Preliminary experiments confirmed the relation between recognition error rate and alcohol intoxication degree. This approach in combination with modern infotelecommunication technologies is useful for monitoring and prevention of person intoxication.

Keywords: alcohol intoxication, automatic speech recognition, recognition error rate, semantic-syntactic analysis.

Введение

Успех в предупреждении совершения преступлений в состоянии опьянения может быть обеспечен созданием широкой социально-экономической, правовой и информационно-технологической системы профилактики пьянства и алкоголизма, эффективного механизма управления этой системой и координации антиалкогольных усилий различных государственных органов, социальных институтов и общественных организаций.

Согласно Приказу № 1166 МВД России от 31 декабря 2012 г. «Вопросы организации деятельности участковых уполномоченных полиции» проводится индивидуальная профилактическая работа с лицами, состоящими на профилактическом учете, в том числе больными алкоголизмом и наркоманией, состоящими на учете в медицинских организациях и представляющих опасность для окружающих. В связи с возрастающей потребностью в постоянном мониторинге опьянения таких лиц при значительном снижении числа участковых уполномоченных полиции особую актуальность приобретает использование современных инфокоммуникационных технологий, позволяющих бесконтактно определять степень алкогольной интоксикации человека по его биометрическим параметрам в процессе коммуникативного акта (телефонного разговора, использования информационно-справочных сервисов и т.п.) [1, 2].

Самым простым, удобным, и, в то же время, индивидуальным средством коммуникации является речь человека. Она обладает физическими характеристиками, которые позволяют получать информацию о состоянии человека благодаря психологическим эффектам, которые вызывают эти характеристики. Однако, основное назначение существующих технологий анализа речи [3-5] -различного вида детекторы (детекторы лжи, страсти, любви и т.д.), которые, как правило, имеют достаточно узкое применение в криминалистике.

На сегодняшний день существует неохваченная область исследований, в которой речь может быть ис-

точником дополнительной информации о состоянии человека: изменения пульса, температуры, кровяного давления, состава крови, аллергических реакций и т.д. Ее получение требует синхронизации речевых и внерече-вых данных и позволит выявить физические параметры речи, отражающие изменение физико-психологического состояния человека. Например, чрезмерное напряжение связок, т.е. наличие микровибраций в определенном участке частот при производстве речи может повлечь повышение артериального давления или температуры; следовательно, пытаясь оценить микротремор - степень напряженной работы связок, можно спрогнозировать изменение внеречевых параметров состояния человека. Изменение качества распознавания речи при использовании инфокоммуникационных технологий (например, при телефонном разговоре) может служить источником информации о степени алкогольной интоксикации абонента.

Структура модели распознавания русской речи, используемой для определения степени алкогольной интоксикации. В проводимом исследовании была применена система интегрального распознавания и понимания речи SIRIUS (SPIIRAS Interface for Recognition and Integral Understanding of Speech) [6, 7], содержащая такие этапы обработки, как: параметризация речевого сигнала, распознавание слитной речи, а также семан-тико-синтаксическая оценка связности произнесенной фразы (рис. 1).

Речевой сигнал

Т

Гипотеза фразы

Рис. 1. Система интегрального распознавания и понимания речи SIRIUS

ТЕХНИЧЕСКИЕ НАУКИ

В системе использовалась концепция интегрального понимания, реализующая объединение в одной системе акустических данных, информации о языке, предметной области и выполняемой задаче, а также их одновременной обработке при анализе речевой команды [8]. Выход каждого уровня распознавания представляет собой множество гипотез с соответствующими оценками. Возможные неопределенности и ошибки, поступившие на текущий уровень (или возникшие на нем), уменьшаются или исключаются в ходе интегральной обработки. Суть интегральной обработки сводится к оценке входных гипотез по критериям соответствующих знаний. На основе частных оценок вырабатывается интегральная оценка. В результате входной сигнал оценивается по разным уровням знаний, а окончательное решение принимается по минимуму интегрального отклонения. Это делает модель робаст-ной к вероятным отклонениям и выгодно отличает ее от общепринятой концепции последовательного разбора. Кроме того, разработанный инструментарий для интегральной оптимизации параметров модели позволяет достичь необходимой эффективности настройки баз данных, а также переносимости модели понимания на новую прикладную задачу.

Данная система обеспечивает робастное распознавание и понимание речи даже при возникновении частичных фонетических и грамматических искажений во входной фразе, а также позволяет уменьшить количество ошибок распознавания смысла в несколько раз по сравнению со стандартными подходами [9].

Для устранения проблем, связанных со сложным механизмом словообразования, был внедрен дополнительный уровень представления речи - морфемный. За счет разделения словоформы на морфемы словарь распознаваемых лексических единиц значительно сокращается, так как в процессе словообразования часто используются одни и те же морфемы. При этом скорость и точность распознавания увеличиваются, что позволяет строить приложения, использующие распознавание русской речи в реальном времени [10].

Распознавание речевого сигнала и последующая оценка связности слов в произнесенной фразе и осмысленность самой фразы является важным критерием состояния диктора. Если характеристики голоса можно попытаться подделать, настолько точно, что на слух будет практически незаметно, то при произношении осмысленного, но незнакомого для абонента текста, всегда возникают ошибки в речи, связанные с характером человека, а также психофизиологическим состоянием, в том числе алкогольной интоксикацией. Такие же неточности возникают и при ответах на заранее подготовленные системой вопросы (при использовании вместо телефонии интерактивных информационных сервисов). Интегральным критерием алкогольной интоксикации человека служит точность автоматического распознавания речи, произносимой человеком. Данный критерий учитывает как изменения параметров голосового тракта, так и семантико-

синтаксическую связность произносимой человеком речи.

Результаты экспериментов по определению степени алкогольной интоксикации человека. Целью эксперимента являлось определение зависимости точности автоматического распознавания речи от степени алкогольной интоксикации говорящего. В тестировании участвовали три человека, имеющие примерно одинаковую массу и принадлежащие к одной социальной группе.

Для каждого тестируемого предварительно записывался образец голоса в нормальном состоянии. Число фраз, используемых для подготовки модели голоса без интоксикации, варьировалось от 200 до 800 предложений. Изменение в этих пределах не показало значительного снижения точности распознавания, в связи с чем был сделан вывод о возможности использования нижнего предела. После создания эталонной модели производилась запись для тестирования системы распознавания речи в нормальном состоянии, затем состояние тестируемых постепенно изменялось.

Результаты эксперимента показали, что точность распознавания существенно выше для дикторов без интоксикации, уровень ошибок распознавания особенно возрастает на первых стадиях интоксикации, затем постепенно фиксируется на определенном уровне, но все же значительно большем, по сравнению с нормальным состоянием (рис. 2).

10-

0 10 20 30 40 50

Уровень интоксикации, мл

Рис. 2. Уровень ошибок распознавания в зависимости от степени интоксикации человека

Следует заметить, что длительность тестовой фразы также влияет на точность распознавания (рис. 3). В начале тестирования диктор делает больше ошибок, и меньше в конце. Это объясняется видимо тем, что при произношении первой фразы диктор испытывает несколько большее волнение, что сказывается на качестве речи, а при увеличении интоксикации это волнение увеличивается.

Следует отметить, что разработанный подход ориентирован на применение в режиме реального времени, если же планируется проводить обработку речевых баз данных в оффлайн режиме, при котором накладываются менее жесткие требования по скорости обра-

9

8

7

6

5

4

3

2

1

0

ТЕХНИЧЕСКИЕ НАУКИ

ботки данных, то могут быть привлечены и другие, более сложные средства автоматизированной обработки речи и текста [11-14].

10

s Е

1...10 11...20 21...30 31...40

Очередной номер фразы

41...50

Рис. 3. Уровень ошибок распознавания в зависимости от номера фразы диктора

Заключение

Полученные результаты свидетельствуют о приемлемой точности распознавания алкогольной интоксикации и возможности использования системы распознавания русской речи в качестве средства мониторинга опьянения лиц, состоящих на профилактическом учете, на основе существующих инфокоммуникационных технологий. В связи с этим, целесообразно установить в КоАП и УК РФ правовые основания такого экспресс-освидетельствования на состояние опьянения для всех случаев, когда это регламентирует законодательство, предусмотрев юридическую ответственность за уклонения от прохождения освидетельствования на состояние опьянения.

Литература

1. Bone D., Li M., Black M.P., Narayanan S.S. Intoxicated speech detection: A fusion framework with speaker-normalized hierarchical functionals and GMM supervectors. Computer Speech and Language, Vol. 28, Issue 2, March 2014, P. 375-391.

2. Schiel F. Perception of alcoholic intoxication in speech. Proceedings of the 12th Annual Conference of the International Speech Communication Association, INTERSPEECH 2011, Florence; Italy; 27-31 August 2011, P. 3281-3284.

3. Zhou G., Hansen J.H.L. and Kaiser J.F.: Methods for Stress Classification: Nonlinear Teo and Linear Speech Based Features // ICASSP'99. Vol. 4. P. 2087-2090.

4. Oudeye, P-Y. The production and recognition of emotions in speech: features and algorithms // International Journal of Human Computer Interaction. 2003. Vol. 59(1-2). P. 157-183.

5. Geiger J.T. Zhang B., Schuller B., Rigoll G. On the influence of alcohol intoxication on speaker recognition. Proceedings of the 53rd AES International Conference, London; United Kingdom; 26 January 2014, P. 318-324.

6. Карпов А.А., Ронжин А.Л., Ли И.В. SIRIUS - си-

стема дикторо-независимого распознавания слитнои русской речи // Известия ТРТУ № 10. 2005. С. 44-53.

7. KarpovA., MarkovK., KipyatkovaI., Vazhenina D., Ronzhin A. Large vocabulary Russian speech recognition using syntactico-statistical language modeling // Speech Communication. Elsevier. 2014, Vol. 56, January, P. 213228.

8. Ronzhin A.L., Karpov A.A. "Russian Voice Interface". Pattern Recognition and Image Analysis, Vol. 15, No. 2, 2005, pp. 432-434.

9. Kosarev Yu.A., LeeI.V, RonzhinA.L., SkidanovE.A., Savage J. Survey of the approaches to speech and text understanding // SPIIRAS Proceedings. Issue 1. Vol. 2. St. Petersburg: SPIIRAS, 2002. P. 157-195.

10. Ронжин Ал.Л., Ронжин Ан.Л. Система аудиовизуального мониторинга участников совещания в интеллектуальном зале // Доклады ТУСУРа, № 1 (22), часть 1, 2011, С. 153-157.

11. Азаров И.С., Вашкевич М.И., Лихачев Д.С., Петровский А.А. Изменение частоты основного тона речевого сигнала на основе гармонической модели с нестационарными параметрами // Труды СПИИРАН. 2014. Вып. 32. С. 5-26.

12. Тиунов С.Д., Мещеряков Р.В., Черных Д.В. Оптимизация вычисления одновременной маскировки речевого сигнала // Труды СПИИРАН. 2014. Вып. 32. С. 45-57.

13. Качковская Т.В. Использование темпоральных характеристик для сегментации речевого потока на крупные смысловые единицы (на материале русского языка) // Труды СПИИРАН. 2014. Вып. 32. С. 68-81.

14. Басов О.О., Носов М.В., Шалагинов В.А. Исследование характеристик джиттера периода основного тона речевого сигнала // Труды СПИИРАН. 2014. Вып. 32. C. 27-44.

References

1. Bone D., Li M., Black M.P., Narayanan S.S. Intoxicated speech detection: A fusion framework with speaker-normalized hierarchical functionals and GMM supervectors. Computer Speech and Language, 2014, Vol. 28, Issue 2, pp. 375-391.

2. Schiel F. Perception of alcoholic intoxication in speech. Proceedings of the 12th Annual Conference of the International Speech Communication Association, INTERSPEECH 2011, Florence. Italy. 2011, pp. 32813284.

3. Zhou G., Hansen J.H.L., Kaiser J.F. Methods for Stress Classification: Nonlinear Teo and Linear Speech Based Features. ICASSP'99. Vol. 4. pp. 2087-2090.

4. Oudeyer P-Y. The production and recognition of emotions in speech: features and algorithms. International Journal of Human Computer Interaction. 2003. Vol. 59(1-2). pp.157-183.

5. Geiger J.T., Zhang B., Schuller B., Rigoll G. On the influence of alcohol intoxication on speaker recognition. Proceedings of the 53rd AES International Conference, London. United Kingdom. 2014. pp. 318-324.

9

8

0

ТЕХНИЧЕСКИЕ НАУКИ

6. Karpov A.A., Ronzhin A.L., Li I.V [SIRIUS -speaker-independent system for recognition of continuous Russian speech]. Izvestija TRTU - TRTU proceedings. 2005. no. 10. pp. 44-53. (In Russ.).

7. Karpov A., Markov K., Kipyatkova I., Vazhenina D., Ronzhin A. Large vocabulary Russian speech recognition using syntactico-statistical language modeling. Speech Communication. Elsevier. 2014, vol. 56, pp. 213-228.

8. Ronzhin A.L., Karpov A.A. "Russian Voice Interface". Pattern Recognition and UmTge Analysas, Vol. 15, No. 2, 2005, pp. 432-434.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9. Kosarev Yu.A., Lee I.V, Ronzhin A.L., Ski-anov E.A., Savage J. [Survey of the approaches to speech and text understanding]. Trudy SPIIRAN - SPIIRAS Pmcaedings. 2002. Vol. 2. Issue 1. pp. 157-195. (In Russ.).

10. Ronzhin Al.L., Ronzhin An.L. [Audiovisual monitoring system of meeting participants in a intelligent

room]. Doklady TUSURa - ProceedingsofTUSUR. 2011. no. 1 (22). i)i). 153-15-7. (In Russ.).

11. Azarov I.S., Vashkevich M.I., Lihachev D.S., Petrovskij A.A. [Pitch modification of speech signal using harmonic model with time-varying parameters]. Trudy SPI-IRAN - SPIIRA2 Proceedrngs. 2014. Vol. 32. pp. 5-26. (In Russ.) .

12. Tiunov S.D., Meshcheryakov R.V., Chernyh D.V. [Optimization of calculation oU frequency2 masking of speech signal]. Trudy SPIIRAN - SPIIRAS Proceedings. 2014. Vol. 32. pp. 45-57. (InRuss.).

13. Kachkovskaia T. V [Temporal aspetts of inSonataonal phrasing (evidence from russian)]. Trudy SPIIRAN -SPIIRAS Proceeding.. Vol. 32. pp. 68-81.(InRuss.).

14. Basov O.O., Nosov M.V., Shalaginov V.A. [Pitch-jitter analysis of the speecn signal].Trudy SPIIRAN -SPIIRAS Proceedings. 2014. Vol. 32. pp. 27-44. (In Russ.).

Профессиональная этика

Профессиональная этика и служебный этикет: учебник для студентов ву-зов, обучающихся по специальностям «Юриспруденция», «Правоохрани-тельная деятельность» / [И.И. Аминов и др.]. М.: ЮНИТИ-ДАНА: Закон и право.

служебный этикет

сотрудников ОВД

Этот учебник - один из немногих опытов разработки проблем профессиональной этики сотрудников органов внутренних дел. Его главная задача - способствовать повышению нравственной и правовой куньтуры работников криминальной полиции и полиции общественной безопанности.

С современных позиций рассматриваются основные этические пробле-мы: сущность морали, категории этики, история нравственных начал в де ятельности царской полиции и советской милиции. Даются рекомендации по формированию у сотрудников общих и профессиональных компетенций, убеждений, умений и навыков соблюдения моральных и правовых норм в ирофессиональной деятельности и повседнивном поведении. Особое внимание уделяется анализу Типово-го кодекса профессиональной этики и служебного поведения в контексте твой или иной главы.

Для учащихся и преподавателей образовательных учреждений МВД России. Учебник может быть использован в процессе служебной подготовки сотрудников пнлицип.

Введение в судебную экспертизу

Введение в судебную экспертизу: учеб. пособие для студентов вузов, обучающихся по специальности «Юриспруденция» / Н.П. Майлис. 2-е изд., перераб. и доп. М.: ЮНИТИ-ДАНА: Закон и право, 2015. 159 с.

В пособии изложены основные теоретические понятия судебной экспертизы, представлены история развития, система государственных экспертных учреждений в России, правовые основы судебно-экспертной деятельности. В соответствии с процессуальным законодательством рассмотрены основные виды экспертиз, назначаемых правоохранительными органами.

Раскрыты научные основы судебной экспертизы, включающие в себя криминалистическую идентификацию и диагностику; технология экспертного исследования; содержательная часть заключения эксперта и его доказательственное значение в расследовании и раскрытии преступлений. Уделено внимание информационному обеспечению судебно-экспертной деятельности, а также экспертной этике и экспертным ошибкам. Для студентов, аспирантов, преподавателей высших учебных заведений, практических работников, назначающих судебные экспертизы, и специалистов, которые их проводят.

i Надоели баннеры? Вы всегда можете отключить рекламу.