Семантика на базе технологий искусственного интеллекта для инженера1
Мещеряков Р. В., доктор технических наук, профессор, главный научный сотрудник, заведующий Лабораторией «Киберфизических систем», Федеральное государственное бюджетное учреждение науки «Институт проблем управления имени В. А. Трапезникова» Российской академии наук, Москва
В статье представлен практический подход к использованию семантики. В качестве методологической базы используются наивные понятия семантического треугольника Фреге и простейших схем обработки информации в программных и робототехнических системах. Приводятся примеры использования семантики для функционирования систем и делаются выводы о перспективах развития.
семантика • программа • робот • интерфейс
ВВЕДЕНИЕ
Развитие технологий искусственного интеллекта неуклонно расширяет сферу применения реальных систем обработки различной слабоструктурированной информации. При этом инженеры и технологи получают в руки инструментарий для решения прикладных задач. Вместе с тем объемы обрабатываемых данных существенно превышают возможности человека и возникают вопросы их агрегирования с формированием соответствующих выводов и решений — как это происходит при моделировании языковой деятельности [1].
Для работы в слабоструктурированных данных недостаточно иметь большую выборку и надежные методы классификации и кластеризации — необходима новая парадигма агрегации и интерпретации данных, которая основана на знаниях. В этой связи методы семантического анализа представляют интерес для практических работ.
ЧТО ТАКОЕ СЕМАНТИКА?
Известные определения термина «семантика» в достаточной мере отражают все многообразие смыслов и ориентированы на различные уровни представления многомодальных сигнальных конструкций (текста, речи, жестов, цветов и др.).
Работа поддержана грантом РНФ 24-1 1-00340 «Исследование и разработка методов обработки слабоструктурированной информации на естественных языках в условиях сильных шумов для решения задач безопасности».
При реальном же использовании в инженерных прикладных системах приходится ориентироваться на более узкий набор сигнальных конструкций, в которых преобладает текст и который наиболее популярен для обработки. С другой стороны, следует отметить, что для обработки важен второй составляющий элемент семантики — предметная среда и ситуация [2-4].
Существующее одно из наиболее известных представлений взаимосвязей в виде семантического треугольника Фреге [5] лишь в некоторой части покрывает потребности инженеров и проектировщиков (рис. 1). Более сложные представления семантики могут использоваться на этапах исследования, однако для прикладных решений часто избыточны.
Представление составных частей семантики на рисунке 1 недостаточно и отражает собой работу функций отображения из одних представлений информации в другие. В указанном представлении отсутствуют подходы к представлению процессов, а также синтеза и декомпозиции предметов.
Таким образом, получаем надежную формализацию для работы, но невысокий функционал. Так, в работе [6] предлагается развитие прикладных технологий Интернета вещей с использованием семантического подхода по обработке информации в сложных системах для разработки интеллектуальных методов и предоставления интеллектуальных услуг для производства.
Можно отметить, что для ряда прикладных разработчиков семантика представляет собой выбранную категорию, смысл, значение, информацию о содержании и их связи(ях), а также его представлении в системе.
В качестве примеров прикладных систем выберем программные и робото-технические системы.
ЗНАК
ЗНАЧЕНИЕ (ПРЕДМЕТ)
СМЫСЛ
Рис. 1. Семантический треугольник Фреге
44
ПРОГРАММНАЯ СИСТЕМА
Очевидный вопрос о наделении машины мыслительными процессами задается очень давно и связан с попыткой передать машине функций человека [7]. Вместе с тем в реальной жизни имеющиеся ресурсы и технологии искусственного интеллекта позволяют проводить выборку и сопоставление различных прикладных понятий на различных языках и проводить сложные семантические отношения. Примером такой системы является система по реализации семантической реляционной модели международного китайского основного словаря в сценариях искусственного на основе лингвистической теории и технологии компьютерной обработки [8].
Практически в любой программной системе информация обрабатывается по схеме, представленной на рисунке 2.
Рис. 2. Схема обработка данных в программной системе
Представленная система наивна и не показывает возможность наличия значительного количества обратных связей и более сложных архитектурных вычислительных конструкций, а также возможность наличия нескольких входов, выходов и внутренних состояний (по аналогии с работой формальных автоматов).
В процессе обработки данных важна не только семантика собственно данных — входных, выходных и внутренних, но и собственно семантики процессов обработки этих данных. Для реализации семантики в программной системе по указанной модели достаточно иметь представление, которое будет однозначно интерпретировано по модели, представленной на рисунке 1.
Наличие семантических коллизий, как правило, решается на уровне интерпретации обработчика программной системы. Следует отметить, что исходные данные имеют небольшое количество коллизий, которые также решаются на уровне предобработки. Выходные данные однозначно идентичны и представляют собой уже значения, которые имеют однозначный смысл, который определен логикой работы алгоритмов программного обеспечения и входными данными.
РОБОТОТЕХНИЧЕСКАЯ СИСТЕМА
Более сложной системой, которая включает в себя программную часть, является робо-тотехническая система или просто робот. Как правило, у робота имеется широко
46
развитая сенсорная подсистема и они могут работать в группе [9, 10]. По аналогии с программной системой можно представить обработку информации в виде схемы, представленной на рисунке 3.
Рис. 3. Схема обработки данных в робототехнической системе
В отличие от чисто программной системы, поступающая информация еще более слабо формализована, источники имеют различную природу, а установление семантического соответствия между предметом и предполагаемым смыслом данных важно для функционирования робота. Представленные на рисунке 3 источники данных имеют различную точность, пространственное разрешение, скорость поступления, законы распределения ошибок и пр.
Другой вопрос, который задается при работе робототехнической системы, — это обнаружение и классификация объектов интереса. Например, для робототехнических систем, которые перемещаются в пространстве, важно определить, является ли препятствие критическим (наезд на него остановит робота или будут нанесены повреждения) или нет (можно перемещаться через него). Для роботов-манипуляторов важно иметь информацию об окружении — в том числе наличие человека в зоне действия для ненанесения вреда [11].
Информация, поступающая с систем технического зрения и другой сенсорики, должна быть предварительно обработана и верифицирована [12, 13], иначе получаемые для работы робота данные приведут к несоответствующим алгоритмам обработки.
Отдельной задачей стоит взаимодействие человека с роботом с использованием интерфейсов [14, 15], и это требует однозначного определения семантики выдаваемых команд роботу. Неверная команда или ее семантическая интерпретация может привести к непоправимым последствиям. Как правило, в указанной задаче дополнительно требуют от робота подтверждение о принятой команде.
ЗАКЛЮЧЕНИЕ
Предлагаемый инженерный проход к понятию семантики позволяет ставить задачи исследователям на уровне конкретных прикладных решений, что является чрезвычайно важным в настоящее время в связи с увеличением программных и робото-технических систем с искусственным интеллектом.
Для прикладных решений следует уделить большее внимание представлению семантики внутри технических систем и разрешению возникающих коллизий на различных уровнях систем обработки информации.
Перспективными представляются направления учета многообразия сторон информации и его генерации для применения, в том числе с использованием генеративных моделей технологий искусственного интеллекта.
Список использованных источников
1. Моделирование языковой деятельности в интеллектуальных системах. Серия: Проблемы искусственного интеллекта / Ред. Кибрик А.Е. - М.: Наука, 1987. - 280 с.
2. Харламов, А. А. Семантика текста как модель ситуации // Речевые технологии. - 2019. -№ 1. - С. 14.
3. Михайлова, М. Ю. Семантика невыразимого и смежные явления // Известия Самарского научного центра Российской академии наук. - 2015. - Т. 17, № 1. - С. 963-966.
4. Мещеряков, Р. В., Бондаренко, В. П. Диалог как основа построения речевых систем // Кибернетика и системный анализ. - 2008. - Т. 44. № 2. - С. 30-42.
5. Чупахин, Н. П. Семантический треугольник Готлоба Фреге и семантический тетраэдр в философии смысла // Вестник Новосибирского государственного педагогического университета. - 2012. - Т. 2, № 1. - С. 59-67.
6. Patel P., Ali M. I. and Sheth A. "From Raw Data to Smart Manufacturing: AI and Semantic Web of Things for Industry 4.0," in IEEE Intelligent Systems, vol. 33, no. 4, pp. 79-86, Jul./Aug. 2018, doi: 10.1109/MIS.2018.043741325.
7. Тьюринг, А. Может ли машина мыслить? / Пер. с англ. Ю.В. Данилова. - М.: ГИФМЛ, 1960.
8. Zhu Y. "Semantic Relationship Model of Chinese International Core Vocabulary in Artificial Intelligence Scenarios" 2023 IEEE 3rd International Conference on Social Sciences and Intelligence Management (SSIM), Taichung, Taiwan, 2023, pp. 312-315, doi: 10.1109/ SSIM59263.2023.10468710.
9. Кутахов, В. П., Мещеряков, Р. В. Управление групповым поведением беспилотных летательных аппаратов: постановка задачи применения технологий искусственного интеллекта // Проблемы управления. - 2022. - № 1. - С. 67-74.
10. Chueshev A., Melekhova O., Meshcheryakov R. Cloud robotic platform on basis of fog computing approach // Lecture Notes in Computer Science. 2018. Т. 11097 LNAI. С. 34-43.
11. Galin R. R., Meshcheryakov R. V. Human-robot interaction efficiency and human-robot collaboration // Studies in Systems, Decision and Control. 2020. Т. 272. С. 55-63.
12. Wagenpfeil S. , Hemmje M. "Towards AI-based Semantic Multimedia Indexing and Retrieval for Social Media on Smartphones," 2020 15th International Workshop on Semantic and Social Media Adaptation and Personalization (SMA, Zakynthos, Greece, 2020, pp. 1-9, doi: 10.1109/ SMAP49528.2020.9248445.
13. Wang H., Jiang Z., Xie L., Jiang D., Shen W. , Tian Q. "Domain-Adaptive Semantic Segmentation Emerges From Vision-Language Supervised Domain-Debiased Self-Training," ICASSP 2024 -2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Seoul, Korea, Republic of, 2024, pp. 3930-3934, doi: 10.1109/ICASSP48485.2024.10447308.
14. Харламов, А. А., Ермишин, К. В. Речевой диалог с коллаборативным роботом на основе многомодальной семантики // Вестник Московского государственного лингвистического университета. Языкознание. Прагмалингвистическое многоголосие. - 2016. - № 15. - С. 206-215.
15. Мещеряков, Р. В., Туровский, Я. А. Перспективные направления развития человеко-машинных интерфейсов // В сборнике: Информационные технологии в науке, образовании и производстве (ИТНОП-2023). Сборник трудов IX Международной научно-технической конференции. - Белгород, 2023. - С. 23-29.
SEMANTICS ON ARTIFICIAL INTELLIGENCE TECHNOLOGIES FOR AN ENGINEER
Meshcheryakov R. V., Doctor of Technical Sciences, Professor, Chief Researcher, Head of the Laboratory of Cyberphysical Systems, Federal State Budgetary Institution of Science V. A. Trapeznikov Institute of Management Problems of the Russian Academy of Sciences, Moscow
This article presents a practical approach to using semantics. The naive concepts of Frege's semantic triangle and the simplest information processing schemes in software and robotic systems are used as a methodological basis. Examples of the use of semantics for the functioning of systems are given and conclusions are drawn about development prospects.
semantics • program • robot • interface
48