Научная статья на тему 'Новостной медиаробот: теоретические аспекты интеллектуальной системы генерации контента'

Новостной медиаробот: теоретические аспекты интеллектуальной системы генерации контента Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
562
128
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕДИАРОБОТ / ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА / ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / БАЗА ЗНАНИЙ / ИНЖЕНЕРИЯ ЗНАНИЙ / ТЕОРИЯ ФРЕЙМОВ / ТЕХНОЛОГИЯ ЕСТЕСТВЕННОГО ЯЗЫКА / MEDIA ROBOT / INTELLECTUAL SYSTEM / ARTIFICIAL INTELLIGENCE / KNOWLEDGE BASE / KNOWLEDGE ENGINEERING / FRAMES THEORY / NATURAL LANGUAGE TECHNOLOGY

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Замков Андрей Владимирович

В статье обсуждается новый феномен цифровой медиасферы новостные медиароботы, способные создавать текстовый контент на технологической платформе интеллектуальных систем. Рассматриваются междисциплинарные подходы к пониманию этого феномена с привлечением теоретических положений и примеров из области искусственного интеллекта, инженерии знаний и технологий естественного языка. В качестве рабочей гипотезы о природе интеллектуальных систем медиароботов формулируется утверждение, что они являются вычислительными моделями, которые имитируют специфические функции естественного интеллекта человека. Феномен имитации как присущая социальным и техническим системам общая способность к самообучению по образцу, расценивается в качестве ключевого механизма адаптации медиароботов к социальной среде. Для иллюстрации функционирования интеллектуальной системы медиаробота приводится кейс генерации новостного контента в контексте теории фреймов междисциплинарного формализма для представления образцов знаний и стереотипов социального поведения. Как возможный эталон для сравнения интеллектуальной системы робота с естественным интеллектом человека рассматривается структура общего интеллекта по Кэттелу Хорну. Отмечается её частичное сходство со структурой «интеллекта» медиаробота. В качестве наиболее перспективного средства расширения вербального интеллекта медиаробота выделяется технология моделирования естественного языка. В заключении делается вывод о существовании конвергентных тенденций между методами инженерии знаний и аналитической журналистики. Утверждается, что для дальнейшего прогресса в создании медиароботов нового поколения, главными чертами которых должны стать способность к самообучению и «чувство» социальной ответственности, необходимы совместные усилия в области междисциплинарных исследований цифровых медиа, искусственного интеллекта и когнитологии.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по СМИ (медиа) и массовым коммуникациям , автор научной работы — Замков Андрей Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

News Media Robot: Theoretical Aspects of Intellectual System for Content Generation

The article discusses a new phenomenon of digital media sphere, i.e. news media robots, which are capable of creating content on a technological platform of intellectual systems. Interdisciplinary approaches to understanding this phenomenon, which attract theoretical concepts and cases from artificial intelligence, knowledge engineering and natural language technologies are considered. It is stated, that in the core of intellectual systems lie computational models of natural human intelligence and knowledge. The phenomenon of imitation as a characteristic of social and technical systems general ability to self-study relying on a sample is viewed as a key mechanism media robots adaptation to social environment. The case study of generating news content within the context of frames theory is provided as an illustration of universal formalism for representation of knowledge and social actions. The structure of general human intelligence, provided by Cattell Horn theory, is considered as a possible reference model for comparison of a robotic intellectual system with natural human intelligence. The similarity between a general intelligence structure and an “intellectual” structure of a media robot is noted. The article defines the technology of modelling a natural language as the most prospective means of broadening the verbal intellect of a media robot. It is stated in conclusion, that one can observe trends for convergence in the methodology of knowledge engineering and analytical journalism. In a long-term perspective serious progress in creating new generation of media robots requires reproduction of such human abilities, as learning and “sense” of social responsibility. For this reason joint efforts in interdisciplinary studies in digital media, artificial intelligence and cognitive sciences are required.

Текст научной работы на тему «Новостной медиаробот: теоретические аспекты интеллектуальной системы генерации контента»

УДК 070.1:004 DOI 10.17150/2308-6203.2019.8(2).260-273

Замков Андрей Владимирович

Научный сотрудник

Проблемная научно-исследовательская лаборатория комплексного изучения актуальных проблем журналистики, факультет журналистики, Московский государственный университет им. М.В. Ломоносова, 125009, Российская Федерация, г Москва, ул. Моховая, 9, e-mail: zamkov.andrey@smi.msu.ru

Andrey V. Zamkov

Research fellow

Laboratory for Complex Media and Journalism Studies, Faculty of Journalism, Lomonosov Moscow State University, 9 Mokhovaya Str., Moscow, 125009, Russian Federation, e-mail: zamkov.andrey@smi.msu.ru

НОВОСТНОЙ МЕДИАРОБОТ: ТЕОРЕТИЧЕСКИЕ АСПЕКТЫ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ ГЕНЕРАЦИИ КОНТЕНТА

Аннотация. В статье обсуждается новый феномен цифровой ме-диасферы — новостные медиароботы, способные создавать текстовый контент на технологической платформе интеллектуальных систем. Рассматриваются междисциплинарные подходы к пониманию этого феномена с привлечением теоретических положений и примеров из области искусственного интеллекта, инженерии знаний и технологий естественного языка. В качестве рабочей гипотезы о природе интеллектуальных систем медиароботов формулируется утверждение, что они являются вычислительными моделями, которые имитируют специфические функции естественного интеллекта человека. Феномен имитации как присущая социальным и техническим системам общая способность к самообучению по образцу, расценивается в качестве ключевого механизма адаптации медиароботов к социальной среде. Для иллюстрации функционирования интеллектуальной системы медиаробота приводится кейс генерации новостного контента в контексте теории фреймов — междисциплинарного формализма для представления образцов знаний и стереотипов социального поведения. Как возможный эталон для сравнения интеллектуальной системы робота с естественным интеллектом человека рассматривается структура общего интеллекта по Кэттелу — Хорну. Отмечается её частичное сходство со структурой «интеллекта» медиаробота. В качестве наиболее перспективного средства расширения вербального интеллекта медиаробота выделяется технология моделирования естественного языка. В заключении делается вывод о существовании конвергентных тенденций между методами инженерии знаний и аналитической журналистики. Утверждается, что для дальнейшего прогресса в создании медиароботов нового поколения, главными чертами которых должны стать способность к самообучению и «чувство»

социальной ответственности, необходимы совместные усилия в области междисциплинарных исследований цифровых медиа, искусственного интеллекта и когнитологии.

Ключевые слова. Медиаробот, интеллектуальная система, искусственный интеллект, база знаний, инженерия знаний, теория фреймов, технология естественного языка.

Информация о статье. Дата поступления 24 декабря 2018 г.; дата принятия к печати 6 мая 2019 г.; дата онлайн-размещения 24 мая 2019 г.

NEWS MEDIA ROBOT: THEORETICAL ASPECTS OF INTELLECTUAL SYSTEM FOR CONTENT GENERATION

Abstract. The article discusses a new phenomenon of digital media sphere, i.e. news media robots, which are capable of creating content on a technological platform of intellectual systems. Interdisciplinary approaches to understanding this phenomenon, which attract theoretical concepts and cases from artificial intelligence, knowledge engineering and natural language technologies are considered. It is stated, that in the core of intellectual systems lie computational models of natural human intelligence and knowledge. The phenomenon of imitation as a characteristic of social and technical systems general ability to self-study relying on a sample is viewed as a key mechanism media robots adaptation to social environment. The case study of generating news content within the context of frames theory is provided as an illustration of universal formalism for representation of knowledge and social actions. The structure of general human intelligence, provided by Cattell — Horn theory, is considered as a possible reference model for comparison of a robotic intellectual system with natural human intelligence. The similarity between a general intelligence structure and an "intellectual" structure of a media robot is noted. The article defines the technology of modelling a natural language as the most prospective means of broadening the verbal intellect of a media robot. It is stated in conclusion, that one can observe trends for convergence in the methodology of knowledge engineering and analytical journalism. In a long-term perspective serious progress in creating new generation of media robots requires reproduction of such human abilities, as learning and "sense" of social responsibility. For this reason joint efforts in interdisciplinary studies in digital media, artificial intelligence and cognitive sciences are required.

Keywords. Media robot, intellectual system, artificial intelligence, knowledge base, knowledge engineering, frames theory, natural language technology.

Article info. Received December 24, 2018; accepted May 6, 2019; available online May 24, 2019.

Проблема и актуальность вопроса

Цифровые трансформации СМИ в настоящее время преодолевают очередной технологический рубеж, который в числе других особенно-

стей характеризуется переходом от «ручного» способа производства контента к его частичной замене ме-диароботами роботизированными системами, управляемыми с помощью технологий искусственного ин-

теллекта. Уточним, что под словом «интеллект» в данном контексте понимается всего лишь способность к имитации разумных форм речевой деятельности машиной, а отнюдь не её, машины, антропоморфное качество.

Так как машинное создание текстов новостей с помощью технологий искусственного интеллекта становится одним из успешных опытов, сначала экспериментальной,а затем и коммерческой роботизации медиа, понимание внутренних механизмов этого явления требует серьезного теоретического осмысления.

В этой статье интеллектуальная система (ИС) медиаробота рассматривается с точки зрения его участия в ключевой фазе медиа-производства, а именно генерации текстового контента. Автор использует междисциплинарный подход с привлечением теоретических положений и примеров из области искусственного интеллекта и инженерии знаний. В сопряжении с концепцией представления знаний как фреймов и технологий естественного языка такое видение применяемых в медиа роботизированных систем дает исследователям объемное теоретическое представление об этом мало исследованном феномене.

Краткий обзор подходов и

терминологии

Рассматриваемые в данной статье медиароботы относятся к категории интеллектуальных систем (ИС) узкого назначения, которые основаны на знаниях вербального опыта повседневной жизни. Их функция состоит в языковом анализе и генерации контента, отражающего динамику стереотипных ситуаций.

Типичными примерами такого контента являются сводки финансовых, спортивных новостей, хроники криминальных событий и т.п.

Интеллектуальная система — это, как правило, конечный продукт междисциплинарных исследований и разработок в области искусственного интеллекта (ИИ). Наряду с интеллектуальными системами широко используется эквивалентный термин «система искусственного интеллекта», например, система общения с машиной на естественном языке в интерактивном режиме [1; 2]. Исследования фундаментальных предпосылок современных систем искусственного интеллекта берут начало в трудах классиков теории автоматического регулирования [3]. Именно они заложили физико-математические основы общей теории саморегуляции. Главным событием, которое инициировало прикладные проекты в этой новой междисциплинарной области, стало Предложение Дартмутской конференции 1956 года по исследованию искусственного интеллекта. Его подготовила инициативная группа учёных и инженеров во главе с профессором Стэнфорд-ского университета Джоном Мак-карти (США) [4]. Конструирование коммерческих интеллектуальных систем обязано своими достижениями, в первую очередь, прогрессу в математической части теории и методологии программирования. Эта динамичная область исследований и разработок во многом опирается на данные смежных дисциплин — психологии, лингвистики, эпистемологии и др., поэтому дать законченное определение её объекту даже с позиций системного подхода затруднительно. Среди наиболее известных

попыток найти такое определение можно выделить теоретический и прагматический_подходы.

Хрестоматийным примером теоретического подхода служит определение искусственного интеллекта как синтетической дисциплины, которая исследует закономерности, лежащие в основе разумного поведения. Роль инструмента исследований здесь играют вычислительные модели принятия решений естественным интеллектом человека [5]. Благодаря прогрессу в области технологии цифрового моделирования этот класс моделей расширяется особенно быстро [6].

Прагматический подход к определению искусственного интеллекта появился в связи с освоением рынком новых технологических решений. Так, например, глоссарий исследовательской компании Gartner (США), предлагающей консалтинговые услуги в области анализа и прогнозирования трендов информационных технологий, определяет искусственный интеллект на основе цели его создания. «Искусственный интеллект — это технология, которая призвана эмулировать базовые человеческие способности к обучению, умозаключениям, пониманию сложного контента, который возникает в естественных диалогах между людьми, усиливать когнитивные способности (т.е. производить так называемые когнитивные вычисления) или замещать людей при выполнении некреативных задач»1.

Следует отметить, что в русскоязычной литературе по проблемам искусственного интеллекта суще-

1 IT Glossary, Gartner Inc., 2018. URL: https://www.gartner.com/it-glossary

ствует возникшее из-за неточности перевода английского словосочетания «artificial intelligence» более претенциозный термин «искусственный интеллект»2. Исходный термин подразумевает «искусственную интеллигентность», а не «интеллект», т.е. не ментальную способность, а свойство машины работать со знаниями, имитируя объективное понимание и рассуждения. С этой ошибкой связано, в частности, возникновение завышенных ожиданий в отношении уровня зрелости технологий искусственного интеллекта.

Теоретическая база и рабочая

гипотеза

Новостной медиаробот — это интеллектуальная система, которая предназначена для автоматизации ключевой фазы цикла медиапроиз-водства — производства и презентации контента.

В терминах ИС контент — это, прежде всего, разновидность социальных знаний, а сама система воспроизводит с различной степенью точности те или иные когнитивные функции человека.

Хотя некоторые системы успешно имитируют и устную речь, в этой статье обсуждается принцип действия роботов, производящих письменные сообщения (тексты).

По характеру решаемых ИС задач их можно разделить на два широких класса — это системы, решающие задачи анализа, и системы, решающие задачи синтеза. Относящиеся к первому классу системы настроены, соответственно, на понимание текста, а системы второго

2 English Oxford Living Dictionary, 2018. URL: https://en.oxforddictionaries.com/definiti-on/intelligence

класса — это генераторы текста. Реальные медиароботы, разумеется, сочетают в себе функции обоих типов, как первого — анализа, так и второго типа — синтеза.

С целью придания большей выразительности презентации медийные роботы нередко наделяются чертами антропоморфных персонажей. ИС робота может быть реализована как чисто программно, так и аппаратно. В первом случае ИС называют ботом или агентом, во втором — роботом. Антропоморфных роботов-андроидов используют в роли виртуальных блогеров и даже телеведущих, имитирующих речь и мимику человека. Типичным примером андроида может служить новостной робот китайского агентства Синьхуа3. В качестве примера бота можно указать голосового помощника Алиса от компании Яндекс4.

Цикл функционирования меди-аробота как интеллектуальной системы объединяет два последовательных этапа — накопление знаний (обучение системы) и генерацию потока новостей. Этап накопления (обучения) состоит из серии процедур человеко-машинного общения, например, формирования словарей, тезаурусов и других источников знаний, которые послужат для генерации контента. Хотя не прекращаются попытки придать этим процедурам форму свободного диалога с машиной, едва ли удастся автоматизировать обучение полностью в обозримом будущем. Напротив, процесс генерации новостей протекает почти

3 World's first AI news anchor makes "his" China debut // XINHUANET. URL: http://www.xinhuanet.com/engNsh/2018-11/08/c_137591813.htm.

4 Яндекс. URL: https://alice.yandex.ru

полностью алгоритмически, т.е. в автономном режиме.

В настоящее время достичь автономного воспроизведения специфичных для работы журналиста интеллектуальных функций (чтения, анализа, создания текста и др.) удалось ценой отказа от создания универсальной интеллектуальной системы, работающей в широкой предметной области. Сегодня архитектуру интеллектуальной системы медиаробота определяют два элемента. Это так называемый лингвистический процессор (оболочка) языковой обработки знаний и база знаний (БЗ). Именно процессор обеспечивает алгоритмическую переработку информации в системе, а БЗ служит её онтологическим ядром. БЗ новостных роботов обычно строятся на узкоспециализированных темах (например, финансы, спорт, погода и др).

База знаний в некотором смысле оказалась переходным средством представления знаний, выраженных формально в виде набора понятных машине символов. База знаний занимает промежуточное место между таким архаическим средством репрезентации как картотека и компьютерная лингвистическая онтология [7]. База знаний медиа-робота — это электронный каталог лингвистических и экстралингвистических знаний. Первые несут сведения о правилах языка, а вторые — о смысловых связях сущностей, в том числе в контексте конкретной темы (финансы, спорт и т.д.).

Прототипами баз знаний являются проекты создания идеографических словарей (тезаурусов) общего языка науки, его основы были заложены ещё в работах Лейбница.

Одна из первых версий такого словаря — «Тезаурус Роже» — была опубликована только в середине XIX века. Она включает описание тысячи смысловых категорий логической модели мира и позволяет проследить системообразующие связи между общим и частным, целым и частью и т.п. Электронная версия этого англоязычного тезауруса по-прежнему актуальна и доступна онлайн [8]. Сравнительно недавно был опубликован русскоязычный аналог «Тезауруса Роже» — первый выпуск идеографического словаря русского языка [9].

База знаний новостного робота, разумеется, не обладает такой полнотой описания сущностей, как упомянутые тезаурусы. Она ориентирована не столько на научную лексику, сколько на словари и языковые правила стереотипов общения — синтаксис, семантику и прагматику ситуационного контекста по избранной узкоспециализированной теме. Такая база знаний хранится в памяти интеллектуальной системы на внутреннем языке машины. Следует отметить, что система может включать несколько версий баз знаний, настроенных на разные национальные языки и темы новостей.

В обыденном сознании человека новостной дискурс представлен неупорядоченным набором эпизодических знаний. Они выражают множество размытых взаимосвязей между событиями, фактами и закономерностями проблемных ситуаций (политических, экономических, спортивных, этнических и т.д.), которые складываются спонтанно. Содержанием же «знаний системы» является экспертный опыт, полученный в результате профессиональной дея-

тельности специалистов (журналистов, аналитиков, редакторов и др.).

Таким образом можно предположить, что первичным источником знаний интеллектуальной системы всегда служит и продолжает оставаться деятельность человека как субъекта познания. Это предположение отвечает так называемой гипотезе слабого искусственного интеллекта [10]. Систематизация знаний, их интерпретация и подготовка для переработки интеллектуальной системой является одной из задач инженерии знаний [7].

Инженерия знаний как методология проектирования интеллектуальной системы медиаробота

Инженерия знаний — синтетическая дисциплина, которая возникла на пересечении методов системного анализа, информатики и когни-тологии (cognitive science), благодаря чему она соединила в своей методологии черты номотетического и идеографического подходов. На данном этапе своего развития инженерия знаний служит технико-теоретической базой для моделирования знаний и конструирования интеллектуальных систем. Претендующая на роль её естественнонаучного основания когнитология является областью исследований, содержащей много нерешённых проблем. Она развивалась относительно независимо, начиная с середины 1970-х годов [11]. Поэтому при создании интеллектуальных систем «инженер по знаниям» (синонимы: аналитик, когнитолог) часто сам испытывал (и продолжает ипытывать) дефицит знаний в области фундаментальных законов, управляющих мышлением. Для компенсации неопределённости аналитик часто был вынужден при-

бегать к эвристическим приёмам решения проектных задач.

Одну из базовых компетенций аналитика составляет оптимизация методов преобразования знаний в машинную форму представления. Как полагает один из видных специалистов по искусственному интеллекту Э. Фейгенбаум [12], центральным принципом инженерии знаний служит тезис Ф. Бэкона о заключённой в знаниях силе. Поэтому интеллект медиаробота в первую очередь определяется его базой знаний и уже во вторую — алгоритмами их переработки. Соответственно, основанные на знаниях алгоритмы, или методы решения задач, в искусственном интеллекте принято относить к «сильным» методам, т.е. основанным на богатой эмпирической базе, в отличие от «слабых» методов, основанных на эвристиках, опирающихся на метод сплошного перебора.

Собственно знания в контексте неклассической эпистемологии также делятся на две категории — эксплицитные и имплицитные знания [13]. Эксплицитные знания могут быть записаны в нотации тех или иных знаковых систем. Для их анализа существуют хорошо разработанные приёмы, например, текстологические. Имплицитные (личностные) знания закодированы в памяти эксперта неявно. Выбор стратегии для извлечения знаний, их вербализации и структурирования является не только одной из центральных задач аналитика, но и современного гуманитарного знания в целом. Сегодня основным средством решения этих задач остаются методы структурной коммуникации. От степени полноты и корректности представления имплицитных, или неявных знаний

зависит уровень антропоморфности социального и языкового поведения робота.

Помимо указанной категоризации знаний применяется и другая категоризация, основанная на степени формализации знаний. Сведения о социальных фактах, составляющие смысл новостного дискурса, относятся к категории слабо формализованных, «мягких» знаний. Для их извлечения из памяти эксперта и передачи в базу знаний системы эти сведения подвергаются процедурам трансформации. Они служат для перевода неявных знаний с естественного языка описания на искусственный язык, близкий к внутреннему (искусственному) языку машины.

Наиболее важную роль играют следующие трансформации. Во-первых, это неформальная процедура извлечения закодированных в памяти знаний. Процедура извлечения в настоящее время считается наиболее узким местом в построении базы знаний. Это вызвано тем, что технология извлечения вынуждена избегать жёстких методов экспертизы из-за риска искажения смысловых связей имплицитных знаний эксперта. Поэтому степень формализации имплицитных знаний на шаге извлечения невысока — она ограничена частным тезаурусом эксперта.

Другим важным шагом процесса подготовки знаний для машинной обработки является формирование так называемого поля знаний — условного описания основных объектов проблемной ситуации, их свойств и отношений. Поле знаний — это модель ситуации, выраженная на языке спецификации знаний — вспомогательном языке аналитика. Смешанная нотация является его

наиболее характерной чертой. Она включает как буквенно-цифровые символы, так и иконические знаки (пиктограммы, графику и др.). Этот язык занимает промежуточный уровень абстракции между естественным и формальным математическим языком.

Выбор или разработка языка описания «мягких» знаний в значительной мере определяется опытом аналитика. Официальные проекты универсальных языков данного типа широкого применения пока не нашли. Как полагают, хорошим приближением к такому языку может стать язык семиотического моделирования, который занимает одно из центральных мест в прикладной семиотике [14].

Своей универсальностью семиотические модели обязаны пластичности языка условных знаков инженерной и когнитивной графики (схем, иконических знаков, графиков и т.д.). Похожие обозначения находят все более широкое применение и в медийной практике в виде языка инфографики. Благодаря этому удаётся строить эффективные нотации, оптимально сочетающие гибкость и строгость со смысловой прозрачностью, интуитивной ясностью и др. Математический аппарат исчислений, например, формальный логики, таким набором качеств не обладает. Нередко на завершающем шаге трансформаций это становится причиной отказа в пользу менее точных, но более гибких языков описания экспертных знаний.

Медиаробот в контексте

концепции фреймов

Завершающий шаг создания базы знаний состоит в переводе свода

знаний на конкретный язык представления в базе знаний робота. Одним из ранних подходов к представлению знаний стал предложенный Марвином Минским ещё в 70-х годах ХХ века язык фреймов Мар-вина Минского [15], а также сетевые модификации и обобщения этой модели. Эти идеи легли в основу современной методологии объектно-ориентированного программирования, позволившей улучшить ясность компьютерных программ [16].

Важным стимулом к созданию концепции «фрейма знаний» стали исследования по гештальтпсихоло-гии. Фрейм — это условный каркас, который отражает, по крайней мере, концептуально, блочную организацию памяти человека. В инженерии знаний фреймами также называют абстрактные образы стереотипов восприятия, например, «стадион», «команда», «состязание» и др. Термином «фрейм» также обозначают и знаковую модель для формализованного представления ментального образа.

Типовую структуру фрейма можно представить в виде поименованного списка ячеек (слотов), который содержит пары (<имя свойства> : <значение свойства>). Такую абстрактную структуру называют фреймом-образцом. Он имеет вид текстового шаблона

{<Имя фрейма> :

(<свойство 7> : <значение 7>);

(<свойство 2> : <значение 2>);

(<свойство п> : <значение п>)}.

При формировании базы данных в пустые ячейки шаблона фрейма-образца заносятся данные о свой-

ствах предметной области. Заполненный фрейм-образец превращается во фрейм-экземпляр, который описывает текущее состояние конкретной новостной истории, например, спортивного состязания:

{<Чемпионат мира по футболу> :

(<место проведения> : <Россия>); (<год проведения> : <2018>); (<участник> : <Германия>);

(<игрок> : <Платтенхардт>); .........................................}.

Фреймы допускают объединение в сети, позволяющие строить иерархические модели знаний. Элементом сети фреймов, например, может быть спортивный профиль игрока

{<Игрок> :

(<фамилия> : <Платтенхардт>); (<имя> : <Марвин>); (<возраст> : <26>); (<рост> : <181>);

(<специализация> : <защитник>)}.

Фреймы зарекомендовали себя как универсальные, гибкие и наглядные модели представления стереотипных новостных историй. В частности, интеллектуальные системы на основе фреймов оказались вполне эффективными в практике роботизации новостных агентств, несмотря на то, что они отражают лишь поверхностную макроструктуру потока новостей — на уровне грамматики текста [17].

Технология естественного языка в интеллектуальной системе медиаробота

Для моделирования глубинных явлений речевой деятельности,

протекающих на уровне грамматики естественного языка (ЕЯ), существует специальный класс алгоритмов и моделей, носящий название технологии ЕЯ. Технология ЕЯ позволяет системе воспроизводить когнитивные процессы создания и понимания контента более точно, чем техника фреймов. Оснащение системы технологией ЕЯ открывает возможности речевого общения с роботом, по крайней мере, в рамках узкопрофессиональной лексики — онлайн анализа информации, самообучения робота и ряда других когнитивных функций. В перспективе, вероятно, лидерство перейдёт от технологий ЕЯ к технологиям самообучения, т.к. именно эта «способность» машины позволит имитировать фундаментальное свойство человеческого мозга — нейропла-стичность.

Дополнив традиционную речевую практику генерации новостных сообщений алгоритмической, технологии ИИ открыли путь к радикальной модернизации системы дискурса. Считается, что она перераспределит роли, права и обязанности между акторами и медиароботами с разной степенью их автономии от социального контроля.

Уровень достижений в исследовании ИИ ещё не позволяет строить роботов с высокой степенью социального интеллекта и ответственности, способностью к самообучению и самостоятельной переработке текстов на уровне полного ЕЯ. Поэтому даже вербальный «интеллект» медиароботов сужен до уровня, так называемого ограниченного ЕЯ. Его характеризует низкое лексическое и грамматическое разнообразие, а также отсутствие высоких требова-

ний к стилю изложения и глубине логических выводов [18].

Язык новостей по мнению ван Дейка [17] доставляет типичный пример такого сужения, отвечающего возможностям современных технологий ЕЯ. Он охватывает информационные ниши повторяющихся проблемных ситуаций — события спортивной, финансовой и криминальной жизни и др. В сводках новостей обычно используются устоявшиеся грамматические формулы (штампы). Они имеют чёткую смысловую структуру и сравнительно легко поддаются алгоритмизации. Это резко упрощает моделирование сценариев дискурса для их воспроизведения машиной. В общем случае такая задача сводится к замене языкового механизма генерации естественных речевых форм системой алгоритмов. Примеры таких «автоматических сообщений», сгенерированных машиной, уже вошли в повседневную практику информационных агентств, в России — это Интерфакс и ТАСС.

Интеллектуальная система

медиаробота как цифровая

модель общего интеллекта

Вопросы алгоритмической (машинной) имитации устной и письменной речи разного уровня сложности, вплоть до речи поэтической, как одни из ключевых проблем теории ИИ поднимались ещё Норбер-том Винером [19]. Они исследуются теоретически и экспериментально более полувека. Так как интеллектуальная система медиаробота по своим внешним характеристикам в идеале должна приближаться к разуму человека, то эффективное применение частных технологий ИИ дополняется минимальным набором

функций «общего интеллекта». Так, технология ЕЯ интегрируется в ме-диаиндустрии с другими интеллектуальными системами — базами знаний, машинным обучением, машинной аналитикой и др.

Хотя разработчики интеллектуальных систем не ставят конечной целью создание копирующих мышление автоматов, многие исследования ИИ сосредоточены на попытках понимания когнитивных основ человеческого разума. Сегодня общий интеллект человека продолжает оставаться единственным критерием для оценки интеллектуальных действий. Важной эмпирической предпосылкой его понимания, которое необходимо для развития теории интеллектуальных систем, станут, вероятно, количественные модели общего интеллекта. Попытку создания такой модели представляет популярная в когнитивной психологии, но мало освещенная в области информатики, двухфакторная модель общего интеллекта Кэттелла — Хорна [20]. На сегодняшний день это наиболее разработанная полевая модель интеллекта. Она создана на основе анализа достаточно представительной выборки психометрических данных. Авторам модели удалось выделить две устойчивые формы общего интеллекта, отвечающие за разные когнитивные функции. Так, кристаллизованная (консервативная) форма интеллекта отвечает за накопленный в течение жизни индивида стратегический запас знаний, решение типовых задач классическими методами и т.п., в то время как подвижная (гибкая) форма интеллекта — за такие приспособительные функции, как количественное мышление, решение тактических задач, адаптацию

к новым условиям и т.п. Признаки этих эмпирических форм, прослеживаются в теоретических основаниях искусственного интеллекта [21], классификации знаний на процеду-ральные и декларативные, а также в архитектуре программ интеллектуальных систем медиароботов.

Выводы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Роботизация производства новостного дискурса стала объективным трендом в развитии медиа-систем XXI века. В связи с этим наблюдается рост удельного веса технологий искусственного интеллекта в роботизированном производстве контента, что приводит к заключению о рождении новой отрасли медиаиндустрии XXI века — роботожурналистики. Эта тенденция постоянно усиливается в контексте долгосрочного программного требования «медиатизации всего» [22]. Его воплощение ведёт к слиянию интеллектуальных ресурсов человека и машины, вплоть до полного поглощения роботом ряда трудовых функций человека. Программа интеллектуальной медиатизации означает глубинную реконструкцию производственных отношений внутри институтов медиа.

2. Сравнительный анализ роботизированных систем генерации контента и структурных особенностей новостного дискурса показал, что практический успех этой новой медиатехнологии во многом обязан системному подходу к синтезу методов инженерии знаний и компьютерной лингвистики с идеями дискурс-анализа [23] (van Dijk T.A., 1988). Подавляющее большинство индустриальных решений генерации и анали-

за текстов являются программными продуктами, созданными на основе подобного синтеза.

3. Интеллектуальные системы медиароботов не обладают никакими «эмерджентными» интеллектуальными свойствами. Своим «интеллектом» они обязаны инженерным приёмам репрезентации моделей контента и контекста, хранящимися в памяти экспертов — лингвистов, психологов, медиааналитиков и др. Классическим примером репрезентации таких моделей служат фреймы знаний.

4. Алгоритмы поведения меди-ароботов лишь имитируют речевую деятельность человека в ключевых фазах производства. В целом же их социальные функции пока ограничены ролью цифровых ассистентов.

5. Обоснованность понимания искусственного интеллекта как модели естественного подтверждается сходством коммуникативных методов (интервью, анкетирование, опрос, и т.п.) извлечения информации, к которым прибегает как инженерия знаний, так и аналитическая журналистика [24]. Это сходство отражает тенденцию к сближению интересов в исследовании новых медиа и когнитологии. Актуальность данной тенденции для СМИ подтверждается становлением новых дисциплин, таких как журналистика данных, цифровая журналистика и т.п. Можно предположить, что сохранение этой конвергентной тенденции в перспективе вызовет к жизни поколение роботов, способных генерировать искусственные тексты, сопоставимые с авторскими текстами качественных (аналитических) СМИ.

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ

1. Мальковский М.Г. Диалог с системой искусственного интеллекта / М.Г Мальков-ский. — М. : Изд-во МГУ, 1985. — 214 с.

2. Content-Based Technology for Recognition of Offensive Sites / Malkovskiy M. [et al.] // Proceedings of the 6th European Christian Internet Conference (ECIC). Frederiksberg, 2001.

3. Максвелл Д.К. Теория автоматического регулирования (линеаризованные задачи) / Д.К. Максвелл, И.А. Вышнеградский, А. Стодола ; под ред. А.А. Андронова, И.Н. Вознесенского. — М. : Изд-во АН СССР, 1949. — 431 с.

4. A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence [Electronic resource] / J. McCarthy [et al.]. — Mode of access: http://www-formal.stanford. edu/jmc/history/dartmouth/dartmouth.html

5. Кузин Л.Т. Основы кибернетики : в 2 т. : учеб. пособие / Л.Т. Кузин. — М. : Энергия, 1979. — Т. 2: Основы кибернетичесских моделей. — 584 с.

6. Люгер Дж.Ф. Искусственный интеллект. Стратегии и методы решения сложных проблем / Дж.Ф. Люгер. — 4-е изд. — М. : Вильямс, 2003. — 864 с.

7. Гаврилова Т.А. Инженерия знаний. Модели и методы : учебник / Т.А. Гаврилова, Д.В. Кудрявцев, Д.И. Муромцев. — СПб. : Лань, 2016. — 324 с.

8. Roget P.M. Roget's Thesaurus of English Words and Phrases / P.M. Roget, G.W. Davidson. — London : Penguin Books, 2002. — 500 p.

9. Баранов О.С. Идеографический словарь русского языка / О.С. Баранов. — М. : Прометей, 1990. — 252 с.

10. Searle J.R. Minds, brains, and programs / Searle J.R. // Behavioral and brain sciences. — 1980. — Т. 3, no. 3. — P. 417-457.

11. Thagard P. Cognitive Science [Electronic resource] / P. Thagard // The Stanford Encyclopedia of Philosophy / ed. E.N. Zalta. — Mode of access: https://plato.stanford.edu/ archives/win2018/entries/cognitive-science.

12. Feigenbaum E. The Age of Intelligent Machines: Knowledge Processing — From File Servers to Knowledge Servers [Electronic resource] / E. Feigenbaum // Kurzweil.Ai.net. — Mode of access: https://web.archive.org/web/20080629111950/http://www.kurzweilai.net/ meme/frame.html?main=%2Farticles%2Fart0098.html

13. Полани М. Личностное знание: на пути к посткритической философии / М. По-лани ; под ред. В.А. Лекторского, В.И. Аршинова. — М. : Прогресс, 1985. — 344 с.

14. Pospelov D.A. Semiotic Models in Control Systems / D.A. Pospelov // The 10th IEEE Symposium on Intelligent Control — Proceedings. — 1995. — P. 6-12.

15. Minsky M. A Framework for Representing Knowledge [Electronic resource] / M. Minsky. — Mode of access: http://web.media.mit.edu/~minsky/papers/Frames/frames.html

16. Дейкстра Е.В. Программирование как вид человеческой деятельности [Электронный ресурс] / Дейкстра Е.В. // Избранные статьи. — Режим доступа: https://docplayer. ru/25908990-Edsger-deykstra-izbrannye-stati.html.

17. Ван Дейк Т.А. Анализ новостей как дискурса / Т.А. Ван Дейк // Ван Дейк Т.А. Язык. Познание. Коммуникация / Т.А. Ван Дейк ; под ред. В.И. Герасимова. — Изд. 2-е. — М., 2015. — С. 111-160.

18. Лукина М.М. Сравнительный анализ структурно-содержательных элементов машинных и журналистских новостных сообщений / М.М. Лукина, Е.А. Палашина // Меди-Альманах. — 2019. — № 1.

19. Винер Н. Кибернетика и общество / Н. Винер. — М. : Иностр. лит, 1958. — 200 с.

20. Cattell R.B. Intelligence: Its Structure, Growth and Action / R.B. Cattell. — Amsterdam : Elsevier Science Publishers, 1987. — 694 p.

21. Luger G.F. Cognitive Science: The Science of Intelligent Systems / G.F. Luger. — New York : Academic Press, 1994.

22. Livingstone S. On the mediation of everything: ICA presidential address 2008 / S. Livingstone // Journal of communication. — 2009. — Vol. 59, iss. 1. — P. 1-18.

23. Van Dijk T.A. News as discourse / T.A. Van Dijk. — Hillsdale : Lawrence Elbraum Associates Publishers, 1988. — 200 p.

24. Тертычный А.А. Аналитическая журналистика : учеб. пособие / А.А. Тертыч-ный. — 2-е изд., испр. и доп. — М. : Аспект Пресс, 2013. — 352 с.

REFERENCES

1. Malkovskii M.G. Dialog s sistemoi iskusstvennogo intellekta [A dialogue with an artificial intelligence system]. Lomonosov Moscow State University Publ., 1985. 214 p.

2. Malkovskiy M., Abramov V., Kantor V., Pilstchikov V., Varov K., Zamkov A. Content-Based Technology for Recognition of Offensive Sites. Proceedings of the 6th European Christian Internet Conference (ECIC). Frederiksberg, 2001.

3. Maxwell J.C., Vyshnegradskii I.A., Stodola A. ; Andronov A.A., Voznesenskii I.N. (eds). Teoriya avtomaticheskogo regulirovaniya (linearizovannye zadachi) [Theory of automatic regulation (linearized problems)] Moscow, Akademiya nauk SSSR Publ., 1949. 431 p.

4. McCarthy J., Minsky M.L., Rochester N., Shannon C.E. A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence. Available at: http://www-formal.stanford. edu/jmc/history/dartmouth/dartmouth.html.

5. Kuzin L.T. Osnovy kibernetiki [Basics of cybernetics]. Moscow, Energiya Publ., 1979. Vol. 2. 584 p.

6. Luger G.F. Artificial Intelligence. Structures and Strategies for Complex Problem Solving. Boston, Addison Wesley, 1998. (Russ. ed.: Luger G.F. Iskusstvennyiintellekt. Strategiii metody resheniya slozhnykh problem. 4th ed. Moscow, Vil'yams Publ., 2003. 864 p.).

7. Gavrilova T.A., Kudryavtsev D.V., Muromtsev D.I. Inzheneriya znanii. Modeli i metody [Knowledge engineering. Models and methods]. Saint Petersburg, Lan' Publ., 2016. 324 p.

8. Roget P.M., Davidson G.W. Roget's Thesaurus of English Words and Phrases. London, Penguin Books, 2002. 500 p.

9. Baranov O.S. Ideograficheskii slovar' russkogo yazyka [Ideographic Russian dictionary]. Moscow, Prometei Publ., 1990. 252 p.

10. Searle J.R. Minds, brains, and programs. Behavioral and brain sciences, 1980, vol. 3, no. 3, pp. 417-457.

11. Thagard P. Cognitive Science. In Zalta E.N. (ed.). The Stanford Encyclopedia of Philosophy. Available at: https://plato.stanford.edu/archives/win2018/entries/cognitive-science.

12. Feigenbaum E. The Age of Intelligent Machines: Knowledge Processing - From File Servers to Knowledge Servers. Available at: https://web.archive.org/web/20080629111950/ http://www.kurzweilai.net/meme/frame.html?main=0/o2Farticles0/o2Fart0098.html

13. Polanyi M. Personal knoweledge. Towards a Post-Critical Philosophy. London, Rout-ledge, 1958. (Russ. ed.: Polanyi M. ; Lektorskii V.A., Arshinov V.I. (eds). Lichnostnoe znanie: na puti kpostkriticheskoi filosofii. Moscow, Progress Publ., 1985. 344 p.).

14. Pospelov D.A. Semiotic Models in Control Systems. The 10th IEEE Symposium on Intelligent Control - Proceedings, 1995, pp. 6-12.

15. Minsky M. A Framework for Representing Knowledge. Available at: http://web.media. mit.edu/~minsky/papers/Frames/frames.html.

16. Dijkstra E.W. Programming Considered as a Human Activity. Avajlable at: https://doc-player.ru/25908990-Edsger-deykstra-izbrannye-stati.html. (In Russian).

17. Van Dijk T.A. News Analysis as Discourse. In Van Dijk T.A.; Gerasimov V.I. (ed.). Yazyk. Poznanie. Kommunikatsiya [Language. Cognition. Communication]. 2nd ed. Moscow, 2015, pp. 111-160. (In Russian).

18. Lukina M.M., Palashina E.A. Comparative analysis of structural-content elements of machine and journalists' news items. MediaAl'manakh = MediaAlmanah Journal, 2019, no. 1. (In Russian).

19. Wiener N. Cybernetics and Society. London, 1954. (Russ. ed.: Wiener N. Kibernetika i obshchestvo. Moscow, Inostrannaya literatura Publ., 1958. 200 p.).

20. Cattell R.B. Intelligence: Its Structure, Growth and Action. Amsterdam, Elsevier Science Publishers, 1987. 694 p.

21. Luger G.F. Cognitive Science: The Science of Intelligent Systems. New York, Academic Press, 1994.

22. Livingstone S. On the mediation of everything: ICA presidential address 2008. Journal of communication, 2009, vol. 59, iss. 1, pp. 1-18.

23. Van Dijk T.A. News as discourse. Hillsdale, Lawrence Elbraum Associates Publishers, 1988. 200 p.

24. Tertychnyi A.A. Analiticheskaya zhurnalistika [Analytical journalism]. 2nd ed. Moscow, Aspekt Press Publ., 2013. 352 p.

ДЛЯ ЦИТИРОВАНИЯ

Замков А.В. Новостной медиаробот: теоретические аспекты интеллектуальной системы генерации контента / А.В. Замков // Вопросы теории и практики журналистики. — 2019. — Т. 8, № 2. — С. 260-273. — DOI: 10.17150/2308-6203.2019.8(2).260-273.

FOR CITATION

Zamkov A.V. News Media Robot: Theoretical Aspects of Intellectual System for Content Generation. Voprosy teorii i praktiki zhurnalistiki = Theoretical and Practical Issues of Journalism, 2019, vol. 8, no. 2, pp. 260-273. DOI: 10.17150/2308-6203.2019.8(2).260-273. (In Russian).

i Надоели баннеры? Вы всегда можете отключить рекламу.