ChatGPT - это интеллектуальная система?
Харламов А. А., доктор технических наук, старший научный сотрудник Института высшей нервной деятельности и нейрофизиологии РАН, профессор кафедры прикладной и экспериментальной лингвистики МГЛУ, профессор департамента программной инженерии ВШЭ, профессор кафедры интеллектуальных информационных систем и технологии Московского физико-технического института, Москва, kharlamov@analyst.ru
В статье предпринята попытка сформулировать представление об интеллектуальных системах с учетом представлений в структуре и функциях мозга человека. Показано, что интеллектуальные системы моделируют две основные интеллектуальные функции человека: синтез осмысленных связных текстов и квази-текстов и анализ текстов и квази-текстов. Это системы, основанные на представлении знаний. Формализация понятия «интеллектуальная система» позволила оценить структуру и функциональность GPT 3.5, на основе которой была реализована система ChatGPT, что, в свою очередь, позволило оценить функциональность этой последней системы. Показано, что ChatGPT реализует функцию генерации текстов, присущую интеллектуальным системам, но эта генерация осуществляется на основе исходного содержательного материала, который вносится в систему извне. То есть если говорить об интеллектуальности ChatGPT содержательно, то можно сказать, что ChatGPT реализует синтез текстов на уровне ниже прагматики, если под семантикой понимать допустимую сочетаемость образов объектов и событий в модели мира.
интеллект • интеллектуальные системы • лингвистический процессор • экстралингвистический процессор • ChаtGPT • TextAnalyst
ВВЕДЕНИЕ
Когда мои студенты затрудняются ответить на вопрос: «Что такое интеллектуальные системы?», я даю им наводящую подсказку: «Интеллектуальные системы — это системы, реализующие интеллектуальные функции». И поскольку ответ на вопрос, что такое интеллектуальные функции, они знают, то с легкостью отвечают на вопрос: «Что такое интеллектуальные системы?».
На самом деле ответ на вопрос, какие интеллектуальные функции присущи человеку, не столь прост, как может показаться на первый взгляд. Давайте рассмотрим его подробно. Более или менее стандартная
отсылка к интеллектуальным функциям человека включает две основные функции: понимание текстов естественного языка и синтез таких текстов.
1. ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ
Чтобы говорить об интеллектуальных системах, надо понять, что из себя представляет интеллект. С разных точек зрения он имеет разные определения.
Определение 1. В БСЭ интеллект определяется как способность мышления, рационального познания, в отличие от таких, например, душевных способностей, как чувство, воля, интуиция, воображение и т.п. [1].
Определение 2. В англо-русском толковом словаре по искусственному интеллекту и робототехнике 2022 г. издания [2] интеллект определяется как способность мозга решать интеллектуальные задачи путем приобретения, накопления и упорядочивания знаний, их адаптации в процессе обучения и на опыте к различным ситуациям.
Определение 3. Таким образом, интеллект — это способность рационального познания или свойство выполнять творческие функции, которые базируются на знаниях.
Формулировки нейроинформатики позволяют продемонстрировать структуру и функциональность естественного интеллекта в части обработки специфической информации [3, 4, 5].
Определение 4. С точки зрения нейроинформатики (с точки зрения обработки информации в мозге человека) под интеллектуальной системой можно понимать систему, обладающую свойствами интеллекта: (1) реализовать две основные интеллектуальные функции человека — понимание текстов языка и синтез осмысленных связных текстов — вторая сигнальная система; и (2) реализовать две другие интеллектуальные функции человека — понимание квазитекстов и синтез осмысленных связных квазитекстов — первая сигнальная система.
Определение 5. По этой причине в структуру интеллектуальной системы (рис. 1) входят: (1) лингвистический и (2) экстралингвистический процессоры, имеющие в своем составе знания, представленные в виде словарей образов событий разной сложности разных модальностей, а также правил их использования, как поуровневых, так и межуровневых.
Таким образом, интеллектуальность функции системы (и самой системы) определяется моделью мира, которую эта функция использует, то есть представленными в ней знаниями.
1.1. Функциональность интеллектуальных систем
Модель мира, которая формируется и используется в процессе функционирования интеллектуальных систем, состоит из двух частей: языковой и экстралингвистической.
1
Семакгическ. синтез Словари и правила Семантическ. анализ
b
Синтаксическ. синтез Словари и правила Сингзксическ. анализ
■ ■
Лексический Синтез Словари и правила Лексический анализ
■ L
Морфологич. синтез Словари и правила МйрфОЛйГЙЧ. анализ
L
Рис. 1. Лингвистический процессор. Здесь справа — поуровневый анализ (всех уровней языка, снизу-вверх), на входе текст, на выходе — представление ситуации в терминах шаблонов ситуаций, слева — поуровневый синтез (от семантики до морфологии сверху-вниз), вверху — представление ситуации, внизу — текст, ее описывающий, в центральной колонке система поуровневых словарей и правил их использования как внутри уровня, так и между уровнями
Определение 6. Языковая часть модели мира (лингвистический процессор) представляет собой: (1) иерархию словарей уровнеобразующих элементов языка, верхний уровень которой представляет словарь допустимой сочетаемости слов (точнее, корневых основ слов, описывающих объекты и события мира), который характеризует допустимую сочетаемость объектов и событий мира в терминах экстралингвистических представлений, а нижние уровни учитывают лингвистические особенности языка, используемого для этого описания; (2) систему правил манипулирования словами словарей как на уровнях, так и в процессе взаимодействия уровней.
Лингвистический процессор называется «процессором» не случайно. В нем в процессе обучения происходят поуровневые процессы формирования поуровневых словарей и правил манипулирования словами этих словарей, а также правил взаимодействия между словарями разного уровня [3] и их использование в процессе анализа-синтеза
текстов. Состав словарей анализирующей части симметричен составу словарей синтезирующей части процессора.
В процессе анализа формируются последовательно словари всех уровней: от морфемного до семантического (самые нижние уровни — акустико-фонетический и гра-фематический — здесь не рассматриваются, так как они различны для звучащей и написанной речи).
Перечень допустимых пар корневых основ слов (на семантическом уровне) виртуально объединяется в направленную однородную взвешенную семантическую сеть. В случае анализа конкретного текста эта семантическая сеть описывает содержание этого текста. Когда модель мира строится на большом корпусе текстов, эта сеть описывает подъязык, представленный в этом корпусе текстов.
Семантическая сеть, построенная на очень большой текстовой выборке, является моделью языка (расширяющуюся вниз иерархией представлений лингвистического процессора), где конкретная цепочка на этой сети соответствует конкретному тексту.
Определение 7. Экстралингвистическая часть модели мира представляет собой: [1) иерархию словарей уровнеобразующих элементов экстралингвистических языков, описывающих мир, верхний уровень которой [второй сверху уровень) представляет словарь допустимой сочетаемости квази-слов, который характеризует допустимую сочетаемость объектов и событий мира в терминах экстралингвистических представлений, а нижние уровни учитывают особенности квази-языков, используемых для этого описания; [2) систему правил манипулирования словами квази-словарей как на уровнях, так и в процессе взаимодействия уровней.
В случае экстралингвистической семантической сети мы имеем модель квази-языка, аналогичную языковой модели, представляющую потенциально реализацию всех мыслимых квази-текстов этого квази-языка.
Определение 8. Квазитексты — последовательности, описывающие мир в терминах экстралингвистических модальностей, где уровни анализа-синтеза определяются специфическими уровнеобразующими элементами, характерными для конкретных неязыковых сенсорных и эффекторных модальностей. Так, для зрительной модальности это: (1) на нижнем уровне — элементарные представления — точка, сегмент дуги, отрезок, пересечения разных типов; (2) уровнем выше — фрагменты объектов; (3) далее — объекты; на верхнем уровне — сцены в составе объектов.
Верхние уровни анализирующих частей лингвистического и экстралингвистического процессоров представляют собой словари попарной сочетаемости образов событий мира в экстралингвистическом представлении и описывающего эту попарную сочетаемость словаря пар корневых основ слов в лингвистическом представлении, причем оба словаря виртуально могут быть представлены как однородные направленные взвешенные семантические сети.
Определение 9. Модель мира представляется двумя семантическими сетями (представлениями верхних уровней лингвистического и квази-лингвистического процессоров), работающими как единое целое.
2. CHATGPT
Попробуем понять, что из описанного выше, касающегося интеллектуальных систем, представлено в системе ChatGPT, то есть насколько ChatGPT является интеллектуальной системой. ChatGPT включает в свой состав в качестве компонента модель языка GPT-3.5, которая используется с целью синтеза связных текстов.
GPT (от англ. Generative Pre-trained Transformer — «генеративный предварительно обученный трансформер») — генеративная искусственная нейронная сеть, разработанная компанией OpenAI. GPT-3.5 — это языковая модель, реализованная на основе архитектуры трансформера. В этом случае языковая модель обучается без учителя на неаннотированном тексте. Трансформер при генерации вывода слева направо обучается максимизировать вероятность, назначенную следующему слову в обучающих данных, с учётом предыдущего контекста [6].
Доработанный вариант GPT-3, получивший название GPT-3.5, стал общедоступным через веб-интерфейс под названием ChatGPT в 2022 г. GPT-3.5 — это большая языковая модель на основе нейронной сети, обученной на большом объеме неразмеченного текста с использованием обучения без учителя. Несмотря на обучение на простых задачах, таких как предсказание следующего слова в предложении, нейронные языковые модели, обученные на большом объеме текстового материала, включают в свое представление большую часть синтаксиса и семантики естественного языка.
2.1. Архитектура системы GPT
Используемая в системе GPT архитектура типа Transformer включает в себя: (1) трансформерный энкодер — нейронную сеть, которая получает на вход последовательность токенов и преобразует ее в последовательность векторов признаков. Это делается с помощью множества слоев, каждый из которых выполняет множество операций, таких как многоканальное внимание и одномерная свертка; и (2) многоуровневый декодер. Декодер имеет несколько уровней, каждый из которых обрабатывает предыдущую часть предложения и использует ее для генерации следующего слова. Каждый уровень декодера состоит из слоев, которые выполняют множество операций, таких как внимание к прошлым токенам и многомерная свертка.
В состав модели Transformer входит механизм внимания, который позволяет сети взвешивать важность различных частей входных данных при составлении прогнозов, позволяя сети сосредоточиться на том, что наиболее важно для получения точных прогнозов. Действуя как когнитивный фильтр, механизм внимания помогает сети обрабатывать и понимать сложные данные, выявляя и выделяя наиболее релевантную информацию.
2.2. Функциональность системы
Функциональность системы сводится к моделированию языка на множестве текстов в виде сети слов, что позволяет за счет использования механизма внимания выбирать из нескольких близких цепочек слов наиболее подходящую для представления содержания, с точки зрения, с одной стороны, проецирования на эту сеть каких-то последовательностей входных реперных объектов (например, слов или последовательностей слов), а с другой стороны — выбора наиболее оптимальной (с учетом оценки весов получившихся цепочек) окончательной цепочки.
2.3. Обучение системы
Процесс обучения GPT включает в себя технику машинного обучения, называемую тонкой настройкой, которая направлена на повышение производительности предварительно обученной модели на конкретной задаче.
2.4. ChatGPT — интеллектуальная система
Из рассмотрения функциональности системы, можно заметить, что ChatGPT реализует (см. рис. 1, левая часть) синтез текста, используя модель языка в ней зашитую, включая допустимую попарную сочетаемость слов в тексте (допустимую комбинаторику сочетаемости событий и объектов в мире), то есть семантику текста. Однако формирование содержания текста не входит в функциональность системы. Из чего можно сделать вывод, что ChatGPT реализует функцию синтеза текста по некоторой содержательной заготовке (которая в систему вносится извне), причем синтез оказывается тем лучше, чем более подробна эта содержательная заготовка. Это хорошо можно объяснить на примере перевода с языка на язык: чем лучше представлено содержание в тексте на входном языке, тем лучше получается качество текста на выходном языке.
Качество же синтезированного текста (форма, а не содержание этого текста) определяется мощностью выборки, использованной при обучении ChatGPT. Причем обучение системы происходит не в один этап — уже предобученная модель языка дообучается на предметную область.
3. TEXTANALYST
Чтобы оценка технологии ChatGPT не показалась субъективной, попробуем рассмотреть с тех же позиций другую технологию — автоматического анализа текстов TextAnalyst [7], чтобы оценить степень ее интеллектуальности.
Технология для автоматической смысловой обработки текстовой информации TextAnalyst основана на использовании структурных свойств текста, которые могут быть выявлены с помощью статистического анализа, реализованного на основе иерархических структур из динамических ассоциативных запоминающих устройств (ДАЗУ) — искусственных нейронных сетей на основе нейроподобных элементов с временной суммацией сигналов [3, 4, 5]. В технологии реализовано
автоматическое выявление семантики текста в виде семантической сети текста, и реализуются функции организации текстовой базы в гипертекстовую структуру, автоматического реферирования, кластеризации и классификации текстов, а также функция смыслового поиска.
Иерархические структуры из ДАЗУ являются удобным инструментом для выявления структурных свойств текстовой информации. Использование указанного инструмента позволяет автоматически, на основе анализа статистики слов и их связей в тексте, реконструировать внутреннюю структуру текста.
Статистический анализ выявляет наиболее часто встречающиеся элементы текста: слова или устойчивые словосочетания. При выявлении связей учитывается статистика попарного появления слов в предложениях текста. Далее статистические показатели пересчитываются в семантические с помощью алгоритма, подобного алгоритму перерасчета весов в сетях Хопфилда. Идея подобных алгоритмов заключается в том, что при расчете какой-то характеристики элемента сети учитываются подобные характеристики элементов в сети, с ним связанных, а также учитываются численные показатели связей. После пересчета статистических характеристик в семантические, понятия, которые мало соответствуют анализируемой предметной области, получают малый вес, а наиболее представительные наделяются высокими показателями.
Семантические веса элементов сети используются при расчете близости (релевантности) фрагментов текста к запросу со стороны пользователя системы. На их основе возможно выделение наиболее информативных участков текста. Использование ассоциативных связей элементов сети позволяет расширять поле поиска информации. Ответ на запрос пользователя в этом случае может содержать информацию, явно не указанную в запросе, но связанную с ней по смыслу.
3.1. Архитектура системы
В состав ядра системы, помимо блока первичной обработки, входят следующие блоки: лингвистический процессор, блок выделения понятий текста, блок формирования семантической сети, блок хранения семантической сети.
Блок первичной обработки извлекает текст из входного потока данных, очищает от нетекстовой информации, а также обрабатывает аббревиатуры, инициалы, заголовки, адреса, номера, даты, указатели времени.
Лингвистический процессор осуществляет предобработку входного текста на основе априорных лингвистических знаний, общих для выбранного языка (в настоящий момент поддерживаются несколько европейских языков, помимо русского и английского), и выполняет следующие функции: сегментацию предложений текста на основе знаков пунктуации и специальных грамматических слов, нормализацию слов и словосочетаний — удаление флексий (окончаний) с сохранением только корневых
64
основ, а также — удаление в тексте семантически несущественных, вспомогательных слов.
Блок выделения ключевых понятий предметной области (слов и словосочетаний) создан на базе программной модели иерархических структур из ДАЗУ и реализует алгоритмы автоматического формирования частотного словаря текста.
Блок формирования семантической сети реализован как база данных, в которой представляются семантические связи понятий предметной области. Поскольку типы семантических связей в системе не определяются, такие связи представляют собой просто ассоциативные связи. В качестве критерия для определения наличия семантической связи между парой понятий используется частота их совместной встречаемости в предложениях анализируемого текста.
Элементы семантической (ассоциативной) сети и их связи имеют числовые характеристики, отражающие их смысловой вес в данной предметной области. Для более точной оценки семантических весов понятий используются веса всех связанных с ними понятий, то есть веса целого семантического сгущения. В результате такого анализа наибольший вес приобретают понятия, обладающие мощными связями и находящиеся как бы в центре семантических сгущений.
3.2. Функциональность программы TextAnalyst
В системе реализованы следующие функции обработки текстовой информации. Функции: (1) формирования гипертекстовой структуры; (2) навигации по базе знаний; (3) формирования тематического дерева; (4) реферирования текстов; (5) автоматической кластеризации множества текстов; (6) сравнения текстов (автоматической классификации текстов); и, наконец, (7) функция формирования ответа на смысловой запрос пользователя — формирование тематического реферата.
3.3. Интеллектуальность технологии
Из рассмотрения функциональности системы можно заметить, что технология TextAnalyst реализует (см. рис. 1) первый, второй и четвертый квадратики правой части функциональности системы, то есть в ней отсутствует анализ формы текста (третий квадратик). Но семантическая сеть, которая реализуется в результате работы системы, характеризует не допустимую попарную сочетаемость в рамках всего языка (модель языка), а только ту часть, которая касается конкретного проанализированного текста (или группы текстов). То есть сформированная семантическая сеть не ограничивает допустимую сочетаемость, а характеризует конкретный текст — описывает семантику этого текста. Что касается интеллектуальности, можно сделать вывод, что TextAnalyst реализует функцию выявления содержательного компонента текста, и если присмотреться к анализу текстов человеком [8], то этот содержательный компонент текста очень напоминает представление содержания текста в мозге человека [9, 10], которое внес автор текста.
TextAnalyst реализует семантический анализ текста как временнОй срез содержания, представленного в тексте. Из чего можно сделать вывод, что TextAnalyst также
является интеллектуальной системой, так как опирается на модель языка, которая представлена иначе, чем в ChatGPT.
В докладе представлены два основных предмета: (1) интеллектуальные системы как частичные модели естественного интеллекта; и (2) система ChatGPT, ее структура и функциональность. Рассмотрение этих предметов показало, что система ChatGPT реализует функцию синтеза текста по цепочке заданных извне реперных данных. Причем качество текста как текста языка зависит от объема обучающей выборки, использованной при предобучении системы ChatGPT. А содержательная часть сгенерированного текста зависит от объема и качества исходных данных, внесенных в систему пользователем в процессе генерации текста.
Качество синтезированного текста как текста языка получается хорошим, поскольку для обучения системы (для формирования модели языка) использована колоссальная по объему обучающая выборка, элементы которой в системе представляются очень большим числом параметров. Однако исходный содержательный материал вносится в систему извне. То есть ChatGPT реализует интеллектуальную функцию генерации осмысленного текста с опорой на модель языка.
Список использованных источников
1. Большая советская энциклопедия (БСЭ). Интеллект (niv.ru).
2. Пройдаков, Э., Теплицкий, Л. Англо-русский толковый словарь по искусственному интеллекту и робототехнике. - М.: А. Сандлер, 2022. - 608 с.
3. Харламов, А. Ассоциативная память — среда для формирования пространства знаний. От биологии к приложениям. - Dusseldorf: Palmarium Academic Publishing, 2017. - 109 с.
4. Neuroinformatics and Semantic Representations: Theory and Applications. Alexander A. Kharlamov & Maria Pilgun eds. - Newcastle upon Tyne: Cambridge Scholars Publishing, 2020. - 317 pp.
5. Integral Robot Technologies and Speech Behavior. Alexander A. Kharlamov & Maria Pilgun eds. - Newcastle upon Tyne: Cambridge Scholars Publishing, 2023. -407 pp.
6. ChatGPT: Optimizing Language Models for Dialogue (англ.). OpenAI (30 ноября 2022). Дата обращения: 13 января 2023 г.
7. TextAnalyst Microsystems, Ltd (analyst.ru)
8. Косиченко, Е. Ф. Имя собственное в семиотическом пространстве культуры и художественного текста: монография. - М.: ФГБОУ ВО МГЛУ, 2017. - 294 с.
9. Леонтьева, Н. Н. Автоматическое понимание текстов. - М.: Академия, 2006. -304 с.
10. Лурия, А. Р. Язык и сознание. - СПб: Питер, 2019. - 336 с.
ЗАКЛЮЧЕНИЕ
66
IS CHATGPT AN INTELLIGENT SYSTEM?
Kharlamov A. A., Doctor of Technical Sciences, Senior Researcher at the Institute of Higher Nervous Activity and Neurophysiology of the Russian Academy of Sciences, Professor of the Department of Applied and Experimental Linguistics at MGLU, Professor of the Department of Software Engineering at the Higher School of Economics, Professor of the Department of Intelligent Information Systems and Technology at the Moscow Institute of Physics and Technology, Moscow, kharlamov@analyst.ru
The article attempts to formulate an idea of intelligent systems, taking into account the ideas in the structure and functions of the human brain. It is shown that intelligent systems model two main intellectual functions of a person: synthesis of meaningful coherent texts and quasi-texts and analysis of texts and quasi-texts. These are systems based on knowledge representation. The formalization of the concept of "intelligent system" allowed us to evaluate the structure and functionality of GPT 3.5, on the basis of which the ChatGPT system was implemented, which, in turn, allowed us to evaluate the functionality of this latter system. It is shown that ChatGPT implements the text generation function inherent in intelligent systems, but this generation is carried out on the basis of the original content material that is introduced into the system from the outside. That is, if we talk about the intellectuality of ChatGPT in a meaningful way, then we can say that ChatGPT implements the synthesis of texts at a level below pragmatics, if semantics is understood as the permissible compatibility of images of objects and events in the world model.
intelligence • intelligent systems • linguistic processor • extralinguistic processor • ChatGPT • TextAnalyst