Научная статья на тему 'О ПОДХОДЕ ДЛЯ АВТОМАТИЧЕСКОЙ ГЕНЕРАЦИИ СЮЖЕТНО СВЯЗАННОГО ТЕКСТА'

О ПОДХОДЕ ДЛЯ АВТОМАТИЧЕСКОЙ ГЕНЕРАЦИИ СЮЖЕТНО СВЯЗАННОГО ТЕКСТА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
228
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГЕНЕРАЦИЯ ТЕКСТА / НЕЙРОННЫЕ СЕТИ / ГРАФ / ВЕКТОР

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Козловский Александр Вячеславович, Мельник Ярослав Эдуардович, Волощук Вадим Игоревич

Рассмотрены проблемы, связанные с современными способами генерации текста, поставлена задача по генерации интерактивного сюжетно связанного текста. Рассмотрены аналоги, в которых выявлены достоинства и недостатки. Предложен подход для генерации текста, в рамках которого, определены входные и выходные данные. Выбрана графовая модель в качестве основы для семантического преобразования текста. Кроме того, выявлена возможность добавления векторов в основную модель для учёта аспекта времени и других дополнительных характеристик, необходимых для полноценного разбора как отдельного предложения, так и всего сюжетного блока. Построен общий алгоритм работы системы. Определенынаправления для дальнейших исследований.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Козловский Александр Вячеславович, Мельник Ярослав Эдуардович, Волощук Вадим Игоревич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON THE APPROACH FOR AUTOMATIC GENERATION OF NARRATIVE-LINKED TEXT

The problems associated with modern methods of text generation are considered, and the task of generating interactive story related text is set. Analogues are considered, with the advantages and disadvantages identified. An approach for text generation is proposed in which input and output data are defined. A graph model is chosen as the basis for the semantic transformation of the text. In addition, the possibility of adding vectors to the basic model in order to take into account the aspect of time and other additional characteristics necessary for full fledged parsing both a single sentence and the whole plot block is revealed. The general algorithm of the system’s work is constructed. Directions for further research have been identified.

Текст научной работы на тему «О ПОДХОДЕ ДЛЯ АВТОМАТИЧЕСКОЙ ГЕНЕРАЦИИ СЮЖЕТНО СВЯЗАННОГО ТЕКСТА»

2. Петров Б. Н. и др. Бортовые терминальные системы управления. М.: Машиностроение, 1983.

200 с.

3. Андриенко А.Я. Вопросы теории и практики создания бортовых терминальных систем жидкостных ракет-носителей // Автоматика и телемеханика. № 3. 2013. С. 103- 119.

4. Андриенко А.Я., Иванов В.П. Совершенствование энергетических характеристик жидкостных ракет средствами автоматического управления. Ч.1. Физико-технические основы управления расходованием жидкого топлива ракет // Проблемы управления. 2009. № 1. С. 66-71.

Ковалев Алексей Сергеевич, бакалавр, старший оператор, era1@mil.ru, Россия, Анапа, ФГАУ «ВИТ «ЭРА»,

Ковалев Александр Сергеевич, специалист, старший оператор, Россия, Анапа, ФГАУ «ВИТ

«ЭРА»

MATHEMATICAL MODEL OF SURTFUNCTIONING FOR ADVANCED LA UNCH VEHICLES

A.S. Kovalev, A.S. Kovalev

This article considers the urgent task of improving the efficiency of liquid-propellant engines ofpromising launch vehicles based on a fuel consumption control system. A mathematical model of the functioning of the SURT has been constructed, which can be used in conjunction with neural networks designed to optimize the operation of fuel consumption control systems.

Key words: model, launch vehicle, control system, fuel consumption, LRE, fuel, oxidizer.

Kovalev Aleksey Sergeevich, backelor, senior operator, era_1@mil.ru, Russia, Anapa, FGAU «MIT

«ERA»,

Kovalev Aleksandr Sergeevich, specialist, senior operator, Russia, Anapa, FGAU «MIT «ERA»

УДК 004.81

DOI: 10.24412/2071-6168-2022-9-160-168

О ПОДХОДЕ ДЛЯ АВТОМАТИЧЕСКОЙ ГЕНЕРАЦИИ СЮЖЕТНО СВЯЗАННОГО ТЕКСТА

А.В. Козловский, Я.Э. Мельник, В.И. Волощук

Рассмотрены проблемы, связанные с современными способами генерации текста, поставлена задача по генерации интерактивного сюжетно связанного текста. Рассмотрены аналоги, в которых выявлены достоинства и недостатки. Предложен подход для генерации текста, в рамках которого-определены входные и выходные данные. Выбрана графовая модель в качестве основы для семантического преобразования текста. Кроме того, выявлена возможность добавления векторов в основную модель для учёта аспекта времени и других дополнительных характеристик, необходимых для полноценного разбора как отдельного предложения, так и всего сюжетного блока. Построен общий алгоритм работы системы. Определенынаправления для дальнейших исследований.

Ключевые слова: генерация текста, нейронные сети, граф, вектор.

Введение. Написание историй, построение сюжета и создание литературных произведений искусства - этот вид деятельности долгое время относили к таким, которые нельзя автоматизировать. Однако со временем вычислительные мощности увеличились, появились новые методики и подходы к обработке информации, в частности, основанные на подражании живым организмам (например, нейронные сети), в результате чего возник вопрос: сможет ли компьютер написать книгу. И ответ на этот вопрос уже есть. Существует несколько разных решений для автоматической генерации текстов, и даже полноценных стихотворений и книг. Так, одна из работ, написанная ИИ (искусственный интеллект) японских разработчиков, прошла в финал литературного конкурса имени ХосиСинъити. Существует даже пример того, как с помощью такой программы человек зарабатывает деньги, публикуя результаты её работы под своим авторством. Помимо этого, в Чикагском Северо-западном университете за 10 лет была разработана программа для написания отчётов по бейсбольным матчам, и при сравнении отчётов по одному матчу она показала себя лучше, нежели настоящий спортивный журналист.

Существуютпримеры и более утилитарного применения подобного ПО (программное обеспечение). Например, проект AllPriorArt, который призван помочь в отсеивании ненастоящих патентов и абсурдных исков за «незаконное» использование технологий таких, как «сетевые игры» или «интернет-реклама». Также генерация текста весьма полезна в создании большого количества схожих описаний таких, как в интернет-магазинах.

Исходя из вышесказанного, можно заключить, что проблема автоматической генерации текста довольно распространена и в будущем её решение сможет постепенно устранить не только надоедливую проверку подлинности документов, но и полумонотонный труд в виде написания журналистских статей или описаний товаров.

Однако каждое из приведённых решений предлагает довольно узкий спектр применения. Предложенный же подход должен помочь в разных вопросах: от преодоления скуки и однообразия до лечения депрессий. Создание случайных мест действий, действующих лиц, ситуаций, но обрамлённых логичным сюжетом сможет давать на выходе почти любую историю, подходящую под задачи.

Выделение проблем. Одна из самых распространённых проблем генерации текста - сохранение и «понимание» контекста самой нейронной сетью. Это прослеживается на примерах уже созданных систем, которые призваны отвечать на сообщения пользователя разного рода. Так, через 2-3 реплики человека видно, что диалог довольно сильно смещается относительно начального запроса.

Также многие решения имеют специфический характер [1], из-за чего не могут охватывать большую проблемную область и применяются только для конкретных целей. Например, вышеупомянутая генерация описаний товаров в интернет-магазинах. Однако существуют и более глобальные решения, которые позволяют отвечать на фразы, делать перевод, писать стихотворения и прозу. Здесь стоит отметить, что перечисленное относится только к лингвистическим задачам, что тоже есть некоторое, хоть и весьма условное, ограничение.

Говоря подробнее об искусственно созданных произведениях искусства, необходимо обратить внимание, что процесс создания обычно ничем не сопровождается, кроме внесения начальных данных и ожидания результата. Поэтому управлять течением генерации, по факту, не представляется возможности, что делает полученную на выходе «книгу» лишь продуктом потребления. И при близком рассмотрении становятся заметны изъяны, допущенные «машиной», что не позволяет в полной мере насладиться чтением и полностью погрузиться в текст. Ведь было бы куда интереснее принимать участие в создании сюжета и принимать решения за главного героя.

Исходя из данных рассуждений, можно выделить следующие проблемы в части современных решений генерации текста:

- негибкая автоматическая генерация текста;

- учёт только семантики слов;

- малая широта применения.

Для решения первой проблемы хорошо подойдёт добавление неких контрольных точек, при достижении которых будет проводиться анализ ситуации в прорабатываемом «мире» и предлагаться выбор среди логически возможных вариантов действий главного героя произведения. Это позволит создать более «человечный» текст.

Учёт только семантики создаёт проблемы с логичностью повествования, поэтому для этого необходимо будет принимать во внимание и другие характеристики (персонажей и предметов их окружающих). Таким образом должны устраниться проблемы с потерей контекста и общей сути происходящего на продолжительном промежутке времени.

Также результаты работы такой генерации текста создадут простор для последующего их применения. Например, борьба со скукой или психологическая помощь человеку. Во втором случае имеется в виду, что непосредственная работа с таким приложением будет проводиться психологом, ставящем перед собой цель создать такой текст, который сможет вывести человека из болезненного состояния.

Анализ аналогов. В ходе поиска аналогов был найден только один прямой. AIDungeon - текстовая приключенческая игра, в которой используется искусственный интеллект для создания контента. В основе системы используется нейронная сеть GPT-2 (GenerativePre-trainedTransformer2) [2]. Таким образом, в данном проекте можно реализовать совершенно любой сюжет за счёт того, что можно абсолютно любым образом реагировать на происходящее (возможны три варианта воздействия: «do», «say» и «story»). Однако из-за отсутствия некоторых ограничений игра нередко выходит за рамки логичности и последовательности.

Также были найдены и менее схожие решения. Среди самого популярного проанализированы

были:

- YaLM (Yet another Language Model), вчастности «Балабоба»;

- русскоязычнаямодель GPT-3 (Generative Pre-trained Transformer 3) Large (ruGPT-3);

- mGPT (multilingual Generative Pre-trained Transformer).

Также были более подробно рассмотрены примеры, приведённые во введении:

- PC Writer 1.0;

- Зинаида Фолс;

- роман «День, когда компьютер напишет роман»;

- АлгоритмФилипаПаркера;

- Narrative Science.

YaLM - разработка «Яндекса», использующаяся для подготовки ответов Поиска и Алисы. Также используется в развлекательных целях и для привлечения внимания («Балабоба»). Этот инструмент в большей мере нацелен на короткие взаимодействия, и именно поэтому подходит для подготовки ответов на вопросы, так как это не требует помнить весь контекст. Однако для построения чего-то более масштабного не подойдёт. Это хорошо видно, при попытках сгенерировать текст в «Балабобе» в режиме коротких историй. Зачастую получается нечто весёлое из-за своей нелогичности. Однако проблемы с потерей контекста существуют и у Алисы.

Русскоязычная модель GPT-3 Large - разработка «Сбера», созданная для того, чтобы и русскоязычные пользователи смогли оценить возможности нейронной сети GPT-3. Из плюсов можно отметить широту применения. Так, например, она может сочинять стихи и прозу, выполнять переводы, вести диалоги по всем канонам логики чат-ботов [3, 4], давать ответы на вопросы. Это стало возможным из-за глубокого обучения, что означает, нейронная сеть специально не обучалась для каждой из этих целей. Однако сам контекст прослеживается довольно слабо и зачастую является далёким от реального мира в режиме диалога. При генерации же текста контекст вовсе становится не понятен через какое-то время

[5].

mGPT - развитие русскоязычной модели GPT-3 Large. Это также разработка Сбера. И эта модель уже поддерживает 61 язык (включая языки народов России и стран СНГ), что является рекордом среди таких проектов. Отличительной особенностью является то, что в перечень языков входят те, которые начинают употребляться всё меньше (например, татарский и якутский). Особенно стоит отметить, что данная модель способна учитывать культурные особенности при генерации текста на разных языках

[6].

PC Writer 1.0 - проект, результатом которого явилась изданная книга «Настоящая любовь». При изучении фрагмента романа стало очевидно, что вникать в суть происходящего довольно сложно, так как детали нагромождаются друг на друга, линии рассуждений не до конца понятны и могут перескакивать. Однако нельзя не признать, что это достойный результат для 2008 года. Также стоит отметить, что для генерации текста требуется довольно много начальной информации: описание сюжета прозаического произведения, образец стиля писателя или писателей, время и место действия. Из-за такого количества стартовых данных невозможно будет создать нечто неожиданное. Также отсутствует непосредственная интерактивность.

Зинаида Фолс - ещё одно решение от «Яндекса», однако более старое и созданное для написания стихов. Отмечается, что нейронная сеть смогла передать чувства и ощущения, подобно человеку. Это несомненно является сильной стороной этого проекта. Однако есть и слабые, такие, как неспособность создать завершённый сюжет и неспособность оценить уместность употребления слов вместе.

Ранее упомянутый роман, прошедший в финал литературного конкурса, - это роман «День, когда компьютер напишет роман». Эта работа не смогла победить, но такой результат является уже сам по себе победой для ИИ в данной сфере. Жюри отмечают, что при прочтении работы не было заметно, что её написал компьютер. Помимо этого, они оценили строгость структуры произведения. Однако при всех достоинствах был выделен и недостаток, а именно отсутствие креативности.

Алгоритм Филиппа Паркера не направлен на написание произведений художественной литературы, а нацелен на более рутинные задачи. Однако сам автор алгоритма также выделяет такое применение, как написание специфических текстов, за которые не могут или не хотят браться настоящие авторы. Алгоритм весьма полезен, однако он не может создавать что-то самостоятельно: ему необходимы тексты из открытых источников как основа.

Также упомянутый, но не названный, проект NarrativeScience создан для написания отчётов. В частности, данная программа показала лучшие результаты, чем реальный журналист, при написании отчёта по бейсбольному матчу, применив лучшие приёмы. Помимо этого, программа применялась для создания финансовых отчётов. И снова необходимо отметить, что и это решение нацелено лишь на устранение монотонной работы, но никак не на создание чего-то нового и творческого.

После рассмотрения всех найденных аналогов можно обобщить их главные недостатки для последующего их устранения в предлагаемом решении. Во-первых, существует проблема сохранения контекста, что не позволяет строить длинные тексты. Во-вторых, в некоторых случаях результат работы алгоритмов может получаться сильно запутанным, что сложно проследить за последовательностью мыслей. В-третьих, присутствие клише в результатах генерации.

Таким образом, можно выделить то, что необходимо учесть в данной работе для достижения поставленных задач. Во-первых, необходимость минимизировать количество входных данных для возможности получить непредсказуемый в достаточной мере результат. Во-вторых, необходимость создать возможность сохранения всех самых важных деталей контекста для возможного последующего применения и для устранения нелогичности.

Предлагаемый подход. Для решения поставленных задач, необходимо сначала определить количество и формат входных и выходных данных. Ориентируясь на постановку задачи, гораздо проще определить формат выходных данных.

Они должны представлять из себя сюжетно-интерактивную последовательность блоков текста, логически и семантически связанных между собой. На данный момент примем, что количество итераций - выбор пользователя, количество самих вариантов выбора на каждой итерации и размер блоков текста должны определяться на уровне самой нейронной сети в зависимости от связанных входных параметров, напрямую не задаваемых пользователем.

С входными данными всё гораздо сложнее, ведь именно на них система должна опираться при генерации последовательности данных. Мы полагаем, что основным параметром должен являться абзац текста, кратко описывающий направленность сюжета. Дополнительными, но не менее важными параметрами определяем следующий список:

- желаемый стиль;

- список жанров, которые обязательно должны иметь место в истории;

- список жанров, которые обязательно должны быть исключены из истории;

- сеттинг.

Однако стоит отметить, что ни один из данных параметров не является обязательным, а только дающим возможность скорректировать курс сюжета при необходимости. Таким образом, остаётся также возможность генерировать нечто неожиданное, что является одной из основных поставленных задач.

Вопрос первичной генерации истории сам по себе не вызывает никаких проблем [7], основная трудность состоит в сохранении и воспроизведении сюжетной последовательности наиболее эффективным и наименее затратным по ресурсам способом. Все представленные модели выше не имеют возможности продолжительного удержания контекста в более чем одну осмысленную страницу текста, потому что изначально не ориентированы на подобного рода цели. На данный момент наиболее популярными задачами для нейронных сетей в сфере обработки текста являются генерация текста и его классификация. Задача генерации текста близка к поставленной проблеме, однако ввиду того, что все текущие решения этой задачи построены на LSTM (LongShort-TermMemory) [8] модели, и несмотря на их способность решать проблему исчезающего градиента, построение осмысленных объемных сюжетов является невозможным. Необходим формат, позволяющий семантически учитывать каждый объект истории, который при этом сохраняет эффективность и имеет свойство масштабируемости. Для этого лучше всего подходитграфовая модель, хорошо заявившая себя на многих аналогичных по объёму задачах [9].

Благодаря структуре, построенной на концепции вершин и рёбер, появляется возможность реализации масштабируемых текстовых конструкций, таких как диалог и повествование в рамках единой системы.

Стоит отметить, что абсолютно всю семантику сохранить невозможно, однако за счёт многоуровневого подхода можно сохранить большую её часть. При этом самый нижний уровень будет включать в себя исключительно примитивную структуру явно выраженных в тексте материальных объектов. В данном случае в качестве вершин представлены подлежащие (материальные объекты). В свою очередь в качестве рёбер использованы элементы предложений, часто выраженные в виде сказуемых, но могут также представлять собой обстоятельства (деепричастные обороты).

Исходя из этого, получается направленный граф, который можно будет обрабатывать алгоритмически и математически.

Пример:

Рыжий лохматый кот залез на дерево, стоявшее в этом дворе уже 100 лет.

Основными объектами в данном случае будут являться кот, дерево и двор.

В качестве рёбер будут выступать соединения кота с деревом и дерево со двором. Если классифицировать двор как место действия, то кот также относится и ко двору, но на данном этапе это не рассматривается.

Данный пример можно представить в виде графа, представленного на рис. 1.

■ Рыжий -■Лохматой

С

Двор

н^ Дереео у-

Рис. 1. Граф, семантически отражающий предложение примера

Классификация «этом» в данном случае будет зависеть от контекста предложений, стоящих до этого, иначе просто не учитывается.

Далее полученная структура заполняется значениями для возможности формализованной обработки. Каждому подлежащему будет автоматически присвоена оценка в виде коэффициента, отражающего степень влияния вершин друг на друга. Каждая вершина так или иначе связана с любой другой, но степень влияния может отличаться.

В примере, указанном выше, видна явная связь кота с деревом и дерева со двором, что говорит об их сильном взаимовлиянии, исходя из чего данным связям можно поставить относительно высокий коэффициент. С другой стороны, несмотря на то что кот находится во дворе, их связь косвенна в текущий момент, что оценивается более слабым коэффициентом.

Если добавить дополнительные действия в текущей истории, то можно заметить существенный недостаток выбранной модели. Пример:

Рыжий лохматый кот залез на дерево, стоявшее в этом дворе уже 100 лет. Однако ветка дерева не выдержала, и он упал на землю.

В данном случае добавляются две вершины: ветка и земля. Ветка связана с деревом, а земля с

котом.

Граф, соответствующий данной ситуации, представлен на рис. 2.

Рис. 2. Граф, соответствующий усложнённому примеру

Однако теперь невозможно определить, какое действие произошло раньше. Для того, чтобы история оставалась актуальной необходимо учитывать такой немаловажный фактор как время, так как без него вся структура текста превратится в неделимый блок информации, лишённый последовательности. Чтобы сохранить графовую модель с учётом нового параметра, было решено совместить её с координатной плоскостью и добавить третью размерность для отражения времени. Из этого выходит полноценная графовая структура в векторном пространстве.

Наличие графа обусловлено необходимостью структурно связать объекты друг с другом и обозначить их взаимоотношения. Векторное пространство в свою очередь позволяет разместить объекты глобально с точки зрения общей истории опираясь на ряд характеристик. Одной из них является время.

Если рассматривать метрики, наиболее подходящие для описанной модели, то можно выделить следующие:

- важность - метрика, отражающая степень влияния объекта на историю на данный момент

времени;

- уместность - насколько уместен данный объект в рамках сеттинга, общей истории, текущей

ситуации.

Вышеописанный пример в данном случае можно изобразить, как показано на рис. 3.

Рис. 3. Граф в трёхмерной системе координат, отражающий смену и последовательность событий 164

На общем временном промежутке кот и ветка будут находиться выше, чем двор, земля или дерево, потому что в тексте явно не описано, что они изменили своё состояние.

Помимо всего прочего стоит учитывать, что существуют такие глобальные и нематериальные концепции как «мысль», «достижение», «причина», «вопрос» и т.д. Например, многие моменты в истории явно не выражены, но их возможно определить (рис. 4).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Не стоит также забывать про тот факт, что некоторые слова могут по-разному трактоваться в зависимости от контекста. Данная проблема говорит о необходимости усложнения исходной модели путём добавления нескольких уровней семантического восприятия. Подобные моменты будут рассматриваться в дальнейших работах по выбранной проблеме.

Таким образом, был выбран метод генерации ключевых точек, объектов и персонажей, в рамках сюжета наделенных рядом характеристик, основываясь на которых будет воспроизводиться текстовая последовательность без особых потерь. Для объектов, наделенных более чем одной метрикой, будет использоваться векторный способ представления данных, и именно векторы нейронная сеть должна будет генерировать и в дальнейшем коррелировать таким образом, чтобы не нарушить логическую последовательность. Сам список таких объектов, выбираемых для конкретной истории, будет генерироваться, основываясь на выбранных сеттинге и жанрах, а также анализе того текста, который был введён пользователем для примера или который был автоматически сгенерирован при отсутствии такового.

Рис. 4. Усложнённый граф, описывающий косвенные связи

Предлагаемое решение должно устранить недочёты существующих аналогов. Отсчёт по времени и графовая структура позволят сохранять последовательность повествования, что устранит спутанность выраженных мыслей. Также работа с графом представляется более гибкой, что предоставит возможности для довольно гибкой генерации последующих контрольных точек. Это устранит частое использование клише.

Структура алгоритма, реализующего предложенный подход. Для реализации подхода разработан следующий алгоритм.

Первым этапом в построении сюжета будет выявление его гиперпараметров, а именно:

- мир, в рамках которого будет описываться сюжет;

- стиль описания истории;

- количество итераций для взаимодействия;

- дату, сезон и время для начала отсчёта времени;

- локации для пролога истории.

Далее, следующим слоем необходимо проинициализировать основные точки в соответствии с вышеупомянутыми параметрами, чтобы нужные объекты для начала сюжета попали в окно.

С данного момента начинается циклическая последовательность действий алгоритма, который содержит 4 этапа:

- генерация последовательности действий, основываясь на точках в формах «существительное - глагол», «существительное - глагол - существительное»;

- добавление различных оборотов, художественных описаний, другими словами - «украшение» текста, учитывая сформированную последовательность и заданный изначально стиль повествования;

- генерация нескольких возможных вариантов выбора для пользователя, основываясь на положении точек;

- смещение точек в пространстве ориентируясь на выбор пользователя.

Для наглядности обобщённый алгоритм, реализующий предложенный подход, изображён на

рис. 5.

Каждый этап представляет собой конкретную нейронную сеть, решающую поставленную перед ней задачу. В первом случае нейронная сеть подбирает количество действий до следующей итерации, определяет их последовательность и приоритет, согласно которому следующий слой будет варьировать количество текста для описания каждого действия.

Второй слой будет решать комбинация из нескольких нейронных сетей. В большей степени подойдут свёрточные нейронные сети [10] для реализации свёртки слоёв и снижения размерности исходных данных. В том числе они необходимы для трансляции текста в формат графа. Далее рекуррентные нейронные сети, которые благодаря токенам и возможности запоминать информацию смогут добавить красок в текст. В частности, модель LSTM отлично подходит для возможности стилизации текста под всевозможные стили, находящиеся в датасете.

За реализацию третьего и четвёртого слоёв будут отвечать стандартные нейронные сети прямого распространения с полносвязной структурой. Если текущая итерация является последней, то данные слои цикла игнорируются.

[ Начало

/Ввод параметров генерации истории

Конец

Рис. 5. Обобщённый алгоритм, реализующий предложенный подход

166

Вывод. В данной работе были выделены проблемы, связанные с вопросами генерации текста, проанализированы доступные аналоги и также предложено собственное решение с применением нового подхода к работе с текстом, учитывающем контекст и логические взаимосвязи объектов.

Данное решение должно позволить посмотреть на формализованную обработку текста по-новому, в частности на генерацию текста.

Предлагаемое решение позволяет решить такие проблемы существующих аналогов, как потеря контекста, излишнее употребление клише и смешанность последовательности мыслей.

Дальнейшую работу над реализацией алгоритма планируется разделить на несколько этапов (от одного до нескольких на каждый этап генерации). В дальнейшем сам алгоритм будет дорабатываться и уточняться. Также планируется создать систему на его основе и провести её тестирование.

Списоклитературы

1. Matveev A., Makhnytkina O.,Matveev Y., Svischev A., Korobova P., Rybin A., Akulov A. Virtual Dialogue Assistant for Remote Exams // Mathematics. 2021. № 9. P. 2229.

2. Budzianowski P., Vulic I. Hello, It's GPT-2 - How Can I Help You?Towards the Use of Pretrained Language Modelsfor Task-Oriented Dialogue Systems // EMNLP. 2019.

3. Menal D.A Tool of Conversation: Chatbot // International journal of computer sciences and engineering. 2017. №5. P. 158-161.

4. Бородин А.И., Вейнберг Р.Р., Литвишко О.В. Методы обработки текста при создании чат-ботов // Гуманитарные балканские исследования. 2019. Т. 3. № 3(5). С. 108-111.

5. Gender and Representation Bias in GPT-3 Generated Stories / L. Li, D. Bamman // Proceedings of the Third Workshop on Narrative Understanding. 2021. P. 48-55.

6. Shliazhko O., Mikhailov V., Fenogenova A., Kozlova A., Tikhonova M., Shavrina T.mGPT: Few-Shot Learners Go Multilingual // ArXiv. 2022. V. abs/2204.07580.

7. Le Cun Y., Zhang X. Text understanding from scratch // Computer Science Department // ArXiv. 2015. V. abs/1502.01710.

8. Hochreiter S., Schmidhuber J. Long short-term memory // NeuralComputation.1997. V. 9(8). P. 1735-1780.

9. Оре О. Графы и их применение. М: Ленанд, 2015.208 с.

10. ВоробьевН. В., Пучков Е. В. Классификация текстов с помощью сверточных нейронных сетей // Молодой исследователь Дона. 2017. №6 (9). С. 2-7.

Козловский Александр Вячеславович, аспирант, kozlovskiy@sfedu.ru, Россия, Таганрог, Институт компьютерных технологий и информационной безопасности ЮФУ,

Мельник Ярослав Эдуардович, студент, iamelnik@sfedu.ru, Россия, Таганрог, Россия, Таганрог, Институт компьютерных технологий и информационной безопасности ЮФУ,

Волощук Вадим Игоревич, студент, vvoloshchuk@sfedu.ru, Россия, Таганрог, Россия, Таганрог, Институт компьютерных технологий и информационной безопасности ЮФУ

ON THE APPROACH FOR AUTOMATIC GENERATION OF NARRATIVE-LINKED TEXT A.V. Kozlovsky, Ya.E. Melnik, V.I. Voloshchuk

The problems associated with modern methods of text generation are considered, and the task of generating interactive story-related text is set. Analogues are considered, with the advantages and disadvantages identified. An approach for text generation is proposed in which input and output data are defined. A graph model is chosen as the basis for the semantic transformation of the text. In addition, the possibility of adding vectors to the basic model in order to take into account the aspect of time and other additional characteristics necessary for full-fledged parsing both a single sentence and the whole plot block is revealed. The general algorithm of the system's work is constructed. Directions for further research have been identified.

Key words: text generation, neural networks, graph, vector.

Kozlovsky Alexander Vyacheslavovich, postgraduate, kozlovskiy@sfedu.ru, Russia, Taganrog, Institute of Computer Technologies and Information Security of the Southern Federal University,

MelnikYaroslavEduardovich, student, iamelnik@sfedu.ru, Russia, Taganrog, Institute of Computer Technologies and Information Security of the Southern Federal University,

VoloshchukVadimIgorevich, student, vvoloshchuk@sfedu.ru, Russia, Taganrog, Institute of Computer Technologies and Information Security of the Southern Federal University

i Надоели баннеры? Вы всегда можете отключить рекламу.