Научная статья на тему 'ОБЗОР МЕТОДОВ И СПОСОБОВ ОБУЧЕНИЯ АЛГОРИТМОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА'

ОБЗОР МЕТОДОВ И СПОСОБОВ ОБУЧЕНИЯ АЛГОРИТМОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
50
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
машинное обучение / обучение с учителем / обучение без учителя / обучение с частичным привлечением учителя / обучение с подкреплением / machine learning / supervised learning / unsupervised learning / semi-supervised learning / reinforcement learning

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — А.В. Скороход, Е.С. Семенкин

В настоящем докладе содержится общее введение в методы настройки (обучения) алгоритмов и моделей машинного обучения. Обсуждение включает в себя рассмотрение использования различных типов и количество данных для процесса обучения. Также представлены сценарии типов процедур обучения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AN OVERVIEW OF LEARNING METHODS OF THE ARTIFICIAL INTELLIGENCE ALGORITHMS

This report provides a general introduction to methods for configuring (learning) machine learning algorithms and models. The discussion includes consideration of the use of different types and amounts of data for the learning process. Scenarios of the types of training procedures are also presented.

Текст научной работы на тему «ОБЗОР МЕТОДОВ И СПОСОБОВ ОБУЧЕНИЯ АЛГОРИТМОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА»

УДК 519.87

ОБЗОР МЕТОДОВ И СПОСОБОВ ОБУЧЕНИЯ АЛГОРИТМОВ ИСКУССТВЕННОГО

ИНТЕЛЛЕКТА

*

А. В. Скороход Научный руководитель - Е. С. Семенкин

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: SkorokhodAV@yandex.ru

В настоящем докладе содержится общее введение в методы настройки (обучения) алгоритмов и моделей машинного обучения. Обсуждение включает в себя рассмотрение использования различных типов и количество данных для процесса обучения. Также представлены сценарии типов процедур обучения.

Ключевые слова: машинное обучение, обучение с учителем, обучение без учителя, обучение с частичным привлечением учителя, обучение с подкреплением.

AN OVERVIEW OF LEARNING METHODS OF THE ARTIFICIAL INTELLIGENCE

ALGORITHMS

А. V. Skorokhod* Scientific supervisor - E. S. Semenkin

Reshetnev Siberian State University of Science and Technology 31, Krasnoyarskii rabochii prospekt, Krasnoyarsk, 660037, Russian Federation E-mail: SkorokhodAV@yandex.ru

This report provides a general introduction to methods for configuring (learning) machine learning algorithms and models. The discussion includes consideration of the use of different types and amounts of data for the learning process. Scenarios of the types of training procedures are also presented.

Key words: machine learning, supervised learning, unsupervised learning, semi-supervised learning, reinforcement learning.

Введение. На протяжении всего существования человечества люди постоянно генерируют различные данные: от наскальных рисунков до йоттабайтов доступной нам цифровой информации сегодня. Имея огромное количество известной и хранимой нами информации -данные, мы можем, получить новое знание. В том числе это как никогда важно и для ракетно-космической промышленности [1]. Выработкой и систематизацией объективных знаний о методах и способах получения новых знаний из данных занимается наука анализа данных (АД). Машинное обучение, подраздел АД, занимается построением математических моделей, и дальнейшей их настройкой - обучением, для получения модели данных. На сегодняшний день существует большое количество процедур обучения алгоритмов, каждый из которых решает задачу моделирования особенностей изучаемых данных [2].

Универсальная математическая модель - функциональная зависимость у = f(x), где f -модель, х - данные, а y - целевое значение. Предполагается, что f находится в процессе обучения, данные x мы имеем всегда, наличие y - опционально. По тому, имеем ли мы в

Секция «Математические методы моделирования, управления и анализа данных»

распоряжении пару (х,у) (размеченные данные) или только х (неразмеченные данные), является ли выборка х выборкой одного распределения, и какое количество данных в доступе, и определяется экспертом тип процедуры обучения.

Таблица 1

Типы процедур обучения в зависимости от вида исследуемых данных_

Алгоритм Данные

Размеченные Неразмеченные данные

рус. англ. Исходн ые Дополнит ельные Исходн ые Дополнит ельные

Глубокое обучение Deep learning *

Обучение с учителем Supervised learning

Обучение без учителя Unsupervised learning

Обучение с подкреплением Reinforcement learning

Р обучение Q learning

Полу управляемое обучение Semi-supervised learning

Активное обучение Active learning

Трансферное обучение Transfer learning

Самообучение Self-supervised learning

Сравнительное обучение Contrastive learning

Мультизадачное обучение Multi-task learning

*

обозначение градиента представлено на рис. 1

Много данных Нет данных

Рис. 1. Градация количества данных для таблицы 1.

В табл. 1 отображено соотношение необходимых размеченных и/или неразмеченных данных для выбранной процедуры обучения. Поговорим подробнее о каждом упомянутом выше принципе обучения и характере данных, используемых в рамках данных концепций.

• Обучение с учителем (или Supervised learning)

- Исследуемые данные размечены, т.е. имеют вид пары (x,y). Так, например, одним из классических наборов анализа данных, считается набор данных Ирисы [3]. В данном наборе x - это измерения параметров цветка, а y - наименование вида ириса.

• Глубокое обучение (или Deep Learning)

- Один из видов обучения с учителем. В случае, если количества примеров данных (x,y) будет слишком велико, классические алгоритмы машинного обучения не способны создавать модель заданной точности. Глубокое обучение - это модификация алгоритмов обучения с учителем для глубинных нейронных сетей, способных справляться с огромным количеством размеченных данных.

• Обучение без учителя (или Unsupervised learning)

- Даны только объекты x (без меток), необходимо эффективно описать, как они располагаются в пространстве описаний.

• Полу управляемое обучение (или Semi-supervised learning)

- Обучающая выборка состоит из данных с метками и без меток (последних, как правило, существенно больше), необходимо также обучить модель y=f(x), неразмеченные данные помогают определить, как объекты располагаются в пространстве описаний. Для обработки неразмеченной части можно использовать как обучение с учителем, так и обучение без учителя.

• Активное обучение (или Active learning)

- В данном типе обучения для исследования доступно большое количество неразмеченных данных, а также малое количество размеченных, получение меток для которых обходится слишком дорого для исследователей. Получение меток возможно при помощи запросов «оракулу».

• Обучение с подкреплением (или Reinforcement learning)

- Строго говоря, не является методом получения моделей данных напрямую. Цель исследователя - моделирование поведения или процесса, которое производится за счет данных. Неразмеченные данные здесь - это пространство состояний имитируемого объекта, а метки, которые мы способны получить - это ответ окружающей среды на состояние (воздействие) модели объекта.

• Q обучение (или Q learning)

- Является подвидом обучения с подкреплением. На основе получаемого от среды вознаграждения модель формирует функцию полезности Q, что впоследствии дает возможность выбирать стратегию поведения на основе предыдущего взаимодействия со средой.

• Трансферное обучение (или Transfer learning)

- В случае, если не/размеченных исследуемых данных мало для построения адекватной модели, возможно использование не/размеченных данных другого распределения (схожего с исследуемым) для построения модели, которую в последствие используют при решении исходной проблемы.

• Самообучение (или Self-supervised learning)

- Является комбинацией применения идей полу контролируемого обучения и трансферного обучения. Имеются данные одного распределения, размеченные в малом количестве. Для неразмеченных данных придумывается новая задача (осуществляется автоматическая разметка), схожая с исходной. Модель, обученная на данных уже, по сути, другого распределения, применяется для исходной небольшой подвыборки размеченных данных.

• Сравнительное обучение (или Contrastive Learning)

- Имеются неразмеченные данные исходного распределения и дополнительные данные другого распределения. Модель исходных данных строится на основе предположения о одинаковом распределении двух выборок.

• Многозадачное обучение (или Multi-task learning)

- При недостаточном, или наоборот, слишком большом, для построения адекватной модели, количестве не/размеченных данных, возможно обучение нескольких моделей на дополнительных данных других распределений, для вынесения общего решения по исследуемым данным. Является, по сути, некой модификацией трансферного обучения.

Библиографические ссылки

1. Meß J. G., Dannemann F., Greif F. Techniques of Artificial Intelligence for Space Applications-A Survey //European Workshop on On-Board Data Processing (OBDP2019). -European Space Agency, 2019.

2. Das K., Behera R. N. A survey on machine learning: concept, algorithms and applications //International Journal of Innovative Research in Computer and Communication Engineering. -2017. - Т. 5. - №. 2. - С. 1301-1309.

3. Fisher R. A. The use of multiple measurements in taxonomic problems //Annals of eugenics. - 1936. - Т. 7. - №. 2. - С. 179-188.

© Скороход А. В., 2021

i Надоели баннеры? Вы всегда можете отключить рекламу.