Научная статья на тему 'АЛГОРИТМЫ МАШИННОГО ОБУЧЕНИЯ'

АЛГОРИТМЫ МАШИННОГО ОБУЧЕНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
304
58
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАШИННОЕ ОБУЧЕНИЕ / АЛГОРИТМ / РЕГРЕССИЯ / SVM / MACHINE LEARNING / ALGORITHM / REGRESSION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Макаров Д.А., Шибанова А.Д.

В данной статье рассмотрена технология машинного обучения. Проведен анализ алгоритмов машинного обучения. Указана область применения каждого из них. Сделан вывод об актуальности технологии машинного обучения, описаны плюсы ее внедрения в производство.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ALGORITHNS OF MACHINE LEARNING

In this article, we consider the technology of machine learning. The analysis of algorithms of machine learning is carried out. The scope of each of them is indicated. The conclusion is made about the relevance of the technology of machine learning, the advantages of its introduction into production are described.

Текст научной работы на тему «АЛГОРИТМЫ МАШИННОГО ОБУЧЕНИЯ»

УДК 004.85

Макаров Д.А. студент

факультет «Информатика и системы управления»

Шибанова А.Д. студент

факультет «Робототехника и комплексная автоматизация»

Московский государственный технический университет имени Н.Э. Баумана Россия, г. Москва АЛГОРИТМЫ МАШИННОГО ОБУЧЕНИЯ

Аннотация: в данной статье рассмотрена технология машинного обучения. Проведен анализ алгоритмов машинного обучения. Указана область применения каждого из них. Сделан вывод об актуальности технологии машинного обучения, описаны плюсы ее внедрения в производство.

Ключевые слова: машинное обучение, алгоритм, регрессия, SVM.

Makarov D.A. student

Faculty of Informatics and Management Systems Moscow State Technical University named after N.E.

Bauman Russia, Moscow Shibanova A.D. student

Faculty of Robotics and complex automation Moscow State Technical University named after N.E.

Bauman Russia, Moscow ALGORITHNS OF MACHINE LEARNING

Annotation: in this article, we consider the technology of machine learning. The analysis of algorithms of machine learning is carried out. The scope of each of them is indicated. The conclusion is made about the relevance of the technology of machine learning, the advantages of its introduction into production are described.

Key words: machine learning, algorithm, regression, SVM.

Рассмотрим алгоритмы, которые активно применяются в технологии машинного обучения.

1. Дерево принятия решений. В этом методе используется древовидный граф: дерево состоит из минимального числа вопросов с ответами «да» либо «нет». Отвечая последовательно на эти вопросы можно получить итоговый ответ. Данный метод структурирует и систематизирует

проблему, а конечное решение получается из логических выводов.

2. Наивная байесовская классификация. Наивные байесовские классификаторы воспринимают различные функции как независимые, это представляет из себя наивное предположение. Такая классификация используется в таких областях: поиск спама, распознавание предметов на фотографиях и т.д.

3. Метод наименьших квадратов. Метод наименьших квадратов принадлежит к линейной регрессии. Обычно с ее помощью находят решение задачи по подгонке прямой, которая проходит через некоторое количество точек. Линия, у которой сумма квадратов расстояний будет наименьшей, принимается искомой. Метод применяется для уменьшения количества погрешностей с помощью создания метрики ошибок.

4. Логистическая регрессия. Логистическая регрессия - это метод вычисления зависимости между категориально зависимыми и независимыми переменными. Для этого используется логистическая функция. Логистическая регрессия представляет из себя мощное статистическое средство предсказания событий, включающее независимые переменные. Это может быть использовано в оценке успеха рекламных кампаний, прогнозе спроса на определенный товар и т.д.

5. Метод опорных векторов (SVM). Так называются алгоритмы, которые используются для решения задач классификации и регрессионного анализа. SVM и его модифицированные версии решают сложные задачи машинного обучения, такие как вырезание определённых нуклеотидных последовательностей ДНК, определение пола человека по фотографии и т.д.

6. Метод главных компонент (PCA). Данный метод - это операция из статистики по преобразованию, переводит процесс наблюдения за как-то связанными между собой переменными, которые могут быть как-то взаимосвязаны между собой, в набор не связанных между собой значений. Задачи, где применяется этот метод - задачи упрощения, минимизации количества данных, их визуализация. Но метод не подходит для ситуаций, где данные слабо упорядочены, недостаточно изучена предметная область.

7. Анализ независимых компонент (ICA). Это метод из статистики, который выявляет скрытые факторы, влияющие на случайные величины. Данный метод формирует на основе многофакторных данных специальную модель. Метод эффективен, когда классические подходы по каким-либо причинам не способны предоставить объективную модель. Он позволяет обнаружить причины явлений, которые не доступны для анализа классическим методам, что позволяет активно применять данный метод в астрономии, анализе данных, распознавании речи.

Рассмотрим диагностику заболеваний. Необходимо представить пациентов как объекты, а признаками - их болезни, симптомы, пол, возраст и т.д. Некоторые признаки целесообразно принять бинарными. Состояния пациентов различной степени тяжести - порядковые признаки, а иные -количественные, такие как рост, вес, объем грудной клетки, принимаемые

препараты и т.д. С помощью информации о данных признаках и специальной программы с машинным обучением можно определить вид заболевания, просчитать возможное лечение и необходимые препараты, определить возможные осложнения и рассчитать действия, необходимые для их предотвращения. Человек не способен быстро обработать такие большие объемы информации, а самое главное - он способен при анализе допустить ошибку. Таким образом, машинное обучение становится незаменимым помощником в сфере медицины и здравоохранения.

Технологии машинного обучения подвластно даже определение наличия полезных ископаемых. В качестве признаков принимаются сведения о нахождении определенных ископаемых на данной территории: наличие на территории местности каких-либо пород, их свойства, как химические, так и физические. Эти свойства можно принять за количественные и качественные признаки. Для обучения программы используется набор территорий со списком их признаков, где полезные ископаемые точно есть. Однако в данном случае существует некоторая специфика, иногда количество признаков много больше количества объектов, поэтому традиционные методы не работают. Так что в машинном обучении внимание акцентируется на поиск зависимостей в ряде уже обнаруженных данных. Данный метод позволяет сэкономить значительный объем средств.

Машинное обучение предоставляет человеку грандиозные возможности, недоступные ранее. Например, система мониторинга состояния здоровья, учитывающая индивидуальные данные, привычки и наследственность пациента. Улучшение систем защиты, которые будут самостоятельно определять взлом или кражу данных и предпринимать попытки к устранению проникновения, возможность организовывать «умную» защиту общественных мест, таких как кафе, стадионы, центральные площади, с помощью технологии распознавания лиц. Внедрение беспилотных автомобилей, которые способны самостоятельно строить маршрут и оценивать дорожную обстановку. Защита банковских карт, качественный перевод с одного языка на другой. Это лишь немногие области применения машинного обучения. Внедрение машинного обучения приведет к оптимизации процесса производства и упрощению ежедневного труда, но вызовет сокращение количества рабочих мест. Самообучающиеся программы заменяют труд человека не только в рутинных процессах, но и требующих интеллектуального труда, с часто встречающимися нестандартными случаями. Такие программы справляются с задачами гораздо лучше человека, что исключает человеческий фактор и значительно ускоряет процесс решения.

Использованные источники: 1. Машинное обучение: виды, алгоритмы, примеры. [Электронный ресурс]. Режим доступа: https://www.gd.ru/articles/9348-mashinnoe-obuchenie (дата обращения 20.06.2018).

2. Бринк Х., Ричардс Д., Феверолф М. Машинное обучение. - Санкт-Петербург: Питер, 2017. - 336 с.

3. Машинное обучение. [Электронный ресурс]. Режим доступа: http://www.machmeleammg.ru/wiki/mdex.php?tiÜe=Машинное_обучение (дата обращения 20.06.2018).

4. Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных. -Москва: ДМК Пресс, 2015. -400 с.

УДК 004.85

Макаров Д.А. студент

факультет «Информатика и системы управления»

Шибанова А.Д. студент

факультет «Робототехника и комплексная автоматизация»

Московский государственный технический университет имени Н.Э. Баумана Россия, г. Москва ПРИНЦИПЫ МАШИННОГО ОБУЧЕНИЯ Аннотация:

В данной статье рассмотрена технология машинного обучения. Указаны ее преимущества и достоинства. Описаны задачи машинного обучения. Рассмотрена их классификация по наличию или отсутствию учителя в процессе обучения.

Ключевые слова: машинное обучение, алгоритм, нейронная сеть, учитель, регрессия.

Makarov D.A. student

Faculty of Informatics and Management Systems Moscow State Technical University named after N.E.

Bauman Russia, Moscow Shibanova A.D. student

Faculty of Robotics and complex automation Moscow State Technical University named after N.E.

Bauman Russia, Moscow PRINCIPLES OF MACHINE LEARNING

Annotation:

In this article, we consider the technology of machine learning. Its advantages and advantages are indicated. The problems of machine learning are described. Their classification according to the presence or absence of a teacher

i Надоели баннеры? Вы всегда можете отключить рекламу.