Научная статья на тему 'Методы машинного обучения в малом бизнесе: содержание и управление'

Методы машинного обучения в малом бизнесе: содержание и управление Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1405
229
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / БИЗНЕС-ПРОЦЕССЫ / ИНСТРУМЕНТАЛЬНЫЙ ПОДХОД / МОДЕЛЬ РЕГРЕССИИ / МЕТОД ОПОРНЫХ ВЕКТОРОВ / МАШИННОЕ ОБУЧЕНИЕ / ARTIFICIAL INTELLECT / BUSINESS PROCESSES / INSTRUMENTAL APPROACH / REGRESSIVE MODEL / METHOD OF SUPPORT VECTORS / MACHINE-AIDED TRAINING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Тищенко Сергей Александрович, Шахмурадян Михаил Андреевич

В статье рассмотрены ключевые характеристики стандартных методов машинного обучения, используемых компаниями в операционных бизнес-процессах. В условиях отечественного курса на развитие инновационного бизнеса, цифровой экономики и инфраструктуры для хранения данных человеческий фактор приобретает ключевое значение. Применение методов искусственного интеллекта в работе сотрудников малых предприятий встречает препятствия, которые заключаются в том числе и в отсутствии представлений у персонала о стратегической функциональности существующих в настоящее время алгоритмов бизнес-процессов. Малые коммерческие предприятия сталкиваются с проблемой незнания основных инструментальных принципов функционирования и использования алгоритмов машинного обучения. Вместе с тем бизнес-процессы предприятия могут быть качественно улучшены благодаря имплементации (реализации) алгоритмов машинного обучения. Авторами приведен формальный и аналитический обзор существующих базовых алгоритмов, используемых рядом крупных коммерческих компаний в качестве потенциального средства для оптимизации бизнеса малого предприятия. Описаны виды алгоритмов и моделей машинного обучения множественная модель регрессии, логистическая регрессия и др., а также инструментальные проблемы их использования аналитиками и разработчиками предприятия. Даны рекомендации по применению данных моделей для повышения эффективности работы малых коммерческих предприятий.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Тищенко Сергей Александрович, Шахмурадян Михаил Андреевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODS OF MACHINE-AIDED TRAINING IN SMALL BUSINESS: CONTENT AND MANAGEMENT

The article provides key characteristics of standard methods of machine-aided training used by companies in operative business processes. Within the frames of home orientation to the innovation business development, digital economy and infrastructure for data storage the human factor becomes essential. The use of methods of artificial intellect by employees of small enterprises faces obstacles that imply personnel ignorance concerning strategic functionality of available today algorithms of business processes. Small commercial enterprises encounter the problem that they do not know the key instrumental principles of functioning and use of machine-aided training algorithms. At the same time business processes of the enterprise could be seriously improved through implementing algorithms of machine-aided training. The authors conducted a formal and analytical review of potential means for small business optimization. They described types of algorithms and models of machine-aided training, such as multiple regressive model, logistic regression, etc., as well as instrumental problems of their use by enterprise analysts and developers. Recommendations were prepared aimed at use of these models in order to raise the efficiency of small commercial enterprises.

Текст научной работы на тему «Методы машинного обучения в малом бизнесе: содержание и управление»

ЭКОНОМИКА ПРЕДПРИНИМАТЕЛЬСТВА

DOI: http://dx.doi.org/10.21686/2413-2829-2019-6-83-95

МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ В МАЛОМ БИЗНЕСЕ: СОДЕРЖАНИЕ И УПРАВЛЕНИЕ

С. А. Тищенко, М. А. Шахмурадян

Московский государственный университет имени М. В. Ломоносова,

Москва, Россия

В статье рассмотрены ключевые характеристики стандартных методов машинного обучения, используемых компаниями в операционных бизнес-процессах. В условиях отечественного курса на развитие инновационного бизнеса, цифровой экономики и инфраструктуры для хранения данных человеческий фактор приобретает ключевое значение. Применение методов искусственного интеллекта в работе сотрудников малых предприятий встречает препятствия, которые заключаются в том числе и в отсутствии представлений у персонала о стратегической функциональности существующих в настоящее время алгоритмов бизнес-процессов. Малые коммерческие предприятия сталкиваются с проблемой незнания основных инструментальных принципов функционирования и использования алгоритмов машинного обучения. Вместе с тем бизнес-процессы предприятия могут быть качественно улучшены благодаря имплементации (реализации) алгоритмов машинного обучения. Авторами приведен формальный и аналитический обзор существующих базовых алгоритмов, используемых рядом крупных коммерческих компаний в качестве потенциального средства для оптимизации бизнеса малого предприятия. Описаны виды алгоритмов и моделей машинного обучения - множественная модель регрессии, логистическая регрессия и др., а также инструментальные проблемы их использования аналитиками и разработчиками предприятия. Даны рекомендации по применению данных моделей для повышения эффективности работы малых коммерческих предприятий. Ключевые слова: искусственный интеллект, бизнес-процессы, инструментальный подход, модель регрессии, метод опорных векторов, машинное обучение.

METHODS OF MACHINE-AIDED TRAINING IN SMALL BUSINESS: CONTENT AND MANAGEMENT

Sergey A. Tishchenko, Mikhail A. Shakhmuradian

Lomonosov Moscow State University, Moscow, Russia

The article provides key characteristics of standard methods of machine-aided training used by companies in operative business processes. Within the frames of home orientation to the innovation business development, digital economy and infrastructure for data storage the human factor becomes essential. The use of methods of artificial intellect by employees of small enterprises faces obstacles that imply personnel ignorance concerning strategic functionality of available today algorithms of business processes. Small commercial enterprises encounter the problem that they do not know the key instrumental principles of functioning and use of machine-aided training algorithms. At the same time business processes of the enterprise could be seriously improved through implementing algorithms of machine-aided training. The authors conducted a formal and analytical review of potential means for small business optimization. They described types of algorithms and models of machine-aided training, such as multiple regressive model, logistic regression, etc., as well as instrumental problems of their use by enterprise analysts and developers. Recommendations were prepared aimed at use of these models in order to raise the efficiency of small commercial enterprises.

Keywords: artificial intellect, business processes, instrumental approach, regressive model, method of support vectors, machine-aided training.

Введение

Экономический курс развитых и развивающихся стран на поддержку и развитие предприятий, занимающихся усовершенствованием и массовым внедрением методов искусственного интеллекта (ИИ), является устоявшимся мировым трендом. Министерство промышленности и информатизации КНР в июле 2017 г. выпустило документ под названием «Трехлетний план действий по содействию развитию нового поколения индустрии искусственного интеллекта (2018-2020 годы)», в котором описываются этапы содействия государства развитию индустрии ИИ на ближайшие три года. Согласно стенографической записи выступления в Коллеж де Франс президента Франции Э. Макрона, посвятившего целую речь технологии ИИ, во Франции будет создана национальная программа в этой области.

В соответствии с Посланием Президента Российской Федерации В. В. Путина Федеральному Собранию от 1 марта 2018 г. внедрение и использование технологий ИИ являются одним из основных приоритетов экономического развития. По итогам послания в феврале 2019 г. президент поручил правительству Российской Федерации разработать стратегию национального развития страны в области искусственного интеллекта. Пионерами комплексного использования технологии в России выступают такие крупные коммерческие организации, как ПАО «Сбербанк» (ИИ используется для персональных рекомендаций клиентам продуктов банка, выявления мошеннических операций, оптимизации рутинных процессов), ООО «Яндекс» (например, подразделение Yandex Data Factory оказывает услуги по разработке моделей оптимизации и прогностических моделей на базе ИИ для отечественных компаний), ПАО «МегаФон» (методы ИИ служат для оптимизации работы центров обслуживания, разработки новых предложений, основанных на аналитике имеющихся данных, кастомизации), ПАО «МТС» (алгоритмы внедряются для забла-

говременной рекомендации по подключению услуги абоненту, для прогнозирования посещаемости открывающихся центров обслуживания) и др.

Ввиду рыночной капитализации, возможности обеспечения информационной безопасности данных пользователей (конфиденциальности, целостности и доступности) и непосредственного доступа к огромному количеству информации о пользователях (так называемым большим данным, где для обработки и выделения скрытых корреляций необходимо использование параллельных вычислений) упомянутые участники рынка могут позволить себе быть первыми по внедрению машинного обучения.

Алгоритмы и модели

машинного обучения

Существует ряд условных препятствий, не позволяющих на данном этапе массово внедрять инструментарий ИИ, а именно машинное обучение (МО), в бизнес-процессы отечественных коммерческих предприятий, малых субъектов хозяйствования. В соответствии с Федеральным законом от 24 июля 2007 г. № 209-ФЗ «О развитии малого и среднего предпринимательства» под малой коммерческой организацией следует понимать хозяйствующий субъект (юридическое лицо или индивидуальный предприниматель), отнесенный в соответствии с условиями, установленными в законе, к малым предприятиям, в том числе к микропредприятиям. Малое предприятие допускает предельное значение среднесписочной численности работников за календарный год до 100 человек. Для признания организации субъектом малого предпринимательства ее доход не должен превышать более 800 млн рублей1.

К объективным препятствиям для внедрения МО в операционные процессы организаций данного типа относятся не только финансовые издержки на инфра-

1 URL: http://www.consultant.ru/document/cons_doc_ LAWJL96415/ (дата обращения: 11.01.2019).

структуру (серверы, программное обеспечение, квалифицированный персонал) или отсутствие больших данных (МО является также независимым инструментом, не требующим использования параллельных вычислений в программировании), но и отсутствие фактического представления у менеджеров стратегической функциональности существующих алгоритмов в бизнес-процессах предприятия [23].

В условиях внедрения цифровой экономики человеческий фактор является ключевым в становлении и развитии инновационного бизнеса. Практически любой из видов бизнес-процессов предприятия (управляющие, операционные, поддерживающие) при наличии операционных данных может быть качественно улучшен благодаря имплементации (реализации) алгоритмов машинного обучения [20. - Р. 1; 28. - Р. 7]. Даже эффективность инновационного процесса внутри предприятия может быть спрогнозирована благодаря описываемому инструментарию [30. - Р. 274]. Следует отметить, что в соответствии с исследованием автора книги «Big Data: Using Smart Big Data, Analytics and Metrics to Make Better Decisions and Improve Performance» Б. Марра менее 20% хранимых копаниями данных используются для принятия решения [25. - Р. 18].

Стоит уточнить, что уже доступны облачные сервисы, выполняющие расчеты по имеющимся бизнес-данным и не требующие глубокого знания алгоритмической и математической составляющих (Amazon Web Services, Microsoft Azure ML Studio и др.) [16. - Р. 5]. Тем не менее готовые системы не всегда просто адаптировать под конкретную бизнес-задачу [29. - Р. 93]. Иногда более оптимально оптимизировать процесс управления вычислительной мощностью серверных ресурсов [3].

Для качественной работы даже с облачными решениями необходимо вникнуть в инструментальный аппарат и понять возможности реализации моделей МО. Следует знать основные понятия для обзора наиболее используемых алгоритмов ма-

шинного обучения в бизнесе, а также некоторые модели МО, используемые и модифицируемые крупными российскими компаниями.

Вначале рассмотрим терминологию исследуемой области. Научные предположения и изыскания в сфере искусственного интеллекта начались еще в начале второй половины XX в. Например, английский математик А. Тьюринг в 1950 г. опубликовал книгу под названием «Computing Machinery and Intelligence», в которой высказал мысль о том, что машину можно запрограммировать для имитации интеллектуальных процессов. Немногим позже американский информатик и основоположник функционального программирования Д. Маккарти ввел термин «искусственный интеллект» [См.: 2. - С. 448].

Появившееся позднее понятие машинного обучения начало развиваться по двухуровневой структуре дефиниции (логической операции): общей и специальной. Автор книги «Программируем коллективный разум» Тоби Сегаран определяет МО как одну из дисциплин искусственного интеллекта, касающихся алгоритма обучения компьютеров [13. - С. 22].

Похожую позицию занимают представители академической среды Университета Сучжоу (КНР), характеризуя машинное обучение как одну из основных областей исследования ИИ [31. - Р. 1].

Авторы книги «Самообучающиеся системы» С. И. Николенко и А. Л. Тулупьев отмечают, что отличительным свойством алгоритма машинного обучения является его способность улучшать свое поведение по мере накопления опыта [8. - С. 17]. Инженер-программист компании Google Дж. Грас рассматривает МО как процесс создания и применения моделей, извлеченных из данных в результате обучения [4. - С. 170].

Профессор компьютерных наук Эдинбургского университета К. Бишоп считает, что результатом работы алгоритма МО является функция y(x), которая принимает некоторое значение x, а затем генерирует

на выход соответствующее значение у [17. - Р. 2].

Э. Траск, один из основателей лаборатории машинного обучения в компании Digital Reasoning, рассматривает МО как область компьютерных наук, где машины учатся решать задачи, для которых они не были запрограммированы непосредственно [15. - С. 29].

Автор книги «Statistics for Machine Learning» П. Дангети утверждает, что целью МО является обобщение обнаруженных зависимостей или создание неизвестных правил для исследуемых данных [19. - Р. 8].

Суммируя все вышеперечисленное, можно дать определение машинного обучения как самостоятельного раздела понятия ИИ, изучающего инструментальные и математические способы построения и обучения целевой функции f наилучшим образом описывающей соотношения входных (х) и выходных (у) переменных. Довольно часто МО имеет дело с недостоверными или недетерминированными величинами. Это обусловлено стохастичностью (случайностью) моделируемой системы и неполнотой наблюдаемых данных [5. - С. 62].

В данной статье речь идет о формализации использования алгоритмов без учета качества набора признаков и формализации данных (структурированные данные, неструктурированные данные, потоковые данные и т. д.) [6. - С. 21]. Для обзорного анализа методов МО необходимо ввести понятие модели. Модель в контексте исследуемой области можно определить как описание математической или вероятностной связи, существующей между величинами. В свою очередь предиктивная модель - это формула для оценки неизвестного значения данных [27. - Р. 45].

Одна из задач машинного обучения -построение рабочей практико-ориенти-рованной модели, основанной на ансамбле алгоритмов с обучающей, валидационной и тестовой выборками. Под выборкой следует подразумевать конечный набор слу-

чаев из множества прецедентов. Аналитиком определяется набор данных, на котором алгоритм обучается выводить целевую функцию у(х), а также набор прецедентов, на которых тестируется качество сформированного алгоритма. Такие наборы данных принято называть признаками.

Признаки следует разделять на три части [4. - С. 173]:

1) обучающее подмножество, на котором проводится непосредственное обучение и построение модели;

2) подмножество перекрестной проверки (валидационное подмножество) для отбора одной из обученных моделей;

3) контрольное подмножество, на котором тестируется итоговая модель.

Отметим, что существуют классифицированные группы моделей машинного обучения. К первой группе относятся алгоритмы обучения с помеченными данными (Supervised Learning), где присутствует выборка, маркированная правильными ответами (пары объект - ответ), на которых проходит обучение. Эта группа называется также обучением с учителем. Основная цель алгоритма - обеспечение модели точной мерой ее ошибки, напрямую сопоставимой с исходящими значениями [18. - Р. 10]. Она состоит из регрессионных и классификационных моделей [21. - С. 3].

Во вторую группу можно отнести алгоритмы, самостоятельно определяющие зависимости и закономерности между рассматриваемыми объектами (Unsupervized Learning). Данный тип обучения называется обучением без учителя. Основная цель такого типа алгоритмов - выявление свойственных структур или общностей во входящих данных [24. - Р. 76].

Существуют также и другие виды МО (с частичным обучением, динамическим обучением и т. д.), однако мы рассмотрим только примеры алгоритмов, обучающихся на маркированных данных, а также способы их применения в бизнес-процессах хозяйствующих субъектов.

Перед непосредственным описанием алгоритмов стоит кратко упомянуть о частых

инструментальных проблемах, возникающих перед аналитиками и разработчиками предприятия в ходе обучения модели. К типичным проблемам МО относятся переобучение и недообучение модели.

Переобучение модели (overfitting) можно определить как процесс, опосредующий хорошую работу прогностической модели на обучающей выборке (более 85% точности), но при этом плохо обобщающий новые группы данных. Причина заключается в наличии шума, искажения входных данных (например, у слишком сложных моделей), что ведет к потенциальному переобучению. К такому же результату приводят низкое смещение и высокая дисперсия (в этом случае следует удалить часть признаков или использовать большее количество данных).

Недообучение модели (underfitting) -процесс, при котором прогностическая модель не работает даже на обучающей выборке. Высокое смещение (следует добавить больше признаков) и низкая дисперсия являются сопутствующими признаками недообучения [4. - С. 172].

Множественная модель регрессии

Множественная модель регрессии (Multiple Regression) является одним из наиболее простых и распространенных алгоритмов машинного обучения, используемых при анализе данных предприятия. На практике чаще приходится сталкиваться с наличием множества различных признаков, оказывающих влияние на исследуемый процесс, при этом простая линейная регрессия становится неактуальным инструментом.

Множественная регрессионная модель представляет собой уравнение простой линейной регрессии с двумя или более признаками и коэффициентами:

yi = ЬгХг + b2X2 + ЬзХз + b4X4 + k + Zi.

Такая модель применяется в процессах, в которых прослеживается сильная линейная зависимость. Задача регрессии - прогноз на основе выборки объектов с различными признаками. Так, например, имея

определенный запас производственных или операционных данных в компании, мы можем оценить стоимость ценных бумаг, нежилой и жилой недвижимости, ожидаемый доход коммерческого предприятия по каналам продаж, рентабельность размещения нового места сбыта продукции и т. д.

К числу задач множественной регрессии можно отнести отражение гипотезы о зависимости между ежедневными обновлениями на сайте и покупками, что особо актуально для такой сферы экономики, как электронная коммерция. На практике линейная модель регрессии часто применяется к наборам данных с большим числом переменных. Однако здесь есть свои трудности. Во-первых, возрастает вероятность переобучения модели. Во-вторых, чем больше ненулевых коэффициентов, тем сложнее разобраться в их значении. Для решения подобного типа проблем необходима регуляризация.

Регуляризация - это метод (для предотвращения переобучения), при котором к случайным ошибкам регрессии добавляется штраф, растущий с увеличением k. После этого сочетание ошибок и штрафа минимизируется. Среди наиболее применяемых методов регуляризации выделим гребневую регрессию (Ridge Regression) и лассо-регуляризацию (L2-regularization).

Алгоритм действия первой техники заключается в применении штрафа к сумме квадратов коэффициентов модели, где штраф равен

P = aZNLi в2п,

где а выполняет функцию условного параметра, управляющего уровнем штрафа.

В свою очередь лассо-регуляризация штрафует на сумму абсолютных значений коэффициентов регрессии:

P = aZN=i |е„ |.

Модель линейной регрессии подразумевает определение влияния параметров на исследуемый процесс и дальнейшее оценивание предикативности этого дей-

ствия (определяем, какой вклад вносит каждый признак в процесс). К примеру, предсказывая длину очереди в гипермар-кете, мы можем определить, насколько такие факторы, как время, наличие свободных касс, график работы гипермаркета, влияют на количество людей в очереди на одну кассу и, соответственно, на формирование ежедневных денежных потоков.

Известно большое количество возможных применений модели линейной регрессии как в крупном, так и в малом бизнесе. К ним относится онлайн-ото-бражение движения общественного транспорта (Яндекс.Карты, Яндекс.Транспорт и пр.), прогнозирование эффективности финансового портфеля (АО «Тинькофф Банк», криптовалютная платформа Cindicator и др.) и т. д. Одним из наиболее ярких примеров использования подобного подхода на практике стало предсказание внутри малого предприятия ООО «Политех-Плюс» поломок оборудования на производстве, а следовательно, необходимости планово-предупредительного обслуживания, в результате чего показатель производства - общая эффективность оборудования (Overall Equipment Effectiveness) -увеличился на 15% [7].

Логистическая регрессия

Логистическая регрессия (Logit Model) является другим наиболее часто используемым в бизнес-процессах инструментом, относящимся к линейным классификаторам. В данном случае изначально формируется бинарная (двоичная) постановка задачи, где ключевым результатом будет отражение принадлежности объекта с определенной вероятностью к одному из двух классов (в случае бинарной логистической регрессии). Ключевым положением в описываемом алгоритме является обучение модели присваиванию подходящих весов каждому признаку. Соотношение входных признаков и коэффициентов подобно предыдущей рассматриваемой модели носит линейный характер. Необходимо предсказать с определенной вероят-

ностью принадлежность уI к одному из двух классов. К примеру, аналитику интернет-издания необходимо найти вероятность Р(г) покупки клиентом полугодовой подписки на электронный журнал. В данном случае искомая величина будет являться вероятностью нахождения Р(х) в одном из нескольких классов: купит / не купит. Данный тип алгоритма включает функционал множественной линейной регрессии, потому что требуется найти значения коэффициентов для входных переменных:

У1 = Ь0 + Ъх + Ъ2%2 + Ъ3%3 + ЬпХп.

Для того чтобы положительные значения коэффициентов соответствовали вероятности, близкой к 1, а отрицательные -вероятности, близкой к 0, необходимо применить к результату линейной регрессии логистическую функцию, обладающую сужающим свойством:

/ (х) = = ——.

М 1 + 1 + вх

График этой функции показан на рис. 1.

—1 —0,8 О О 5 0 О

о

—0,6

.1 (

0,4

0,2

.....if'

о......о о 0 -0

Рис. 1. Графическое отображение логистической функции

После нахождения линейных коэффициентов можно перейти к вычислению вероятности принадлежности объекта к определенному классу:

У1 = /(Х;Ь) + £; ,

рЬ0 + ь1х1 + Ь2х2 + Ъ3х3 + Ь„х„

Р( У) = ■

1 + e

bo + bixi + b2x2 + b3x3 + bnxn

0

2

4

6

8

где Х1, Х2, ..., Xn - входные признаки.

1

f (x) = Р(У) = _(fc0 + biXi + b2X2 + b3x3 + bnxn) '

где p 6 [0; 1].

Решим задачу классификации с двумя значениями: у = 0 и у = 1, где у - класс объекта. При условии положительности и увеличения входящего значения результат функции стремится к 1, а при условии отрицательности и увеличения входящего значения результат стремится к 0.

В нашем случае при обучении на определенном наборе признаков и при введении одномерного массива параметров X = {х1, Х2, Xn} аналитик интернет-издания с определенной вероятностью Р(х) сможет говорить о возможности покупки клиентом полугодовой подписки на журнал. Следует отметить, что на практике устойчивость к ошибкам у логистической регрессии выше, чем у линейной.

Модели с использованием логистической регрессии могут применяться для предсказания состояния системы при наличии двоичного исхода вариантов. Например, оценка возможности коммерческого предложения товара клиенту (предлагать/не предлагать), а также оценка вероятности перехода клиента на платную подписку на сервис в соответствии с оценкой его поведения на сайте или иных количественных характеристик (купит платную подписку/не купит платную подписку) для оптимизации использования бюджета на маркетинг (система «ЯндексДи-рект», социальные сети «ВКонтакте», Google.AdWords, Amazon, Facebook, Spotify, Netflix, Linkedln и др.).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Модель может также использоваться для выявления мошеннических транзакций по карте. В случае если результат алгоритма ниже 0,5, операция является законной, а если выше 0,5, то имеют место подозрения на совершение финансовой махинации (подобные скоринговые модели используют такие крупные компании, как ПАО «Сбербанк», АО «Тинькофф Банк», АО «Альфа-Банк» и др.).

Аналогичным образом может проводиться проверка на уязвимость программного обеспечения к кибератакам, а также на безопасность целостной информационной инфраструктуры организации. Подобные услуги предоставляет ряд малых предприятий как в США (Balbix, Silverfort, SparkCognition и т. д.), так и в России (ООО «Гарда Технологии»).

Метод опорных векторов

Эту же задачу можно было бы отразить и с помощью другого алгоритма, который называется методом опорных векторов (от англ. Support Vector Machine - SVM). Данная модель является видоизмененным методом оптимальной разделяющей гиперплоскости, разработанной во второй половине XX в. коллективом советских математиков под руководством В. Н. Вапника. Основная задача алгоритма заключается в поиске такой гиперплоскости (прямой, кривой, многообразия), которая наилучшим образом разделяет классы Y 6 {-1; 1}, так называемая разделяющая классификация (Discriminative Classification) [11. -С. 459]. Алгоритм учитывает помеченную обучаемую выборку данных и классифицирует эти данные путем отображения оптимальной гиперплоскости [26. - Р. 146]. Стоит также отметить, что метод опорных векторов является как классификационным, так и регрессионным инструментом прогнозирования, который используется для максимизации точности прогноза при автоматическом устранении избыточности данных [22. - Р. 153].

Мы охарактеризуем бинарную классификацию, при гипотетическом использовании которой руководство коммерческой организации смогло бы узнать, к какому из двух классов (купит/не купит) будет относиться клиент, посещающий их сайт. Отметим, что довольно часто в практике используются и многоклассовые классификации:

g(x) = ь7х + юо.

Нахождение данной прямой является оптимизационной задачей, результатом

которой будут необходимые коэффициенты:

f (x) = sign( Е?=1 )K(x( >, x) + ô> 0,

где ai > 0, K(x(i>, x).

Максимизация расстояния между классами опосредует более точную классификацию. Оптимальное положение разделяющей гиперплоскости зависит от небольшой доли обучающих объектов, которые лежат ближе всего к гиперплоскости и являются опорными векторами (рис. 2). Опорными векторами выступают признаки, чье

1

расстояние до гиперплоскости равно й—¡7.

c

л1 )

• • > л • >* » •

• - Ai W • 1 • *

< 1 • 1 * t *

-1.0 -0.5

00

05

1(1

15

го

2.5

id

3.5

Рис. 2. Графическое отображение разделяющей гиперплоскости

Существует ситуация, при которой гиперплоскость может не существовать. Подобная проблема решается с помощью повышения размерности либо при использовании ядерной функции (Kernel Trick), которая вычисляет скалярные произведения большей размерности и использует их результаты для поиска гиперплоскости. Возможно также, что существует более одной идеальной гиперплоскости. В этом случае ситуация определяется тем, что оптимальной признается линия, которая максимизирует отступ от наиближайших точек классов. На практике приходится иметь дело с линейно разделимыми и линейно

неразделимыми классами, хотя последние встречаются намного чаще.

Руководитель лаборатории по искусственному интеллекту Стэнфордского университета Э. Ын в лекциях своего курса отмечал, что подавляющее большинство исследователей МО воспринимали SVM как намного более эффективный алгоритм обучения, чем нейронные сети.

Метод опорных векторов при выполнении не занимает много места в оперативной памяти компьютера (оставаясь при этом эффективным при работе с большим количеством признаков), а также довольно быстро предсказывает значения входных объектов. При увеличении количества обучающих выборок вычислительные затраты значительно увеличиваются. При реализации данной модели существует вероятность возникновения ситуации «черного ящика» (Black Box Problem), при которой инженеры системы не могут понять, по какому принципу та или иная классификация была сделана алгоритмом. Метод опорных векторов очень часто используют для работы с медиафайлами: классификациями фотографий, рисунков, рукописного текста (ABBYY FineReader, VisionLabs, Google Lens, PPT Vision и др.). Среди малых предприятий в Российской Федерации ансамбль решений, основанный на классификации, используют ООО «Нтех Лаб» (создали технологию распознавания лиц FindFace), ООО «Вижнлабс», ООО «Системы компьютерного зрения» и т. д.

Заключение

В результате проведения внутриоргани-зационных мероприятий по снижению уровня неосведомленности в области машинного обучения по ключевым базовым алгоритмам сотрудники малых предприятий сумеют не только выделить новые ключевые показатели эффективности, но и в конечном итоге при успешной импле-ментации системной инфраструктуры ИИ будут иметь более высокие шансы повлиять на один из самых важных факторов

развития организации - скорость принятия решений.

Ключевой характеристикой внедрения ИИ в экосистему малого предприятия является изначальное понимание выгод подобных действий. Данные умозаключения невозможно сформировать без обзорного понимания концептуальных свойств технологического и экономического содержания.

Целью данной статьи было именно обзорное отражение используемых на сегодняшний день базовых методов машинного обучения, которые могут быть применены и имплементированы в бизнес-процессы малого предприятия. Нами не рассматривалось все множество имеющихся подходов и алгоритмов, таких как, например, графические модели (внимание концентрировалось на обучении с учителем), по причине обозначенной проблематики и ограничений формата научной статьи, однако стоит отметить высокий потенциал такой области машинного обучения, как глубинное обучение (Deep Learning), состоящее из композиции нейронных сетей, а также обучения с подкреплением (Reinforcement Learning). Сейчас подобная технология очень активно используется для реализации программ умных городов в различных странах (КНР, США, России).

Нейронные сети в свою очередь обладают своими методами действия, например, методом обратного распространения ошибки (Backpropagation) или методом коррекции с обратной передачей сигнала ошибки [1. - С. 16]. Этот тип моделей ва-

жен для решения задач с нечеткой логикой, где регламентация процедуры является довольно затруднительной (например, распознавание рукописного текста) [14. -С. 217].

Обучение с подкреплением составляет отдельное направление в области машинного обучения. Алгоритм при решении поставленной задачи в данной модели взаимодействует со средой (или соперником). Его поведение определяется ответами (наградой) этой среды на его действия [12. - С. 26]. Задача агента - заработать как можно большую награду [9. - С. 376].

В целом описанные и охарактеризованные выше алгоритмы машинного обучения являются надежными прикладными методами работы с бизнес-данными хозяйствующего предприятия. Так как информация сейчас составляет фундаментальную и количественную основу на любом из уровней бизнес-процессов предприятия, ее использование для увеличения ключевых показателей эффективности является стратегическим фактором успеха и конкурентоспособности организации.

Наряду с непониманием и незнанием руководством и менеджментом коммерческих предприятий не только малого, но и среднего звена прикладного характера алгоритмов искусственного интеллекта и возможностей их имплементации во внутренние и внешние процессы организации, существует проблема накопления объема неструктурированных данных хозяйствующего субъекта и невозможности их использования в подобном виде для обучения моделей МО.

Список литературы

1. Барский А. Б. Нейронные сети: распознавание, управление, принятие решений. - М. : Финансы и статистика, 2004.

2. Брукшир Дж. Информатика и вычислительная техника. - 7-е изд. - СПб. : Питер, 2004.

3. Гмах Д., Ролиа Д., Черкасова Л., Кемпер А. Управление вычислительной мощностью и прогнозирование потребностей центров обработки данных // Информационная бе-

зопасность. - 2008. - № 2 (112). - URL: https://www.bytemag.ru/articles/detail.php?ID= 11622

4. Грас Дж. Data Science. Наука о данных с нуля : пер. с англ. - СПб. : БХВ-Петербург,

2017.

5. Гудфеллоу Я., Бенджио И., Курвилль А. Глубокое обучение / пер. с англ. А. А. Слинки-на. - 2-е изд., испр. - М. : ДМК Пресс, 2018.

6. Дэви С., Мейсман А., Мохамед А. Основы Data Science и Big Data. Python и наука о данных. - СПб. : Питер, 2017.

7. Козлов А, Котов К., Седов С. 3 примера применения машинного обучения для бизнеса, чтобы использовать бизнес-процессы. - URL: https://www.gd.ru/articles/9073-mashinnoe-obuchenie (дата обращения: 01.11.2019).

8. Николенко С. И., Тулупьев А. Л. Самообучающиеся системы. - М. : МЦНМО, 2009.

9. Николенко С., Кадурин А., Архангельская Е. Глубокое обучение. - СПб. : Питер, 2018.

10. Орешков В. И., Васильев Е. П. Совершенствование процесса принятия управленческих решений в экономике и бизнесе на основе применения интеллектуального анализа данных / / Фундаментальные исследования. - 2012. - № 9-4. - С. 965-971. - URL: http:// www.fundamental-research.ru/ru/article/ view?id=30432 (дата обращения: 20.03.2019).

11. Плас В. Дж. Python для сложных задач: наука о данных и машинное обучение. -СПб. : Питер, 2018.

12. Саттон Р. С., Барто Э. Г. Обучение с подкреплением : пер. с англ. - М. : Бином, 2011.

13. Сегаран Т. Программируем коллективный разум : пер. с англ. - СПб. : Символ-Плюс, 2008.

14. Тарик Р. Создаем нейронную сеть : пер. с англ. - СПб. : ООО «Альфа-книга», 2017.

15. Траск Э. Грокаем глубокое обучение. - СПб. : Питер, 2019. - (Серия «Библиотека программиста»).

16. Amunategui M, Roopaei M. Monetizing Machine Learning: Quickly Turn Python ML Ideas into Web Applications on the Serverless Cloud. - New York : Apress, 2018.

17. Bishop C. M. Pattern Recognition and Machine Learning. - New York : Springer Science + Business Media, LLC, 2006. - URL: https://pdfs.semanticscholar.org/8f8f/9222d66a 30f1f4026dc1035ef10f9ccd079d.pdf (дата обращения: 06.11.2018).

18. Bonaccorso G. Machine Learning Algorithms: Popular Algorithms for Data Science and Machine Learning. - 2nd edition. - Birmingham, UK : Published by Packt Publishing Ltd.,

2018.

19. Dangeti P. Statistics for Machine Learning. - Birmingham, UK : Published by Packt Publishing Ltd., 2017.

20. Fox C. Data Science for Transport : Springer Textbooks in Earth Sciences, Geography and Environment. - Springer, 2018.

21. Kevin P. Murphy Machine Learning A Probabilistic Perspective. - Cambridge : The MIT Press Cambridge, 2012.

22. Lakshmi P. Y. Big Data Analytics Made Easy. - Chennai, India : Notion Press, 2016.

23. Leaders look to embrace AI, and high-growth companies are seeing the benefits. - URL: https://news.microsoft.com/ europe/features/leaders-look-to-embrace-ai-and-high-growth-companies-are-seeing-the-benefits/ (дата обращения: 10.03.2019).

24. Liu Y. Python Machine Learning by Example: Implement Machine Learning Algorithms and Techniques to Build Intelligent Systems. - 2nd edition. - Birmingham, UK : Published by Packt Publishing Ltd., 2019.

25. Marr B. Big Data: Using Smart Big Data, Analytics and Metrics to Make Better Decisions and Improve Performance. - United Kingdom, 2015. - URL: https://www.wiley.com/en-us/Big+Data%3A+Using+SMART+Big+Data%2C+Analytics+and+Metrics+To+Make+Better+ Decisions+and+Improve+Performance-p-9781118965832

26. Minichino J., Howse J. Learning Open CV 3 Computer Vision with Python. - 2nd edition. -Birmingham, UK : Published by Packt Pulishing Ltd., 2015.

27. Provost F., Fawcett T. Data Science for Business. - Sebastopol : O'Reilly Media, Inc., 2013.

28. Raman A., Hyong Tok W. A Developer's Guide to Building AI Aplications. - Sebastopol : O'Reilly Media, Inc., 2018.

29. Rosing M., Scheer A., Scheel H. The Complete Business Process Handbook: Body of Knowledge from Process Modeling to BPM. - Vol. 1. - Elsevier Inc., 2015.

30. Yawen L., Yang L., Yang B., Wang N., Wu T. Application of Interpretable Machine Learning Models for the Intelligent Decision / / Neurocomputing. - 2019. - Vol. 333. - P. 273-283.

31. Zhang J., Zhan Z., Lin Y., Chen N., Gong Y., Zhong J. Evolutionary Computation Meets Machine Learning: A Survey / / Ieee Computational Intelligence Magazine. - 2011. -November. - URL: http://www.dblab.ntua.gr/~gtsat/collection/Machine%20Learning/ 06052374.pdf (дата обращения: 03.10.2018).

References

1. Barskiy A. B. Neyronnye seti: raspoznavanie, upravlenie, prinyatie resheniy [Neural Networks: Recognition, Management, Decision Making]. Moscow, Finance and Statistics, 2004. (In Russ.).

2. Brookshire J. Informatika i vychislitelnaya tekhnika [Computer Science and Computer Engineering]. 7th edition. Saint Petersburg, Piter, 2004. (In Russ.).

3. Gmakh D., Rolia D., Cherkasova L., Kemper A. Upravlenie vychislitelnoy moshchnostyu i prognozirovanie potrebnostey tsentrov obrabotki dannykh [Management of Computing Power and Forecasting the Needs of Data Centers]. Informatsionnaya bezopasnost [Information Security], 2008, No. 2 (112). (In Russ.). Available at: https://www.bytemag.ru/articles/ detail.php?ID= 11622

4. Grasse J. Data Science. Nauka o dannykh s nulya [Data Science. The Science of Data from Scratch], translated from English. Saint Petersburg, BKHV-Peterburg, 2017. (In Russ.).

5. Goodfellow Ya., Bengio I., Courville A. Glubokoe obuchenie [Deep Learning], translated from English by A. A. Slinkin. 2nd edition, corrected. Moscow, DMK Press, 2018. (In Russ.).

6. Devi S., Meysman A., Mokhamed A. Osnovy Data Science i Big Data. Python i nauka o dannykh [Fundamentals of Data Science and Big Data. Python and Data Science]. Saint Petersburg, Piter, 2017. (In Russ.).

7. Kozlov A., Kotov K., Sedov S. 3 primera primeneniya mashinnogo obucheniya dlya biznesa, chtoby ispolzovat biznes-protsessy [3 Examples of Using Machine Learning for Business to Leverage Business Processes]. (In Russ.). Available at: https://www.gd.ru/ articles/9073-mashinnoe-obuchenie (accessed 01.11.2019).

8. Nikolenko S. I., Tulupev A. L. Samoobuchayushchiesya sistemy [Self-Learning Systems]. Moscow, MTSNMO, 2009. (In Russ.).

9. Nikolenko S., Kadurin A., Arkhangelskaya E. Glubokoe obuchenie [Deep Learning]. Saint Petersburg, Piter, 2018. (In Russ.).

10. Oreshkov V. I., Vasilev E. P. Sovershenstvovanie protsessa prinyatiya upravlencheskikh resheniy v ekonomike i biznese na osnove primeneniya intellektualnogo analiza dannykh [Improvement of the Process of Making Administrative Decisions in Economics and Business on the Basis of Application of Intellectual Data Analysis]. Fundamentalnye issledovaniya [Fundamental Research], 2012, No. 9-4, pp. 965-971. (In Russ.). Available at: http:// www.fundamental-research.ru/ru/article/ view?id=30432 (accessed 20.03.2019).

11. Plus V. Dzh. Python dlya slozhnykh zadach: nauka o dannykh i mashinnoe obuchenie [Vander Python for Complex Tasks: Data Science and Machine Learning]. Saint Petersburg, Piter, 2018. (In Russ.).

12. Sutton R. S., Barto E. G. Obuchenie s podkrepleniem [Training with Reinforcement], translated from English. Moscow, Binom, 2011. (In Russ.).

13. Segaran T. Programmiruem kollektivnyy razum [Programming a Collective Mind], translated from English. Saint Petersburg, Simvol-Plyus, 2008. (In Russ.).

14. Tarik R. Sozdaem neyronnuyu set [Create a Neural Network], translated from English. Saint Petersburg, OOO «Alfa-kniga», 2017. (In Russ.).

15. Trask E. Grokaem glubokoe obuchenie [Grokay Deep Learning]. Saint Petersburg, Piter, 2019. (Seriya «Biblioteka programmista»). (In Russ.).

16. Amunategui M., Roopaei M. Monetizing Machine Learning: Quickly Turn Python ML Ideas into Web Applications on the Serverless Cloud. New York, Apress, 2018.

17. Bishop C. M. Pattern Recognition and Machine Learning. New York, Springer Science + Business Media, LLC, 2006. Available at: https://pdfs.semanticscholar.org/8f8f/9222d66a 30f1f4026dc1035ef10f9ccd079d.pdf (accessed 06.11.2018).

18. Bonaccorso G. Machine Learning Algorithms: Popular Algorithms for Data Science and Machine Learning. 2nd edition. Birmingham, UK, Published by Packt Publishing Ltd., 2018.

19. Dangeti P. Statistics for Machine Learning. Birmingham, UK, Published by Packt Publishing Ltd., 2017.

20. Fox C. Data Science for Transport. Springer Textbooks in Earth Sciences, Geography and Environment. Springer, 2018.

21. Kevin P. Murphy Machine Learning A Probabilistic Perspective. Cambridge, The MIT Press Cambridge, 2012.

22. Lakshmi P. Y. Big Data Analytics Made Easy. Chennai, India, Notion Press, 2016.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

23. Leaders look to embrace AI, and high-growth companies are seeing the benefits. Available at: https://news.microsoft.com/europe/features/leaders-look-to-embrace-ai-and-high-growth-companies-are-seeing-the-benefits/ (accessed 10.03.2019).

24. Liu Y. Python Machine Learning by Example: Implement Machine Learning Algorithms and Techniques to Build Intelligent Systems. 2nd edition. Birmingham, UK, Published by Packt Publishing Ltd., 2019.

25. Marr B. Big Data: Using Smart Big Data, Analytics and Metrics to Make Better Decisions and Improve Performance. United Kingdom, 2015. Available at: https://www.wiley.com/en-us/Big+Data%3A+Using+SMART+Big+Data%2C+Analytics+and+Metrics+To+Make+Better+ Decisions+and+Improve+Performance-p-9781118965832

26. Minichino J., Howse J. Learning Open CV 3 Computer Vision with Python. 2nd edition. Birmingham, UK, Published by Packt Pulishing Ltd., 2015.

27. Provost F., Fawcett T. Data Science for Business. Sebastopol, O'Reilly Media, Inc., 2013.

28. Raman A., Hyong Tok W. A Developer's Guide to Building AI Aplications. Sebastopol, O'Reilly Media, Inc., 2018.

29. Rosing M., Scheer A., Scheel H. The Complete Business Process Handbook: Body of Knowledge from Process Modeling to BPM. Vol. 1. Elsevier Inc., 2015.

30. Yawen L., Yang L., Yang B., Wang N., Wu T. Application of Interpretable Machine Learning Models for the Intelligent Decision. Neurocomputing, 2019, Vol. 333, pp. 273-283.

31. Zhang J., Zhan Z., Lin Y., Chen N., Gong Y., Zhong J. Evolutionary Computation Meets Machine Learning: A Survey. Iee Computational Intelligence Magazine, 2011, November. Available at: http://www.dblab.ntua.gr/~gtsat/collection/Machine%20Learning/06052374.pdf (accessed 03.10.2018).

Сведения об авторах

Сергей Александрович Тищенко

кандидат физико-математических наук, доцент кафедры экономической информатики МГУ имени М. В. Ломоносова. Адрес: ФГБОУ ВО «Московский государственный университет имени М. В. Ломоносова», 119991, Москва, Ленинские горы, д. 1. E-mail: [email protected]

Михаил Андреевич Шахмурадян

аспирант кафедры экономики инноваций МГУ имени М. В. Ломоносова. Адрес: ФГБОУ ВО «Московский государственный университет имени М. В. Ломоносова», 119991, Москва, Ленинские горы, д. 1. E-mail: [email protected]

Information about the authors

Sergey A. Tishchenko

PhD, Assistant Professor

of the Department for Economic Informatics

of the Lomonosov MSU.

Address: Federal State Educational Institution

of Higher Professional Education Lomonosov

Moscow State University, 1 Leninskie gory,

Moscow, 119991, Russian Federation.

E-mail: [email protected]

Mikhail A. Shakhmuradian

Post-Graduate Student of the Department for Economics of Innovation of the Lomonosov MSU. Address: Federal State Educational Institution of Higher Professional Education Lomonosov Moscow State University, 1 Leninskie gory, Moscow, 119991, Russian Federation. E-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.