Путь машинного обучения: междисциплинарный анализ развития технологий

Семенова Анастасия Алексеевна

УДК: 004.89

DOI: 10.24412/2414-9241-2024-10-98-110

ПУТЬ МАШИННОГО ОБУЧЕНИЯ: МЕЖДИСЦИПЛИНАРНЫЙ АНАЛИЗ РАЗВИТИЯ ТЕХНОЛОГИЙ

Анастасия Алексеевна Семенова

кандидат социологических наук, доцент, независимый исследователь, Санкт-Петербург, Россия; e-mail: [email protected]

Машинное обучение представляет собой динамично развивающуюся область, претерпевшую значительное эволюционное развитие в последние десятилетия. В данной статье проведен междисциплинарный анализ исторического пути развития технологий машинного обучения, охватывающий ключевые этапы с начала 1940-х гг. до настоящего времени. В статье представлены основные этапы развития, включая ранние концептуальные исследования, а также современные достижения. Автором выделены вклады отечественных и зарубежных ученых на протяжении этапов развития машинного обучения, освещены ключевые направления и будущие перспективы развития машинного обучения, включая рост интереса к глубокому обучению, обучению с подкреплением и применению больших данных. В целом статья выделяет ключевые моменты и тренды, помогая читателю лучше понять эволюцию машинного обучения и его важное значение в современном мире. Результаты анализа подчеркивают многогранность и междисциплинарный характер машинного обучения, а также его важное значение для современной науки, технологий и промышленности. Представленный материал привлекает внимание к необходимости разработки эффективных стратегий управления данными и обеспечения безопасности в контексте растущей роли машинного обучения в современном информационном обществе.

Ключевые слова: машинное обучение, искусственный интеллект, глубинное обучение, большие данные, междисциплинарность.

Машинное обучение (machine learning) является одним из наиболее значительных достижений в области искусственного интеллекта (ИИ), которое коренным образом изменило подходы к обработке данных и принятию решений. Данная технология, основанная на создании и обучении алгоритмов для распознавания закономерностей и предсказания результатов, стала неотъемлемой частью многих сфер человеческой деятельности, включая медицину, финансы, образование, транспорт и др. (Шумский, 2019: 340).

История машинного обучения охватывает несколько десятилетий и включает в себя множество этапов и прорывов, от зарождения идеи в середине XX в. до современных достижений в области глубокого обучения и нейронных сетей. Этот путь был сопровожден значительными научными и технологическими прорывами, а также периодами скептицизма и застоя. Развитие машинного обучения неразрывно связано с прогрессом в различных научных дисциплинах, таких как математика, статистика, информатика и нейробиология, а также с технологическими инновациями в области вычислительной техники и хранения данных.

Машинное обучение представляет собой ветвь искусственного интеллекта (ИИ), направленную на разработку алгоритмов и статистических моделей, которые позволяют компьютерам обучаться и принимать решения на основе данных. С момента своего зарождения в середине XX в. технологии машинного обучения прошли длинный путь от простых математических моделей до сложных нейронных сетей, демонстрирующих выдающиеся результаты в разнообразных областях, от обработки естественного языка до автономных систем. Для понимания современного состояния и будущего потенциала машинного обучения важно исследовать его историю с междисциплинарной точки зрения, учитывая вклад различных научных дисциплин, технологических достижений и общественных изменений (Флах, 2023: 401).

Изучение истории технологии машинного обучения с междисциплинарной перспективы имеет несколько важных аспектов, которые подчеркивают актуальность данного исследования:

— Научное понимание и развитие: анализ исторических этапов и ключевых научных открытий в области машинного обучения позволяет лучше понять эволюцию методов и подходов, а также выявить факторы, способствующие научным прорывам.

— Технологические инновации: история машинного обучения тесно связана с развитием вычислительных технологий и инфраструктур. Междисциплинарный анализ позволяет изучить, как изменения в аппаратном обеспечении, алгоритмах и данных влияли на прогресс в области машинного обучения, что важно для прогнозирования будущих технологических трендов.

— Социальное и экономическое влияние: машинное обучение оказывает значительное влияние на различные аспекты современной жизни, включая экономику, медицину, образование и социальные отношения. Понимание исторического контекста позволяет более полно оценить социальные и этические последствия внедрения машинного обучения и способствует формированию политики и стратегий их использования.

— Образование и подготовка специалистов: исторический анализ машинного обучения предоставляет ценные уроки для обучения и подготовки новых поколений специалистов в области ИИ. Знание исторических контекстов помогает исследователям лучше понять принципы работы алгоритмов, а также осознать важность междисциплинарного подхода в решении сложных задач (Вата-манюк, Левоневский, Малов, 2019: 176).

Таким образом, изучение истории технологии машинного обучения с междисциплинарной точки зрения представляет собой важную и актуальную задачу, способствующую не только научному и технологическому прогрессу, но и более глубокому пониманию роли машинного обучения в современном обществе.

Далее рассмотрим основные этапы развития машинного обучения.

Ранние этапы (1940-1950-е гг.).

На ранних этапах развития машинного обучения идеи и концепции, лежащие в основе этой области, только начали формироваться, прежде всего благодаря работам ученых, таких как Уоррен Маккалок и Уолтер Питтс (McCulloch Warren S., Pitts Walter H., 1943: 115-133).

Одним из первых концептуальных вкладов стал перцептрон, предложенный Фрэнком Розенблаттом в 1957 г. Перцептрон представлял собой простую модель искусственного нейрона и использовался для задач классификации. Его разработка была вдохновлена работами Уоррена Маккалока и Уолтера Питтса, которые в 1943 г. предложили математическую модель нейронных сетей, описывающую нейроны как простые бинарные вычислительные устройства. В отличие от нейронной сети Маккалока — Питтса, перцептрон был основан на идеях обратного распространения ошибки, что позволило ему корректировать свои веса для более точных прогнозов. Их модель стала первым шагом к созданию компьютерных систем, способных имитировать работу человеческого мозга (Rosenblatt, 1962: 626).

Следовательно, разработка перцептрона стала первым шагом к практическому применению искусственных нейронных сетей в задачах классификации и распознавания образов. Однако ограничения простоты этой модели (невозможность решения задач, нелинейно разделяемых в пространстве признаков) привели к временному затишью в развитии машинного обучения в конце 1950-х и начале 1960-х гг. Несмотря на это, идеи и концепции, заложенные в этих ранних работах, оказали огромное влияние на будущее развитие рассматриваемой нами области и являются основой для многих современных методов и алгоритмов машинного обучения.

В этот период российские ученые также внесли свой вклад в развитие теории нейронных сетей, хотя значительная часть ранних исследований была сосредоточена в основном за пределами страны. Например, Александр Ляпунов, вместе с Владимиром Леонтьевым, в 1941 г. разработали первый искусственный нейрон, который использовался для обработки информации в аналоговых компьютерах (Lyapunov, Leontiev, 1941: 270).

Период энтузиазма и первых алгоритмов (1960-1970-е гг.).

В 1960-х и 1970-х гг. ученые продолжили исследовать возможности алгоритмов, основанных на нейронных сетях и других подходах. В этот период были предложены такие алгоритмы, как метод ^средних (k-means) для кластеризации и линейная регрессия для предсказания. Алгоритм разбивает набор данных на k кластеров, где каждый объект данных принадлежит к кластеру с ближайшим центром. Это был один из первых алгоритмов машинного обучения, который нашел широкое применение в анализе данных и многих областях, требующих группировки данных.

Линейная регрессия также стала широко используемым методом для предсказания значений на основе линейной зависимости между входными и выходными переменными. Метод был применен в различных областях, включая экономику, медицину и социологию, и оказался очень эффективным для анализа и предсказания временных рядов и других типов данных.

В 1967 г. была предложена идея использования деревьев принятия решений для задачи классификации. Деревья принятия решений представляют собой графическую модель принятия решений, которая использует структуру ветвлений для принятия последовательных решений о классификации объектов данных. Метод стал широко применяться в медицинских диагностических системах, системах поддержки принятия решений и других областях, требующих классификации объектов.

Также отметим, что А. Я. Колмогоров, российский математик, внес вклад в развитие теории вероятностей и математической статистики, что сыграло важную роль в развитии методов классификации и регрессии.

Следовательно, период 1960-х и 1970-х гг. характеризовался интенсивным исследованием и экспериментированием с различными методами и алгоритмами машинного обучения. Многие из рассматриваемых методов оказались фундаментальными для современной практики машинного обучения и продолжают активно использоваться в научных и прикладных исследованиях.

В период энтузиазма и первых алгоритмов машинного обучения ученые продолжили исследования в области алгоритмов, основанных на искусственных нейронных сетях и других подходах. Данный период был отмечен значительным расширением и углублением понимания теоретических основ машинного обучения и разработкой новых методов и алгоритмов (Trevor, Tibshirani, Friedman, 2009: 558).

Застой и критика (1970-1980-е гг.).

Несмотря на первоначальный энтузиазм, к 1970-м гг. многие исследования в области нейронных сетей столкнулись с трудностями. В 1969 г. Марвин Минский и Сеймур Пейперт опубликовали книгу «Perceptrons», в которой были выявлены ограничения однослойных перцептронов. Это привело к периоду застоя, известному как «зима искусственного интеллекта», когда финансирование и интерес к нейронным сетям значительно сократились (Marvin, Papert, 1969: 316).

Период с середины 1970-х по конец 1980-х гг. был отмечен застоем и критикой в области исследований нейронных сетей и машинного обучения в целом. Несмотря на ранний энтузиазм и перспективы, возникли трудности, которые привели к значительному снижению интереса к этой области, а иногда и к откровенной критике. Однако ученые продолжили работать в области

машинного обучения и нейронных сетей. Именно благодаря их упорному труду и научным достижениям удалось преодолеть затишье и вернуть интерес к исследованиям в области искусственного интеллекта и машинного обучения в конце 1980-х и начале 1990-х гг.

Возрождение интереса и новые подходы (1980-1990-е гг.).

В 1980-х гг. произошло возрождение интереса к машинному обучению благодаря разработке новых методов и улучшению вычислительных мощностей. В 1986 г. Дэвид Румельхарт, Джеффри Хинтон и Рональд Уильямс представили алгоритм обратного распространения ошибки (back propagation), который значительно улучшил обучение многослойных нейронных сетей и корректировал веса связей между нейронами на основе разницы между фактическим и ожидаемым выходами сети. Обратное распространение ошибки стало основой для развития глубокого обучения и позволило преодолеть ограничения, связанные с однослойными перцептронами, которые были показаны в книге «Perceptrons» Марвина Минского и Сеймура Пейперта. Этот метод стал ключевым для развития глубокого обучения в последующие десятилетия (Минский, Марвин, Пейперт, 1971: 261).

Помимо алгоритма обратного распространения ошибки, в 1980-е и 1990-е гг. было разработано множество других методов машинного обучения, таких как метод опорных векторов (Support Vector Machines), алгоритмы кластеризации, решающие деревья и байесовские методы классификации. Данные методы стали широко используемыми в различных областях, включая обработку изображений, обработку естественного языка, биоинформатику и финансовую аналитику.

Улучшение вычислительных мощностей, развитие компьютерных технологий и доступность больших объемов данных также существенно способствовали развитию машинного обучения в этот период. Возможность быстро обрабатывать большие

массивы данных позволила исследователям проводить более сложные и точные анализы, что ускорило развитие и применение методов машинного обучения в реальном мире.

Отечественные ученые продолжили вносить свой вклад в развитие новых методов и подходов в машинном обучении. Так, вклад Владимира Вапника в разработку метода опорных векторов (SVM) в 1990-х гг. имел огромное значение для развития методов классификации и регрессии.

В целом период с 1980-х по 1990-е гг. ознаменовался ростом интереса к машинному обучению, интенсивным развитием новых методов и алгоритмов, а также расширением областей их применения. Этот период стал отправной точкой для развития современных технологий машинного обучения и искусственного интеллекта (Vapnik, 1995: 314).

Период больших данных и мощных вычислений (2000-2010-е гг.).

С начала 2000-х гг. развитие интернета и рост объемов данных привели к появлению новых подходов в машинном обучении. Становится популярным использование больших данных (big data) и мощных вычислительных ресурсов для обучения сложных моделей. Алгоритмы, такие как случайные леса (random forests) и поддерживающие векторные машины (SVM), получили широкое распространение. Глубокое обучение (deep learning) стало ключевым направлением в машинном обучении, оно основано на многослойных нейронных сетях и позволяет автоматически извлекать сложные иерархические признаки из данных. Глубокое обучение достигло значительных успехов в обработке изображений, речи и текста, превзойдя результаты традиционных методов во многих задачах распознавания образов и классификации (Лекун, 2021: 335).

Кроме того, период также характеризовался значительным ростом вычислительных мощностей и доступности высокопроизводительных вычислительных ресурсов, таких как графические

процессоры (GPU) и облачные вычисления, что позволило исследователям обрабатывать и анализировать огромные массивы данных и обучать сложные модели машинного обучения в значительно более короткие сроки.

В целом период с начала 2000-х по 2010-е гг. стал временем значительного прогресса в области машинного обучения, отмеченного широким применением методов обработки больших данных, развитием глубокого обучения и улучшением вычислительных ресурсов. Период можно рассматривать как отправную точку для создания множества новых технологий и приложений, которые существенно изменили многие аспекты нашей жизни.

Современные достижения и будущее (2010-е — настоящее

время).

С начала 2010-х гг. глубокое обучение стало доминирующим подходом в машинном обучении благодаря достижениям в архитектурах нейронных сетей, таких как сверточные нейронные сети (CNN) и рекуррентные нейронные сети (RNN). Эти сети способны эффективно работать с данными, имеющими пространственную структуру, такими как изображения, благодаря использованию сверточных слоев для извлечения локальных признаков и слоев субдискретизации для уменьшения размерности данных. Сверточные нейронные сети стали стандартом в распознавании образов, обработке изображений, медицинской диагностике и автоматизации промышленных процессов.

Еще одним важным достижением стали рекуррентные нейронные сети (RNN), которые предназначены для работы с последовательными данными, такими как текст и звук. RNN обладают памятью и способны учитывать контекст предыдущих входных данных при обработке последующих, что сделало их эффективными в задачах машинного перевода, анализа текста, генерации текста и других приложениях, связанных с последовательными данными (Ian, Bengio, Courville, 2016: 808).

Появление платформ для разработки и применения искусственного интеллекта, таких как TensorFlow (Google), и PyTorch, разработанная компанией Google, и PyTorch, разработанная Facebook8, существенно ускорило внедрение методов машинного обучения в промышленность и науку.

С начала 2010-х гг. машинное обучение продолжает развиваться с большой скоростью, и в настоящее время мы видим появление таких направлений, как обучение с подкреплением, генеративные модели и автоэнкодеры, открывающих новые возможности для решения сложных задач в различных областях.

В настоящее время в России функционирует ряд крупных компаний и стартапов, которые активно занимаются разработкой и применением методов машинного обучения. Например, «Яндекс» использует методы машинного обучения в своих поисковых системах, картографических сервисах, голосовом помощнике «Алиса», рекомендательных системах и многих других продуктах и услугах; «Сбербанк» использует машинное обучение для кредитного скоринга, анализа данных клиентов, обработки естественного языка и др.; «Газпром нефть» применяет машинное обучение для оптимизации процессов добычи нефти, прогнозирования цен на нефтепродукты, управления инфраструктурой; «Mail.ru Group» применяет методы машинного обучения в своих продуктах и сервисах, таких как почта, социальные сети, игровая платформа и др.; «Лаборатория Касперского» использует машинное обучение для борьбы с киберугрозами и анализа потенциально вредоносного программного обеспечения; МТС применяет методы машинного обучения для анализа данных о потребителях, оптимизации сетей связи и других задач.

Мы обозначили лишь несколько примеров крупных организаций, которые успешно развивают методы машинного обучения и интегрируют их в свои продукты и услуги. Однако и другие

Является продуктом организации Meta, деятельность которой запрещена на территории Российской Федерации.

компании, стартапы, университеты и исследовательские лаборатории вносят значительный вклад в развитие данной области.

Считаем, что в настоящее время процессы машинного обучения сталкиваются с определенными вызовами и проблемами:

во-первых, обеспечение защиты данных и приватности (с ростом объемов данных и распространением ИИ становится все важнее обеспечить защиту данных и приватность пользователей);

во-вторых, обучение на нерепрезентативных данных (многие модели машинного обучения подвержены проблеме смещения данных, когда обучающие данные не представляют всего разнообразия реального мира);

в-третьих, этические и социальные вопросы (применение машинного обучения может вызывать этические и социальные проблемы, например дискриминацию и трудности с прозрачностью решений при автоматизированных системах принятия решений в сфере правосудия или здравоохранения и пр.) и др.

Если говорить об ожиданиях от машинного обучения, то, на наш взгляд, следует обозначить следующие аспекты:

— более широкое применение в различных отраслях (машинное обучение продолжает интегрироваться в различные сферы деятельности, включая здравоохранение, транспорт, финансы, сельское хозяйство и др., что создает новые возможности для инноваций и автоматизации);

— развитие автономных систем, способных адаптироваться к окружающей среде и принимать решения в реальном времени без вмешательства человека, что приведет к улучшению эффективности и безопасности;

— улучшение точности и надежности моделей;

— интеграция с другими технологиями (машинное обучение будет все более интегрироваться с другими технологиями, такими как интернет вещей (IoT), блокчейн и квантовые вычисления, что приведет к появлению новых возможностей и решений).

Таким образом, история машинного обучения полна взлетов и падений, но каждое новое открытие и технологический прорыв приближали нас к современному состоянию области. Сегодня машинное обучение является неотъемлемой частью множества приложений — от медицинской диагностики до автономных автомобилей. В будущем нас ожидают новые вызовы и возможности, связанные с дальнейшим развитием алгоритмов и интеграцией машинного обучения в различные сферы жизни.

Список литературы

Лекун Я. Как учится машина: революция в области нейронных сетей и глубокого обучения. М.: Альпина ПРО, 2021. 335 с.

Минский М., Пейперт С. Перцептроны: введение в вычислительную геометрию / Пер. с англ. М. И. Ивонина. М.: Мир, 1971. 261 с.

Модели и способы взаимодействия пользователя с киберфизическим интеллектуальным пространством / И. В. Ватаманюк, Д. К. Левоневский, Д. А. Малов [и др.]. СПб.: Лань, 2019. 176 с.

Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных. М.: ДМК Пресс, 2023. 401 с.

Шумский С. А. Машинный интеллект. Очерки по теории машинного обучения и искусственного интеллекта. М.: РИОР, 2019. 340 с.

Goodfellow I., Bengio Y., Courville A. Deep Learning. Cambridge: MIT Press, 2016. 808 p.

Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd ed. New York: Springer, 2009. 558 p.

Lyapunov A. A., Leontiev V. E. The Theory of Automatic Regulators. Moscow: USSR Academy of Sciences, 1941. 270 p.

Minsky M., Papert S. Perceptrons: An Introduction to Computational Geometry. Cambridge: MIT Press, 1969. 316 p.

McCulloch W. S., Pitts W. H. A Logical Calculus of Ideas Immanent in Nervous Activity // Bulletin of Mathematical Biophysics. 1943. Vol. 5, no. 4. P. 115-133.

Rosenblatt F. Principles of Neurodynamics: Perceptrons and the Theory of Brain Mechanisms. Washington: Books, 1962. 626 p.

Vapnik V. N. The Nature of Statistical Learning Theory. New York: Springer, 1995. 314 p.

THE JOURNEY OF MACHINE LEARNING: AN INTERDISCIPLINARY ANALYSIS OF TECHNOLOGICAL DEVELOPMENT

Anastasia A. Semenova

PhD in Sociology, Associate Professor, Independent Researcher, St Petersburg, Russia; e-mail: [email protected]

This interdisciplinary article delves into the historical evolution of machine learning technologies, tracing their development from the early 1940s to the present day. Through a comprehensive analysis spanning foundational conceptual research to contemporary breakthroughs, it provides insights into the transformative journey of machine learning. By highlighting the substantial contributions of researchers across these stages, the article illuminates key advancements and milestones that have shaped the field.

Moreover, it discusses key directions and future prospects for machine learning, emphasizing the growing interest in deep learning, reinforcement learning, and the application of big data. These emerging trends signal the ongoing evolution and expanding applications of machine learning across diverse domains, promising novel insights and solutions.

Overall, the analysis underscores the multidimensional and interdisciplinary nature of machine learning, emphasizing its profound impact on contemporary science, technology, and industry. By examining historical developments and future trajectories, the article offers valuable insights into the continuous advancement and significance of machine learning in shaping the modern world, contributing to a deeper understanding of its role and potential applications.

The article explores the implications of machine learning advancements on various sectors such as healthcare, finance, and education, highlighting the transformative potential of these technologies in addressing complex real-world challenges. Furthermore, it discusses the ethical considerations and societal impacts associated with the widespread adoption of machine learning, emphasizing the importance of responsible innovation and equitable access to these technologies.

Additionally, the article examines the role of emerging technologies such as artificial intelligence (AI) and Internet of Things (IoT) in synergizing with machine learning, fostering new avenues for innovation and disruption across industries.

Keywords: machine learning, artificial intelligence, deep learning, big data, interdisciplinarity.

Путь машинного обучения: междисциплинарный анализ развития технологий Текст научной статьи по специальности «Социологические науки»

Аннотация научной статьи по социологическим наукам, автор научной работы — Семенова Анастасия Алексеевна

Похожие темы научных работ по социологическим наукам , автор научной работы — Семенова Анастасия Алексеевна

The Journey of Machine Learning: an Interdisciplinary Analysis of Technological Development

Текст научной работы на тему «Путь машинного обучения: междисциплинарный анализ развития технологий»