УДК 004
Рысбай Н.
магистрант,
Международный университет информационных технологий (г. Алматы, Республика Казахстан)
МАШИННОЕ ОБУЧЕНИЕ В ПЕРЕДОВЫХ ИССЛЕДОВАНИЯХ.
ПРОЦЕССЫ РАЗРАБОТКИ
Аннотация: в статье посвящено обзору методов машинного обучения и оценке их пригодности для задач, связанных с исследованием новых процессов. Использование методов машинного обучения в экономических исследованиях рассматривается в публикациях. Показано, что проблемы, решаемые с помощью методов машинного обучения, обычно можно разделить на классификацию, регрессию, уменьшение размерности, кластеризацию или поиск аномалий. Ключевые методы машинного обучения и возможные приложения для них в задачах исследования творческой деятельности. Определено, что изучение инновационных процессов в различных экономических системах выиграет от добавления методов машинного обучения к традиционным методологиям, чтобы обеспечить более тщательный анализ наблюдаемых явлений.
Ключевые слова: машинное обучение, машинное зрение, компьютерное зрение, оптическое распознавание текста, трансферное обучение, алгоритм, данные.
Введение
В результате многочисленных применений искусственный интеллект с каждым днем занимает все больше места в основной экономике. Методы машинного обучения, которые являются важнейшим компонентом технологий искусственного интеллекта, позволяют пользователям справляться с проблемами в изменяющейся среде, обучаясь с течением времени, а также используя уже существующие алгоритмы для анализа, прогнозирования и принятия решений. параметры. Принцип машинного обучения заключается в
выявлении закономерностей и принятии решений, оказывающих наименьшее негативное влияние на людей. Машинное обучение и передовые технологии искусственного интеллекта в настоящее время являются незаменимыми инструментами для решения управленческих задач во многих отраслях народного хозяйства [1]. Мы считаем, что управление инновационными процессами на разных уровнях иерархии является смежной задачей.
Управление инновациями требует использования соответствующих инструментов для решения проблем по мере появления новых технологических возможностей. Методы машинного обучения используются в дополнение к традиционным методам анализа, прогнозирования и принятия решений из дополнительных инструментов решения, называемых задачами [7]. Поэтому цель данного исследования — дать обзор фундаментальных методов машинного обучения, которые используются в настоящее время и которые могут быть использованы для решения задач исследования творческой активности различных социально-экономических иерархий. Широкий спектр доступных в настоящее время программных решений не позволяет рассмотреть их все из-за быстрого развития науки о данных и машинного обучения. В этом разделе разработка нейронных сетей будет рассмотрена только с использованием самых известных библиотек и фреймворков машинного обучения. В настоящее время самым популярным языком программирования для построения нейронных сетей является Python [1].
Исследования в области машинного обучения начались с искусственного интеллекта. На заре искусственного интеллекта как научной области исследователи были очень заинтересованы в том, чтобы научить машины учиться на данных. В результате они попытались подойти к проблеме, используя различные символические подходы и методы, которые в то время назывались нейронными сетями; однако в большинстве случаев это были только модели, которые, как позже выяснилось, были переупакованными вариациями общих линейных моделей вероятности и статистики. Из-за сосредоточения внимания на
логических и основанных на знаниях подходах существует разрыв между искусственным интеллектом и машинным обучением. На вероятностные системы повлияли теоретические и практические проблемы сбора и отображения данных. [1] К 1980 году экспертные системы вытеснили статистику в качестве доминирующей технологии искусственного интеллекта. Хотя был достигнут прогресс в разработке символических и основанных на знаниях систем, которые привели к индуктивному логическому программированию, область статистических исследований, особенно та, которая сосредоточена на распознавании образов и поиске данных, теперь находится за пределами компетенции ИИ. Машинное обучение стало отдельной областью и начало расширяться в 1990-х годах. Текущее направление пытается создать ИИ, пытаясь решить реальные, измеримые проблемы. После этого, вместо применения символической методологии, унаследованной от искусственного интеллекта, область начала концентрироваться на методах и моделях, основанных на вероятности и статистике. [2]
Приступая к разработке автоматизированной информационной системы или алгоритма с использованием технологии машинного зрения, крайне важно иметь представление об инструментах и решениях, которые необходимо использовать для обеспечения оптимальной функциональности готового программного продукта. На примере разработки автоматизированной информационной системы распознавания номерных знаков движущихся автомобилей рассмотрим некоторые процедуры, необходимые при разработке программного обеспечения. Процесс идентификации элементов на изображении осуществляется компьютерным зрением, также известным как машинное зрение. Принятие решений о соответствующем образе действий необходимо после изучения соответствующей теоретической литературы. Алгоритмы компьютерного зрения можно разделить на две категории: - "Традиционные" методы компьютерного зрения - Алгоритмы машинного обучения.
Алгоритмы машинного обучения способны на это и неуклонно движутся в этом направлении, потому что нейронная сеть, архитектурно похожая на человеческий мозг, выдает прогнозы и делает выводы на тех размеченных данных, для которых ранее были четко распознаны объекты интереса. Следует уделить внимание стратегии трансфертного обучения. Трансферное обучение — это ветвь машинного обучения, целью которой является перенос знаний, полученных от одной целевой задачи, к другой. В прошлом, если вы хотели заняться глубоким обучением, вам требовался доступ к огромному чистому набору данных в дополнение к навыкам, необходимым для создания и обучения собственных эффективных моделей. Благодаря описанному выше способу использования нейросетевой технологии для решения задач разработчику не нужно самостоятельно проектировать нейросетевую модель, что является совсем не простой задачей. Применяя этот метод, вы можете время от времени использовать лучшую архитектуру, а также экономить время и деньги. Для успешного переноса обучения требуется модель, обученная на наборе данных, сопоставимом с целевым. Например, при использовании для решения задачи распознавания слов модель, обученная на фотографиях лиц, работает плохо. [6] Поэтому распространены модели, обученные на больших и разнообразных наборах данных. Из-за своей нетривиальной зависимости архитектурная структура нейронной сети способна отмечать объекты, ранее появлявшиеся на других, «чистых» и неотмеченных изображениях. Однако время обучения, количество слоев, количество весовых коэффициентов, математическое обоснование и другие отличительные характеристики алгоритмов на основе нейронных сетей также выделяют их. Чтобы облегчить выбор макета нейронной сети, вы можете использовать веб-инструмент «paperswithcode.com». на этом веб-сайте вы можете найти информацию о ряде важных топологий нейронных сетей, которые часто используются в компьютерных науках. [7]
Существует два типа распознавания в задачах компьютерного зрения, связанных с поиском текста на изображении: распознавание с использованием
метрик и распознавание с использованием нейронных сетей. Из-за недавнего роста популярности классификаторы нейронных сетей теперь все чаще используются в исследованиях распознавания текста. Для точного обнаружения и идентификации текста на картинке с заданной частотой положительных, правильных выводов необходимо найти сплошную обучающую выборку. При решении задач такого рода часто нецелесообразно начинать с нуля, поскольку качество обучающих данных (как по количеству, так и по качеству) будет иметь существенное влияние на точность обнаружения. Будущая работа по распознаванию текста также будет гораздо больше использовать аппаратные ресурсы системы, чем если бы она полагалась на методы распознавания с использованием готовых открытых решений. Тот факт, что они используют меньше системных ресурсов и не требуют никакого специализированного программного обеспечения, кроме языка программирования, который будет использоваться для разработки решения, облегчает их включение в проект, хотя они не менее эффективны. [8]
Следует отметить, что при выполнении алгоритма определения области с положением номерных знаков на изображении метод вернет текстовые данные, отображающие разметку объекта обнаружения. Исследуемое изображение необходимо будет уменьшить в будущем после запуска алгоритма обнаружения, чтобы сэкономить на аппаратных и технических ресурсах. Только те части программы, которые должны давать результаты, такие как оптическое распознавание текста, будут использоваться в последующих разделах программы. К этим данным относятся координаты расположения госномер автомобиля, которые будут использоваться методом оптического распознавания текста. [6]
Заключение
Группы по известному признаку. синтетическая нейронная сеть. Благодаря исследованиям в области теории искусственного интеллекта нейронные сети являются одним из самых популярных и эффективных методов
обработки данных [5]. При изучении закономерностей процессов, недоступных непосредственному наблюдению и не поддающихся эмпирическому исследованию, особое значение имеют нейронные сети [2]. Это особенно верно в отношении социально-экономических процессов, модели которых формируются множеством зависимых переменных. Кроме того, применение аппарата нейросетевого моделирования и прогнозирования оправдано не только на уровне макроэкономических показателей и явлений, но и на уровне конкретных предприятий и хозяйствующих субъектов [3]. В результате аппаратура искусственного нейросетевого моделирования может быть использована для изучения и прогнозирования инновационных процессов и явлений на различных иерархических уровнях народного хозяйства при проведении исследований инновационной деятельности. ^средний подход.
Цель алгоритма — пометить входные данные в соответствии с тем, насколько они похожи. В нынешних реалиях цифровизации общества методы машинного обучения еще не получили широкого распространения для анализа творческой работы. Однако мы думаем, что вскоре будет важно использовать такие технологии для решения этих проблем. Основными причинами этого являются необходимость анализа огромных объемов данных и быстрый рост объема информации. Чтобы исследовать творческую деятельность социально-экономических систем с различной иерархией, эта работа была направлена на обзор основных методов машинного обучения, используемых в настоящее время. Полный спектр алгоритмов машинного обучения не рассматривался в этой статье из-за широты предмета. Крайне важно подчеркнуть огромный потенциал как глубокого обучения (создание нейронных сетей), так и обучения с подкреплением. В настоящее время эти технологии активно эксплуатируются при разработке проектов умного города во многих промышленно развитых и развивающихся странах. Алгоритмы машинного обучения и традиционные подходы обычно являются надежными применимыми инструментами для
исследования уникальных процессов, поскольку оценка важной информации служит краеугольным камнем для получения обоснованных выводов.
СПИСОК ЛИТЕРАТУРЫ:
1. Mullainathan S., Spiess J. Machine learning: an applied econometric approach, Journal of Economic Perspectives, 2017, 87-106 p.
2. Athey S., The impact of machine learning on economics, The Economics of Artificial Intelligence: An Agenda, 2018. University of Chicago Press, 2020.
3. Martin A., TensorFlow: large-scale machine learning on heterogeneous systems, 2019.
4. Machine Learning for Humans [Electronic resource] URL: https://vas3k.ru/blog/machine_learning/
5. Pedregosa F., Scikit-learn: machine learning, Journal of Machine Learning Research, 2011, 2825 p.
6. Flach, P. Machine Learning, DMK Press, 2015. 400 p.
7. Spitsyn V. G. et al. Application of the Haar wavelet transform, the method of principal components and neural networks for optical character recognition in images in the presence of impulse noise, Computer Optics, 2016, 249-257pp.
8. Migran N. Review and comparative analysis of machine learning libraries for machine learning, 2019.
Rysbay N.
Master's student, International University of Information Technologies (Almaty, Republic of Kazakhstan)
MACHINE LEARNING IN ADVANCED RESEARCH. DEVELOPMENT PROCESSES
Abstract: the article is devoted to the review of machine learning methods and assessment of their suitability for tasks related to the study of new processes. The use of machine learning methods in economic research is discussed in publications. It is shown that problems solved using machine learning methods can usually be divided into classification, regression, dimensionality reduction, clustering or anomaly search. Key machine learning methods and possible applications for them in creative activity research tasks. It is determined that the study of innovation processes in various economic systems will benefit from the addition of machine learning methods to traditional methodologies in order to provide a more thorough analysis of the observed phenomena.
Keywords: machine learning, machine vision, computer vision, optical text recognition, transfer learning, algorithm, data.