Научная статья на тему 'Применение машинного обучения для повышения эффективности управления нефтяными скважинами'

Применение машинного обучения для повышения эффективности управления нефтяными скважинами Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
211
48
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАШИННОЕ ОБУЧЕНИЕ / ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / МАШИНА ОПОРНЫХ ВЕКТОРОВ / НЕФТЯНЫЕ СКВАЖИНЫ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Аунг Зеар, Михайлов И. С.

В статье рассматривается применение метода интеллектуального анализа данных машины опорных векторов (SVM) для решения практической задачи оценки эффективности нефтяных скважин. Данный нелинейный метод показывает лучшие результаты анализа чем метод линейной регрессии (LR), также являющейся методом машинного обучения. В работе приведены и проанализированы принципы решения задачи классификации с помощью методов логистической регрессии и машины опорных векторов. В экспериментах рассчитаны и сопоставлены точности этих двух алгоритмов при одинаковых условиях.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Аунг Зеар, Михайлов И. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Применение машинного обучения для повышения эффективности управления нефтяными скважинами»

8. International vocabulary of Metrology - Basic and general concepts and associated terms. Ed. 2, JCGM, 2010. - 82 p.

9. GOST R 54500.3-2011. (Guide ISO/IEC 98-3) The uncertainty of the measurement. Part 3. The guide to the expression of uncertainty in measurement.

10. Galeev A. P., Nazarova G. S. Features terminology in the field of dependability, used in the national

standards currently in force. Fluctuation and degradation processes in semiconductor devices: Materials of international scientific-methodical seminar, Moscow, Moscow scientific-technical society radio electronics and communications named after A. S. Popov, National Research university "MPEI", 2014, p.p. 179-182.

ПРИМЕНЕНИЕ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ УПРАВЛЕНИЯ НЕФТЯНЫМИ СКВАЖИНАМИ

Аунг Зеар,

аспирант кафедры ПМ, Михайлов И. С.,

к.т.н., доцент кафедры ПМ Национальный исследовательский университет «МЭИ»,

г. Москва, Россия,

АННОТАЦИЯ

В статье рассматривается применение метода интеллектуального анализа данных - машины опорных векторов ^УМ) для решения практической задачи оценки эффективности нефтяных скважин. Данный нелинейный метод показывает лучшие результаты анализа чем метод линейной регрессии (LR), также являющейся методом машинного обучения. В работе приведены и проанализированы принципы решения задачи классификации с помощью методов логистической регрессии и машины опорных векторов. В экспериментах рассчитаны и сопоставлены точности этих двух алгоритмов при одинаковых условиях.

Ключевые слова: машинное обучение; интеллектуальный анализ данных; машина опорных векторов; нефтяные скважины.

Введение

Развитие цифровизации параметров работы нефтяных скважин, как источников значений параметров для массового производства, так и методов сбора данных в реальном времени, позволяет обеспечивать оптимизацию процесса добычи нефти [1]. Использование машинного обучения для очистки, интеграции, преобразования данных, разработки приложений и оптимизации анализа данных нефтяных скважин является новым научным подходом к решению задачи анализа работы нефтяных скважин. В настоящее время параметры нефтяных скважин, используемые в алгоритме анализа данных, относительно просты, при условии отсутствия параметров, зависящих от других групп параметров, и стандартных способах вычисления оценки данных [2-3]. В статье предлагается нелинейный алгоритм классификации SVM, построение структуры системы разработки данных и модели распознавания полифилетических параметров с использованием SVM через карту пространства признаков высокой размерности и оптимизированную гиперплоскостную классификацию для решения задачи анализа нелинейных параметров нефтяных сква-

жин и распознавания шаблонов совокупностей значений параметров скважин, отражающих их текущее состояние.

1. Полифилетические параметры модели распознавания образов нефтяных скважин

В процессе добычи нефти центр наблюдения собирает, передает, анализирует и выдает в режиме реального времени данные о давлении, температуре, электрическом напряжении, электрическом токе и нагрузке, а также других первичных параметрах, что помогает администратору понимать условия работы нефтяной скважины и обеспечивать её работу в режиме высокой эффективности и низкого потребления [4-5]. Как правило к данным параметрам также относятся пиковые значения электрического тока и напряжения, напорное давление насоса, противодавление, давление масла и давление в затрубном пространстве скважины. Эти данные передаются в автоматизированную систему управления в режиме реального времени. После выполнения линейной аппроксимации и прогнозирования данных, лицо принимающее решение может оценивать состояние скважины в данный момент и прогнозировать её поведение в будущем, для принятия соответствующих компенсирующих управляющих воздействий.

Рис. 1. Модель распознавания шаблона состояния нефтяной скважины

На рисунке 1 представлен процесс распознавания текущей ситуации на скважине.

2. Нелинейный 8УМ

2.1 Метод ядра

Метод ядра позволяет решить задачу нелинейной классификации с помощью нелинейного преобразования [6]. При условии, что входное пространство является Евклидовым-пространством и признаковое пространство является гильбертовым пространством, метод ядра означает произведение

векторов объектов, полученных в процессе преобразования входных данных из входного пространства в признаковое пространство. С помощью метода ядра можно исследовать нелинейные данные с целью получения нелинейного метода 8УМ. Вся указанная процедура представляет собой работу линейного метода 8УМ в многомерном пространстве признаков.

Метод ядра показан на рисунке 2.

Общая идея заключается в использовании нелинейного преобразования для изменения входного пространства в пространство признаков, которое может преобразовать модель гиперповерхности в

исходном пространстве в гиперплоскость в пространстве признаков. Это означает, что нелинейная задача классификации в исходном пространстве

преобразуется в задачу, которая может быть решена линейным SVM в пространстве признаков.

2.2 8УМ

Общая идея SVM заключается в решении задачи правильной классификации множества данных и максимизации геометрического поля. Может быть несколько разделяющих гиперплоскостей, но существует только одна разделяющая гиперплоскость с максимальным геометрическим отступом. Прямое объяснение максимизации геометрического поля заключается в том, что гиперплоскость с максимальным геометрическим отступом, полученным из классификации, равна классификации обучающих данных по достаточному фактору определенности. Необходимо не только правильно классифицировать, но и разделять ближайшие точки с достаточным коэффициентом достоверности. Этот процесс может предоставить определенные данные с хорошей прогностической способностью, которая называется способностью обобщения.

При решении нелинейной задачи после преобразования в многомерное пространство, как правило, трудно найти гиперплоскость, которая может полностью разделить точки данных, а это значит, что есть некоторые особые точки. Но после удаления этих особых точек большая часть точек становится линейно разделима. Чтобы решить эту проблему, мы импортируем скользящую переменную в обучающую выборку. В ситуации мягких краёв задача обучения SVM будет иметь вид:

i

s.t. yi(wx.+b)>1-^i. (2)

Где С-параметр штрафа. При увеличении С также увеличивается штраф за ошибки классификации. Необходимо отрегулировать целевую функцию, чтобы минимизировать количество особых точек, одновременно максимизируя отступ от гиперплоскости.

3. Алгоритм линейной логистической регрессии

Алгоритм линейной логистической регрессии - это классический метод классификации в исследовании статистики, относящийся к линейной логарифмической модели. Эта модель классификации представляет собой условное распределение вероятностей Р (У / X), которое является моделью суждения. Она может быть получена из модели линейной регрессии hw (х)= ^^ и сигмоидной кривой:

P(Y=1\X) = -

(3)

Где x-вход, у-выход, w-взвешенный коэффициент и wx - внутреннее произведение. Функция распределения логистической регрессии и функция плотности показаны на рисунке 3.

Рис. 3. Функция распределения логистической регрессии и функция плотности

Логистическая регрессия сравнивает разницу между двумя условными вероятностями и относит обучающий пример x в большую вероятностную группу. Для обучающего набора данных можно использовать функцию максимального правдоподобия для оценки параметров модели для получения логистической модели. Вводятся следующие предположения.

Р(У=\х) =Лх)ЛУ 0=х) 1 =Дх). (4) Функция правдоподобия имеет вид:

пил*)] [1-/(х)]1-у1

(5)

Логарифмическая функция правдоподобия имеет вид:

L(w)=Y.U[y log f(x) + (1- y)log(1 - f(x))].(6) 4. Реализация и результаты эксперимента

4.1 Эксперимент по оценке эффективности планирования работы нефтяной скважины

Эффективность системы - это наиболее важный фактор качества работы системы добычи. Эффективность системы добычи - это отношение полезного количества добытой жидкости к потребляемой мощности в единицу времени, что является существенным фактором производства. В результате эксперимента в качестве целевого фактора была выбрана эффективность системы. Предполагается, что значение эффективности системы выше 45% является положительным, меньше 45% - отрицательным.

В интеллектуальном анализе данных такие параметры, как нагрузка, температура и электрическое напряжение насоса, подходят для решения задачи классификации в модели оценки. При анализе эффективности насосной системы рассматриваются влияющие на неё факторы, перечисленные в таблице 1. Данные, приведенные в таблице 1, были получены для каждой нефтяной скважины в одно время.

1

WX

Таблица 1.Параметры нефтяной скважины

Параметры Единица Измерения Параметры Единица Измерения

Глубина [м] Реактивная мощность [КВ]

Период работы [ч] Давление масла [МПа]

Максимальная нагрузка [КН] Максимальное давление [МПа]

Минимальная нагрузка [КН] Минимальное давление [МПа]

Коэффициент мощности [1] Давление продукции [МПа]

Активная мощность [КВ] Напряжение [В]

Максимальная активная мощность [КВ] Ток [А]

Для улучшения результатов выполненной работы в соответствии с полученными данными были выполнены следующие действия.

1) С целью повышения эффективности данных была собрана вся возможная относящаяся к ним информация.

2) Была выполнена предварительная обработка данных методами сглаживания, нормализации и шумоподавления.

3) Создана модель оценки для решения реальных задач.

4) Выполнена оценка полученных моделей.

5) Выработана оптимальная модельная схема.

Таблица 2.Результаты классификации

6) Выполнено сравнение результатов с реальными данными, после чего выполнено обновление модели.

4.2 Результаты классификации

Эксперимент проводился на языке python на примере нефтяных скважин месторождения с использованием алгоритмов SVM и LR. 1980 нефтяных скважин были выбраны в качестве обучающего множества, оставшиеся 20 нефтяных скважин в качестве тестовой выборки. Согласно опыту, параметр штрафа C был установлен 0.8, функция оценки RBF и стандартное отклонение 0.5 для модели SVM; параметр штрафа С=1 для LR. Сравнение прогнозируемой и реальной эффективности приведено в таблице 2.

№ Реальное значение Прогноз LR Прогноз SVM № Реальное значение Прогноз LR Прогноз SVM

1 0 1 0 11 0 0 1

2 0 0 0 12 0 0 0

3 0 0 0 13 0 0 0

4 0 0 0 14 0 0 0

5 0 0 0 15 0 0 0

6 0 1 1 16 1 1 1

7 1 0 1 17 0 1 0

8 1 1 1 18 0 0 0

9 0 1 1 19 0 0 0

10 1 1 1 20 1 1 1

При использовании логистической модели было обнаружено 15 правильных результатов классификации, что означает, что точность достигает 75%. В рамках модели 8УМ найдено 18 правильных классификаций с точностью 90%, которые удовлетворяют условиям прогнозирования. С помощью метода уменьшения размерности РСА можно уменьшить размерность данных 17 до 2 с учетом

визуализации, результат которой показан на рисунке 4. Множество точек на рис. 4 означает определенный набор данных. Квадраты означают правильную классификацию 8УМ, а звезды - ЬЯ. Перекрывающиеся части корректны в обоих алгоритмах, а красные крестики являются ошибками классификации.

Рис.4. Результаты эксперимента SVM и LR

В предметной области нефтяных скважин распределение данных осложнено высокой размерностью пространства данных, что может оказать большое влияние на сбор первичных данных. В этой ситуации возможна ошибка сбора одного или нескольких видов данных, а также неравномерное распределение данных. Классический ручной анализ, такой как применение диаграмм, линейный анализ или логистическая регрессия, не позволяет достигнуть высокого качества классификации. В этом случае машина опорных векторов с использованием метода ядра лучше подходит для нелинейного сложного процесса обработки данных.

5. Заключение

В работе выполнен теоретический анализ метода опорных векторов и метода логистической регрессии. Показано, что нелинейный алгоритм SVM работает лучше, чем линейный алгоритм LR при анализе системы нефтяных скважин и прогнозировании их эффективности. В дальнейшем необходимо разработать метод классификации на базе машины опорных векторов, позволяющий осуществлять классификацию исходного множества данных на несколько классов с возможностью оценки степени близости к каждому из этих классов.

6.Литература

[1]Yong Soo Kim. Performance evaluation for classification methods: A comparative simulation study[J]. Expert Systems With Applications, 2009,373.

[2]Hanuman Thota, Raghava Naidu Miriyala, Siva Prasad Akula, K. Mrithyunjaya Rao, Chandra Sek-har Vellanki, et al.. Performance Comparative in Classification Algorithms Using Real Datasets[J]. Journal of Computer Science & Systems Biology, 2009, 0201.

[3] HungLinh Ao, Junsheng Cheng, Yu Yang, Tung Khac Truong. The support vector machine parameter optimization method based on artificial chemical reaction optimization algorithm and its application to roller bearing fault diagnosis. Journal of Vibration and Control.2015(12).

[4] Rimjhim Agrawal, Thukaram Dhadbanjan. Identification of Fault Location in Distribution Networks Using Multi Class Support Vector Machines. International Journal of Emerging Electric Power Systems.2012(3).

[5] Snehal A. Mulay, P.R. Devale, G.V. Garje. Intrusion Detection System Using Support Vector Machine and Decision Tree. International Journal of Computer Applications.2010(3).

[6] Wang Liejun, Lai Huicheng, Zhang Taiyi. An Improved Algorithm on Least Squares Support Vector Machines. Information Technology Journal.2008(2).

[7] R. Cogdill, P. Dardenne. Least-squares support vector machines for chemometrics: an introduction andevaluation. Journal of Near Infrared Spectroscopy.2004(2).

[8] Ke Lin, Anirban Basudhar, Samy Missoum. Parallel construction of explicit boundaries using support vector machines. Engineering Computations.2013(1).

[9] Ashkan Moosavian, Hojat Ahmadi, Babak Sakhaei, Reza Labbafi. Support vector machine and K-nearest neighbour for unbalanced fault detection. Journal of Quality in Maintenance Engineering.2014(1).

[10] Long Zhang, Jianhua Wang. Optimizing parameters of support vector machines using team-search-based particle swarm optimization. Engineering Computations. 2015(5).

УДК 331.101.1_

ЭРГОНОМИЧЕСКИЕ ОСОБЕННОСТИ ЭФФЕКТИВНОГО ВОСПРИЯТИЯ ЗРИТЕЛЬНОЙ

ИНФОРМАЦИИ СЛАБОВИДЯЩИМИ_

Горячкин Б.С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

к.т.н., доцент

Московский государственный технический университет им. Н.Э. Баумана,

Москва Красильников С.Н.

магистр

Московский государственный технический университет им. Н.Э. Баумана,

ERGONOMIC FEATURES OF EFFECTIVE PERCEPTION OF VISUAL INFORMATION,

VISUALLY IMPAIRED

Goryachkin B.S.

Ph.D., assistant professor Moscow State Technical University. N.E. Bauman,

Moscow Krasil'nikov S. N.

master

Moscow State Technical University. N.E. Bauman,

АННОТАЦИЯ

В статье проведен анализ разработанной системы оценки эргономичности сайта для слабовидящих людей на основании исследования их трудовой занятости на предприятиях. Особое внимание уделяется

i Надоели баннеры? Вы всегда можете отключить рекламу.