УДК 519.65:519.233
DOI: 10.18698/0236-3933-2018-1-31-48
ПРЯМОЙ МЕТОД ОЦЕНКИ ПАРАМЕТРОВ ДВУСЕГМЕНТНОЙ КУСОЧНО-ЛОГИСТИЧЕСКОЙ КРИВОЙ
А.Н. Гнеушев [email protected]
А.А. Гурченков И.И. Мороз
Вычислительный центр им. А.А. Дородницына ФИЦ «Информатика и управление» РАН, Москва, Российская Федерация
Аннотация
Рассмотрен подход к аппроксимации экспериментальных данных кусочно-логистической кривой, состоящей из двух сегментов, на основе линейной среднеквадратичной регрессии. Основным ограничением задачи является требование применения только арифметики с фиксированной запятой для работы алгоритма оценивания во встроенных вычислительных системах. Предложен подход прямой оценки по экспериментальным данным параметров модели, в которой точка сопряжения сегментов совпадает с точками перегиба составляющих логистических функций. На первом этапе оценена точка перегиба, разбивающая элементы выборки данных на две части. На втором этапе каждая часть выборки независимо аппроксимирована собственной обобщенной логистической функцией с заданной точкой сопряжения. Для оценки параметров кривой предложено использовать дифференциальное уравнение, решением которого является обобщенная логистическая функция в среднеквадратичной регрессии второго порядка. Разработанный метод может быть применен в комбинации с другими известными прямыми методами
Ключевые слова
Обобщенная логистическая кривая, в-функция, сигмовидная кривая, кусочно-логистическая кривая, аппроксимация, передаточная характеристика
Поступила в редакцию 16.05.2017 © МГТУ им. Н.Э. Баумана, 2018
Работа выполнена при финансовой поддержке РФФИ (грант № 16-07-01171)
Введение. В области технического управления или при исследовании естественных систем часто строят модели процессов, которые описываются экспоненциально растущими до некоторого уровня функциями с последующим убыванием скорости роста вплоть до достижения максимума. Подобные процессы роста с двумя участками насыщения (снизу и сверху) хорошо представляются функцией с сигмовидной формой, в качестве которой часто используют логистическую функцию. Логистическую функцию широко применяют во многих областях знания, включая медицинские и общественные науки, например для моделирования роста популяции организмов в условиях ограниченных ресурсов, в статистических системах предсказания, классификации, принятия решений, в экономике, химии, математической психологии, в маркетинговых исследованиях.
Для автоматического управления технической системой ставится задача аппроксимации передаточной характеристики объекта управления модельной кривой по выборке измерений его выходного сигнала [1]. В тех случаях, когда точная модель передаточной характеристики объекта неизвестна, используют косвенный подход к ее оценке через аппроксимацию переходной характеристики с помощью приближенной дробно-рациональной функции [1]. Однако в некоторых случаях есть возможность получить достаточно плотную, без существенных разрывов выборку измерений с выхода системы при заданном входном сигнале без существенных переходных процессов. Для квазистационарного линейного входного воздействия выходом системы будет передаточная функция, которая для таких устройств управления, как моторизированные ротационные краны и клапаны, представляет собой 5-образную зависимость потока жидкости через устройство от угла открытия. Для оптической системы объектива с моторизированной диафрагмой передаточная функция представляет собой 5-образную зависимость потока света через оптическую систему от управляющего сигнала шагового электропривода, определяющего угол открытия диафрагмы. При квазистационарном управлении указанными устройствами можно пренебречь переходными процессами и использовать передаточную функцию в явном виде.
Для модульных автоматических систем, например система водоснабжения или фотоаппарат, объекты управления (моторизированный кран и оптический объектив соответственно) могут комплектоваться отдельно, заменяться в процессе эксплуатации различными моделями разных производителей и иметь передаточные характеристики, различающиеся в определенном диапазоне. Для того чтобы внедренная система управления работала с такими объектами, необходимо реализовать встроенную в систему автоматическую калибровку новых подключаемых объектов. Это требование накладывает дополнительные ограничения на вычислительную сложность алгоритма калибровки и получение передаточной характеристики, так как обычно система управления реализовывается на таких устройствах, как ¥РОА, микроконтроллеры, микропроцессоры малой вычислительной мощности, работающие только с целочисленной арифметикой [2, 3]. На таких устройствах программная эмуляция вещественной арифметики ресурсоемка, и вещественное число может быть представлено только в виде дробного числа с фиксированной запятой. Это обстоятельство препятствует использованию таких оптимизационных нелинейных методов, как метод максимального правдоподобия, нелинейной, в том числе итеративной оптимизации, поскольку эти методы работают с широким численным диапазоном в промежуточных вычислениях. В таких условиях становятся актуальными прямые алгебраические методы оценки параметров передаточной функции устройства.
Как правило [4], в качестве модели для сигмовидных зависимостей рассматривают логистическую кривую (рис. 1, а), имеющую нулевую нижнюю асимптоту. В реальных технических системах сигмовидные передаточные характеристики устройств имеют существенные отклонения от этой простой модели. Так, для устройств с характеристикой, имеющей отрицательную нижнюю
асимптоту, выходные значения ограничиваются снизу нулевым порогом и не доступны для наблюдения (рис. 1, б). Точность оценки нижней асимптоты является довольно важной, так как она определяет «уровень нуля» на передаточной характеристике — один из основных параметров работы устройства.
Рис. 1. Вид логистической кривой (я) с нулевой нижней асимптотой и вид кусочно-логистической кривой (б) с сопряжением двух сегментов в точке перегиба и с отрицательной нижней асимптотой, недоступной для наблюдения
Дополнительная проблема для аппроксимации — случай передаточной характеристики, не симметричной относительно точки перегиба вследствие неидеальности реализации системы или других факторов (см. рис. 1, б). Тогда можно предложить кусочно-логистическую модель, где части характеристики с двух сторон от точки перегиба аппроксимируются логистической функцией с разными параметрами со скачком производной в точке сопряжения. В общем случае основная сложность при кусочно-сегментной аппроксимации кривой заключается в оценке положений точек сопряжения соседних сегментов.
Численные методы аппроксимации логистической кривой можно разбить на два класса: 1) прямые методы, основанные на различных алгебраических преобразованиях для линеаризации исходной задачи и оценки параметров линейным методом наименьших квадратов [4, 5]; 2) нелинейные методы, в которых итеративно минимизируется нелинейная относительно параметров невязка экспериментальных данных и модели по различным критериям [6-8].
Обзор прямых алгебраических методов оценки параметров логистической функции с нулевой нижней асимптотой по экспериментальным данным представлен в работе [4]. Прямые методы Хотеллинга (Но1еШ^) и Тинтнера (ТтШег) сравниваются в работе [5]. Перечисленные методы основаны на алгебраических преобразованиях логистической функции с нулевой нижней асимптотой и соответствующего ей интегрального уравнения для их линеаризации относительно неизвестных параметров. В работе сделан вывод, что метод Тинтнера лучше аппроксимирует экспериментальные данные. Однако эти методы довольно чувствительны к числу и точности экпериментальных отсчетов, приходящихся на асимптоты модельной кривой.
Различные полиномиальные аппроксимации вплоть до третьей степени логистической функции с нулевой нижней асимптотой без использования арифметики с плавающей запятой предложены в работе [2]. Однако такая реализация содержит свободные параметры, которые не определяются автоматически. Кусочно-линейные подходы и аппроксимация второго порядка для представления логистической функции с заданными параметрами для реализации на ¥РОА рассмотрены в работе [3].
Процесс прогнозирования спроса на электроэнергию с помощью построения логистической кривой с нулевой нижней асимптотой смоделирован в работе [9]. Для оценки ее параметров использована комбинация прямых методов, в частности верхняя асимптота оценена из системы уравнений логистической функции, значения которой находятся в трех или четырех отдельных экспериментальных точках. Остальные параметры найдены методом Гаусса ^аше) [4] с помощью линейной регрессии на основе линеаризации выражения для логистической функции. Простая логистическая модель для прогнозирования загрузки электросетей также использована в работах [10-12]. Оценка трех параметров выполнена в работе [10] решением системы из трех уравнений логистической функции в отдельных экспериментальных точках.
Подход к логистической регрессии методом максимального правдоподобия с помощью численной итеративной оптимизации параметров методом Ньютона представлен в работах [6-8, 13, 14]. Необходимые и достаточные условия, гарантирующие существование оптимального решения, представлены в работе [7]. В этих работах также использована модель логистической функции с нулевой нижней асимптотой. Подход к оценке параметров логистической функции с ограничениями на основе квадратичной оптимизации предложен в работах [15, 16]. Логистическая модель в работе [17] использована для прогнозирования роста туристического спроса в Лас-Вегасе на основе нелинейной оптимизации.
Методы кусочно-логистической аппроксимации рассмотрены в работах [18-21]. В них предложено использовать сегментированную логистическую кривую, которая скачкообразно меняет темп роста в точке сопряжения сегментов при сохранении асимптот. Для нахождения точки сопряжения и других параметров применен подход интервальной оптимизации [19] и метод максимального правдоподобия [18]. В обоих подходах использована итеративная нелинейная оптимизация.
В настоящей работе рассмотрена задача автоматической аппроксимации экспериментальных данных, полученных путем измерения 5-образной, незначительно асимметричной передаточной характеристики объектива с моторизированной диафрагмой, управляемой шаговым электродвигателем. Дополнительное ограничение для алгоритма аппроксимации — использование вычислительной системы, которая работает только с целыми числами, а вещественные числа могут быть представлены только как дробные числа с фиксированной запятой.
Рассмотренные в публикациях прямые методы аппроксимации 5-образной кривой используют простую логистическую модель с нулевой асимптотой и не
описывают алгоритма оценки нижней асимптоты в более общем случае. Кусочно-логистические методы аппроксимации несимметричной кривой используют итеративную нелинейную оптимизацию, их реализация затруднена на целочисленных вычислительных системах. Таким образом, эти методы не содержат алгоритма решения поставленной задачи.
В настоящей работе предложен прямой алгоритм оценивания параметров логистической кривой с ненулевой нижней асимптотой, решающий задачу при заданных ограничениях. На основе дифференциального уравнения, решением которого является обобщенная логистическая функция, с помощью линейной регрессии второго порядка оценены все параметры, в том числе нижняя асимптота. Для аппроксимации несимметричной 5-образной передаточной кривой предложена кусочно-логистическая модель, имеющая неизвестную нижнюю асимптоту и состоящая из двух сегментов, точка сопряжения которых совпадает с точками перегиба составляющих логистических функций (см. рис. 1, б). Для оценки параметров модели опытная выборка разделена на две части. Каждая часть независимо аппроксимируется собственной обобщенной логистической функцией. Описываемые алгоритмы могут быть реализованы с использованием дробных чисел с фиксированной запятой. Приведены результаты численного эксперимента применения алгоритмов, комбинирующих различные прямые методы оценивания 5-образной кривой.
Прямые методы аппроксимации данных логистической функцией. Рассмотрим обобщенную логистическую функцию в виде
K
1 + г~
У = C-' а >0, K >0, b еИ, C еИ, x еИ, (1)
где С — постоянная составляющая, нижняя асимптота; К — параметр емкости, определяющий верхнюю асимптоту (К + С); а — параметр темпа роста; Ь — сдвиг, определяющий положение кривой на оси X. Перегиб кривой находится в точке с координатами х0= Ь / а, у0= С + К /2. Логистическая функция (1) является решением дифференциального уравнения
¿У = ±(у - С)(К + С - у), (2)
ах К
описывающего динамику роста характеристики у(х) с двумя асимптотами.
Простая логистическая функция имеет нулевую асимптоту и описывается выражением (1) при С = 0. При аппроксимации выборки данных такой функции существует ряд прямых численных методов оценки ее параметров, обзор которых можно найти в работах [4, 5]. Рассмотрим несколько основных подходов.
В ранних работах оценки параметров простой логистической кривой получали на основе произвольно выбранных трех точек с одинаковым интервалом или трех сумм обратных величин значений отсчетов и последующего решения замкнутой системы уравнений относительно трех параметров а, Ь, К [4].
Более поздние работы описывают методы, основанные на некоторых алгебраических преобразованиях, для линеаризации уравнений (1), (2) и нахождения по ним параметров функции методом наименьших квадратов. Так, в методе Гаусса исходное выражение (1) приводится к линейному относительно параметров а, Ь виду:
ln KdZzC)=b _ ях. У - C
(3)
Приняв параметр C = 0 и предварительно независимо оценив значение параметра K, неизвестные a, b находятся из построения прямой среднеквадратичной регрессии по выражению (3).
В методе Фишера (Fisher) [4] для оценки параметров логистической кривой использовано выражение (2) в виде
1 dy
- = a--(y - C).
(y - C) dx K
(4)
В методе предложено аппроксимировать левую часть (4) выражением (при С = 0)
(i_ dy > y dx
= 1 (ln(y) - ln(yM) + ln(y,.+ 1) - ln(y)) = i ln ^
2 2 y._i
где г — индекс точки из выборки экспериментальных данных. Далее параметры а, К находят построением прямой среднеквадратичной регрессии по выражению
iln ¿it!
2 y.-i
K
yi.
(5)
Метод Хотеллинга [4] использует другую аппроксимацию левой части выражения (4) относительно средней точки на интервале, содержащем три отсчета (при С = 0):
(1 dy > y dx
л
(y.+i - yi) ln q
yi+i q -1
q=
у.-i(yi+i - у. ) y<+i(yi - yi-i)
(6)
а, К — параметры, которые находят с помощью линейной регрессии (4).
В методе Раухгардена (Roughgarden) [4] для аппроксимации производной в левой части выражения (4) применяют простую конечную разность при единичном шаге:
(
I dl
y dx
Л
_ yi+i - yi
i
у.
(7)
В работе [5] этот подход также называется методом Хотеллинга.
Другой подход использован в методах Родса (Rhodes) [4] и Тинтнера [5]. На основе исходной функции (1) для соседних отсчетов из выражений
1 1 + g-axi+Ь 1 e~axi+1+b
zi = ~ = ~ , zi+1 ='
Уг - C K K
следует итеративное представление
1 - e ~а
z,+1= e-aZi +——, (8)
K
которое далее используют для построения прямой среднеквадратичной регрессии zi+1(zi) и оценки параметров a, K.
В методе Лесли (Leslie) [4] использовано выражение (8) в форме
У 1 - e ~а 1у~ = ea + ^-^y (9)
У+1 K
для прямой регрессии yi / yi+1 на yi.
Метод оценки параметров обобщенной логистической функции. Для оценки всех параметров обобщенной логистической функции (1) необходимо, в частности, оценить нижнюю асимптоту, параметр C. Рассмотренные ранее прямые методы не предполагают алгоритма для его оценки. Предложим подход для решения такой задачи.
Отметим, что правая часть выражения (2) является полиномом второй степени функции y и запишем ее в виде
dy = а (-y2 + (2C + K) y + CK - C2) = A2 y2 + A y + Ao. (10)
dx K
Здесь A2 = -a / K, A1 = -a (2C + K)/ K, A0=(a(CK - C2))/K — коэффициенты полинома, которые можно получить с помощью построения среднеквадратичной регрессии второго порядка по экспериментальным данным, т. е. найти решение системы линейных уравнений
,.2 _ vi dy
nAo + Ai£y + AZy«? = X, л
dx ),
Ao !y + Ai Ey2 + A2 Eyf= 1у|£ J
,.2.4 V,.3 , A . V,.4 _ V,.2 I dy
А0 Еу2 + А1 Еу? + а2 Еу4 = Ху2 ах \,
г г г г \аХ /г
где суммирование проводится по всей выборке, а производные аппроксимируются конечными разностями. По найденным значениям коэффициентов и с учетом того, что а >0, можно оценить параметры логистической функции выражениями
а = 7АмА0А2, К = -—, С = а-А-. (11)
А2 2А2
При найденных значениях К, С, а параметр Ь может быть определен методом Гаусса (3):
а" ^ 1 " К - (у, - С) Ь = -X х, + -Х1п-^—, (12)
п ,=1 п ,=1 у, - С
где п — число отсчетов в опытной выборке; С, К, а — оцененные параметры на предыдущих шагах. Из выражения (12) следует, что координата х0 может быть оценена как
Ь 1 » ^ 1 » К - (у, - С) Хо=- = - ^ +—X 1п-—. (13)
а п ,=1 ап ,=1 у1 - С
Построим несколько альтернативных алгоритмов оценивания параметров С, К, а, комбинируя различные методы. Разные комбинации оценок параметров закодируем в названии алгоритма так, чтобы после названия метода приводилось множество параметров, которые им оцениваются: < метод > {параметры}... < метод > {параметры}. Названия алгоритмов приведены в табл. 1 и указано, каким методом и по какой формуле оценивается каждый параметр для предлагаемой комбинации.
Метод аппроксимации кусочно-логистической кривой. Для аппроксимации асимметричной 5-образной кривой рассмотрим кусочно-логистическую модель.
Сегментированную логистическую кривую, которая скачкообразно меняет темп роста а в точке сопряжения сегментов при сохранении асимптот, предложено использовать в работах [18, 20]. Таким образом, параметр а (х) является ступенчатой функцией с разрывом в пороговой точке сопряжения сегментов. Для нахождения точки сопряжения и других параметров используют подход интервальной оптимизации [19] и метод максимального правдоподобия [18]. В обоих подходах применяют итеративную нелинейную оптимизацию, которая не может быть реализована с помощью только арифметики с фиксированной запятой.
Таблица 1
Комбинации методов для оценки логистической кривой
Алгоритм Оценка параметра
C K а b
ProposedjC, K, a} Gausejb} (11) (11) Методом Гаусса (12)
ProposedjC, K} Gause{a,b} (11) Методом Гаусса(3) Методом Гаусса(3)
ProposedjC, K} Leslie {a} Gausejb} (11) (11) Методом Лесли (9)
ProposedjC} Leslie {K,a} Gausejb} Методом Лесли (12) Методом Лесли (12) Методом
ProposedjC, K} Fisher {a} Gausejb} (11) Методом Гаусса (12)
ProposedjC} Fisher {K, a} Gausejb} Методом Фишера (5) Фишера (5)
В настоящей работе использован прямой подход. На первом этапе оценено положение точки сопряжения, которая разбивает выборку данных на две части. На втором этапе, при заданной точке сопряжения, выполняется аппроксимация каждой части опытной выборки логистической кривой (1) одним из прямых методов, описанных ранее.
Используем модель с точкой сопряжения, совпадающей с точкой перегиба обеих логистических кривых (см. рис. 1, б):
y =
Ci
C2
Ki
1
e-aix +bi
K2
при x < x0; при x > x0,
(14)
1 + e ~a2X+Ь2
Xo = Ь1 /й1 = Ь2 /a2, УО = С1 + Kl / 2 = С2 + K2/2;
al >0, a2 > 0, К >0, K2 > 0, С е ЭТ, C2 е ЭТ, Ь1 е % Ь2 е ЭТ;
Ll ={al,bl,Kl,Cl},L2 = {112^2^2^2},
где (х0, у0) — координаты точки сопряжения; Ll, L2 — параметры соответ ствующих логистических функций.
На первом этапе оцениваются координаты точки сопряжения (х0, у0) при допущении, что исходная кривая является незначительно асимметричной. Выражение (13) не позволяет этого сделать без априорной оценки неизвестных параметров д, К, С Предложим альтернатив- -50 0 50 100 х
ный подход оценки координаты Хо, ис- Рис. 2. График производной логисти-пользуя свойства симметричности логи- ческой функции (1)
стической кривой и выражение для ее производной
йу = дКе-дх+Ь йх ~ (1 + е-дх+Ь )2
(15)
имеющей вид колокола (рис. 2).
Утверждение 1. Среднее значение производной логистической функции (15) равно координате х0= Ь/ а точки перегиба самой функции (1).
м Действительно, среднее значение производной (15) определяется по выражению
x0 ='
K
л£| dx
J
ахе
-ax+b
(1 + e-ax+b )2
dx,
(16)
где
!\dl ) dx = __L
J 1 dx ) 1 + e-ax+b
= K.
Второй интеграл в выражении (16) берется по частям:
xo =-
ч 1
1
e—ax +b
x^-да -да A '
dx.
1 + e ~ax+b
Здесь интеграл с использованием замены переменной г = гах равен
-f 1 ,7 eax , ln(eb + eax) I -- dx = I —-dx =-
J 1 + e~ax+b J eb
-rr^ -L I t- —nri t-
— e + e a В результате получаем
x—T x ln(eb + eax) .Xo = Л , где I =----.
1 + e ~ax+b a
Преобразуя выражение под пределами
I _ ax - ln(eb + eax) - ln(eb + eax )e~ax+b = " a(1 + e -ax+b)
= ax - (ln eax + ln(1 + e~ax+b)) - ln(eb + eax )e~ax+b = a(1+e~ax+b)
- ln( 1 + e~ax+b) - ln(eb + eax )e-ax+b = _ ln(1 + e~ax+b) _ ln(eb + eax) a(1 + e-ax+b) = a(1 + e'ax+b) a(eax-b +1)
и раскрывая неопределенность в выражении второго слагаемого
. ln(eb + eax) = . _1_= . 1 =o
Л" a(eax-b +1) = Л" a( 1 + e-ax+b )eax-b = Л" a(eax-b +1) = ,
для первого предела получаем
ln(1 + e~ax+b) ln(eb + eax)
Hm 1 = - Шп a(1 , e-ax +b) " lim a(eax-b , 1) =0.
xxa(1 + e ) xa(e +1)
Раскрывая неопределенность в выражении первого слагаемого I
1 1 lim --—г = lim-—г = 0,
1 п-ax+b „„-ax+b
1 т e _ae
для второго предела имеем
1 ln(eb + eax) ln eb b
limi =lim j-e^b -lim —a—" —a~ ~ ~ aa
x x 1 -t- e x a a a
Прямой метод оценки параметров двусегментной кусочно-логистической кривой Окончательно определяем, что
Л _b_
хо - lim I ~ lim I - — - Хо- ►
x^+w x а
На основе утверждения 1 для нахождения точки перегиба логистической функции (1) и параметра b будем использовать оценку среднего значения производной (16) по дискретной выборке из выражения
" ( dy ^
X x
i-1
dx
Хо-----—, b - аХо. (17)
( dy ^
i-1
dx
i
Чем более симметрична опытная выборка в диапазоне асимптот кривой, тем точнее оценка (17) среднего значения.
Значение координаты у0 находится по линейной интерполяции экспериментальных данных в точке х 0:
У г (х1+1 _ х0) + Уг+1(х0 _ х1 ) /10ч
Уо--. (18)
хг+1 _ хг
Исходная опытная выборка разбивается на две части: 1) левую (х < х0); 2) правую (х > х0). В каждой части оцениваются параметры своей логистической кривой (14) путем построения регрессии второго порядка (10) при условии совпадения ее максимума и точки сопряжения (18), т. е. при условии равенства нулю производной выражения (10) в точке у0. Таким образом решается следующая система линейных алгебраический уравнений:
„2^ I йУ
пА0 + А1XУ + -АXУ2 - X, 7 ,
—0 ху + -1x у2 + -2 x у! - x у, [ ^ 1;
г г г г VdX У г
А1 + 2А2у0 -0,
где суммирование проводится по соответствующей части разделенной выборки. Решение этой системы и оценка параметров (11) логистической функции имеет простой вид, с учетом ограничения а >0:
А - А - 2М1 у0 ; . - М1;
°0 °0 °0 (19)
N2 „ N2 П0 г К
а-:-г; К------; С - у0--.
| П01 N1 | Д, | 2
Здесь
Nо = D1£- I £ 1-Dlid- .
ax ). j I ax ),
N1 = и£ У1 У.- Ерт] , N 2^4 ^(N1 у2 - N 0); (20)
I у ах . . у ах
Во = д^у-нБо, а = 2уо£у-Еу2, Оо=2уоЕу0 "Еу3.
I I I I I
Таким образом, из выражений (17), (19) по соответствующей части опытной выборки находят параметры Ь1у Ь2 соответствующих логистических функций.
Отметим, что вычисления на основе выражений (17), (19), включая алгоритм вычисления квадратного корня из целого числа, могут быть реализованы с использованием арифметики с фиксированной запятой на целочисленном процессоре.
Как и ранее, путем комбинирования прямых методов сформулируем несколько альтернативных алгоритмов для оценки параметров, закодировав различные комбинации методов. Названия алгоритмов приведены в табл. 2 и указано, каким методом и по какой формуле оценивается каждый параметр для предлагаемой комбинации.
Таблица 2
Комбинации методов кусочно-логистической оценки
AnropMTM Оценка параметра
C K a b
Proposed{C, K, a} (19)
Proposed {C, K} Gause{a} (19) Методом Гаусса (3)
ProposedjC, K} Leslie {a} (19) Методом Лесли (9) (17)
Proposed {C} Leslie {K,a} Методом Лесли (9)
ProposedjC, K} Fisher {a} (19) Методом Фишера (5)
Proposed {C} Fisher {K,a} Методом Фишера (5)
Численная оценка параметров модели передаточной характеристики.
В качестве экспериментальных данных в работе использованы измерения яр-костной характеристики оптической системы объектива с моторизированной диафрагмой, управляемой шаговым электродвигателем. Степень открытости диафрагмы задана порядковым номером шага двигателя, который с помощью контроллера преобразовывался в соответствующий сигнал управления двигателем. Таким образом, экспериментальная передаточная характеристика представляет собой зависимость средней яркости точечного источника освещения, зарегистрированной сенсором оптической системы, от номера шага моторизированной диафрагмы (рис. 3, а).
250 yt
Рис. 3. Измеренная передаточная характеристика (а) оптической системы объектива, кусочно-квадратичная аппроксимация производной значений экспериментальных данных (б), результат аппроксимации кусочно-логистической кривой (в)
б
а
в
Передаточная характеристика немного асимметрична, имеет отрицательную нижнюю асимптоту, недоступную для измерения. Разный объем экспериментальных данных, приходящихся на обе асимптоты характеристики, не будет искажать оценку координаты точки перегиба по выражению (17), так как их вклад в производную (15) минимален (см. рис. 2). Промежуточный результат аппроксимации производной (10) передаточной характеристики тремя параболами показан на рис. 3, б. Левая парабола аппроксимирует левую часть выборки, правая парабола — правую. Сегменты парабол построены на основе выражений (19). Третья парабола, показанная штриховой линией, построена по всей совокупности данных по формулам (11). В точке сопряжения заметен разрыв значений в кусочно-квадратичной аппроксимации.
Результат кусочно-логистической аппроксимации передаточной характеристики приведен на рис. 3, в. При кусочно-логистическом подходе нижняя асимптота оценивается довольно точно.
В качестве численной меры точности использовался критерий
у - у(X ))2
А32 - 2-, „, ч
¡=1 у(х)
и нормированное среднеквадратичное отклонение
CKO =
£( y - y(Xi ))2
i=1
Ey2
i=i
где у(х) — значение аппроксимирующей функции в точке х/. Численное сравнение результатов работы предлагаемых методов приведено в табл. 3.
Таблица 3
Сравнение предлагаемых алгоритмов для аппроксимации экспериментальных данных
Алгоритм СКО Хз2
Односегментный логистический подход
Proposed{C,K,a} Gausejb} 0,021 8,3
Proposed {С,K} Gause{a,b} 0,019 8,6
ProposedjC, K} Leslie {a} Gause{b} 0,052 123,1
Proposed{C} Leslie{K,a} Gause{b} 0,50 29,5
Proposed {C,K} Fisher {a} Gause{b} 0,054 140,7
Proposed {C} Fisher {K,a} Gause{b} 0,061 32,6
Кусочно-логистический подход
Proposed{C, K, a} 0,020 3,5
Proposed {C, K} Gause{a} 0,022 3,9
Proposed {C,K} Leslie {a} 0,018 3,2
Proposed {C} Leslie {K,a} 0,020 6,2
Proposed {C,K} Fisher {a} 0,016 6,5
Proposed {C} Fisher {K,a} 0,020 8,0
Заключение. Разработан прямой метод аппроксимации экспериментальных данных кусочно-логистической кривой, в которой точка сопряжения сегментов совпадает с точками перегиба составляющих логистической функции. Предложен метод оценки параметров обобщенной логистической функции на основе линейной среднеквадратичной регрессии второго порядка. Рассмотрены варианты комбинаций различных прямых методов и проведено численное сравнение их точности на примере аппроксимации передаточной характеристики объектива с моторизированной диафрагмой. Представлены результаты сравнения.
Результаты экспериментов показывают, что кусочно-логистический метод имеет преимущество по точности приближения экспериментальных данных в окрестности нижней асимптоты перед односегментной аппроксимацией обобщенной логистической функцией и решает поставленную задачу.
Разработанный метод на основе выражений (17), (19) дает возможность реализовать алгоритм оценивания достаточной точности с применением только целочисленной арифметики и дробных чисел с фиксированной запятой.
Развитием подхода может быть разработка итеративного алгоритма автоматического оценивания точки сопряжения сегментов путем адаптивного перераспределения экспериментальных данных между сегментами на каждой итерации на основе метода максимального правдоподобия.
ЛИТЕРАТУРА
1. Балакирев В.С., Дудников Е.Г., Цирлин А.М. Экспериментальное определение динамических характеристик промышленных объектов управления. М.: Энергия, 1967. 230 с.
2. Cyganek B., Socha K. Computationally efficient methods of approximations of the S-shape functions for image processing and computer graphics tasks // Image Processing & Communications.
2012. Vol. 16. No. 1-2. P. 19-28.
3. Tisan A., Oniga S., Mic D., Buchman A. Digital implementation of the sigmoid function for FPGA circuits // Acta Technica Napocensis. Electronics and Telecommunication. 2009. Vol. 50. No. 2. P. 15-20.
4. Pareja G.P. Fitting a logistic curve to population size data: Ph.D. Theses. Ames, Iowa, Iowa State University, 1984. 191 p.
5. Skrobacki Z. Selected methods for the estimation of the logistic function parameters // Maintenance and Reliability. 2007. No. 3 (35). P. 52-56.
6. Nelder J.A. The fitting of a generalization of the logistic curve // Biometrics. 1961. Vol. 17. No. 1. P. 89-110.
7. Juki'c D, Scitovski R. Solution of the least-squares problem for logistic function // Journal of Computational and Applied Mathematics. 2003. Vol. 156. No. 1. P. 159-177.
8. Ngunyi A., Mwita P.N., Odhiambo R.O. On the estimation and properties of logistic regression parameters // IOSR Journal of Mathematics. 2014. Vol. 10. Iss. 4. P. 57-68.
DOI: 10.9790/5728-10435768
URL: http://www.iosrjournals.org/iosr-jm/papers/Vol10-issue4/Version-3/J010435768.pdf
9. Liang J., Liang Y. Analysis and modeling for China's electricity demand forecasting based on a new mathematical hybrid method // Information. 2017. Vol. 8. Iss. 1. P. 33-48.
DOI: 10.3390/info8010033
10. Improved parametric estimation of logistic model for saturated load forecast / Y. Jia, S. Li, Y. Tan, F. Zhao, F. Hou // Power and Energy Engineering Conf. (APPEEC). Asia-Pacific Shanghai, China, 2012. DOI: 10.1109/APPEEC.2012.6307579
11. A novel analysis and forecast method of electricity business expanding based on seasonal adjustment / Y. Zhang, X. Han, G. Yang, Y. Wang, et al. // Power and Energy Engineering Conf. (APPEEC). 2016. P. 707-711. DOI: 10.1109/APPEEC.2016.7779595
12. Analysis and forecast of saturated load for the central city district of Tianjin / K. Cui, L. Zhang, J. Li, Z. Zhang, Z. Yuan // Electric Power Technologic Economics. 2008. Vol. 20. No. 5. P. 32-36.
13. Ngufor C., Wojtusiak J. Learning from large-scale distributed health data: An approximate logistic regression approach // Proc. 30th Int. Conf. on Machine Learning. Atlanta, Georgia, USA,
2013. JMLR: W& CP. Vol. 28.
URL: https://pdfs.semanticscholar.org/bf8f/e07b6304786a5efa9d313587cdc7fbed75b4.pdf
14. Banerjee H. Estimation of parameters for logistic regression model in dose response study with a single compound or mixture of compounds. Ph.D. Theses. UC, Riverside, 2010. 77 p.
URL: http://escholarship.org/ uc/item/5fv0b84p
15. Fan G. A method to estimating the parameters of general logistic curve // Journal of Liaoning Normal University. 2009. Vol. 32. No. 4. P. 426-429.
16. Fan G. A Method to estimating the parameters of logistic model and application // Mathematics in Economics. 2010. Vol. 27. No. 1. P. 105-110.
17. Chu F.L. Using a logistic growth regression model to forecast the demand for tourism in Las Vegas // Tourism Management Perspectives. 2014. Vol. 12. P. 62-67.
DOI: 10.1016/j.tmp.2014.08.003
18. Pastor R., Guallar E. Use of two-segmented logistic regression to estimate changepoints in epidemiologic studies // Am. J. Epidemiol. 1998. Vol. 148. No. 7. P. 631-642.
19. Yu J.R., Tzeng G.H., Li H.L. General fuzzy piecewise regression analysis with automatic change-point detection // Fuzzy Sets and Systems. 2001. Vol. 119. Iss. 2. P. 247-257.
DOI: 10.1016/S0165-0114(98)00384-4
20. Yu J.R., Tseng F.M. Fuzzy piecewise logistic growth model for innovation diffusion: A case study of the TV industry // Int. J. Fuzzy Syst. 2016. Vol. 18. Iss. 3. P. 511-522.
DOI: 10.1007/s40815-015-0066-8
21. Yu J.R., Tzeng G.H. Fuzzy multiple objective programming in an interval piecewise regression model // Int. J. Uncertain. Fuzziness Knowl.-Based Syst. 2009. Vol. 17. No. 3. P. 365-376.
Гнеушев Александр Николаевич — канд. физ.-мат. наук, научный сотрудник Вычислительного центра им. А.А. Дородницына ФИЦ «Информатика и управление» РАН (Российская Федерация, 119333, Москва, ул. Вавилова, д. 40).
Гурченков Анатолий Андреевич — д-р физ.-мат. наук, ведущий научный сотрудник Вычислительного центра им. А.А. Дородницына ФИЦ «Информатика и управление» РАН (Российская Федерация, 119333, Москва, ул. Вавилова, д. 40).
Мороз Ирина Игоревна — младший научный сотрудник Вычислительного центра им. А.А. Дородницына ФИЦ «Информатика и управление» РАН (Российская Федерация, 119333, Москва, ул. Вавилова, д. 40).
Просьба ссылаться на эту статью следующим образом:
Гнеушев А.Н., Гурченков А.А., Мороз И.И. Прямой метод оценки параметров двусег-ментной кусочно-логистической кривой // Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2018. № 1. C. 31-48. DOI: 10.18698/0236-3933-2018-1-31-48
DIRECT METHOD FOR ESTIMATING PARAMETERS OF TWO-SEGMENTED PIECEWISE LOGISTIC CURVE
In this study we examine an approach to approximation of General logistic function, piecewise experimental data of a two-segmented piecewise logistic logistic curve, S-shape transient recurve based on the linear mean square regression. The re- sponse, sigmoid function, mean quirement to use fixed-point arithmetic only in the estima- square approximation
A.N. Gneushev A.A. Gurchenkov I.I. Moroz
Dorodnitsyn Computing Centre Federal Research Centre Computer Science and Control, Russian Academy of Sciences, Moscow, Russian Federation
Abstract
Keywords
tion algorithm is the main condition for the operation in the embedded system. The paper proposes a method for parameters estimation of the piecewise logistic curve with the segment change-point coinciding with the inflection of the logistic functions. At the first stage we estimated the curve inflection point divided the samples of the experimental data into two parts. At the second stage, each part of the data is approximated independently by a generalized logistic function with the given inflection point. As a result, we suggest using a differential equation whose solution is the generalized logistic function in the mean square secondorder regression for estimating the parameters of
the curve. The developed method can be used in combina- Received 16.05.2017 tion with other known direct computing methods © BMSTU, 2018
The work was carried out with the state financial support of the Russian Foundation for Basic Research (grant no. 16-07-01171)
REFERENCES
[1] Balakirev V.S., Dudnikov E.G., Tsirlin A.M. Eksperimental'noe opredelenie dinamicheskikh kharakteristik promyshlennykh ob'ektov upravleniya [Experimental determination of the dynamic characteristics of industrial control objects]. Moscow, Energiya Publ., 1967. 230 p.
[2] Cyganek B., Socha K. Computationally efficient methods of approximations of the S-shape functions for image processing and computer graphics tasks. Image Processing & Communications, 2012, vol. 16, no. 1-2, pp. 19-28.
[3] Tisan A., Oniga S., Mic D., Buchman A. Digital implementation of the sigmoid function for FPGA circuits. Acta Technica Napocensis, Electronics and Telecommunication, 2009, vol. 50, no. 2, pp. 15-20.
[4] Pareja G.P. Fitting a logistic curve to population size data. Ph.D. Theses. Ames, Iowa, Iowa State University, 1984. 191 p.
[5] Skrobacki Z. Selected methods for the estimation of the logistic function parameters. Maintenance and Reliability, 2007, no. 3 (35), pp. 52-56.
[6] Nelder J.A. The fitting of a generalization of the logistic curve. Biometrics, 1961, vol. 17, no. 1, pp. 89-110.
[7] Juki'c D., Scitovski R. Solution of the least-squares problem for logistic function. Journal of Computational and Applied Mathematics, 2003, vol. 156, no. 1, pp. 159-177.
[8] Ngunyi A., Mwita P.N., Odhiambo R.O. On the estimation and properties of logistic regression parameters. IOSR Journal of Mathematics, 2014, vol. 10, iss. 4, pp. 57-68.
DOI: 10.9790/5728-10435768
Available at: http://www.iosrjournals.org/iosr-jm/papers/Vol10-issue4/Version-3/J010435768.pdf
[9] Liang J., Liang Y. Analysis and modeling for China's electricity demand forecasting based on a new mathematical hybrid method. Information, 2017, vol. 8, iss. 1, pp. 33-48.
DOI: 10.3390/info8010033
[10] Jia Y., Li S., Tan Y., Zhao F., Hou F. Improved parametric estimation of logistic model for saturated load forecast. Power and Energy Engineering Conf. (APPEEC), Asia-Pacific Shanghai, China, 2012. DOI: 10.1109/APPEEC.2012.6307579
[11] Zhang Y., Han X., Yang G., Wang Y., Zhang L., Miao X. A novel analysis and forecast method of electricity business expanding based on seasonal adjustment. Power and Energy Engineering Conference (APPEEC), 2016, pp. 707-711. DOI: 10.1109/APPEEC.2016.7779595
[12] Cui K., Zhang L., Li J., Zhang Z., Yuan Z. Analysis and forecast of saturated load for the central city district of Tianjin. Electric Power Technologic Economics, 2008, vol. 20, no. 5, pp. 32-36.
[13] Ngufor C., Wojtusiak J. Learning from large-scale distributed health data: An approximate logistic regression approach. Proc. 30th Int. Conf. on Machine Learning, Atlanta, Georgia, USA, 2013. JMLR: W& CP, vol. 28.
Available at: https://pdfs.semanticscholar.org/bf8f/e07b6304786a5efa9d313587cdc7fbed75b4.pdf
[14] Banerjee H. Estimation of parameters for logistic regression model in dose response study with a single compound or mixture of compounds. Ph.D. Theses. UC, Riverside, 2010. 77 p. Available at: http://escholarship.org/uc/item/5fv0b84p
[15] Fan G. A method to estimating the parameters of general logistic curve. Journal of Liaoning Normal University, 2009, vol. 32, no. 4, pp. 426-429.
[16] Fan G. A Method to estimating the parameters of logistic model and application. Mathematics in Economics, 2010, vol. 27, no. 1, pp. 105-110.
[17] Chu F.L. Using a logistic growth regression model to forecast the demand for tourism in Las Vegas. Tourism Management Perspectives, 2014, vol. 12, pp. 62-67. DOI: 10.1016/j.tmp.2014.08.003
[18] Pastor R., Guallar E. Use of two-segmented logistic regression to estimate changepoints in epidemiologic studies. Am. J. Epidemiol., 1998, vol. 148, no. 7, pp. 631-642.
[19] Yu J.R., Tzeng G.H., Li H.L. General fuzzy piecewise regression analysis with automatic change-point detection. Fuzzy Sets and Systems, 2001, vol. 119, iss. 2, pp. 247-257.
DOI: 10.1016/S0165-0114(98)00384-4
[20] Yu J.R., Tseng F.M. Fuzzy piecewise logistic growth model for innovation diffusion: A case study of the TV industry. Int. J. Fuzzy Syst., 2016, vol. 18, iss. 3, pp. 511-522.
DOI: 10.1007/s40815-015-0066-8
[21] Yu J.R., Tzeng G.H. Fuzzy multiple objective programming in an interval piecewise regression model. Int. J. Uncertain. Fuzziness Knowl.-Based Syst., 2009, vol. 17, no. 3, pp. 365-376.
Gneushev A.N. — Cand. Sc. (Phys.-Math.), Researcher Fellow, Dorodnitsyn Computing Centre Federal Research Centre Computer Science and Control, Russian Academy of Sciences (Vavilova ul. 40, Moscow, 119333 Russian Federation).
Gurchenkov A.A. — Dr. Sc. (Phys.-Math.), Leading Research Fellow, Dorodnitsyn Computing Centre Federal Research Centre Computer Science and Control, Russian Academy of Sciences (Vavilova ul. 40, Moscow, 119333 Russian Federation).
Moroz I.I. — Junior Researcher Fellow, Dorodnitsyn Computing Centre Federal Research Centre Computer Science and Control, Russian Academy of Sciences (Vavilova ul. 40, Moscow, 119333 Russian Federation).
Please cite this article in English as:
Gneushev A.N., Gurchenkov A.A., Moroz I.I. Direct Method for Estimating Parameters of Two-Segmented Piecewise Logistic Curve. Vestn. Mosk. Gos. Tekh. Univ. im. N.E. Baumana, Priborostr. [Herald of the Bauman Moscow State Tech. Univ., Instrum. Eng.], 2018, no. 1, pp. 31-48 (in Russ.). DOI: 10.18698/0236-3933-20018-1-31-48