Научная статья на тему 'Подходы к обработке экспериментальных данных в условиях ограниченной информации'

Подходы к обработке экспериментальных данных в условиях ограниченной информации Текст научной статьи по специальности «Математика»

CC BY
165
62
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЧИСЛЕННЫЙ ВЕРОЯТНОСТНЫЙ АНАЛИЗ / МАЛЫЕ ВЫБОРКИ / ЭМПИРИЧЕСКАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ

Аннотация научной статьи по математике, автор научной работы — Чевер А. А.

В данной статье рассмотрены некоторые подходы к определению понятия малой выборки, её размерности и отнесение выборки к категории малой или большой. Рассматривается проблема оценивания функции распределения в условиях ограниченного объема информации. Предлагается метод сглаживания эмпирической функции распределения на основе кубических сплайнов и процедур численного вероятностного анализа.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Подходы к обработке экспериментальных данных в условиях ограниченной информации»

136

НАУЧНЫЕ ИССЛЕДОВАНИЯ И РАЗРАБОТКИ МОЛОДЫХ УЧЕНЫХ

Выводы:

1. Разработана композиция на основе акриламида и цитрата серебра для получения в процессе крашения полифункциональной отделки шерстяного топса (волокна).

2. Применение данной композиции позволяет получить антимикробные свойства на шерстяных текстильных материалах, повышении их прочности и износостойкости при последующей механической переработке.

3. Применение композиции с цитратом серебра позволяет совместить процесс крашения и заключительной отделки, в результате чего волокно приобретает высокую износостойкость и антимикробность;

Список литературы:

1. Пехташева Е.Л. Биоповреждения и защита непродовольственных товаров. - М.: Мастерство, 2002. - 224 с.

2. Сафонов В.В. Биохимические процессы в отделочном производстве. -М., 2005. - 215 с.

3. Технологические расчеты в химической технологии волокнистых материалов / Под ред. Л.И. Беленького. - 2-е изд., перераб. и доп. - М.: Высш. шк., 1985 - 240 с.

ПОДХОДЫ К ОБРАБОТКЕ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ В УСЛОВИЯХ ОГРАНИЧЕННОЙ ИНФОРМАЦИИ

© Чевер А.А.*

Институт космических и информационных технологий Сибирского федерального университета, г. Красноярск

В данной статье рассмотрены некоторые подходы к определению понятия малой выборки, её размерности и отнесение выборки к категории малой или большой. Рассматривается проблема оценивания функции распределения в условиях ограниченного объема информации. Предлагается метод сглаживания эмпирической функции распределения на основе кубических сплайнов и процедур численного вероятностного анализа.

Ключевые слова: численный вероятностный анализ, малые выборки, эмпирическая функция распределения.

В современной практике часто приходится обрабатывать результаты многократных измерений наблюдаемой величины. Это касается выходных

Магистрант.

Технические науки

137

сигналов нескольких датчиков, измеряющих одну и ту же величину (температура, давление, изменение состояние объекта или навигационные параметры). Алгоритм обработки полученных измерительных данных напрямую зависит от размера полученных данных, называемых выборками. Во многих случаях практикам и исследователям приходится сталкиваться с небольшим объемом данных, то есть с малыми выборками. Например, малые выборки имеют место в следующих областях: службы контроля качества предприятий, имеющих мелкосерийное производство; производство и эксплуатация дорогостоящих и высоконадежных технических изделий. Аналогичные примеры можно отыскать в медицине, биологии и т.д.

Анализ литературы и публикаций по данной тематике выявил наличие такой проблемы, как отсутствие единого подхода к определению понятия «малая выборка» и задания верхней границы между малой и большой выборками. Существует несколько подходов к определению понятия малой выборки. Согласно А.А. Вовк, малая выборка - выборочное наблюдение, основанное на изучении небольшого числа наблюдений [2]. Автор поясняет, что верхнее значение малой выборки, как правило, не должно превышать 30. Малая выборка - малое число наблюдений над случайной величиной, описывающей случайное явление. Таким видят понятие малой выборки в своей публикации Д.В. Гаскаров и В.И. Шаповалов [1].

В обработке данных, численном моделировании и анализе важное место занимает проблема отнесения выборки к классу «малых» или «больших». Другими словами, какова должна быть размерность и, соответственно, граница отнесения выборки к категории малых или больших выборок. Для определения критерия верхней границы выборки есть два основных правила: верхняя граница зависит от предъявляемых требований к точности результатов или от используемого способа обработки данных, то есть от того, насколько математический аппарат способен извлечь («выжать») информацию из выборочных данных, проводя, например, статистическую обработку данных с целью извлечения знаний из выборки [2].

При этом важно оценить, какое количество информации содержится в выборке заданного объема и какое количество информации необходимо для получения результата с заданной точностью и достоверностью.

С такой точки зрения можно полагать, что выборка является малой, если она содержит количество информации, недостаточное для получения заданной точности и достоверности в решаемой задаче. Если нет возможности точно оценить количество информации, с которой имеет дело статистик, то это необходимо сделать хотя бы приближенно.

Таким образом, выборку следует считать малой, если при ее обработке методами, основанными на группировке наблюдений, нельзя достичь заданных точности и достоверности.

В настоящее время все значимее становится проблема разработки методов статистического анализа данных в условиях малых выборок. Основны-

138

НАУЧНЫЕ ИССЛЕДОВАНИЯ И РАЗРАБОТКИ МОЛОДЫХ УЧЕНЫХ

ми задачами таких исследований являются: оценивание закона распределения (вычисление количественных характеристик случайной величины по конечной выборке; оценивание моментов случайной величины; проверка статистических гипотез; оценивание статистических зависимостей).

При анализе имеющейся информации ограниченного объема в условиях различного вида неопределенностей задача оценивания функции распределения представляет важную проблему. Основным методом ее решения в таких условиях является построение эмпирической функции распределения, имеющей вид ступенчатой функции. Эта задача приобретает особое значение для выборок очень малого объема, содержащих менее десяти наблюдений. Отметим, что умение строить хорошую (в вероятностном смысле) оценку функции распределения при малых выборках дает возможность вычислять хорошие оценки моментов случайной величины и более уверенно, т.е. с меньшими ошибками первого и второго рода, принимать решение при проверке статистических гипотез [3, 5].

Рассмотрим задачу построения эмпирической функции распределения одномерной непрерывной случайной величины X. Пусть дана выборка x1, x2, ..., xn. Не ограничивая общности, будем считать, что последовательность xi монотонно возрастающая. Пусть

m

Fn = P(X < х) = —. (1)

n

Если теперь рассматривать Fn как функцию x то формула (1) является оценкой функции распределения F(x). Выражение (1) называется эмпирической функцией распределения. Необходимо заметить, что эмпирическая функция распределения проходит через точки (xj, i/n).

Важно отметить, что поскольку эмпирическая функция распределения не является непрерывно дифференцируемой, то функцию плотности вероятности получить непосредственно дифференцированием нельзя. Для этих целей в работе [3] предлагается метод сглаживания эмпирической функции распределения на основе кубических сплайнов Эрмита s. Функционал для сглаживания можно записать в виде

n

ф( z) = х (s( X) - Hn)2 + а\\s"||2,

i=i

где а - параметр сглаживания, ||-|| - евклидова норма.

На рис. 1. представлен пример сглаживания эмпирической функции распределения по выборке x1, x2, ., xn, n = 7, распределенной по треугольному закону на отрезке [0, 2], с вершиной в точке (1, 1). Цифрами представлены соответственно: 3 - эрмитовый сплайн, представляющий сглаженную функцию распределения, 2 - точная функция распределения, 1 - эмпирическая функция распределения.

Технические науки

139

Рис. 1. Сглаживание эмпирической функции распределения [3]

Рис. 2. Гистограмма, аппроксимирующая функцию плотности вероятности и точная функции

Список литературы:

1. Гаскаров Д.В., Шаповалов В.И. Малая выборка. - М.: Статистика, 1978. - 248 с.

2. Вовк А.А. Основы общей теории статистики. - М.: Маршрут. 2006. -240 с.

3. Dobronets B., Popova O. Numerical probabilistic approach for data nonparametric analysis // В сборнике: Applied methods of statistical analysis. Nonparametric approach. Proceedings of the international workshop. - 2015. - С. 376-384.

4. Добронец Б.С., Попова О.А. Элементы численного вероятностного анализа // Вестник Сибирского государственного аэрокосмического университета им. академика М.Ф. Решетнева. - 2012. - № 2 (42). - С. 19-23.

5. Добронец Б.С., Попова О.А. Численный вероятностный анализ неопределенных данных: монография / Сибирский федеральный университет, Институт космический и информационных технологий. - Красноярск, 2014. -167 с.

6. Добронец Б.С., Попова О.А. Численный вероятностный анализ для исследования систем в условиях неопределенности // Вестник Томского го-

140

НАУЧНЫЕ ИССЛЕДОВАНИЯ И РАЗРАБОТКИ МОЛОДЫХ УЧЕНЫХ

сударственного университета. Управление, вычислительная техника и информатика. - 2012. - № 4 (21). - С. 39-46.

7. Добронец Б.С., Попова О.А. Представление и обработка неопределенности на основе гистограммных функций распределения и P-Boxes // Информатизация и связь. - 2014. - № 2. - С. 23-26.

8. Добронец Б.С., Попова О.А. Гистограммный подход к представлению и обработке данных космического и наземного мониторинга // Известия ЮФУ Технические науки. - 2014. - № 6 (155). - С. 14-22.

9. Попова О.А. Гистограммный информационно - аналитический подход к представлению и прогнозированию временных рядов // Информатизация и связь. - 2014. - № 2. - С. 43-47.

10. Попова О.А. Численный вероятностный анализ для агрегации, регрессионного моделирования и анализа данных // Информатизация и связь. -2015. - № 1. - С. 15-21.

11. Dobronets B.S., Krantsevich A.M., Krantsevich N.M. Software implementation of numerical operations on random variables // Журнал Сибирского федерального университета. Серия: Математика и физика. - 2013. - Т. 6. № 2. -С. 168-173.

12. Uglev VA., Popova O.A., Dobronets B.S. The accuracy calculation control of reliability indices for equipment responsible appointment // International Siberian Conference on Control and Communications (SIBCON). - Omsk: OmGTU, 2015. Print ISBN: 978-1-4799-7102-2 DOI: 10.1109/SIBCON.2015. 7147248.

i Надоели баннеры? Вы всегда можете отключить рекламу.