Научная статья на тему 'Робастная статистика и ее применение'

Робастная статистика и ее применение Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
153
27
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Харин Юрий

Информация все отчетливее становится высокоценным товаром, который необходимо производить, хранить, обрабатывать, транспортировать и охранять.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Robust statistics and its application

Information increasingly becomes a valuable commodity that needs to produce, store, process, transport and protect.

Текст научной работы на тему «Робастная статистика и ее применение»

ТЕМА НОМЕРА

Юрий Харин

директор Научно-исследовательского института прикладных проблем математики и информатики, член-корреспондент

Робастная статистика и ее применение

Информация все отчетливее становится высокоценным товаром, который необходимо производить, хранить, обрабатывать, транспортировать и охранять. Для развития и координации теоретических и прикладных исследований в области криптографической защиты информации, компьютерного моделирования и анализа данных в 2000 г. в БГУ создан Национальный научно-исследовательский центр прикладных проблем математики и информатики. Впоследствии он был преобразован в научно-исследовательский институт, в структуру которого сейчас входят 7 лабораторий, в том числе испытательная, аккредитованная на проверку средств шифрования, электронной цифровой подписи и хэширования. Идея создания Научно-исследовательского института прикладных проблем математики и информатики (НИИ ППМИ) была сформулирована еще в 1977 г. основателем и первым деканом факультета прикладной математики БГу членом- корреспондентом Евгением Ивановым.

Одно из важнейших достижений НИИ ППМИ — разработка основ теории ро-бастного (от англ. robust — «устойчи-

вый», «стойкий») статистического анализа данных, позволяющего снижать влияние «выбросов» и других искажений в исследуемой выборке. Это помогло решить ряд практических задач дис-криминантного и кластерного анализа, статистического распознавания образов, прогнозирования временных рядов. К наиболее важным из них можно отнести по-прежнему актуальную для Республики Беларусь проблему диагностики злокачественных новообразований, особенно на ранней стадии их развития. Известно, что рост опухоли приводит к изменению биохимических показателей крови (ПК), которые позволяют определять появление болезни значительно раньше (иногда на несколько месяцев), чем с помощью инструментальных, рентгенологических и других средств. Основной статистический метод, применяемый в медицинских исследованиях, — дискриминантный анализ. однако на конечной стадии развития злокачественных опухолей в определенных биохимических ПК регистрируются аномальные «выбросы», наличие которых приводит к снижению точности и эффективности установления диагноза, что влечет за со-

бой необходимость применения робаст-ных решающих правил. В лаборатории статистического анализа данных и моделирования под руководством доцента Абрамовича М.С. совместно с РНПЦ онкологии и медицинской радиологии им. Н.Н. Александрова (РНПЦ ОМР) в 2001—2004 гг. в рамках Госпрограммы «Информационные технологии» была создана экспертная система диагностики злокачественных новообразований на основе биохимических ПК с использованием робастных статистических решающих правил, которая позволила за счет новых алгоритмов повысить точность диагностики более чем на 5%.

Еще одна разработка — компьютерная система определения метастатического поражения у больных с одной из самых распространенных на сегодняшний день злокачественных опухолей — мелано-мой кожи. При хирургическом ее лечении, как правило, профилактически удаляются регионарные лимфоузлы. Это не всегда оправданно и зачастую приводит к увеличению сроков госпитализации больного, а во многих случаях — к инвалидности. Применение традиционных статистических способов не позволяет

22

НАУКА И ИННОВАЦИИ №8(90)_2010

ИНФОРМАЦИОННЫЕ МАГИСТРАЛИ

эффективно выявлять больных, которым показана операция. Разработанный метод статистической классификации дает возможность с минимальной вероятностью ошибки определять необходимость удаления лимфоузлов. Результатом стали повышение точности диагностики, оптимизация процесса принятия решений при хирургическом лечении мела-номы кожи и, как следствие, снижение количества ненужных операций. Разработки внедрены в РНПЦ ОМр, Гродненской областной клинической больнице, Минском городском и ряде областных клинических онкодиспансеров.

В настоящее время совместно с РНПЦ детской онкологии и гематологии создается программный комплекс построения и визуализации кластеров заболеваемости злокачественными новообразованиями у детей и подростков. он позволит выделить основные очаги заболеваемости, сделать выводы о географической вариабельности заболеваемости, смертности, опухолевых характеристиках, лечении, выживаемости и даже о социально-экономических факторах, способствующих развитию рака.

Робастные методы статистического анализа нашли свое прикладное применение и в машиностроении. С 2002 г.

в ходе научно-исследовательской деятельности совместно с МАЗом разработаны методы, алгоритмы оценки комплексных и технико-экономических показателей использования и надежности автотранспортных средств по цензу-рированным выборкам ограниченного объема. Создан программный комплекс, позволяющий формировать более 20 отчетов, касающихся вероятности безотказной работы, оценки ресурса, определения деталей, лимитирующих надежность, технико-экономических показателей эксплуатации и т.д. Комплекс, внедренный в деятельности управления главного конструктора МАза, позволяет оценивать оптимальный ресурс и срок службы автомобилей и, как следствие, избегать значительного увеличения затрат при их эксплуатации. Также появляется возможность установить обоснованные нормативы расхода и объема производства запчастей, периодичности и состава операций техобслуживания, предупредительную систему замен деталей с небольшим ресурсом, которая предотвратит внеплановые ремонты; выделять элементы, требующие первоочередного увеличения надежности. такой системный подход способствует повышению конкурентоспособности автомобилей «МАЗ» на внешнем рынке.

Робастный статистический анализ широко используется и в финансовой сфере. Например, для оценки динамики важнейших макроэкономических показателей было разработано математическое и программное обеспечение — первый отечественный эконометрический пакет прикладных программ «СЭМП», в котором реализованы как традиционные, так и робастные методы статистического прогнозирования. Для построения и анализа денежно-кредитной политики (ДКП) создан инструментарий в виде эконометрических и аналитических моделей — системы, предназначенные для прогнозирования целевых индикаторов и оценки вариантов ДКП: СЭМ-ДКП-1 (2004 г.) и СЭМ-ДКП-2 (2007 г.). Разработки успешно внедрены в практику Национального банка Республики Беларусь.

К числу наиболее актуальных задач управления банковскими рисками, для решения которых активно применяются методы робастного эконометрического прогнозирования, можно отнести анализ устойчивости коммерческих банков, разработку систем раннего предупреждения банковских кризисов, а также оценку кредитоспособности заемщиков, или кредитный скоринг.

Ваза данных больных меланомой кожи 1»С1 без метастатического поражения лимфоузлов

ЁМЩИ Диагностические информативные наборы показателей 0 КОМПЬЮТЕРНАЯ СИСТЕМА ДИАГНОСТИКИ

Ф О Женщины !.....СИ Логистическая регрессия

онкологии и медрадиологии им. Н.Н. Александрова

В-8 Э [¡и База данные больных меланомой кожи В -СП без метастатического поражения лимфоузлов Й -СИ с метастатическим поражением лимфоузлов Возраст | ОТ 50 до 59 Преши.Фон | приобретенный Площадь |б25

(В "СЗ Женщины В "1111 Мужчины : ■ Логистическая регрессия Обобщенный дискриминантный анализ У р. инвазии |5 ^ Толщина |б

На Фоне ЛМД |да ^

Врастание

« Назад | Далее » | Готово | Отмена |

Интерфейс компьютерной системы диагностики метастатического поражения регионарных лимфоузлов у больных меланомой кожи

Прогнозирование макроэкономических показателей на основе многомерной эконометрической модели в ППП СЭМП

№8(90)_2010 НАУКА И ИННОВАЦИИ

23

i Надоели баннеры? Вы всегда можете отключить рекламу.