ТЕМА НОМЕРА
Юрий Харин
директор Научно-исследовательского института прикладных проблем математики и информатики, член-корреспондент
Робастная статистика и ее применение
Информация все отчетливее становится высокоценным товаром, который необходимо производить, хранить, обрабатывать, транспортировать и охранять. Для развития и координации теоретических и прикладных исследований в области криптографической защиты информации, компьютерного моделирования и анализа данных в 2000 г. в БГУ создан Национальный научно-исследовательский центр прикладных проблем математики и информатики. Впоследствии он был преобразован в научно-исследовательский институт, в структуру которого сейчас входят 7 лабораторий, в том числе испытательная, аккредитованная на проверку средств шифрования, электронной цифровой подписи и хэширования. Идея создания Научно-исследовательского института прикладных проблем математики и информатики (НИИ ППМИ) была сформулирована еще в 1977 г. основателем и первым деканом факультета прикладной математики БГу членом- корреспондентом Евгением Ивановым.
Одно из важнейших достижений НИИ ППМИ — разработка основ теории ро-бастного (от англ. robust — «устойчи-
вый», «стойкий») статистического анализа данных, позволяющего снижать влияние «выбросов» и других искажений в исследуемой выборке. Это помогло решить ряд практических задач дис-криминантного и кластерного анализа, статистического распознавания образов, прогнозирования временных рядов. К наиболее важным из них можно отнести по-прежнему актуальную для Республики Беларусь проблему диагностики злокачественных новообразований, особенно на ранней стадии их развития. Известно, что рост опухоли приводит к изменению биохимических показателей крови (ПК), которые позволяют определять появление болезни значительно раньше (иногда на несколько месяцев), чем с помощью инструментальных, рентгенологических и других средств. Основной статистический метод, применяемый в медицинских исследованиях, — дискриминантный анализ. однако на конечной стадии развития злокачественных опухолей в определенных биохимических ПК регистрируются аномальные «выбросы», наличие которых приводит к снижению точности и эффективности установления диагноза, что влечет за со-
бой необходимость применения робаст-ных решающих правил. В лаборатории статистического анализа данных и моделирования под руководством доцента Абрамовича М.С. совместно с РНПЦ онкологии и медицинской радиологии им. Н.Н. Александрова (РНПЦ ОМР) в 2001—2004 гг. в рамках Госпрограммы «Информационные технологии» была создана экспертная система диагностики злокачественных новообразований на основе биохимических ПК с использованием робастных статистических решающих правил, которая позволила за счет новых алгоритмов повысить точность диагностики более чем на 5%.
Еще одна разработка — компьютерная система определения метастатического поражения у больных с одной из самых распространенных на сегодняшний день злокачественных опухолей — мелано-мой кожи. При хирургическом ее лечении, как правило, профилактически удаляются регионарные лимфоузлы. Это не всегда оправданно и зачастую приводит к увеличению сроков госпитализации больного, а во многих случаях — к инвалидности. Применение традиционных статистических способов не позволяет
22
НАУКА И ИННОВАЦИИ №8(90)_2010
ИНФОРМАЦИОННЫЕ МАГИСТРАЛИ
эффективно выявлять больных, которым показана операция. Разработанный метод статистической классификации дает возможность с минимальной вероятностью ошибки определять необходимость удаления лимфоузлов. Результатом стали повышение точности диагностики, оптимизация процесса принятия решений при хирургическом лечении мела-номы кожи и, как следствие, снижение количества ненужных операций. Разработки внедрены в РНПЦ ОМр, Гродненской областной клинической больнице, Минском городском и ряде областных клинических онкодиспансеров.
В настоящее время совместно с РНПЦ детской онкологии и гематологии создается программный комплекс построения и визуализации кластеров заболеваемости злокачественными новообразованиями у детей и подростков. он позволит выделить основные очаги заболеваемости, сделать выводы о географической вариабельности заболеваемости, смертности, опухолевых характеристиках, лечении, выживаемости и даже о социально-экономических факторах, способствующих развитию рака.
Робастные методы статистического анализа нашли свое прикладное применение и в машиностроении. С 2002 г.
в ходе научно-исследовательской деятельности совместно с МАЗом разработаны методы, алгоритмы оценки комплексных и технико-экономических показателей использования и надежности автотранспортных средств по цензу-рированным выборкам ограниченного объема. Создан программный комплекс, позволяющий формировать более 20 отчетов, касающихся вероятности безотказной работы, оценки ресурса, определения деталей, лимитирующих надежность, технико-экономических показателей эксплуатации и т.д. Комплекс, внедренный в деятельности управления главного конструктора МАза, позволяет оценивать оптимальный ресурс и срок службы автомобилей и, как следствие, избегать значительного увеличения затрат при их эксплуатации. Также появляется возможность установить обоснованные нормативы расхода и объема производства запчастей, периодичности и состава операций техобслуживания, предупредительную систему замен деталей с небольшим ресурсом, которая предотвратит внеплановые ремонты; выделять элементы, требующие первоочередного увеличения надежности. такой системный подход способствует повышению конкурентоспособности автомобилей «МАЗ» на внешнем рынке.
Робастный статистический анализ широко используется и в финансовой сфере. Например, для оценки динамики важнейших макроэкономических показателей было разработано математическое и программное обеспечение — первый отечественный эконометрический пакет прикладных программ «СЭМП», в котором реализованы как традиционные, так и робастные методы статистического прогнозирования. Для построения и анализа денежно-кредитной политики (ДКП) создан инструментарий в виде эконометрических и аналитических моделей — системы, предназначенные для прогнозирования целевых индикаторов и оценки вариантов ДКП: СЭМ-ДКП-1 (2004 г.) и СЭМ-ДКП-2 (2007 г.). Разработки успешно внедрены в практику Национального банка Республики Беларусь.
К числу наиболее актуальных задач управления банковскими рисками, для решения которых активно применяются методы робастного эконометрического прогнозирования, можно отнести анализ устойчивости коммерческих банков, разработку систем раннего предупреждения банковских кризисов, а также оценку кредитоспособности заемщиков, или кредитный скоринг.
Ваза данных больных меланомой кожи 1»С1 без метастатического поражения лимфоузлов
ЁМЩИ Диагностические информативные наборы показателей 0 КОМПЬЮТЕРНАЯ СИСТЕМА ДИАГНОСТИКИ
Ф О Женщины !.....СИ Логистическая регрессия
онкологии и медрадиологии им. Н.Н. Александрова
В-8 Э [¡и База данные больных меланомой кожи В -СП без метастатического поражения лимфоузлов Й -СИ с метастатическим поражением лимфоузлов Возраст | ОТ 50 до 59 Преши.Фон | приобретенный Площадь |б25
(В "СЗ Женщины В "1111 Мужчины : ■ Логистическая регрессия Обобщенный дискриминантный анализ У р. инвазии |5 ^ Толщина |б
На Фоне ЛМД |да ^
Врастание
« Назад | Далее » | Готово | Отмена |
Интерфейс компьютерной системы диагностики метастатического поражения регионарных лимфоузлов у больных меланомой кожи
Прогнозирование макроэкономических показателей на основе многомерной эконометрической модели в ППП СЭМП
№8(90)_2010 НАУКА И ИННОВАЦИИ
23