Научная статья на тему 'Выбор информативных признаков для системы прогнозирования желчнокаменной болезни'

Выбор информативных признаков для системы прогнозирования желчнокаменной болезни Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
91
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЖЕЛЧНОКАМЕННАЯ БОЛЕЗНЬ / CHOLELITHIASIS / ВЫБОР ПРИЗНАКОВ / T-КРИТЕРИЙ СТЬЮДЕНТА И МАННА-УИТНИ ДЛЯ СРАВНЕНИЯ СРЕДНИХ / T-STUDENT TEST AND MANN-WHITNEY TEST FOR COMPARISON OF MEANS / ФАКТОРНЫЙ АНАЛИЗ / КОРРЕЛЯЦИОННЫЙ АНАЛИЗ / CORRELATION ANALYSIS / FEATURE SELECTION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Горбаченко Владимир Иванович, Кузнецов Роман Николаевич, Кузнецова Ольга Юрьевна

Актуальность и цели. В настоящее время в медицине резко увеличился поток и объем информации, в то время как способ ее анализа, как правило, остался прежним. Иначе говоря, разрешение проблем обработки и анализа медицинской информации это узкое место, сдерживающее дальнейшее развитие медицинской науки и повышение эффективности лечебно-диагностической помощи. Цель данного исследования разработка подхода к выбору прогностических признаков на основе группировки статистических методов. Сокращение набора признаков позволит повысить точность прогноза компьютерной системы прогнозирования и сократить затраты и время на получение медицинских анализов. Материалы и методы. Реализация задачи была достигнута за счет использования группировки статистических методов исследования. С помощью методики оценки, основанной на анализе корреляционной связи между входными векторами и выходами в обучающей выборке, был сокращен набор лабораторных показателей для прогнозирования послеоперационных осложнений при желчнокаменной болезни. Результаты. В работе подробно описан комплекс статистических методов, позволяющих уменьшить количество анализов с 15 до 5, используемых для прогнозирования послеоперационных осложнений при желчнокаменной болезни. Выводы. По результатам статистического анализа можно сделать вывод о том, что наиболее информативными признаками являются лейкоциты, нейтрофилы палочкоядерные, лимфоциты, общий билирубин, длительность оперативных вмешательств. Это позволило из множества разнообразных показателей выбрать их минимальное число, достаточное для прогнозирования послеоперационных осложнений при желчнокаменной болезни.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Горбаченко Владимир Иванович, Кузнецов Роман Николаевич, Кузнецова Ольга Юрьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS OF METHODS TO REDUCE THE DIMENSIONALITY OF THE TRAINING DATA OF MEDICAL PATIENTS WITH CHOLELITHIASIS

Background. Currently in medicine have dramatically increased the flow and amount of information, while the method of analysis, as a rule, remained the same, in other words, the resolution of the problems of processing and analysis of medical information is a bottleneck impeding the further development of medical science and the improved treatment and diagnostic services. The purpose of this study is to provide a method for the reduction of the original feature space based on the grouping of statistical methods. Reduction of laboratory parameters allow the doctor to increase the accuracy of the diagnosis, reducing the cost and time of research. Materials and methods. Implementation of the task was achieved through the use of group statistical methods. Using valuation techniques based on the analysis of correlation between the input vectors and the outputs in the training set has been reduced to a set of laboratory parameters for prediction of postoperative complications of cholelithiasis... Background. Currently in medicine have dramatically increased the flow and amount of information, while the method of analysis, as a rule, remained the same, in other words, the resolution of the problems of processing and analysis of medical information is a bottleneck impeding the further development of medical science and the improved treatment and diagnostic services. The purpose of this study is to provide a method for the reduction of the original feature space based on the grouping of statistical methods. Reduction of laboratory parameters allow the doctor to increase the accuracy of the diagnosis, reducing the cost and time of research. Materials and methods. Implementation of the task was achieved through the use of group statistical methods. Using valuation techniques based on the analysis of correlation between the input vectors and the outputs in the training set has been reduced to a set of laboratory parameters for prediction of postoperative complications of cholelithiasis. Results. In the work described in detail the complex statistical methods that reduce the number of tests from 15 to 5, used for predicting postoperative complications of cholelithiasis. Conclusions. According to the results of the statistical analysis, it can be concluded that the most informative features are: Leucocytes, stab Neutrophils, Lymphocytes, Total bilirubin, Duration of surgical interventions. This allowed, from lots of a variety of indicators to select the minimum number sufficient to predict postoperative complications in gallstone disease. function show_eabstract() { $('#eabstract1').hide(); $('#eabstract2').show(); $('#eabstract_expand').hide(); } ▼Показать полностью

Текст научной работы на тему «Выбор информативных признаков для системы прогнозирования желчнокаменной болезни»

УДК 004.032.26

ВЫБОР ИНФОРМАТИВНЫХ ПРИЗНАКОВ ДЛЯ СИСТЕМЫ ПРОГНОЗИРОВАНИЯ ЖЕЛЧНОКАМЕННОЙ БОЛЕЗНИ

В. И. Горбаченко, Р. Н. Кузнецов, О. Ю. Кузнецова

ANALYSIS OF METHODS TO REDUCE THE DIMENSIONALITY OF THE TRAINING DATA OF MEDICAL PATIENTS WITH CHOLELITHIASIS

V. I. Gorbachenko, R. N. Kuznetsov, O. Yu. Kuznetsova

Аннотация. Актуальность и цели. В настоящее время в медицине резко увеличился поток и объем информации, в то время как способ ее анализа, как правило, остался прежним. Иначе говоря, разрешение проблем обработки и анализа медицинской информации - это узкое место, сдерживающее дальнейшее развитие медицинской науки и повышение эффективности лечебно-диагностической помощи. Цель данного исследования - разработка подхода к выбору прогностических признаков на основе группировки статистических методов. Сокращение набора признаков позволит повысить точность прогноза компьютерной системы прогнозирования и сократить затраты и время на получение медицинских анализов. Материалы и методы. Реализация задачи была достигнута за счет использования группировки статистических методов исследования. С помощью методики оценки, основанной на анализе корреляционной связи между входными векторами и выходами в обучающей выборке, был сокращен набор лабораторных показателей для прогнозирования послеоперационных осложнений при желчнокаменной болезни. Результаты. В работе подробно описан комплекс статистических методов, позволяющих уменьшить количество анализов с 15 до 5, используемых для прогнозирования послеоперационных осложнений при желчнокаменной болезни. Выводы. По результатам статистического анализа можно сделать вывод о том, что наиболее информативными признаками являются лейкоциты, нейтрофилы палочкоядерные, лимфоциты, общий билирубин, длительность оперативных вмешательств. Это позволило из множества разнообразных показателей выбрать их минимальное число, достаточное для прогнозирования послеоперационных осложнений при желчнокаменной болезни.

Ключевые слова: желчнокаменная болезнь, выбор признаков, /-критерий Стьюдента и Манна-Уитни для сравнения средних, корреляционный анализ, факторный анализ.

Abstract. Background. Currently in medicine have dramatically increased the flow and amount of information, while the method of analysis, as a rule, remained the same, in other words, the resolution of the problems of processing and analysis of medical information is a bottleneck impeding the further development of medical science and the improved treatment and diagnostic services. The purpose of this study is to provide a method for the reduction of the original feature space based on the grouping of statistical methods. Reduction of laboratory parameters allow the doctor to increase the accuracy of the diagnosis, reducing the cost and time of research. Materials and methods. Implementation of the task was achieved through the use of group statistical methods. Using valuation techniques based on the analysis of correlation between the input vectors and the outputs in the training set has been reduced to a set of laboratory parameters for prediction of postoperative complications of cholelithiasis. Results. In the work described in detail the complex statistical methods that reduce the number of tests from 15 to 5, used for predicting postoperative

complications of cholelithiasis. Conclusions. According to the results of the statistical analysis, it can be concluded that the most informative features are: Leucocytes, stab Neutrophils, Lymphocytes, Total bilirubin, Duration of surgical interventions. This allowed, from lots of a variety of indicators to select the minimum number sufficient to predict postoperative complications in gallstone disease.

Key words: cholelithiasis, feature selection, /-Student test and Mann-Whitney test for comparison of means, correlation analysis.

Введение

Желчнокаменная болезнь (ЖКБ) относится к наиболее распространенным заболеваниям в мире и занимает третье место после сердечнососудистых заболеваний и сахарного диабета [1, 2]. По данным разных авторов, 10-20 % взрослого населения России и Европы страдают ЖКБ. Количество осложнений после открытых операций на желчевыводящих путях колеблется от 3,7 до 37,3 % [3-5]. Уровень послеоперационных осложнений напрямую связан с длительностью пребывания пациента в стационаре, что обуславливает рост экономических затрат на лечение данной группы больных. Сложность диагностики и прогнозирования ЖКБ вызывает необходимость разработки системы прогнозирования этого заболевания, которая будет являться системой поддержки принятия решения врачом. Компьютерные системы медицинской диагностики и прогнозирования, особенно построенные на основе нейронных и нейро-нечетких сетей, интенсивно развиваются и показали свою эффективность [6-9]. Но для ЖКБ подобные системы отсутствуют. Построение систем диагностики и прогнозирования основано на машинном обучении. При этом система, обученная на большом наборе зашум-ленных, не относящихся к делу или неправильно маркированных данных, не будет работать лучше, чем система, обученная на меньшем наборе данных, которые более адекватны задачам в реальном мире. Для этого необходим выбор надежных прогностических признаков (Feature selection) [10-11].

Цель данного исследования - разработка подхода к выбору прогностических признаков на основе группировки статистических методов. Выбор наиболее значимых признаков позволит повысить точность прогноза компьютерной системы и сократить затраты и время на получение медицинских анализов.

1. Постановка задачи

Для решения задачи прогнозирования послеоперационных осложнений при желчнокаменной болезни была сформирована группа наблюдений, которая составила 109 историй болезни пациентов отделения торакальной хирургии областной клинической больницы им. Н. Н. Бурденко. Из них 63 случая без осложнения, 46 осложненных случаев. Использовано 15 показателей на основе общего и биохимического анализа крови (гемоглобин, эритроциты, цветовой показатель, лейкоциты, нейтрофилы палочкоядерные, нейтрофилы сегментоядерные, лимфоциты, моноциты, скорость оседания эритроцитов, общий белок, общий билирубин, амилаза, мочевина, креатинин, глюкоза), а также два дополнительных показателя (длительность оперативных вмешательств, пол) [5, 12-13]. Данная группа наблюдений в дальнейшем будет использоваться как обучающая выборка для системы прогнозирования.

Цель исследования заключается в сокращении исходного пространства признаков, которое производится путем решения следующих основных задач:

1) анализ эмпирического распределения для выяснения возможности применения различных статистических методов для отбора информативных показателей;

2) изучение совпадений или различий показателей исследуемых объектов для выявления наиболее информативных признаков;

3) исследование наличия/отсутствия зависимости между показателями и количественное описание этих зависимостей; задачей медицинского исследования является получение связи между факторами, воздействующими на организм, и параметром-откликом на это воздействие;

4) использование факторного анализа для выбора признаков.

2. Анализ эмпирического распределения

Для выяснения возможности применения различных статистических методов необходимо провести проверку на соответствие нормальному закону распределения медицинских анализов. Данная проверка осуществлялась средствами статистического пакета StatSoft STATISTICA 10.0 [14].

Эмпирическое распределение переменной представляется в виде статистического ряда распределения, характеризующего связь между возможными значениями переменной и частотой их наблюдений в выборке. Для построения статистического ряда распределения в выборке необходимо иметь несколько десятков и более наблюдений, которые группируются в m интервалов. Выбор числа интервалов в группировке возможен по формуле Стерджес-са [15]:

m = 1 + 3,322lgN,

где N - объем выборки.

По данным статистического ряда распределения строится гистограмма. По виду гистограммы делаются предварительные выводы о характере и соответствии эмпирического распределения нормальному закону распределения. По результатам статистической проверки видно, что такие показатели, как гемоглобин, лимфоциты, общий белок, имеют эмпирическое распределение, близкое к нормальному, остальные показатели не подчиняются нормальному закону распределения.

Из этого следует, что для обработки данных доступны не все методы статистического анализа. В дальнейшем будем применять непараметрические методы, которые позволяют исследовать данные без каких-либо допущений о характере распределения переменных, в том числе при нарушении требования нормальности распределения.

3. Изучение совпадений или различий показателей для выявления наиболее информативных признаков

Типовой задачей анализа данных в медико-биологических исследованиях является установление совпадений или различий характеристик экспериментальной и контрольной группы. Для этого формулируются статистические гипотезы: гипотеза об отсутствии различий (так называемая нулевая ги-

потеза), гипотеза о значимости различий (так называемая альтернативная гипотеза). Так как данные не подчиняются закону нормального распределения, то для проверки гипотезы о совпадении характеристик двух групп целесообразно использование непараметрического метода Вилкоксона (Манна-Уитни) [15]:

и = Щп2 + "х ("2* + ^ " Гх ,

где п1 - количество элементов в первой выборке; п2 - количество элементов во второй выборке; Тх - сумма рангов, соответствующая выборке с пх элементами.

Проанализировав результаты метода Вилкоксона (Манна-Уитни), можно сделать вывод о том, что средние значения анализов больных с осложнениями и больных без осложнений значимо различаются у следующих показателей: лейкоциты, нейтрофилы палочкоядерные, лимфоциты, общий билирубин, длительность оперативных вмешательств. Поэтому эти факторы следует включить в выборку для системы прогнозирования.

4. Исследование наличия/отсутствия зависимости между показателями

Одной из важных задач медицинского исследования является получение связи между факторами, воздействующими на организм, и параметром-откликом на это воздействие, а также моделирование этого параметра в зависимости от действующего фактора. Для понижения размерности входных данных были проанализированы все показатели пациентов с осложнениями и пациентов без осложнений. Для выявления зависимостей между переменными и результатом (наличие/отсутствие осложнений) был проведен корреляционный анализ. Так как данные не подчиняются нормальному закону распределения, целесообразно использовать непараметрические коэффициенты связи - коэффициенты ранговой корреляции Спирмена и Кендалла. Коэффициент Спирмена вычисляется по формуле [16-18]

6У й2

Р = 1 ~12 V

п (п2 -1)

где ! й2 - сумма квадратов разностей рангов; п - число парных наблюдений.

Коэффициент ранговой корреляции Кендалла применяется для выявления взаимосвязи между количественными или качественными показателями, если их можно ранжировать, и рассчитывается по формуле [16-18]

п-1

4! Я

х = ——--1,

п (п -1)

где п - объем выборки (число сопоставляемых пар); Я - число рангов во втором вариационном ряду, больших, чем данное ранговое число и расположенных ниже него. Достоверность коэффициентов корреляции Спирмена и Кендалла оценивается на основе рассчитанного /-критерия Стьюдента:

г = -

г

ху\

1 - г2 ' п - 2

где

1 - г2 х

ху = тг - средняя квадратичная ошибка коэффициента корреля-

V п - 2

ции; гху - коэффициент корреляции.

Рассчитанные значения 1>критерия сравнивают с критическим ^ 05, соответствующим уровню значимости р = 0,05 . При г < г005 коэффициент корреляции считают незначимым (уровень значимости р > 0,05). При г > г005 коэффициент корреляции считают значимым (уровень значимости р < 0,05).

Проанализировав результаты расчета коэффициентов корреляции, можно сделать вывод о том, что наиболее коррелированными с результатом анализами являются лейкоциты, нейтрофилы палочкоядерные, общий билирубин, длительность оперативных вмешательств. Эти факторы следует включить в выборку для системы прогнозирования.

5. Использование факторного анализа для выбора признаков

В медицинских исследованиях всегда имеется большое общее количество исследуемых связей. Однако многие из них будут статистически незначимыми, и при отсутствии клинической значимости их не надо принимать во внимание и интерпретировать. Как правило, статистически и клинически значимыми оказываются 5-25 % всех возможных связей [19]. Для решения этой проблемы может применяться факторный анализ.

На предварительном этапе исходные переменные, на основе которых будут отыскиваться факторы, стандартизуются. Под стандартизацией понимается вычитание из каждого значения переменной ее среднего значения с последующим делением полученного результата на среднеквадратическое отклонение этой переменной. После стандартизации среднее значение каждой исходной переменной становится равным нулю, а дисперсия - единице. Общая дисперсия стандартизированных данных равна сумме дисперсий переменных, т.е. числу переменных. В нашем случае мы имеем 15 переменных, каждая из которых имеет дисперсию 1, поэтому общая дисперсия данных равна 15. Это наибольшая изменчивость, которая потенциально может быть выделена с помощью метода главных компонент. Для выделения факторов был использован метод главных компонент.

Рассмотрим модель факторного анализа [20]. Пусть задана система переменных Х1, Х2,..., Хп . Значения переменных или признаков Х1, Х2,..., Хп известны для каждого из N объектов. Представим исходную информацию в виде матрицы Х = х у размерности (п XN). Каждая строка состоит из значений одного показателя для каждого из N объектов исследования. Предполагается, что каждый элемент этой матрицы х^ является результатом воздей-

ствия некоторого числа т гипотетических общих факторов и одного характерного фактора:

где а/г - весовой коэффициент /-й переменной на г-м общем факторе (или нагрузка /-й переменной на г-м общем факторе); - значение г-го общего фактора на ,-м объекте исследования; й / - нагрузка или весовой коэффициент /-й переменной на /-м характерном факторе; у^ - значение /-го характерного фактора на ,-м объекте исследования; / = 1,..., п; , = 1,..., N; г = 1,..., т; т ■ п.

Так как массив данных X = Х/ представляет величины различной размерности, для того чтобы перейти к безразмерным величинам, пронормируем элементы массива.

где X/ - выборочное среднее /-й переменной (признака); Б/ - выборочная дисперсия /-й переменной. После этих преобразований получим

где ajm - неизвестные коэффициенты, называемые факторными нагрузками; dJvJi называется остатком (невязкой) или остаточным специфическим фактором. Задача состоит в том, чтобы оценить ajm некоторым оптимальным образом.

В качестве критерия оптимальности использовали минимум расхождения между ковариационной матрицей исходных признаков и той, которая получается после оценивания факторных нагрузок (мера «расхождения» двух матриц, в данном случае есть просто евклидова норма их разности), это приводит к методу главных компонент. Главные компоненты упорядочиваются в порядке убывания той дисперсии, которую они «объясняют». Первая главная компонента объясняет большую часть дисперсии, чем вторая, вторая -большую, чем третья, и т.д. Решение об остановке процедуры выделения факторов принимается на основании критерия Кайзера. При использовании данного критерия, если фактор не выделяет дисперсию, эквивалентную, по крайней мере, дисперсии одной переменной, он опускается [20].

Результатом выполнения факторного анализа в пакете StatSoft STATISTICA 10.0, были определены следующие два фактора:

- фактор 1 (Ф-1) (показатели: гемоглобин, эритроциты, цветовой показатель, общий белок);

- фактор 2 (Ф-2) (показатели: общий билирубин, лимфоциты, лейкоциты, нейтрофилы палочкоядерные).

Проанализировав результаты расчета факторного анализа, можно выделить следующие факторы для включения их в выборку для системы про-

xij = aj1fu + aj2 f2i + ... + ajnfn + ... + aj-mfmi + djVji ,

У у = aj1f1. + aj 2f2 i + ... + ajnfn + ... + ajmfmt + djV,

гнозирования: гемоглобин, эритроциты, цветовой показатель, общий белок, общий билирубин, лимфоциты, лейкоциты, нейтрофилы палочкоядерные.

Заключение

В табл. 1 приведены результаты статистического исследования обучающей выборки различными методами, для того чтобы выбрать наиболее информативный набор входных анализов. В данной таблице знаком + обозначена информативность анализа в каждом методе.

Таблица 1

Результат исследования данных

Название Критерий Вилкоксона Корреляционный анализ Факторный анализ

(Манна-Уитни)

1. Гемоглобин +

2. Эритроциты +

3. Цветовой показатель +

4. Лейкоциты + + +

5. Нейтрофилы палочкоядерные + + +

6. Нейтрофилы сегментоядерные

7. Лимфоциты + +

8. Моноциты

9. Скорость оседания эритроцитов

10. Общий билирубин + + +

11. Общий белок +

12. Амилаза

13. Глюкоза

14. Длительность оперативных + +

вмешательств

15. Пол

Для дальнейшей диагностики выбирались те анализы, информативность которых подтвердилась большинством методов. Наиболее информативными признаками являются лейкоциты, нейтрофилы палочкоядерные, лимфоциты, общий билирубин, длительность оперативных вмешательств, что позволило сократить число анализов с 15 до 5.

Это дало возможность из множества разнообразных показателей выбрать их минимальное число, достаточное для прогнозирования послеоперационных осложнений при желчнокаменной болезни.

Список литературы

1. Головской, Б. В. Новый диагностический синдром при хроническом бескамерном холецистите / Б. В. Головской // Третий Всесоюзный съезд гастроэнтерологов : материалы съезда. - М., 1984. - Т. 1. - С. 238-239.

2. Ильченко, А. А. Желчнокаменная болезнь / А. А. Ильченко. - М. : Анахарсис, 2004. - 200 с.

3. Ultrasoundin Gastroenterology and Hepatology / ed. by M. Gebel. - Berlin, Wien : Blackwel-Wiss.-Verl, 1999. - 269 p.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Галкин, В. А. Хронический некалькулезный холецистит / В. А. Галкин. - М. : Медицина, 1986. -128 с.

5. Биохимический анализ крови: нормы, показатели, результаты и расшифровка. Биохимия крови. - URL: http://www.policlinica.ru/analiz3_1.html

6. Steyerberg, E. Clinical Prediction Models: A Practical Approach to Development, Validation, and Updating / E. Steyerberg. - Springer, 2009. - 500 p.

7. Moein, S. Medical Diagnosis Using Artificial Neural Networks / S. Moein. - Hershey, PA, United States : IGI Global, 2014. - 310 p.

8. Kumar, A. V. Fuzzy Expert Systems for Disease Diagnosis / A. V. Kumar. - Hershey, PA, United States : IGI Global, 2014. - 401 p.

9. Кузнецова, О. Ю. Нейросетевые и нейро-нечеткие технологии диагностики синдрома эндогенной интоксикации с почечной дисфункцией / О. Ю. Кузнецова, В. И. Горбаченко, А. А. Соломаха. - Пенза : Приволж. Дом знаний, 2014. - 236 с.

10. Liu, H. Computational Methods of Feature Selection / H. Liu, H. Motoda. - Boca Ration ; London ; New York ; Washington, D.C. : Chapman and Hall/CRC, 2007. - 440 p.

11. An Introduction to Statistical Learning: with Applications in R / G. James, D. Witten, T. Hastie, R. Tibshirani. - Springer, 2013. - 426 p.

12. Лабораторная гематология / С. А. Луговская, В. Т. Морозова, М. Е. Почтарь, В. В. Долгов. - М., 2002. - 116 с.

13. Тица, Н. У. Клиническое руководство по лабораторным тестам / Н. У. Тица. -М., 2003. - 942 с.

14. Куприенко, Н. В. Статистика. Методы анализа распределений. Выборочное наблюдение / Н. В. Куприенко, О. А. Пономарева, Д. В. Тихонов. - СПб. : Изд-во Политехн. ун-та, 2009. - 138 с.

15. Юнкеров, В. И. Математико-статистическая обработка данных медицинских исследований / В. И. Юнкеров, С. Г. Григорьев. - СПб. : ВМедА, 2002. - 266 с.

16. Лагутин, М. Б. Наглядная математическая статистика : в 2 т. / М. Б. Лагутин. -М. : П-центр, 2003. - Т. 1. - 345 с. ; Т. 2. - 346 с.

17. Лапач, С. Н. Статистика в науке и бизнесе / С. Н. Лапач, А. В. Чубенко, П. Н. Бабич. - Киев : Морион, 2002. - С. 187-189.

18. Юнкеров, В. И. Математико-статистическая обработка данных медицинских исследований / В. И. Юнкеров, С. Е. Григорьев. - СПб. : ВМедА, 2002. - 266 с.

19. Реброва, О. Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA / О. Ю. Реброва. - М. : МедиаСфера, 2006. - 312 с.

20. Халафян, А. А. STATISTICА 6. Статистический анализ данных / А. А. Халафян. -М. : ООО «Бином-Пресс», 2007. - 512 с.

Горбаченко Владимир Иванович

доктор технических наук, профессор, кафедра компьютерных технологий, Пензенский государственный университет E-mail: gorvi@mail.ru

Кузнецов Роман Николаевич

ведущий программист,

Пензенский государственный университет

E-mail: nahab007@rambler.ru

Gorbachenko Vladimir Ivanovich doctor of technical sciences, professor, sub-department of computer technology, Penza State University

Kuznetsov Roman Nikolaevich lead programmer, Penza State University

Кузнецова Ольга Юрьевна кандидат технических наук, доцент, кафедра информационно-вычислительных систем,

Пензенский государственный университет E-mail: ellekasandra@yandex.ru

Kuznetsova Olga Yurjevna candidate of technical sciences, associate professor, sub-department of information and computing system, Penza State University

УДК 004.032.26 Горбаченко, В. И.

Выбор информативных признаков для системы прогнозирования желчнокаменной болезни / В. И. Горбаченко, Р. Н. Кузнецов, О. Ю. Кузнецова // Модели, системы, сети в экономике, технике, природе и обществе. - 2016. - № 1 (17). - С. 233-241.

i Надоели баннеры? Вы всегда можете отключить рекламу.