Оценка влияния условий труда на параметры крови с помощью нейросетей
Решетникова Н.В., Петровская В.А., Товбис Е.М., Привалко Е.Ю., Жуков Л.А.
Сибирский Государственный Технологический Университет Красноярская городская детская больница 2 Красноярская краевая станция переливания крови E-mail: [email protected] http://zhukov.wallst.ru
В настоящей работе производилась обработка гематологических, биохимических и иммунологических исследований доноров электролизных цехов алюминиевого завода, подвергающихся иммунному плазмоферезу на основе нейросетей с учителем [1].
Использовались следующие параметры: величина титра антител, число плазмаферезов и некоторые изучаемые гематологические, биохимические, иммунологические характеристики, указывающие на функциональные сдвиги в системе гомеостаза в ответ на введение стафилококкового антигена и под влиянием многолетних плазмаферезов [2].
Данные параметры были сведены в файлы данных формата DBASE, отдельные для каждой категории рабочих. Файл с анодчиками содержит 266 записей, электролизники - 186 записей, крановщики 168, слесари - 198, сварщики - 130, студенты - 472.
При обработке использовался нейроимитатор NeuroPro версии 0.25. Были созданы и обучены несколько нейронных сетей с различными параметрами [1].
В качестве поля ответа использовалось поле - общее количество лейкоцитов
[3].
Таблица 1. Описание входных параметров_
№ Поле Xmax Описание
Гематологические показатели
1 X2 450,0 Гемоглобин (г/л)
2 X6 11,4 Лейкоциты (х10**9/л)
3 X7 13,0 Эозинофилы (%)
4 X8 10,0 Палочкоядерные (%)
5 X9 73,0 Сегментоядерные (%)
6 X10 57,0 Лимфоциты (%)
7 Х11 73,0 Моноциты (%)
8 Х12 23,0 СОЭ (мм/ч)
Печеночные пробы
9 Х13 27,4 Билирубин общий (мкмоль/л)
10 Х14 12,0 Ас Ат (ед.)
11 Х15 11,0 Ал Ат (ед.)
12 Х16 5,3 Тимоловая проба (ед.)
Биохимические показатели
13 Х17 91,4 Белок общий (г/л)
14 Х18 72,5 Альбумин (г/л)
15 Х19 7,5 Альфа 1%
16 Х20 12,7 Альфа 2%
17 Х21 11,7 Бета %
18 Х22 23,3 Гамма %
Плазмаферез (ПФ)
19 Х25 450,0 Доза взятой крови (мл)
20 Х28 270,0 Криопреципитат (мл)
21 Х29 9815,0 Суммарная доза извлеченной плазмы (мл)
22 Х30 310,0 Интервал между последующими ПФ
23 Х31 450,0 Разность между х25, не нулевым х26,х27,х28
Хтах - максимальное значение в поле
Для определения средней и максимальной ошибок было обучено и протестировано несколько нейросетей с 3 слоями нейронов с точностью 1,3 и характеристикой нейронов 0,3.
Таблица 2. Средняя и максимальная ошибки по категориям рабочих
Параметры Анод-ники Электро-лизники Крановщики Слесари Сварщики Студенты
Средняя ошибка 1,82 1,85 2,12 2,05 1,93 2,35
Максимальная ошибка 7,68 8,15 11,10 29,86 7,13 11,86
* В данной таблице анодчики обучались по данным электролизников, все остальные - по данным анодчиков.
Как видно из таблицы 2 наибольшая средняя ошибка наблюдается при тестировании данных студентов, что можно объяснить более благоприятными условиями их "работы". Так как изначально данные студентов предполагалось использовать в качестве тестовой выборки.
Было проведено сравнение тестовых выборок разных профессий по количеству правильно определенных примеров для чего использовалась нейросеть с точностью 1,5 (таблицы 3,4).
Таблица 3. Количество правильно определенных примеров для тестовых выборок_
ТВ Лдоё Е1ес Кгаи Б1ев 8Ш2 Буаг
ОВ
Лдоё 191 81 71 91 182 41
Е1ес 86 182 96 121 279 70
Кгаи 83 112 166 126 271 69
Б1ев 57 80 79 198 222 65
8Ш2 92 141 133 142 472 91
Буаг 72 77 88 85 229 130
Сумма 191 182 166 198 472 130
Прим.1. Сумма представляет собой общее количество использованных примеров.
Прим.2. По диагонали все ответы правильные, т.к. обучающая и тестовая выборки совпадают.
Таблица 4. Процент правильно определенных примеров для тестовых выборок_
ТВ Лдоё Е1ес Кгаи Б1ев 8Ш2 Буаг Среднее
ОВ
Лдоё 100 44 42 45 38 31 41
Е1ес 45 100 57 61 59 54 56
Кгаи 43 61 100 63 57 53 56
Б1ев 29 43 48 100 47 50 44
8Ш2 48 77 80 71 100 70 69
Буаг 37 42 53 42 48 100 46
Среднее 40 53 56 56 50 52
* Средний процент вычисляется без учета диагональных значений.
Из таблиц 3 и 4 видно, что данные анализов крови разных профессий сильно различаются по количеству правильно решенных примеров. Причем, при обучении по данным анализов сварщиков самый большой процент верно определенных примеров (53%) имеет тестовая выборка крановщиков, что может быть объяснено схожими условиями труда данных категорий рабочих. В целом, правильность тестирования сети, обученной по анодчикам, наихудшая, что может объясняться существенно разными условиями труда. К сожалению,
не все результаты тестирования можно легко объяснить. Например, при обучении по электролизникам, крановщикам и анодчикам наибольший процент верных прогнозов, соответственно 61%, 63% и 45%, давало тестирование по файлу слесарей. Наибольший процент правильных ответов (80%) дало тестирование данных крановщиков при обучении по файлу студентов. Исходно данные по студентам собирались для контроля, однако полученные результаты не сильно выделяют студентов из большинства групп других профессий.
В среднем наибольший процент верных ответов наблюдается при тестировании выборок крановщиков и слесарей. Для обучающих выборок максимален процент по студентам (69%) и чуть меньше - по электролизникам и крановщикам.
Было проведено также сравнение тестовых выборок разных профессий по количеству правильно определенных примеров для чего использовалась нейросеть с точностью 1,5 при обучении по половине выборки и тестировании по другой половине (таблицы 5,6).
Объемы обучающих выборок составили: анодчики - 105, электролизники -91, крановщики - 81, слесари - 99, студенты - 236, сварщики - 65.
Таблица 5. Количество правильно определенных примеров для тестовых выборок_
ТВ Лдоё Е1ес Кгаи Б1ев 8Ш2 Буаг
ОВ
Лдоё 46 48 47 62 128 21
Е1ес 51 39 45 57 106 26
Кгаи 42 40 44 50 121 27
Б1ев 28 41 38 40 90 34
8Ш2 34 40 35 65 153 27
Буаг 46 39 33 57 131 27
Сумма 86 91 85 99 236 65
Прим.1. Сумма представляет собой общее количество использованных примеров.
Прим.2. По диагонали не все ответы правильные, т.к. обучающая и тестовая выборки не совпадают.
Таблица 6. Процент правильно определенных примеров для тестовых выборок_
ТВ Anod Е1ес Кгап Sles Stu2 Svar Среднее
ОВ
Anod 53 53 55 63 54 32 47
Elec 59 43 53 58 45 40 45
Кгап 49 44 52 51 51 42 44
Sles 33 45 45 40 38 52 38
39 44 41 66 65 42 45
Svar 53 43 39 58 56 42 44
Среднее 48 45 48 56 52 42
* Средний процент вычисляется с учетом диагональных значений.
При обучении и тестировании по половинным выборкам, как видно из таблиц 5,6, результаты немного отличаются от тех, которые были получены при обучении и тестировании по полным выборкам. Например, при обучении по данным электролизников наибольший процент правильных прогнозов давало тестирование по выборке анодчиков, что может объясняться схожими условиями труда данных категорий рабочих.
Были определены наиболее значимые входные параметры тестовых выборок разных профессий для чего использовалась одна нейросеть с точностью 1,5 (таблица 7).
Таблица 7. Наиболее значимые входные параметры для тестовых выборок
(ОВ/ТВ)
Поле Лдоё/ Лдоё Лдоё/ Е1ес Лдоё/ Кгаи Лдоё/ Б1ев Лдоё/ 8Ш2 Лдоё/ Буаг Е1ес/ Лдоё Е1ес/ Е1ес Е1ес/ Кгаи Е1ес/ Б1ев Е1ес/ 8Ш2 Е1ес/ Буаг
Х2 0,47 0,49 0,43 0,46 0,46 0,56 0,41 0,44 0,48 0,45 0,45 0,42
Х7 0,29 0,21 0,32 0,29 0,29 0,20 0,34 0,38 0,31 0,29 0,35 0,31
Х8 0,62 0,41 0,37 0,29 0,41 0,40 0,44 0,49 0,40 0,43 0,48 0,35
Х9 0,50 0,50 0,52 0,62 0,63 0,62 0,53 0,58 0,60 0,61 0,71 0,53
Х10 0,36 0,19 0,16 0,26 0,39 0,19 0,44 0,22 0,21 0,24 0,41 0,15
Х11 0,64 0,74 0,56 0,68 0,64 0,72 0,65 0,80 0,80 0,61 0,74 0,70
Х12 1,00 0,81 0,67 0,75 0,89 1,00 1,00 0,79 1,00 0,94 1,00 1,00
Х13 0,51 0,45 0,45 0,35 0,53 0,79 0,53 0,48 0,55 0,54 0,54 0,49
Х14 0,22 0,23 0,18 0,18 0,35 0,19 0,14 0,16 0,18 0,16 0,39 0,25
Х15 0,26 0,21 0,17 0,22 0,35 0,25 0,41 0,24 0,21 0,26 0,39 0,35
Х16 0,37 0,30 0,22 0,33 0,42 0,40 0,29 0,33 0,33 0,33 0,41 0,40
Х17 0,46 0,33 0,35 0,40 0,50 0,37 0,27 0,32 0,26 0,37 0,39 0,31
Х25 0,51 0,43 0,41 0,42 0,39 0,45 0,30 0,50 0,42 0,36 0,50 0,41
Х28 0,98 1,00 0,66 1,00 1,00 0,91 0,75 1,00 0,74 1,00 0,83 0,70
Х29 0,90 0,86 1,00 0,72 0,71 0,82 0,87 0,96 0,92 0,75 0,90 0,79
Х30 0,60 0,65 0,62 0,54 0,50 0,65 0,47 0,52 0,54 0,43 0,59 0,55
Х31 0,30 0,13 0,18 0,17 0,19 0,16 0,33 0,20 0,24 0,14 0,24 0,21
Поле Кгаи/ Лдоё Кгаи/ Е1ес Кгаи/ Кгаи Кгаи/ Б1ев Кгаи/ 8Ш2 Кгаи/ Буаг Б1ев/ Лдоё Б1ев/ Е1ес Б1ев/ Кгаи Б1ев/ Б1ев Б1ев/ 8Ш2 Б1ев/ Буаг
Х2 0,46 0,40 0,37 0,57 0,42 0,46 0,48 0,38 0,34 0,38 0,47 0,30
Х7 0,36 0,27 0,26 0,34 0,37 0,27 0,29 0,29 0,25 0,33 0,34 0,18
Х8 0,52 0,40 0,34 0,36 0,38 0,37 0,58 0,38 0,21 0,24 0,39 0,20
Х9 0,58 0,56 0,58 0,55 0,55 0,48 0,55 0,71 0,55 0,59 0,66 0,56
Х10 0,53 0,29 0,28 0,36 0,58 0,17 0,45 0,34 0,29 0,32 0,62 0,21
Х11 0,65 0,64 0,55 0,67 0,54 0,42 0,83 0,69 0,58 0,55 0,62 0,44
Х12 1,00 1,00 1,00 1,00 1,00 1,00 0,45 0,75 0,74 0,81 0,83 0,60
X13 0,5б 0,5б 0,52 0,52 0,53 0,39 0,72 0,3б 0,29 0,32 0,40 0,24
X14 0,18 0,19 0,17 0,15 0,23 0,11 0,47 0,29 0,21 0,19 0,42 0,10
X15 0,45 0,18 0,19 0,3б 0,35 0,27 0,81 0,27 0,2б 0,2б 0,47 0,24
X^ 0,30 0,22 0,24 0,35 0,38 0,25 0,37 0,43 0,33 0,37 0,43 0,3б
X17 0,32 0,2б 0,21 0,3б 0,27 0,24 0,2б 0,53 0,4б 0,37 0,49 0,30
X25 0,43 0,4б 0,41 0,55 0,49 0,41 0,41 0,73 0,б3 0,70 0,б4 0,49
X28 0,94 0,84 0,64 0,99 0,64 0,69 0,б2 0,81 0,б8 0,76 0,71 0,4б
X29 0,91 0,92 0,79 0,бб 0,б4 0,б2 0,б8 0,90 0,88 0,б3 0,78 0,5б
X30 0,73 0,72 0,72 0,84 0,67 0,75 1,00 1,00 1,00 1,00 1,00 1,00
X31 0,31 0,17 0,23 0,22 0,1б 0,22 0,31 0,24 0,22 0,22 0,24 0,18
Поле Stu2/ Anod Stu2/ Elec Stu2/ Kran Stu2/ Sles Stu2/ Stu2 Stu2/ Svar Svar/ Anod Svar/ Elec Svar/ Kran Svar/ Sles Svar/ Stu2 Svar/ Svar
X2 0,б3 0,51 0,55 0,54 0,44 0,45 0,55 0,28 0,25 0,39 0,41 0,41
X7 0,33 0,17 0,23 0,23 0,1б 0,19 0,55 0,30 0,37 0,44 0,40 0,29
X8 0,39 0,24 0,29 0,20 0,20 0,20 0,38 0,17 0,12 0,17 0,23 0,13
X9 0,74 0,57 0,б5 0,б7 0,59 0,57 0,95 0,45 0,49 0,55 0,48 0,43
X10 0,59 0,33 0,37 0,25 0,57 0,28 0,б7 0,35 0,27 0,34 0,54 0,24
X11 0,б9 0,50 0,59 0,б2 0,67 0,49 0,93 0,47 0,50 0,57 0,58 0,50
X12 0,78 0,51 0,54 0,55 0,67 0,53 0,83 0,67 0,62 0,59 0,75 0,72
X13 0,42 0,20 0,29 0,33 0,42 0,29 0,42 0,23 0,31 0,37 0,48 0,2б
X14 0,42 0,19 0,19 0,31 0,34 0,18 0,5б 0,28 0,18 0,3б 0,б8 0,35
X15 0,44 0,14 0,23 0,41 0,20 0,15 0,40 0,22 0,29 0,29 0,39 0,24
X^ 0,57 0,3б 0,41 0,50 0,б0 0,35 0,82 0,51 0,48 0,57 0,74 0,49
X17 0,44 0,45 0,47 0,47 0,37 0,38 0,30 0,28 0,27 0,31 0,35 0,29
X25 1,00 0,92 1,00 1,00 1,00 1,00 0,90 0,95 0,94 1,00 1,00 1,00
X28 0,51 0,50 0,43 0,57 0,45 0,30 0,4б 0,45 0,29 0,49 0,44 0,39
X29 0,91 1,00 0,73 0,77 0,58 0,72 0,91 0,б0 0,67 0,71 0,80 0,74
X30 0,78 0,82 0,75 0,87 0,73 0,65 1,00 1,00 1,00 0,95 0,99 0,94
X31 0,45 0,1б 0,20 0,17 0,24 0,15 0,бб 0,23 0,30 0,34 0,3б 0,24
Как видно из таблицы 7 наиболее значимыми входными параметрами являются:
гематологические показатели: Х11 - Моноциты (%) Х12 - СОЭ (мм/ч) плазмаферез:
Х25 - Доза взятой крови (мл) Х28 - Криопреципитат (мл) Х29 - Суммарная доза извлеченной плазмы (мл) Х30 - Интервал между последующими плазмаферезами. Следовательно, среди наиболее значимых параметров выделяются суммарная доза извлеченной плазмы, СОЭ и интервал между плазмоферезами, что указывает на большую значимость показателей плазмафереза по сравнению с другими.
Список литературы
1. Горбань А.Н., Россиев Д.А. Нейронные сети на персональных компьютерах. Н.: Наука, 1996
2. Петровская В. А., Жуков Л. А., Оводова А. А. Нейросетевая обработка данных по гематологии // 2-й семинар "Новые информационные технологии" Москва, 1999. С.30
3. Петровская В.А., Жуков Л.А., Доценко О.Н., Гулько Т.И. Изучение влияния плазмафереза на функциональное состояние организма доноров с использованием нейросетей // "Информационные технологии": межвуз. конференция. Красноярск, 1999. С.46-49