Научная статья на тему 'Обобщение медицинских данных в программе MS Excel процедурой многофакторных «Промежуточных итогов»'

Обобщение медицинских данных в программе MS Excel процедурой многофакторных «Промежуточных итогов» Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1342
111
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОМЕЖУТОЧНЫЕ ИТОГИ / МНОГОФАКТОРНЫЕ ИТОГИ / РАК ЖЕЛУДКА / ВЫЖИВАЕМОСТЬ / ПРОГНОЗ / ОБРАБОТКА СТАТИСТИЧЕСКИХ ДАННЫХ / SUBTOTAL / EXCEL / INTERMEDIATE OUTCOMES / MULTIFACTORIAL / GASTRIC CANCER / SURVIVAL / PROGNOSIS / ANALYSIS OF STATISTICAL DATA

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Григорьев Руслан Аркадиевич, Ахметзянов Фоат Шайхутдинович

Цель. Оптимизировать обобщение статистических данных онкологических пациентов по выживаемости и летальности. Методы. Обобщение статистических данных с помощью многофакторных «промежуточных итогов». Результаты. Программный код используют с 1990 г. по настоящее время для обобщения статистических данных по выживаемости и летальности больных раком желудка, оперированных в Казанском городском онкологическом диспансере. Этот код даёт возможность оценить чувствительность отдельных статистических показателей к факторам, заданным исследователем, что позволяет рассматривать его как универсальный метод анализа базы данных в тех случаях, когда количество комбинаций факторов велико. Метод имеет высокую скорость обработки и уменьшает общий объём команд оператора. Универсальность программы предполагает использовать её функции для обобщения результатов итерационных вычислений. Процедура многофакторных промежуточных итогов реализована на базе MS Excel средствами Visual Basic for Applications. Предложенная программа трёхфакторных «промежуточных итогов» служит удобным и быстрым инструментом поиска релевантных факторов. Достоверность анализа эффективности лечебной тактики в отношении онкологических пациентов значительно возрастает при использовании предложенной программы. Вывод. Апробация алгоритма для анализа базы данных результатов в медицине и для обобщения результатов итерационных вычислений (например, рекурсивный метод и метод двигающегося окна) и уравнений с разными комбинациями временных рядов в эконометрике может указывать на состоятельность алгоритма как мощнейшего инструмента анализа и обобщения баз данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Григорьев Руслан Аркадиевич, Ахметзянов Фоат Шайхутдинович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPILATION OF MEDICAL DATA IN THE MS EXCEL PROGRAM USING THE PROCEDURE OF MULTIFACTORIAL «INTERMEDIATE OUTCOMES»12

Aim. To optimize the compilation of statistical data on oncology patients according to survival and mortality. Methods. Compilation of statistical data by using the multifactorial «intermediate outcomes». Results. A program code has been used from 1990 to the present time to compile statistical data on survival and mortality of patients with gastric cancer operated on at the Kazan City Oncology Dispensary. This code makes it possible to evaluate the sensitivity of selected statistical indicators to the factors specified by the researcher, which makes it possible to regard it as a universal method for analysis of the databases in cases where the number of combinations of factors is large. The method has a high processing speed and reduces the total amount of operator commands. The universality of the program intends the use of its functions to compile the results of iterative calculations. The procedure of multifactor intermediate outcomes was implemented on the basis of MS Excel by means of Visual Basic for Applications. The proposed program of three-factor «intermediate outcomes» serves as a convenient and fast tool for finding relevant factors. Reliability of the analysis of the effectiveness of the treatment strategy for oncology patients increases significantly during application of the proposed program. Conclusion. Testing of the algorithm for analysis of the database of results in medicine and summarizing the results of iterative calculations (for example, a recursive method and the moving window method) and the equations with different combinations of time series in econometrics may indicate the viability of the algorithm as an extremely powerful tool of analysis and generalization of databases.

Текст научной работы на тему «Обобщение медицинских данных в программе MS Excel процедурой многофакторных «Промежуточных итогов»»

МЕДИЦИНСКАЯ КИБЕРНЕТИКА И ИНФОРМАТИКА

УДК 004.9: 612.087: 616-006-036.8-089.168 К01

ОБОБЩЕНИЕ МЕДИЦИНСКИХ ДАННЫХ В ПРОГРАММЕ MS EXCEL ПРОЦЕДУРОЙ МНОГОФАКТОРНЫХ «ПРОМЕЖУТОЧНЫХ ИТОГОВ»

Руслан Аркадиевич Григорьев1*, Фоат Шайхутдинович Ахметзянов2

‘Казанский государственный энергетический университет,

Казанский государственный медицинский университет

Реферат

Цель. Оптимизировать обобщение статистических данных онкологических пациентов по выживаемости и летальности.

Методы. Обобщение статистических данных с помощью многофакторных «промежуточных итогов».

Результаты. Программный код используют с 1990 г. по настоящее время для обобщения статистических данных по выживаемости и летальности больных раком желудка, оперированных в Казанском городском онкологическом диспансере. Этот код даёт возможность оценить чувствительность отдельных статистических показателей к факторам, заданным исследователем, что позволяет рассматривать его как универсальный метод анализа базы данных в тех случаях, когда количество комбинаций факторов велико. Метод имеет высокую скорость обработки и уменьшает общий объём команд оператора. Универсальность программы предполагает использовать её функции для обобщения результатов итерационных вычислений. Процедура многофакторных промежуточных итогов реализована на базе MS Excel средствами Visual Basic for Applications.

Предложенная программа трёхфакторных «промежуточных итогов» служит удобным и быстрым инструментом поиска релевантных факторов.

Достоверность анализа эффективности лечебной тактики в отношении онкологических пациентов значительно возрастает при использовании предложенной программы.

Вывод. Апробация алгоритма для анализа базы данных результатов в медицине и для обобщения результатов итерационных вычислений (например, рекурсивный метод и метод двигающегося окна) и уравнений с разными комбинациями временных рядов в эконометрике может указывать на состоятельность алгоритма как мощнейшего инструмента анализа и обобщения баз данных.

Ключевые слова: промежуточные итоги, многофакторные итоги, subtotal, Excel, рак желудка, выживаемость, прогноз, обработка статистических данных.

COMPILATION OF MEDICAL DATA IN THE MS EXCEL PROGRAM USING THE PROCEDURE OF MULTIFACTORIAL «INTERMEDIATE OUTCOMES» R.A. Grigor'ev', F.Sh. Akhmetzyanov2. ‘Kazan State Power Engineering University, Kazan, Russia, 2Kazan State Medical University, Kazan, Russia. Aim. To optimize the compilation of statistical data on oncology patients according to survival and mortality. Methods. Compilation of statistical data by using the multifactorial «intermediate outcomes». Results. A program code has been used from 1990 to the present time to compile statistical data on survival and mortality of patients with gastric cancer operated on at the Kazan City Oncology Dispensary. This code makes it possible to evaluate the sensitivity of selected statistical indicators to the factors specified by the researcher, which makes it possible to regard it as a universal method for analysis of the databases in cases where the number of combinations of factors is large. The method has a high processing speed and reduces the total amount of operator commands. The universality of the program intends the use of its functions to compile the results of iterative calculations. The procedure of multifactor intermediate outcomes was implemented on the basis of MS Excel by means of Visual Basic for Applications. The proposed program of three-factor «intermediate outcomes» serves as a convenient and fast tool for finding relevant factors. Reliability of the analysis of the effectiveness of the treatment strategy for oncology patients increases significantly during application of the proposed program. Conclusion. Testing of the algorithm for analysis of the database of results in medicine and summarizing the results of iterative calculations (for example, a recursive method and the moving window method) and the equations with different combinations of time series in econometrics may indicate the viability of the algorithm as an extremely powerful tool of analysis and generalization of databases. Keywords: intermediate outcomes, multifactorial, subtotal, Excel, gastric cancer, survival, prognosis, analysis of statistical data.

Стандартная процедура «промежуточных итогов» (ПИ, англ. вариант — subtotal), встроенная в MS Excel, служит одним из методов обобщения данных в таблице со стандартным представлением [3-5]. Вместе с тем, ПИ используют лишь один фактор (столбец), что ограничивает возможности процедуры в тех случаях, когда необходимо учитывать множество факторов. Так, база данных больных раком желудка после проведённого лечения может включать как стандартные параметры пациента (пол, возраст

Адрес для nepenflCKH:Ruslan.Grigoryev@yandex.ru 692

и др.), так и параметры его заболевания (стадию процесса, глубину инвазии, макроскопическую и микроскопическую характеристику, вид оперативного вмешательства, объём лим-фаденэктомии и т.д.). При этом только стадии опухоли имеют 16 значений по классификации ТКМ. Таким образом, выбор сравниваемых групп больных занимает значительное время, или их анализ в ряде случаев становится вовсе невозможным.

В связи с проблемой обработки базы данных онкологических больных ещё в конце 90-х годов

[1] возникла потребность в разработке программы многофакторных ПИ, которая позволяла

бы отслеживать чувствительность показателей к нескольким факторам одновременно. Она должна была быть реализована в MS Excel, не уменьшая при этом его удобства и функционала, что и было осуществлено средствами Visual Basic for Applications (VBA).

Код программы впоследствии использовали в ряде исследований, не относящихся к области медицины, например при обработке и обобщении статистических показателей случайных последовательностей [2], а также результатов решения итерационных уравнений, использовавших панельные данные российских банков и временные ряды биржевых индексов.

Сравнение стандартной процедуры ПИ и многофакторных ПИ

Для демонстрации недостатков процедуры ПИ рассмотрим общий вид диалогового окна (рис. 1). Процедура ПИ фиксирует изменения лишь в одном столбце (факторе), обозначенном фразой «При каждом изменении в:». При этом обобщение данных может проводиться по множеству ячеек, указанных в поле: «Добавить итоги по:», но лишь с одной из статистических функций, выбранных в поле «Операция».

Рис. 1. Форма стандартной процедуры «промежуточных итогов» в программе MS Excel 2007.

Переход от однофакторного подхода к многофакторному в рамках стандартной процедуры ПИ, конечно, возможен. Для этого необходимо объединить интересующие нас в данный момент факторы в один, например с помощью функции «сцепить» (англ. [Concatenate (cell1, cell2)]). Очевидно, что применение дополнительных рутинных операций для повышения общего количества используемых факторов снижает привлекательность стандартной процедуры ПИ.

К сожалению, данная процедура не претерпела сколь-нибудь значимых изменений за последние 10 лет: ПИ версии MS Excel 2010 по-прежнему оперируют изменением значений лишь в одном факторе.

Рассмотрим работу стандартной процедуры однофакторных ПИ и результат работы программы многофакторных ПИ, предложенной далее в разделе «Реализация процедуры многофакторных ПИ средствами VBA». Для этого воспользуемся базой данных больных раком желудка, лечившихся в Казанском городском онкологическом диспансере (ныне в составе Республиканского клинического онкологического диспансера, г. Казань), за 20 лет. В рамках данной статьи анализировались данные больных, у которых опухоль локализовалась в пределах I-II сегментов желудка, локализацию опухоли учитывали как один из факторов.

Применение стандартной процедуры однофакторного ПИ представлено на рис. 2.

Для получения на рис. 2 результата исследователю необходимо выставить ряд предварительных фильтров. Выборка должна включать следующие маркёры: (1) выписанные больные,

(2) больные, пережившие 5-летний период, (3) локализация опухоли по сегментам I, II, I-II. Только после данных операций можно проводить стандартную процедуру ПИ. Кроме того, нахождение 5-летней выживаемости необходимо проводить с помощью автоматической формулы путём деления показателя «Жили 5 и > лет» на показатель «Выписанные». При этом формулу расчёта 5-летней выживаемости вводят вручную.

Далее рассмотрим отчёт многофакторных ПИ. В табл. 1-3 показаны одно-, двух- и трёхфакторные ПИ, подсчитанные с помощью программы, описанной в разделе «Реализация процедуры многофакторных ПИ средствами VBA».

1|2|3 Вб ВН BI BJ

1 ЦЭК1- Выписанные Жили 5 и >лет ПВ

0 2 Общий итог 506 231 45.65%

И 3 1 сегмент Итог 104 49 47.12%

в 108 1 -2 сегм. Итог 258 97 37.60%

.0 367 2 сегмент Итог 144 85 59.03%

Рис. 2. «Промежуточные итоги» 5-летней выживаемости с учётом локализации опухоли в желудке, где столбец ЛОКЬ» — локализация опухоли, «Выписанные» — число выписанных из стационара больных, «Жили 5 и > лет» — пережившие 5-летний срок после операции, «ПВ» — 5-летняя выживаемость.

Таблица 1.

Пример расчёта с помощью программы однофакторных «промежуточных итогов»

Локализация опухоли в желудке (сегмент) Число выписанных из стационара больных 5-летняя выживаемость, %

I 104 47,12

II 144 59,03

І-П 258 37,6

Всего 506 45,65

Таблищ 2.

Пример расчёта с помощью программы двухфакторных «промежуточных итогов»

Локализация опухоли в желудке (сегмент) Стадия по системе ТЫМ Число выписанных из стационара больных 5-летняя выживаемость, %

I 3 2 0 12 16,67

I 3 1 0 8 37,5

I 2 0 0 37 51,35

I 1 0 0 6 83,33

I 2 2 0 4 50

I 3 0 0 28 50

I 2 1 0 9 44,44

II 3 2 0 8 37,5

II 3 1 0 7 28,57

II 2 0 0 58 63,79

II 1 0 0 23 78,26

II 2 2 0 6 33,33

II 3 0 0 27 62,96

II 2 1 0 14 42,86

II 1 2 0 1 0

ьп 3 2 0 51 17,65

ьп 3 1 0 49 22,45

ьп 2 0 0 49 59,18

ьп 1 0 0 1 100

ьп 2 2 0 12 50

ьп 3 0 0 84 44,05

ьп 2 1 0 12 33,33

Всего: 506 45,65

Табл. 1 является идентичной результатам стандартной процедуры ПИ с той лишь разницей, что исследователь экономит время на установлении фильтров, генерации дополнительных столбцов маркёров и выставлении формул при исчислении нестандартных параметров.

При переходе к двух- (табл. 2) и трёхфакторным (табл. 3) ПИ исчезает усреднение показателя, так как происходит дробление выборки на большее количество микрогрупп, создающихся большим числом факторов. В этой связи вскры-694

Таблица 3.

Пример расчёта с помощью программы трёхфакторных «промежуточных итогов»

Локализация опухоли в желудке (сегмент) Стадия по системе тям Глубина инвазии Число выписанных из стационара больных 5-летняя выживаемость, %

I 3 2 0 ПС 12 16,67

I 3 1 0 ПС 8 37,5

I 2 0 0 ПМ 30 50

I 2 0 0 ПП 7 57,14

I 1 0 0 ПСл 6 83,33

I 2 2 0 ПМ 4 50

I 3 0 0 ПС 28 50

I 2 1 0 ПМ 8 50

I 2 1 0 ПП 1 0

II 3 2 0 ПС 8 37,5

II 3 1 0 ПС 7 28,57

II 2 0 0 ПМ 42 61,9

II 2 0 0 ПП 16 68,75

II 1 0 0 ПСл 23 78,26

II 2 2 0 ПМ 5 20

II 2 2 0 ПП. 1 100

II 3 0 0 ПС 27 62,96

II 2 1 0 ПМ 11 45,45

II 2 1 0 ПП 3 33,33

II 1 2 0 ПСл 1 0

ьп 3 2 0 ПС 51 17,65

ьп 3 1 0 ПС 49 22,45

ьп 2 0 0 ПМ 47 59,57

ьп 2 0 0 ПП 2 50

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ьп 1 0 0 ПСл 1 100

ьп 2 2 0 ПМ 11 45,45

ьп 2 2 0 ПП 1 100

ьп 3 0 0 ПС 84 44,05

ьп 2 1 0 ПМ 12 33,33

Всего 506 45,65

Примечание. Глубина инвазии: ПС — в пределах серозного слоя, ПМ — в пределах мышечного слоя, ПП — в пределах подслизистой оболочки, ПСл — в пределах слизистой оболочки.

вается неоднородность рассчитываемых статистических показателей, связанных с чувствительностью данных показателей к выбранным факторам. Кроме того, для ряда групп значительно уменьшается количество больных, что приводит к сокращению достоверности оценки статистического показателя. Однако для микрогрупп со значительным числом больных значения рассчитываемых показателей всё более уточняются, повышая соответствие и достоверность показателей.

Реализация процедуры многофакторных ПИ средствами VBA

Представим блок-схему для реализации n-факторных ПИ (рис. 3). Ключевой является процедура n-факторной сортировки «Б3», обеспечивающая ранжирование строк в группы, объединённые общей комбинацией значений исследуемых факторов.

В связи с этим можно утверждать, что изменение комбинации значений n-факторов при последовательном переборе строк базы указывает на конец текущей выборки и начало новой. Так, вход на первую строку базы означает начало первой выборки, с которой последовательно строка за строкой (обследование за обследованием) собираются в массив статистические показатели. Подтверждённая смена комбинации значений n-факторов в условном блоке X ведёт к сохранению данных по статистике текущей выборки в строку i в отчёте. Массив статистических показателей после вывода в отчёт обнуляется, чтобы быть готовым для расчёта показателей новой выборки.

Последовательный перебор строк (обследований) организуется с помощью условного цикла Y, который разрешает цикл, пока триггер check не примет значение 0. При этом триггер check приобретает значение 0 в случае подтверждения наличия пустых значений во всех n факторах в следующей строке (g+1) в условном блоке Z. При неудовлетворении условиям check=1 (то есть при check=0) программа проводит обобщение по всем статистическим итогам всех найденных выборок, подбивая результаты в общую сумму (где это возможно) «ВСЕГО» по базе.

Реализация алгоритма многофакторных ПИ с применением VBA для MS Excel также представлена в варианте, где число факторов равно трём. Так, рис. 4 демонстрирует код процедуры с группами команд, выделенными фигурной скобкой, соответствующих ключевым элементам блок-схемы рис. 3. Отметим, что смена анализируемого фактора для данного кода может быть осуществлена изменением одной ячейки путём ввода номера столбца (два-четыре нажатия клавиш). При этом активизация алгоритма происходит с помощью «горячей клавиши», что значительно уменьшает суммарное время, затрачиваемое на генерацию отчёта трёхфакторных ПИ по сравнению с однофакторным вариантом. К примеру, для баз данных, состоящих из 10 000 строк1 (обследований), время генерации отчёта может составлять от 1 до 6 с в зависимости от количества уникальных значений в заданных факторах. В тех случаях, когда комбинации факторов многочисленны и заранее известны, код может быть дополнен их списком, что позволит значительно сократить время на операциях выставления номеров столбцов, соответствующих анализируемым факторам.

Стандартные и специфические функции для расчёта статистических показателей в процедуре трёхфакторных ПИ

С учётом задач анализа необходимо подобрать функции для расчёта статистических показателей, которые соответствуют требованиям исследования, в массив. Для используемых в стандартной процедуре ПИ функций можно применить фрагмент кода расчёта статистических показателей, являющийся их заменителем. Так, функция подсчёта количества обследований может быть заменена значением параметра cou в строке 49 (см. рис. 4).

Операция нахождения минимума для заданной выборки по столбцу x может быть реализована с помощью кода в строке 44 (рис. 5). Операция нахождения максимума по столбцу x проводится с помощью кода в строке 45, а сумма по столбцу x может быть реализована с помощью кода в строке 46.

В работах Ф.Ш. Ахметзянова и соавт. [1] алгоритм высчитывал ПИ по послеоперационным осложнениям и летальности в зависимости от объёма операции на желудке и лимфатических узлах, возраста больных. При оценке выживаемости учитывали объём операции на желудке, стадию, объём лимфодиссекции, глубину инвазии, форму роста опухоли, локализацию и степень дифференцировки опухоли.

Кроме того, при подсчёте могут быть введены специфические функции, например подсчёт значений выше и ниже определённого уровня. Предположим, что столбец x содержит данные об отдалённых результатах больных после операции, тогда 1-, 2-, 3-, 4- и 5-летняя выживаемость может быть собрана в статистический массив с использованием следующего кода (рис. 6).

Для обобщения результатов решения уравнений с использованием итерационных вычислений может встать вопрос подсчёта тестов, где гипотеза отклонялась при p <0,05 и p <0,01. Так, в работе Р.А. Григорьева на базе модели с помощью трёхфакторной процедуры ПИ были обобщены результаты решения множества уравнений, где параметр, отражающий оценочный уровень конкурентных условий в отрасли, был значимым. Алгоритм «consolidator» использовался при подсчёте числа отклонений от гипотезы непредшествия по Грейнжеру с последующим визуальным представлением обобщённых результатов. Предположим, что статистическому блоку необходимо провести операцию подсчёта общего числа строк (уравнений), где гипотеза была отклонена при p <0,05 и p <0,01 только для уравнений с достигнутой конвергенцией. Тогда статистический блок может иметь следующий вид (рис. 7).

Строка 43 на рис. 7 проверяет наличие конвергенции в ячейке g,y, так как при отсутствии

1На программу накладывается ограничение по количеству оперируемых строк в базе данных, соответствующих лимитам MS Excel. Для версии MS Excel 2007 ограничение составляет 1 0 48 576 строк.

X

Рис. 3. Блок-схема кода «consolidator» для n факторов.

0

1 2

3

4

5

6

7

8 9

10

11

12

13

14 1Б 16

17

18

19

20 21 22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60 61 62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

------начало кода "consolidator".

1 фиксация начального значения таймера номер строки для вывода статистики в отчет

количество ячеек для названия строки в отчете соответствует числу факторов

массив статистической информации

номер последней ячейки участвующей в сортировке

триггер

номер последней ячейки участвующей в сортировке

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

•------начало блока очистки предыдущего отчета

Sub consolidator()

wl = Timer ¡ = 1 f = 3

Dim st(3)

lastline = 1048576 check=l cou=0

Sheets("sum3").Select '----

Range(Cells(2,1), Cells(lastline, ll)).Select

Selection.Delete Shift:=xlShiftUp '------ конец блока очистки предыдущего отчета

Ы = Sheets('!sum3,,).Cells(l, l).Value ' получение фактора 1 в виде номера столбца в базе Ь2 = Sheets('!sum 3").Cells(l, 2).Value ' получение фактора 2 в виде номера столбца в базе ЬЗ = Sheets(’^um 3").Cells(l, 3).Value ' получение фактора 3 в виде номера столбца в базе

Worksheets("data") Select '------начало блока сортировки с учетом факторов

Range(Selection, ActiveCell.SpecialCells(xlLastCell)). Select ActiveWorkbook.Worksheets("U").Sort.SortFields.Clear

ActiveWorkbook.Worksheets("Lr').Sort.SortFields.Add Key:=Range(Cells(l, bl), Cells(lastline, bl))_ , SortOn:=xlSortOnValues, Order:=xlAscending, DataOption:=xlSortNormal ActiveWorkbook.Worksheetsf'lD.Sort.SortFields.Add Key:=Range(Cells(l, b2), Cells(lastline, b2))_

, SortOn:=xlSortOnValues, Order:=xlAscending, DataOption:=xlSortNormal ActiveWorkbook.Worksheets("ir).Sort.SortFields.Add Key:=Range(Cells(l, b3), Cells(lastline, b3) _

), SortOn:=xlSortOnValues, Order:=xl Ascending, DataOption:=xlSortNormal With ActiveWorkbook.Worksheets("Ll").Sort .SetRange Range(Cells(l, 1), Cells(lastline, 280))

.Header = xlGuess .MatchCase = False .Orientation = xlTopToBottom .SortMethod = xIPinYin •Apply End With

Range("al").Select Sheets(''Sum3").Select Do Until check= 0 g = g + l

al = Sheets("data").Cells(g, bl).Value a2 = Sheets("data").Cells(g, b2).Value a3 = Sheets("data").Cells(g, b3).Value

}*

>

Б2

БЗ

1-----конец блока сортировки с учетом факторов

1 проверка достижения конца базы (check=0)

’ изменение номера анализируемой строки в базе 1 сбор текущего значения по фактору 1 ' сбор текущего значения по фактору 2 ’ сбор текущего значения по фактору 3 nal = Sheets("data").Cells(g + 1, bl).Value 1 сбор последующего значения по фактору 1 na2 = Sheets("data").Cells(g + 1, b2).Value 1 сбор последующего значения по фактору 2 паЗ = Sheets("data").Cells(g + 1, b3).Value 1 сбор последующего значения по фактору 3

------ начало блока сбора статистической информации

If Sheets(l).Cells(g, 112).Value<= 1 Then st(l) = st(l) + 1 If Sheets(l).Cells(g, 112¡.Value <= 5 Then st(2) = st{2) ♦ 1 If Sheets(l).Cells(g, 112).Value <= 10Then st(3) = st(3) + 1

------конец блока сбора статистической информации

}

}

Б4

Б5

сои = сои + 1 ’ изменение значения счетчика обследований

If nal = al And na2 = a2 And паЗ = аЗ Then ’ проверка смены комбинации значений факторов в след. Строке

If nal = "" And па2 = "" And паЗ = "" Then check = 0 ’ проверка достижения конца базы

Else

і = і + 1 ’ изменения номера текущей строки отчета

For Z = 1 То 3 '------начало блока вывода в отчет накопленной статистической информации

Sheets("sum3").Cells(i, f ♦ Z).Value = st(Z) st(Z)= 0

Next Z '...... конец блока вывода в отчет накопленной статистической информации

Sheets(“sum3”). Cells(i, f ♦ 7).Value = сои ' вывод в отчет числа обследований в выборке сои = 0 ’ обнуление числа обследований в выборке

Sheets{"sum3").Cells(i, l).Value = Sheets ("data").Cells(g, bl).Value ' вывод в отчет значение фактора 1 Sheets("sum3").Cells(i, 2).Value = Sheets ("data").Cells(g, b2).Value ' вывод в отчет значение фактора 2 Sheets("sum3").Cells(i, 3).Value = Sheets ("data").Cells(g, b3).Value ' вывод в отчет значение фактора 3 End If Loop

і = і + 1 '-------начало блока сведения отчета в графу ВСЕГО

For с = f+1 To f+3 For k = 2 To і -1

Sheets(,,sum3").Cells(i, c).Value = SheetsfsumB'TCellsO, c).Value ♦ Sheets("sum3").Cells(k, c).Value Next k Next с

Sheets("sum3").Cells(i, f).Value ="ВСЕГО'......... конец блока сведения отчета в графу ВСЕГО

Sheets(”sum3").Select

Sheets("sum3").Cells(l, ll).Value = Timer - wl' вывод времени работы программы End Sub '......конец кода "consolidator".

}

>

}

Б6

Б7

Б8

Рис. 4. Реализация алгоритма трёхфакторных промежуточных итогов.

43 ‘ начало блока расчёта стат. показателей

44 If Sheets(1).Cells(g, x).Value <= st(1) Then st(1) = Sheets(1).Cells(g, 14).Value

45 If Sheets(1).Cells(g, x).Value => st(2) Then st(2) = Sheets(1).Cells(g, 15).Value

46 st(3) = st(3) + Sheets(1).Cells(g,x).Value

47 ‘ конец блока расчёта стат. показателей

Рис. 5. Код реализации простых статистически функций.

‘ начало блока расчёта стат. показателей

43 If Sheets(1).Cells(g, x).Value => 1 and Sheets(1).Cells(g, x).Value <2 Then st(1) = st(1) + 1

44 If Sheets(1).Cells(g, x).Value => 2 and Sheets(1).Cells(g, x).Value <3 Then st(2) = st(2) + 1

45 If Sheets(1).Cells(g, x).Value => 3 and Sheets(1).Cells(g, x).Value <4 Then st(3) = st(3) + 1

46 If Sheets(1).Cells(g, x).Value => 4 and Sheets(1).Cells(g, x).Value <5 Then st(4) = st(4) + 1

47 If Sheets(1).Cells(g, x).Value => 5 Then st(5) = st(5) + 1

‘ конец блока сбора стат. показателей

Рис. 6. Код подсчёта выживаемости больных раком желудка.

43 If Sheets(1).Cells(g, y).Value = «A» Then ‘ начало блока расчёта стат. показателей

44 st(1) = st(1) + 1

45 If Sheets(1).Cells(g, x).Value <= 0.05 Then st(2) = st(2) + 1

46 If Sheets(1).Cells(g, x).Value <= 0.01 Then st(3) = st(3) + 1

47 End If ‘ конец блока расчёта стат. показателей

Рис. 7. Код подсчёта числа отклонённых гипотез для р <0,05 и р <0,01 с учётом достигнутой конвергенции.

достигнутой конвергенции уравнение считается нерешённым. При этом столбец у хранит данные о наличии конвергенции, а в строке g хранятся данные о результатах решения уравнения. Строка 44 проводит подсчёт всех уравнений, где конвергенция была достигнута, а строки 45 и 46 подсчитывают общее число отклонений гипотезы при p <0,05 и p <0,01 по столбцу x соответственно.

Приведённые в статье работы [1, 2] могут подтвердить успешную апробацию алгоритма «consolidator» в анализе таблиц с множеством столбцов, которые способны выступать в качестве факторов. При этом сокращение времени на рутинную подготовку данных для анализа делает предложенный метод привлекательным инструментом обобщения статистических данных.

ВЫВОДЫ

1. В наше время исследовательская работа предполагает анализ множества факторов, влияющих на тот или иной процесс или показатель. Предложенная программа трёхфакторных ПИ служит удобным и быстрым инструментом поиска релевантных факторов.

2. Достоверность анализа эффективности лечебной тактики в отношении онкологических пациентов значительно возрастает при использовании предложенной программы трёхфакторных ПИ.

3. Апробация алгоритма для анализа базы данных результатов в медицине и для обобщения результатов итерационных вычислений (например, рекурсивный метод и метод двигающегося окна) и уравнений с разными комбинациями временных рядов в эконометрике может указывать на состоятельность алгоритма как мощнейшего инструмента анализа и обобщения баз данных.

4. Программа имеет значительный потенциал в обобщении результатов кластерных вычислений, когда необходимо компактно представить совокупность множества типичных микрозадач.

ЛИТЕРАТУРА

1. Ахметзянов Ф.Ш., Китаев М.Р., Ядыков О.А., Ахметзянова Ф.Ф. Лимфогенное метастазирование рака дистального отдела желудка // Рос. онкол. ж. — 2011. — №1. — С. 30-33.

2. Григорьев Р.А. О двух методах сжатия численного хаоса // Извест. вузов. Проблемы энергетики. — 2005. — №9-10. — С. 106-110.

3. Михайлов А.А., Полевой Д.В. Проблемы анализа таблично структурированной информации // Труды института системного анализа РАН. — 2007. — №29. — С. 88-96.

4. Aitken P.G. Excel pivot tables and charts — Indianapolis, Indiana. — Wiley Publishing, Inc., 2005. — 276 p.

5. Dalgleish D. Excel pivot tables recipe book: a problemsolution approach. — Berkeley, California: APRESS, 2006. — 307 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.