Научная статья на тему 'Некоторые аспекты преподавания дисциплины «Информатика с основами математической биостатистики»'

Некоторые аспекты преподавания дисциплины «Информатика с основами математической биостатистики» Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
62
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТАТИСТИЧЕСКИЙ АНАЛИЗ / МАТЕМАТИЧЕСКАЯ СТАТИСТИКА / БИОСТАТИСТИКА / СТАТИСТИЧЕСКИЕ ФУНКЦИИ / ПАКЕТ АНАЛИЗА / EXCEL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Василекина Ольга Михайловна

Рассматриваются методические вопросы проведения занятий по дисциплине «Информатика с основами математической биостатистики». Приводится пример решаемых задач в программе MS Excel

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Василекина Ольга Михайловна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Некоторые аспекты преподавания дисциплины «Информатика с основами математической биостатистики»»

УДК 519.22:004

НЕКОТОРЫЕ АСПЕКТЫ ПРЕПОДАВАНИЯ ДИСЦИПЛИНЫ «ИНФОРМАТИКА С ОСНОВАМИ МАТЕМАТИЧЕСКОЙ БИОСТАТИСТИКИ»

Ольга Михайловна Василекина, к.э.н.

ФГБОУВПО «Великолукская ГСХА», Россия, г. Великие Луки

Рассматриваются методические вопросы проведения занятий по дисциплине «Информатика с основами математической биостатистики». Приводится пример решаемых задач в программе MS Excel.

Ключевые слова: статистический анализ; математическая статистика; биостатистика; Excel; статистические функции; пакет анализа.

Математическая статистика -это наука о математических методах анализа данных, полученных при проведении массовых наблюдений (измерений, опытов).

Статистические методы исследований широко применяются в самых разных отраслях науки и производства. В биологии и медицине, в социологии и экономике обработка результатов экспериментов, опросов, исследований выполняется с использованием методов математической статистики.

Статистический анализ предполагает многократную обработку больших объемов данных, выполнение достаточно трудоемких расчетов. Поэтому с развитием вычислительной техники и программного обеспечения автоматизация статистических расчетов стала одним из приоритетных направлений в развитии информационных систем.

Для решения задач статистической обработки данных существует специализированное программное обеспечение, но оно, как правило, является дорогостоящим. Более доступная большинству пользователей программа Microsoft Excel предоставляет широкие возможности для анализа статистических данных. По спектру доступных функций Excel сегодня почти не уступает специальным программам обработки статистических данных.

В статистике совокупность результатов измерений называют распределением. Microsoft Excel дает возможность анализировать распределения, используя встроенные статистические функции, функции анализа выборок и генеральной совокупности, а также инструменты надстройки Пакет анализа: Описательная статистика, Гистограмма, Корреляционный анализ и др.

В курсе «Информатика с основами математической биостатистики», который изучают студенты 1 курса специальности «Ветеринария» Великолукской ГСХА, мы достаточно подробно рассматриваем возможности программы MS Excel в целом и конкретно применительно к области статистических расчетов, связанных с обработкой данных биологических исследований.

Во время занятий студенты решают конкретную задачу по статистической обработке данных. В

первую очередь данные выборки (учебный пример) группируются и составляется вариационный ряд, на основе которого строятся гистограмма и полигон частот.

Затем по выборочным данным с помощью встроенной функции и расчетных формул MS Excel рассчитываются средние показатели (функция СРЗНАЧ (данные) и показатели вариации (стандартное отклонение СТАНДОТКЛОН (данные), дисперсия, коэффициент вариации) (рис. 1).

1

;

5 ^

Е

6 7 В ï 10 11 12 13 1-1Е 16 17

15 1Э

20

21

22 2Е

24

;е 26 27 2Е 29 3-d il 12 ЕЕ ЕА ЕЕ

16 37

в i с i d

Х-ЗНЭЧВНКР ГрКЗНЭКОВ

2,4 2,6 1,9

2,3 2,7 2, В 3 2,6 2,7 1,6 2,3 1,2 1.2

Группирование

ИГГШ1 ХТТИ1

ОбЩЕЕ HD"-

шдрнант I

Мин. Кол-во интервалов ширина интервала

Бэргэционьыг ред знэченинх частот 1.29 1.5В 1,67 2.16 2.45 2, "4 3.05

1,7

1,5 2.S 2,7

1.5

2,7 2.7

2.3 2,2

1.4

1.4 2, В

2.5 1,5

0,29

2,4 2,2 1.7 1,7

1.3

1.3 1.?

2.4 2, В 2.4

2.3 1.9

1.4 1.В

Асимметрии -0.05 ■■ пг^= 0,2673 Эксцвк: -1.5В9 гтг.= 0,5345

2,5 1,3

2.7 2,9 1.5 1,1 1.9 1.3 2,9 1,3 2.1 2,3 1,7 1,1

2,5 1,5 2,1 1.3 1.2 1.2 2,5 1,7

1.3 2,5 1.5

2.4 1.4

1

j_h_L

Статистические показатели

Среднее а рифмЕгптн веков 2,04

Ста еда ртноЕ отклонение 0,61

дисперсии 0.3 7

Медиана 2,10

Меда 1,30

Полигон частот

.IS .58 1.S7 2,IS :.4Е 1.74 3.D3

Гистограмма

129 .58 1.17 2.LE 2 ¿5 1.74 3,C3

Рисунок 1 - Статистическая обработка данных в MS Excel

Анализируя полигон частот, а также рассчитанные показатели асимметрии и эксцесса имеющегося распределения данных, студенты делают вывод о типе отклонений данного распределения от нормального распределения и о существенности этих отклонений.

Проверку статистической гипотезы о том, что данная совокупность данных подчиняется нормальному закону распределения, студенты выполняют при помощи критерия Пирсона, который рассчитывается также с помощью встроенных статистических функций и расчетных формул MS Excel (рис. 2).

Помимо широкого набора статистических функций в MS Excel есть надстройка Пакет анализа, ко-

торая также позволяет быстро и эффективно выполнять все основные статистические расчеты. Эта надстройка входит в состав программы MS Excel, но может требовать подключения в Параметрах Excel. Чтобы подключить надстройку Пакет анализа, нужно в меню Файл выбрать Параметры и в разделе Надстройки перейти к надстройкам и включить Пакет анализа.

Выполнив обработку данных Пакетом анализа (описательная статистика), студенты имеют возможность проверить свои предыдущие расчеты, сделанные при помощи формул и функций Excel, так как полученный набор показателей дублирует сделанные ранее расчеты.

А Б С D Е F

1 Левый конец интервала Правый конец интервала Середина интервала

2 Хк Хк+1 Середины Частоты Теоретические частоты хи -квадрат

3 1 1,29 1,145 9 5,488207782 2,24712421

А 1,29 1,58 1,435 17 9,740171077 5,41110783

5 1,58 1,87 1,725 9 13,84713574 1,69672092

б 1,87 2Д6 2,015 9 15,76976093 2,90617361

7 2,16 2,45 2,305 15 14,38690776 0,02612668

8 2,45 2,74 2,595 11 10,51436837 0,02243008

9 2,74 3,03 2,885 14 6,155443829 9,99717701

10 84 75,90199549

11 Среднее 2,04 хи-кв. набл. 22,3068603

12 Дисперсия 0,37 хи-кв. теор. 9,48772904

13 1 Станд. отк. 0,61

14

На блюда емое значение критерия (22,31)значительно превышает критическое

(9,49), поэтому гипотеза о нормальном распределении признаков в данной

15 выборке не подтвердилась.

Рисунок 2 - Проверка статистической гипотезы о нормальном распределении признаков в выборке

Рисунок 3 - Корреляционный анализ двух выборок данных

Для изучения статистических зависимостей и методов их анализа в курсе «Информатика с основами математической биостатистики» студенты выполняют корреляционный анализ двух выборок данных при помощи статистических функций Excel, а также при помощи Пакета анализа (Корреляционный анализ) (рис. 3). Кроме того, определить, есть ли корреляционная зависимость между двумя признаками, студентам помогает анализ точечной диаграммы, построенной по двум выборкам.

Для того чтобы закрепить полученные умения по статистической обработке данных, студенты выполняют самостоятельные индивидуальные задания по статистическому анализу выборочных данных. Таким образом, достигается цель дисциплины «Информатика с основами математической биостатистики» - не только получить основные навыки работы в прикладных программах, но и получить представление об осн о в ах статистического анализа данных и возможности автоматизации статистических расчетов.

E-mail: vasilekina@yandex.ru

182112 Псковская область, г. Великие Луки, пр. Ленина д. 2, Великолукская ГСХА. Тел.: (81153) 3-65-87

i Надоели баннеры? Вы всегда можете отключить рекламу.