Научная статья на тему 'Обработка результатов статистического наблюдения посредством табличного процессора'

Обработка результатов статистического наблюдения посредством табличного процессора Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
178
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
пакет анализа / макрофункция «Описательная статистика» / первичные результаты наблюдений (экспериментов) / максимум / минимум / интервал (разница между наибольшим и наименьшим значениями набора данных) / сумма / счет (объем или количество данных в наборе) / простые числовые характеристики вариации данных / analysis package / macrofungi Descriptive statistics / preliminary results of observations (experiments) / high / low / range (difference between largest and smallest values in the dataset) / the amount of the expense (the amount or quantity of data in the dataset) / simple numerical characteristics of data variation

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Андрей Александрович Страхов, Екатерина Александровна Слесарева, Нина Владимировна Задохина

Анализируется работа макрофункции «Описательная статистика»

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Андрей Александрович Страхов, Екатерина Александровна Слесарева, Нина Владимировна Задохина

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PROCESSING OF STATISTICAL OBSERVATION RESULTS BY MEANS OF A TABLE PROCESSOR

The article deals with the work of the macro-function Descriptive statistics.

Текст научной работы на тему «Обработка результатов статистического наблюдения посредством табличного процессора»

ПСИХОЛОГИЧЕСКИЕ НАУКИ

УДК 004.9 ББК 88

Doi 10.24411 /2073-0454-2018-10060 © А.А. Страхов, Е.А. Слесарева, Н.В. Задохина, 2018

ОБРАБОТКА РЕЗУЛЬТАТОВ СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ ПОСРЕДСТВОМ ТАБЛИЧНОГО ПРОЦЕССОРА

Андрей Александрович Страхов, доцент кафедры информатики и математики

Московский университет МВД России имени В.Я. Кикотя (117437, Москва, ул. Академика Волгина, д. 12) E-mail: [email protected]

Екатерина Александровна Слесарева, доцент кафедры информатики и математики, кандидат психологических наук Московский университет МВД России имени В.Я. Кикотя (117437, Москва, ул. Академика Волгина, д. 12) E-mail: [email protected]

Нина Владимировна Задохина, старший преподаватель кафедры информатики и математики, кандидат педагогических наук

Московский университет МВД России имени В.Я. Кикотя (117437, Москва, ул. Академика Волгина, д. 12) E-mail: [email protected]

Аннотация. Анализируется работа макрофункции «Описательная статистика».

Ключевые слова: пакет анализа, макрофункция «Описательная статистика», первичные результаты наблюдений (экспериментов), максимум, минимум, интервал (разница между наибольшим и наименьшим значениями набора данных), сумма, счет (объем или количество данных в наборе), простые числовые характеристики вариации данных.

PROCESSING OF STATISTICAL OBSERVATION RESULTS BY MEANS OF A TABLE PROCESSOR

Andrey A. Strakhov, associate professor of the Department of informatics and mathematics Moscow University of the Ministry of Internal affairs of Russia named after V.Ya. Kikot' (117437, Moscow, ul. Akademika Volgina, d. 12) E-mail: [email protected]

Ekaterina A. Slesareva, associate professor, Chair of informatics and mathematics, candidate of psychological sciences Moscow University of the Ministry of Internal affairs of Russia named after V.Ya. Kikot' (117437, Moscow, ul. Akademika Volgina, d. 12) E-mail: [email protected]

Nina V. Zadokhina, senior lecturer, Chair of informatics and mathematics, candidate of pedagogical sciences Moscow University of the Ministry of Internal affairs of Russia named after V.Ya. Kikot' (117437, Moscow, ul. Akademika Volgina, d. 12) E-mail: [email protected]

Annotation. The article deals with the work of the macro-function Descriptive statistics.

Keyword: analysis package, macrofungi Descriptive statistics, preliminary results of observations (experiments), high, low, range (difference between largest and smallest values in the dataset), the amount of the expense (the amount or quantity of data in the dataset), simple numerical characteristics of data variation.

Citation-индекс в электронной библиотеке НИИОН

Для цитирования: Страхов А.А., Слесарева Е.А., Задохина Н.В. Обработка результатов статистического наблюдения посредством табличного процессора. Вестник Московского университета МВД России. 2018;(6):305—308.

Рассмотрим работу макрофункции «Описательная статистика».

Основная задача описательной статистики — обобщить первичные результаты наблюдений (экспериментов) и представить данные в форме, удобной для восприятия и анализа. Инструмент анализа «Описательная статистика» Excel применяется для

создания одномерного статистического отчета, содержащего информацию о центральной тенденции и изменчивости вариационного ряда.

Пусть значения переменной величины распределились следующим образом (табл. 1).

Введем исходные данные в Excel и применим инструмент анализа «Описательная статистика», кото-

Табл. 1

A B C D E F G H I J K L M N O P Q R

7 6 12 5 9 11 11 3 5 11 12 6 5 13 4 11 4 18

Данные — Анализ — Анализ данных — Описательная статистика

Файл Главная I Вставка Разметка с Формулы

Данные

Получение знешних данных

AI

Рецензиро 1 ' Вид Разработки Inquire Power Pivo- 0 Поиск Общий доступ

Рп

J3 gg

Создать запрос ' L© Скачать & пр...

Pi

л

Обновить

все * Leo Подключения

Форма Форма...

я!

Я А А Я

Я| Сортировка

Фильтр ,

Сортировка и фильтр

В'§

Работа с данными '

Прогноз

Структура

^□Анализ данных Поиск решения у

Анализ

а

Анализданных ? X

Инструменты анализа

Однофакторный дисперсионный анализ Двухфакторный дисперсионный анализ с повторениями Двухфакторный дисперсионный анализ без повторений Корреляция [ Отмена 1 Справка

Экспоненциальное сглаживание Двухвыборочный Я-тест для дисперсии Анализ Фурье Гистограмма V б

Рис. 1

рый запускается из формы Анализ данных в группе Анализ на вкладке Данные (рис. 1 а, б).

Если в группе Анализ нет команды вызова формы Анализ данных, следует перейти в параметры Excel и активировать Пакет анализа в списке Надстройки Excel (рис. 2).

Перед расчетом статистических характеристик важно, чтобы исходные данные были упорядочены (ранжированы) по убыванию (рис. 3).

Не углубляясь особо в теорию математической статистики, прокомментируем, что мы получили для набора данных В1:В18.

Максимум, минимум, интервал (разница между наибольшим и наименьшим значениями набора данных), сумма, счет (объем или количество данных в наборе) — простые числовые характеристики вариации данных.

Среднее (арифметическое) рассчитывается как сумма всех значений числового набора данных, деленная на мощность (количество элементов).

Значение среднего арифметического не всегда отражает основную тенденцию изучаемого показателя. Например, если девять человек получают пенсию 10 тыс. руб., а один — 100 тыс. руб., то их средняя пенсия составит 19 тыс. руб., что не совсем правильно характеризует ситуацию. Или, о чем говорит средняя температура людей в больничной палате? Поэтому для более точной оценки центральной тенденции показателя в ряде случаев используют медиану и моду.

Медиана—это число, геометрически расположенное в середине шкалы упорядоченного числового набора данных, так, что половина данных имеют значения больше медианы (справа), а половина — меньше (слева).

Файл — Параметры — Надстройки — Управление — Перейти

Параметры Excel

Общие

Формулы

Правописание

Сохранение

Язык

Специальные возможности Дополнительно Настроить ленту Панель быстрого доступа

Надстройки

Центр управления безопасностью

Надстройки

Имя ж расположение -

Активные надстройки приложений

Inquire C:\...ativeShim. -Г

тс

X Надстройки

Доступные надстройки: Euro Currency Tools VlfiШ

S Пакет анализа — VBA Поиск решения

Надстройка: Inquire Издатель: Microsoft Corporation

Совместимость: Отсутствуют сведения о совместимости Расположение: C:\Program Files (x86)\Microsoft Office\root\Office16\DCF\ NativeShim.dll

Описание: NativeShim Inquire Addins used by SpreadsheetlQ.

Управление: Надстройки Excel

Перейти...

OK

Обзор-

Автоматизация...

Пакет анализа

Содержит инструменты для анализа научных и финансовых данных

Отмена

Рис. 2

Мода — число, наиболее часто встречающееся в наборе данных.

При нормальном симметричном распределении набора данных все три значения центральной тенденции будут совпадать (рис. 4).

Среднее арифметическое, медиана и мода наиболее информативны при сравнении наборов данных.

Дисперсия выборки (от лат. dispersio — рассеяние) — среднее арифметическое квадратов отклонений чисел ряда от среднего значения.

Стандартное отклонение — квадратный корень из дисперсии выборки, является мерой того, насколько широко разбросаны точки данных относительно их среднего.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Эксцесс показывает крутизну пика распределения, характеризует относительную остроконечность или сглаженность распределения по сравнению с нормальным распределением. Положительный эксцесс обозначает относительно остроконечное распределение (пик заострен). Отрицательный эксцесс обозначает относительно сглаженное распределение (пик закруглен). Если эксцесс существенно отличается от нуля, то распределение имеет или более закругленный пик, чем нормальный, или, напротив, имеет более острый пик (возможно, имеется несколько пиков). Эксцесс нормального распределения равен нулю.

Асимметрия или асимметричность показывает отклонение распределения от нормального. Если асимметрия существенно отличается от нуля, то, в отличие от нормального, распределение несимметрично. Если распределение имеет длинный правый хвост, то асимметрия положительна, если длинный хвост слева — отрицательна.

Выбросы (outliers) — данные, резко отличающиеся от большинства значений набора данных.

Описательная статистика Входные данные Входной интервал:

Группирование:

вядиаша

ш

(§) по столбцам О по строкам

|~| Метки в первой строке

Параметры вывода

(•) Выходной интервал: |$С$1 №

О Новый рабочий лист: 1 1

О Новая рабочая книга

0 Итоговая статистика

1^1 Уровень надежности: |95 %

0 К-ый наименьший: 1

0 К-ый наибольший: 1

Рис. 3

л А в С D

1 R 18 Столбец1

2 N 13

3 С 12 Среднее 8,5

4 К 12 Стандартная ошибка 0,960834332

5 F 11 Медиана 8

б G 11 Мода 11

7 J 11 Стандартное отклонение 4,076474832

8 Р 11 Дисперсия выборки 16,61764706

9 Е 9 Эксцесс -0,18844451

10 А 7 Асимметричность 0,571485441

11 В б Интервал 15

12 L б Минимум 3

13 D 5 Максимум 18

14 1 5 Сумма 153

15 М 5 Счет 18

16 О 4 Наибольший(1) 18

17 Q 4 Наименьший(1) 3

18 н 3 Уровень надежности(95,0%) 2,027183242

Литература

1. Ищенко А.Н., Страхов А.А. Информатика и информационные технологии в профессиональной деятельности (создание простейшей системы психологического тестирования с помощью табличного процессора Excel на примере теста Г.Айзенка). М., 2017.

Отрицательная асимметрия

Стандартное нормальное распределение

Положительная асимметрия

С01ВДШЙ1КШМ* СГШШШКМИШ шишпииммтмй

шммкшм (ммшшм OIWIMMHIM

(Wt

С01МЦ11ПКЯШМША С№ЩШН0|ШКШМ сстцЮМММШМ (ЯШ

Ч> XII

Рис. 4

2. Ищенко А.Н., Ищенко И.Н. Информатика и информационные технологии в профессиональной деятельности (создание простейшей учебной автоматизированной системы бухгалтерского учета с помощью табличного процессора Excel): Учеб. наглядное пособие. М.: Издательство «Перо», 2017.

3. Ищенко А.Н., Страхов А.А. Вопросы применения табличного процессора как инструментальной основы первоначального обучения автоматизации психологического тестирования // Естественные и технические науки. 2017. № 10. С. 129-131.

4. Слесарева Е.А., Смирнов Д.Е. Информационные технологии как средство решения практических задач в деятельности психолога // Государственная служба и кадры. 2016. № 4.

5. Слесарева Е.А., Задохина Н.В. Критерии статистической значимости как неотъемлемая часть экспериментальной психологии // Вестник Московского университета МВД России. 2017. № 4.

6. Слесарева Е.А. Математические методы в психологии как средство обработки экспериментальных данных: Сб. мат. Всерос. науч.-техн. конф. «Математические методы и информационные технологии управления в науке, образовании и правоохранительной сфере». Рязань: Московский государственный технический университет имени В.Э. Баумана, Академия ФСИН России, Рязанский государственный университет имени С.А. Есенина. 2017. С. 325-329.

References

1. Ishchenko A.N., Strakhov A.A. Informatika i in-formatsionnyye tekhnologii v professional'noy deyatelno-

sti (sozdaniye prosteyshey sistemy psikhologicheskogo te-stirovaniya s pomoshch'yu tablichnogo protsessora Excel na primere testa G.Ayzenka). M., 2017.

2. Ishchenko A.N., Ishchenko I.N. Informatika i in-formatsionnyye tekhnologii v professional'noy deyatel'no-sti (sozdaniye prosteyshey uchebnoy avtomatizirovannoy sistemy bukhgalterskogo ucheta s pomoshch'yu tablichnogo protsessora Excel): Ucheb. naglyadnoye posobiye. M.: Izdatel'stvo «Pero», 2017.

3. Ishchenko A.N., Strakhov A. A. Voprosy primene-niya tablichnogo protsessora kak instrumental'noy osnovy pervonachal'nogo obucheniya avtomatizatsii psikhologicheskogo testirovaniya // Estestvennyye i tekhnicheskiye nauki. 2017. № 10. S. 129-131.

4. Slesareva E.A., Smirnov D.E. Informatsionnyye tekhnologii kak sredstvo resheniya prakticheskikh za-dach v deyatel'nosti psikhologa // Gosudarstvennaya sluzhba i kadry. 2016. № 4.

5. Slesareva E.A., Zadokhina N. V. Kriterii statistiches-koy znachimosti kak neot'yemlemaya chast' eksperimen-tal'noy psikhologii // Vestnik Moskovskogo universiteta MVD Rossii. 2017. № 4.

6. Slesareva E.A. Matematicheskiye metody v psikhologii kak sredstvo obrabotki eksperimental'nykh dan-nykh: Sb. mat. Vseros. nauch.-tekhn. konf. «Matematicheskiye metody i informatsionnyye tekhnologii uprav-leniya v nauke, obrazovanii i pravookhranitel'noy sfere». Ryazan': Moskovskiy gosudarstvennyy tekhnicheskiy universitet imeni V.E. Baumana, Akademiya FSIN Rossii, Ryazanskiy gosudarstvennyy universitet imeni S.A. Esenina. 2017. S. 325-329.

i Надоели баннеры? Вы всегда можете отключить рекламу.