ПСИХОЛОГИЧЕСКИЕ НАУКИ
УДК 004.9 ББК 88
Doi 10.24411 /2073-0454-2018-10060 © А.А. Страхов, Е.А. Слесарева, Н.В. Задохина, 2018
ОБРАБОТКА РЕЗУЛЬТАТОВ СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ ПОСРЕДСТВОМ ТАБЛИЧНОГО ПРОЦЕССОРА
Андрей Александрович Страхов, доцент кафедры информатики и математики
Московский университет МВД России имени В.Я. Кикотя (117437, Москва, ул. Академика Волгина, д. 12) E-mail: [email protected]
Екатерина Александровна Слесарева, доцент кафедры информатики и математики, кандидат психологических наук Московский университет МВД России имени В.Я. Кикотя (117437, Москва, ул. Академика Волгина, д. 12) E-mail: [email protected]
Нина Владимировна Задохина, старший преподаватель кафедры информатики и математики, кандидат педагогических наук
Московский университет МВД России имени В.Я. Кикотя (117437, Москва, ул. Академика Волгина, д. 12) E-mail: [email protected]
Аннотация. Анализируется работа макрофункции «Описательная статистика».
Ключевые слова: пакет анализа, макрофункция «Описательная статистика», первичные результаты наблюдений (экспериментов), максимум, минимум, интервал (разница между наибольшим и наименьшим значениями набора данных), сумма, счет (объем или количество данных в наборе), простые числовые характеристики вариации данных.
PROCESSING OF STATISTICAL OBSERVATION RESULTS BY MEANS OF A TABLE PROCESSOR
Andrey A. Strakhov, associate professor of the Department of informatics and mathematics Moscow University of the Ministry of Internal affairs of Russia named after V.Ya. Kikot' (117437, Moscow, ul. Akademika Volgina, d. 12) E-mail: [email protected]
Ekaterina A. Slesareva, associate professor, Chair of informatics and mathematics, candidate of psychological sciences Moscow University of the Ministry of Internal affairs of Russia named after V.Ya. Kikot' (117437, Moscow, ul. Akademika Volgina, d. 12) E-mail: [email protected]
Nina V. Zadokhina, senior lecturer, Chair of informatics and mathematics, candidate of pedagogical sciences Moscow University of the Ministry of Internal affairs of Russia named after V.Ya. Kikot' (117437, Moscow, ul. Akademika Volgina, d. 12) E-mail: [email protected]
Annotation. The article deals with the work of the macro-function Descriptive statistics.
Keyword: analysis package, macrofungi Descriptive statistics, preliminary results of observations (experiments), high, low, range (difference between largest and smallest values in the dataset), the amount of the expense (the amount or quantity of data in the dataset), simple numerical characteristics of data variation.
Citation-индекс в электронной библиотеке НИИОН
Для цитирования: Страхов А.А., Слесарева Е.А., Задохина Н.В. Обработка результатов статистического наблюдения посредством табличного процессора. Вестник Московского университета МВД России. 2018;(6):305—308.
Рассмотрим работу макрофункции «Описательная статистика».
Основная задача описательной статистики — обобщить первичные результаты наблюдений (экспериментов) и представить данные в форме, удобной для восприятия и анализа. Инструмент анализа «Описательная статистика» Excel применяется для
создания одномерного статистического отчета, содержащего информацию о центральной тенденции и изменчивости вариационного ряда.
Пусть значения переменной величины распределились следующим образом (табл. 1).
Введем исходные данные в Excel и применим инструмент анализа «Описательная статистика», кото-
Табл. 1
A B C D E F G H I J K L M N O P Q R
7 6 12 5 9 11 11 3 5 11 12 6 5 13 4 11 4 18
Данные — Анализ — Анализ данных — Описательная статистика
Файл Главная I Вставка Разметка с Формулы
Данные
Получение знешних данных
AI
Рецензиро 1 ' Вид Разработки Inquire Power Pivo- 0 Поиск Общий доступ
Рп
J3 gg
Создать запрос ' L© Скачать & пр...
Pi
л
Обновить
все * Leo Подключения
Форма Форма...
я!
Я А А Я
Я| Сортировка
Фильтр ,
Сортировка и фильтр
В'§
Работа с данными '
Прогноз
Структура
^□Анализ данных Поиск решения у
Анализ
а
Анализданных ? X
Инструменты анализа
Однофакторный дисперсионный анализ Двухфакторный дисперсионный анализ с повторениями Двухфакторный дисперсионный анализ без повторений Корреляция [ Отмена 1 Справка
Экспоненциальное сглаживание Двухвыборочный Я-тест для дисперсии Анализ Фурье Гистограмма V б
Рис. 1
рый запускается из формы Анализ данных в группе Анализ на вкладке Данные (рис. 1 а, б).
Если в группе Анализ нет команды вызова формы Анализ данных, следует перейти в параметры Excel и активировать Пакет анализа в списке Надстройки Excel (рис. 2).
Перед расчетом статистических характеристик важно, чтобы исходные данные были упорядочены (ранжированы) по убыванию (рис. 3).
Не углубляясь особо в теорию математической статистики, прокомментируем, что мы получили для набора данных В1:В18.
Максимум, минимум, интервал (разница между наибольшим и наименьшим значениями набора данных), сумма, счет (объем или количество данных в наборе) — простые числовые характеристики вариации данных.
Среднее (арифметическое) рассчитывается как сумма всех значений числового набора данных, деленная на мощность (количество элементов).
Значение среднего арифметического не всегда отражает основную тенденцию изучаемого показателя. Например, если девять человек получают пенсию 10 тыс. руб., а один — 100 тыс. руб., то их средняя пенсия составит 19 тыс. руб., что не совсем правильно характеризует ситуацию. Или, о чем говорит средняя температура людей в больничной палате? Поэтому для более точной оценки центральной тенденции показателя в ряде случаев используют медиану и моду.
Медиана—это число, геометрически расположенное в середине шкалы упорядоченного числового набора данных, так, что половина данных имеют значения больше медианы (справа), а половина — меньше (слева).
Файл — Параметры — Надстройки — Управление — Перейти
Параметры Excel
Общие
Формулы
Правописание
Сохранение
Язык
Специальные возможности Дополнительно Настроить ленту Панель быстрого доступа
Надстройки
Центр управления безопасностью
Надстройки
Имя ж расположение -
Активные надстройки приложений
Inquire C:\...ativeShim. -Г
тс
X Надстройки
Доступные надстройки: Euro Currency Tools VlfiШ
S Пакет анализа — VBA Поиск решения
Надстройка: Inquire Издатель: Microsoft Corporation
Совместимость: Отсутствуют сведения о совместимости Расположение: C:\Program Files (x86)\Microsoft Office\root\Office16\DCF\ NativeShim.dll
Описание: NativeShim Inquire Addins used by SpreadsheetlQ.
Управление: Надстройки Excel
Перейти...
OK
Обзор-
Автоматизация...
Пакет анализа
Содержит инструменты для анализа научных и финансовых данных
Отмена
Рис. 2
Мода — число, наиболее часто встречающееся в наборе данных.
При нормальном симметричном распределении набора данных все три значения центральной тенденции будут совпадать (рис. 4).
Среднее арифметическое, медиана и мода наиболее информативны при сравнении наборов данных.
Дисперсия выборки (от лат. dispersio — рассеяние) — среднее арифметическое квадратов отклонений чисел ряда от среднего значения.
Стандартное отклонение — квадратный корень из дисперсии выборки, является мерой того, насколько широко разбросаны точки данных относительно их среднего.
Эксцесс показывает крутизну пика распределения, характеризует относительную остроконечность или сглаженность распределения по сравнению с нормальным распределением. Положительный эксцесс обозначает относительно остроконечное распределение (пик заострен). Отрицательный эксцесс обозначает относительно сглаженное распределение (пик закруглен). Если эксцесс существенно отличается от нуля, то распределение имеет или более закругленный пик, чем нормальный, или, напротив, имеет более острый пик (возможно, имеется несколько пиков). Эксцесс нормального распределения равен нулю.
Асимметрия или асимметричность показывает отклонение распределения от нормального. Если асимметрия существенно отличается от нуля, то, в отличие от нормального, распределение несимметрично. Если распределение имеет длинный правый хвост, то асимметрия положительна, если длинный хвост слева — отрицательна.
Выбросы (outliers) — данные, резко отличающиеся от большинства значений набора данных.
Описательная статистика Входные данные Входной интервал:
Группирование:
вядиаша
ш
(§) по столбцам О по строкам
|~| Метки в первой строке
Параметры вывода
(•) Выходной интервал: |$С$1 №
О Новый рабочий лист: 1 1
О Новая рабочая книга
0 Итоговая статистика
1^1 Уровень надежности: |95 %
0 К-ый наименьший: 1
0 К-ый наибольший: 1
Рис. 3
л А в С D
1 R 18 Столбец1
2 N 13
3 С 12 Среднее 8,5
4 К 12 Стандартная ошибка 0,960834332
5 F 11 Медиана 8
б G 11 Мода 11
7 J 11 Стандартное отклонение 4,076474832
8 Р 11 Дисперсия выборки 16,61764706
9 Е 9 Эксцесс -0,18844451
10 А 7 Асимметричность 0,571485441
11 В б Интервал 15
12 L б Минимум 3
13 D 5 Максимум 18
14 1 5 Сумма 153
15 М 5 Счет 18
16 О 4 Наибольший(1) 18
17 Q 4 Наименьший(1) 3
18 н 3 Уровень надежности(95,0%) 2,027183242
Литература
1. Ищенко А.Н., Страхов А.А. Информатика и информационные технологии в профессиональной деятельности (создание простейшей системы психологического тестирования с помощью табличного процессора Excel на примере теста Г.Айзенка). М., 2017.
Отрицательная асимметрия
Стандартное нормальное распределение
Положительная асимметрия
С01ВДШЙ1КШМ* СГШШШКМИШ шишпииммтмй
шммкшм (ммшшм OIWIMMHIM
(Wt
С01МЦ11ПКЯШМША С№ЩШН0|ШКШМ сстцЮМММШМ (ЯШ
Ч> XII
Рис. 4
2. Ищенко А.Н., Ищенко И.Н. Информатика и информационные технологии в профессиональной деятельности (создание простейшей учебной автоматизированной системы бухгалтерского учета с помощью табличного процессора Excel): Учеб. наглядное пособие. М.: Издательство «Перо», 2017.
3. Ищенко А.Н., Страхов А.А. Вопросы применения табличного процессора как инструментальной основы первоначального обучения автоматизации психологического тестирования // Естественные и технические науки. 2017. № 10. С. 129-131.
4. Слесарева Е.А., Смирнов Д.Е. Информационные технологии как средство решения практических задач в деятельности психолога // Государственная служба и кадры. 2016. № 4.
5. Слесарева Е.А., Задохина Н.В. Критерии статистической значимости как неотъемлемая часть экспериментальной психологии // Вестник Московского университета МВД России. 2017. № 4.
6. Слесарева Е.А. Математические методы в психологии как средство обработки экспериментальных данных: Сб. мат. Всерос. науч.-техн. конф. «Математические методы и информационные технологии управления в науке, образовании и правоохранительной сфере». Рязань: Московский государственный технический университет имени В.Э. Баумана, Академия ФСИН России, Рязанский государственный университет имени С.А. Есенина. 2017. С. 325-329.
References
1. Ishchenko A.N., Strakhov A.A. Informatika i in-formatsionnyye tekhnologii v professional'noy deyatelno-
sti (sozdaniye prosteyshey sistemy psikhologicheskogo te-stirovaniya s pomoshch'yu tablichnogo protsessora Excel na primere testa G.Ayzenka). M., 2017.
2. Ishchenko A.N., Ishchenko I.N. Informatika i in-formatsionnyye tekhnologii v professional'noy deyatel'no-sti (sozdaniye prosteyshey uchebnoy avtomatizirovannoy sistemy bukhgalterskogo ucheta s pomoshch'yu tablichnogo protsessora Excel): Ucheb. naglyadnoye posobiye. M.: Izdatel'stvo «Pero», 2017.
3. Ishchenko A.N., Strakhov A. A. Voprosy primene-niya tablichnogo protsessora kak instrumental'noy osnovy pervonachal'nogo obucheniya avtomatizatsii psikhologicheskogo testirovaniya // Estestvennyye i tekhnicheskiye nauki. 2017. № 10. S. 129-131.
4. Slesareva E.A., Smirnov D.E. Informatsionnyye tekhnologii kak sredstvo resheniya prakticheskikh za-dach v deyatel'nosti psikhologa // Gosudarstvennaya sluzhba i kadry. 2016. № 4.
5. Slesareva E.A., Zadokhina N. V. Kriterii statistiches-koy znachimosti kak neot'yemlemaya chast' eksperimen-tal'noy psikhologii // Vestnik Moskovskogo universiteta MVD Rossii. 2017. № 4.
6. Slesareva E.A. Matematicheskiye metody v psikhologii kak sredstvo obrabotki eksperimental'nykh dan-nykh: Sb. mat. Vseros. nauch.-tekhn. konf. «Matematicheskiye metody i informatsionnyye tekhnologii uprav-leniya v nauke, obrazovanii i pravookhranitel'noy sfere». Ryazan': Moskovskiy gosudarstvennyy tekhnicheskiy universitet imeni V.E. Baumana, Akademiya FSIN Rossii, Ryazanskiy gosudarstvennyy universitet imeni S.A. Esenina. 2017. S. 325-329.