Научная статья на тему 'Исследование взаимосвязей данных с помощью диаграмм рассеяния и корреляций'

Исследование взаимосвязей данных с помощью диаграмм рассеяния и корреляций Текст научной статьи по специальности «Математика»

CC BY
405
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЗАИМОСВЯЗЬ ДАННЫХ / ДИАГРАММА РАССЕЯНИЯ / КОРРЕЛЯЦИЯ / КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ / ДВУМЕРНЫЕ ДАННЫЕ

Аннотация научной статьи по математике, автор научной работы — Круцких Татьяна Константиновна

В статье рассматривается процесс исследования взаимосвязей двумерных данных, значение корреляции и диаграммы рассеяния, а также нахождение коэффициента корреляции.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Круцких Татьяна Константиновна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Исследование взаимосвязей данных с помощью диаграмм рассеяния и корреляций»

Литература

1. Информационные технологии в управлении предприятием. [Электронный ресурс]: ИНТУИТ. URL: http://www.intuit.ru/studies/courses/13833/1230/lecture/24057/ (дата обращения: 11.07.2016).

2. Использование информационных технологий и систем для повышения эффективности управления бизнес-процессами организации. [Электронный ресурс]: Издательская группа «Дело и сервис». URL: http://dis.ru/library/557/26292/ (дата обращения: 11.07.2016).

3. Клиент-серверные технологии. [Электронный ресурс]: Informator JSC. URL: http://www.informator.ru/nkl_server.html/ (дата обращения: 11.07.2016).

Исследование взаимосвязей данных с помощью диаграмм рассеяния и корреляций Круцких Т. К.

Круцких Татьяна Константиновна /Krutskikh ТаНапа Кот1апйпоупа - бакалавр прикладной

информатики,

кафедра информатики, факультет информатики и робототехники, Уфимский государственный авиационный университет, г. Уфа

Аннотация: в статье рассматривается процесс исследования взаимосвязей двумерных данных, значение корреляции и диаграммы рассеяния, а также нахождение коэффициента корреляции.

Ключевые слова: взаимосвязь данных, диаграмма рассеяния, корреляция, коэффициент корреляции, двумерные данные.

Окружающий мир полон различных взаимосвязей: между отношением к труду и производительностью, между корпоративной стратегией и долей рынка, между вмешательством государства и состоянием экономики, между объемом выпускаемой продукции и затратами, между сбытом и доходами.

При исследовании двумерных данных (например, заработной платы и образования), каждое измерение можно изучать по отдельности - в качестве части одномерной совокупности данных. Но выявить взаимосвязь между ними можно лишь при совместном изучении двух измерений [1].

Диаграмма рассеяния представляет каждое наблюдение (или элементарную единицу) в пространстве двух измерений, соответствующих двум факторам. Если одна переменная рассматривается как «причина», влияющая на другую переменную, она обозначается буквой X, и ей соответствует горизонтальная ось. Реагирующая на это влияние переменная обозначается буквой Y, и ей соответствует вертикальная ось [2]. Если невозможно четко определить, какая переменная оказывает влияние, а какая подвержена ему, то можно просто обозначить один фактор X, а другой — Y.

Диаграмма рассеяния для небольшой двумерной совокупности данных, представленной на рисунке 1, показана на рисунке 2.

Затраты на технологические инновации организаций за 2013 год по областям Российской Федерации в млн. рублей

Область РФ Площадь области, км' (X.) Затраты на технологические инновации организаций, млн. руб. (¥0 ХнХср - ^"ср (ХьХсрХУЬУср)

Белгородская 27100 1107,37 -8700 -2760,81 24019011.77

Брянская 34900 2080,25 -900 -1787.93 1609133,63

Владимирская 29000 4720,81 -6800 852.63 -5797912.22

Воронежская 52200 7564,28 16400 3696,10 60616008,02

Средние значения: 35800 3 868,2 Сумма: 80446241,19

Стандартные отклонения: 11426,58 2898,67

Объем выборки: 4

Рис. 1. Анализ двухмерной совокупности данных

Рис. 2. Диаграмма рассеяния

Коэффициент корреляции, обозначающийся как г, является числом в диапазоне от -1 до 1, который характеризует силу взаимосвязи данных. Корреляция, равная 1, указывает на идеальную взаимосвязь в виде прямой линии, причем более высокие значения одной переменной соответствуют идеально предсказуемым более высоким значениям другой переменной. Корреляция, равная -1, указывает на идеальную отрицательную взаимосвязь в виде прямой линии, причем одна переменная уменьшается с ростом другой [3].

Обычная интерпретация корреляции, равной 0, заключается в том, что взаимосвязи нет, есть только случайность.

Формула для коэффициента корреляции

-^Г i (X - X№ - Y ) n -1 i=1

r =

SxSy

включает двумерные данные, начиная с двух измерений (XI, У1), сделанных для первого объекта, и заканчивая измерениями (Хп, Yn).

Рассматривая каждый столбец чисел по отдельности, можно, например, вычислить обычное стандартное отклонение выборки только для значений X, т. е. найти Sх; аналогично, Sy представляет собой стандартное отклонение только лишь для значений Y. Формула для вычисления коэффициента корреляции также включает сумму попарных произведений значений X и Y, которая фиксирует их взаимозависимость, разделенную на п-1 (как обычно поступают при вычислении стандартного отклонения).

Взаимосвязь между площадью области и затратами на технологические инновации организаций в данной области оказалась сильной положительной (г =0,81): точки на диаграмме выстраиваются снизу вверх при движении слева направо. Это свидетельствует о том, что в областях, имеющих большую занимаемую площадь, было затрачено больше средств на технологические инновации организаций, чем в областях с меньшей площадью.

Литература

1. Диаграмма рассеяния в Excel и сферы ее применения. [Электронный ресурс]: ExcelTABLE: http://exceltable.com/grafiki/diagramma-rasseyaniya/ (дата обращения: 15.07.2016).

2. Двухмерный визуальный анализ данных. [Электронный ресурс]: Сообщество HR-менеджеров: http://www.hr-portal.ru/statistica/gl5/gl5.php/ (дата обращения: 15.07.2016).

3. Сигел Эндрю Практическая бизнес-статистика. Пер. с англ. М. Издательский дом «Вильямс», 2002. 1056 с.

Система автоматического управления по сигналу

гиростабилизатора

1 2 Петров А. А. , Будин Д. И.

1Петров Алексей Александрович /Petrov Alexey Aleksandrovich - студент; 2Будин Дмитрий Иванович /Budin Dmitry Ivanovich - студент, кафедра систем автоматического управления и контроля, факультет интеллектуальных технических систем, Национальный исследовательский университет Московский институт электронной техники, г. Зеленоград

Аннотация: в статье рассматриваются особенности создания системы автоматического управления, на вход которой поступает сигнал гиростабилизатора.

Ключевые слова: гиростабилизатор, СА У.

Гиростабилизатор - это гироскопическое устройство, предназначенное для стабилизации отдельных объектов или приборов, а также для определения угловых отклонений объектов. Данные приборы предназначены для стабилизации полезной нагрузки и управления ее положением в заданной системе координат. Цель

38

i Надоели баннеры? Вы всегда можете отключить рекламу.