Научная статья на тему 'КОМБИНИРОВАНИЕ И ОПТИМИЗАЦИЯ МЕТОДИК АНАЛИЗА УПОРЯДОЧЕННОГО НАБОРА ЧИСЕЛ'

КОМБИНИРОВАНИЕ И ОПТИМИЗАЦИЯ МЕТОДИК АНАЛИЗА УПОРЯДОЧЕННОГО НАБОРА ЧИСЕЛ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
44
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА / ОБРАБОТКА РЕЗУЛЬТАТОВ ЭМПИРИЧЕСКОГО ИССЛЕДОВАНИЯ / СТАТИСТИЧЕСКИЙ АНАЛИЗ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Норокеску Марис Марсовна

По результатам изучения коллектива при помощи методик психологического тестирования с целью оценки и рассмотрения различных психологических показателей членов этого коллектива исследователь-психолог формирует набор чисел. Эти числа демонстрируют ему в удобной для всестороннего анализа личные качества исследуемых людей. Чтобы было возможно математически и статистически оценить эмоциональную атмосферу в коллективе и дать характеристику группе, исследователю нужно поделить людей на три группы. Первая - это те, у кого показатели ниже среднего для коллектива. Вторая - это типичные представители, так называемый “среднячок”. Третья - это те, у кого изучаемые показатели повышенные. Данное исследование описывает методику, которая основана на комбинировании инструментов математической статистики и предлагает исследователю беспристрастную чисто математическую оценку результатов его исследований.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Норокеску Марис Марсовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMBINING AND OPTIMIZING METHODS FOR ANALYZING AN ORDERED SET OF NUMBERS

Based on the results of studying the team using psychological testing techniques in order to evaluate and consider various psychological indicators of the members of this team, the researcher-psychologist forms a set of numbers. These numbers demonstrate to him, in a form convenient for comprehensive analysis, the personal qualities of the people studied. In order to be able to mathematically and statistically assess the emotional atmosphere in the team and characterize the group, the researcher needs to divide people into three groups. The first is those who have indicators below the average for the team. The second is typical representatives, the so-called “average". The third is those who have increased the studied indicators. This study describes a methodology that is based on a combination of mathematical statistics tools and offers the researcher an unbiased purely mathematical assessment of the results of his research.

Текст научной работы на тему «КОМБИНИРОВАНИЕ И ОПТИМИЗАЦИЯ МЕТОДИК АНАЛИЗА УПОРЯДОЧЕННОГО НАБОРА ЧИСЕЛ»

УДК 519.237.4

DOI: 10.24412/2071-6168-2023-2-177-180

КОМБИНИРОВАНИЕ И ОПТИМИЗАЦИЯ МЕТОДИК АНАЛИЗА УПОРЯДОЧЕННОГО

НАБОРА ЧИСЕЛ

М.М. Норокеску

По результатам изучения коллектива при помощи методик психологического тестирования с целью оценки и рассмотрения различных психологических показателей членов этого коллектива исследователь-психолог формирует набор чисел. Эти числа демонстрируют ему в удобной для всестороннего анализа личные качества исследуемых людей. Чтобы было возможно математически и статистически оценить эмоциональную атмосферу в коллективе и дать характеристику группе, исследователю нужно поделить людей на три группы. Первая — это те, у кого показатели ниже среднего для коллектива. Вторая — это типичные представители, так называемый "среднячок". Третья — это те, у кого изучаемые показатели повышенные. Данное исследование описывает методику, которая основана на комбинировании инструментов математической статистики и предлагает исследователю беспристрастную чисто математическую оценку результатов его исследований.

Ключевые слова: математическая статистика, обработка результатов эмпирического исследования, статистический анализ.

На сегодняшний день психология как наука предлагает ряд опросников, методик, инструментов и других средств для оценки личностных качеств как отдельного человека, так и целых групп испытуемых людей. Среди них можно выделить те, которые при помощи таких научных подходов, как анализ и синтез, дедукция и индукция, моделирование, дефрагментация и так далее разделяет целостную личность человека на ряд качеств, которые можно оценивать числовыми показателями. Дефрагментирует и упрощает человека до математической модели его личности в текущем состоянии на момент выполнения среза. В таком разложенном виде — в формате набора чисел и соответствующих им показателей — человек становится удобен для изучения и рассмотрения.

Вопрос этичности подобных подходов остаётся за пределами данного исследования. Поэтому посчитаем описанный выше способ постижения природы личности правомерным и найдём способ проводить эти операции качественно.

Итак, исследователь психологии ставит для себя задачу оценить предложенный ему коллектив по выбранному конкретному показателю. Он ищет подходящие методики, которые удобны для измерения нужного показателя, и предлагает членам коллектива опросники для заполнения. Переведя результаты опроса в числовую форму, он получает в свои руки некоторые числа. Его следующая задача потенциально может быть сформулирована следующим образом: определить, что в коллективе есть норма, а что выбивается из нормы в зону аномалии.

То есть, если разбить описанную цель на этапы, получается такая последовательность пунктов:

1. Решить, что в пределах этого коллектива представляют собой чрезмерно низкие показатели

2. Решить, что в пределах этого общества принято называть чрезмерно высокими показателями

3. Вычленить так называемую "норму", которая описывает средних, так сказать, "заурядных" представителей коллектива

Для решения этих задач предложим ряд инструментов математической статистики. И затем выполним апробацию на данных, сгенерированных по принципу случайности.

Для апробации будем использовать абстрактный виртуальный психологический тест, в рамках которого назначим такой диапазон значений каждого показателя: от 0 до 100. Затем сгенерируем несколько наборов виртуальных упорядоченных по возрастанию тестовых показателей, переведённых в числа:

1 набор: 23 25 28 28 32 48 52 52 73 75 76 78 91 91 94

2 набор: 2 4 5 10 17 36 40 41 41 52 73 74 77 78 80

3 набор: 10 10 17 28 40 45 56 67 72 76 79 86 90 95 99

4 набор: 1 9 17 25 39 40 50 50 50 55 56 59 63 66 68

5 набор: 31 32 37 46 53 59 62 65 78 79 81 82 87 99 99

Для каждого из предложенных наборов показателей затем вычислим следующие величины: самое часто встречающееся здесь значение, иначе называемое модой, общую сумму всех членов набора, поделённую на количество чисел, входящих в него, затем - разность между самым большим и самым маленьким значением, входящим в набор, то есть, размах набора [2]. И, кроме того, выберем некое число, расположившееся точно посередине набора [3]. Далее понадобится посчитать среднее линейное отклонение - то есть, математическую меру разброса значений показателя вокруг их усреднённого, срединного значения (среднего арифметического) [4] и межквартильный размах - разность между первым и третьим фрагментом набора, содержащим четверть от всего набора [5].

Известия ТулГУ. Технические науки. 2023. Вып. 2

Как предполагается в начале исследования, наиболее полезную для дальнейших аналитических изысканий информацию исследователю представит методика, предполагающая подсчитывание среднего арифметического для набора чисел, его медианы и, помимо прочего межквартильного размаха. Последний статистический показатель, то есть, межквартильный размах, потенциально полезен в виду того, что его использование помогает отщеплять чрезмерно, так сказать, аномально большие и малые величины внутри набора [6].

Были проведены исследования выбранных статистических величин. Результаты этих подсчётов

в табл. 1.

Средние величины для наборов оцениваемых психологических показателей

Таблица 1

№ набора Мода Ср. арифм. Размах Медиана Ср. лин. откл. Межкв. размах

1 28 57.72 70 52 22.17 49

2 42 42.86 77 41 23 63

3 10 58.1 88 67 25.44 57

4 50 42.12 67 50 16.21 33

5 99 66 66 65 18.01 35

Заметим, что такие величины, среднее арифметическое для набора чисел и его мода очень сильно поддаются воздействию значений, выходящих за так называемый диапазон нормы. Даже поверхностный визуальный осмотр ряда доказывает это. Данные из таблицы 1 подтверждают данное замечание. Поэтому отбросим их и не будем использовать в продолжении исследования. Продолжим работу с меж-квартильным размахом и медианой.

Затем разберём потенциально полезные способы получить искомый диапазон "нормальных" или "типичных" значений.

С целью решения этой задачи мы выберем несколько потенциально пригодных величин, а затем каждой выбранной величины рассмотрим некий диапазон, который можно с её помощью вычленить, выделить из представленного работа по описанным ниже правилам:

1. отход в большую и в меньшую сторону на половину от её значения;

2. отход от неё в большую и в меньшую сторону на половину значения размаха ряда;

3. отход от неё в большую и в меньшую сторону на значение среднего линейного отклонения.

Выполним апробацию каждого правила на тестовом наборе данных и оценим результаты апробации.

Как упоминалось ранее, среднее арифметическое и мода исключены из дальнейших исследований по причине их подверженности влиянию значений, выходящих за пределы интересного сейчас срединного диапазона.

Результаты проверки каждого правила из трёх для медианы набора чисел и для его межквар-тильного размаха приведены в табл. 2.

Таблица2

Диапазоны средних значений на основе медианы и межквартильного размаха_

Медиана

Набор Величина отклонения

Половина значения Половина размаха ряда Среднее линейное отклонение

23 25 28 28 32 48 52 52 73 75 76 78 91 91 94 28 28 32 48 52 52 73 75 76 78 23 25 28 28 32 48 52 52 73 75 76 78 32 48 52 52 73 75

2 4 5 10 17 36 40 41 41 52 73 74 77 78 80 36 40 41 41 52 2 4 5 10 17 36 40 41 41 52 73 74 77 78 17 36 40 41 41 52

10 10 17 28 40 45 56 67 72 76 79 86 90 95 99 40 45 56 67 72 76 79 86 90 95 99 28 40 45 56 67 72 76 79 86 90 95 99 45 56 67 72 76 79 86 90

1 9 17 25 39 40 50 50 50 55 56 59 63 66 68 25 39 40 50 50 50 55 56 59 63 66 68 17 25 39 40 50 50 50 55 56 59 63 66 39 40 50 50 50 55 56 59 63 66

31 32 37 46 53 59 62 65 78 79 81 82 87 99 99 37 46 53 59 62 65 78 79 81 82 87 32 37 46 53 59 62 65 78 79 81 82 87 46 53 59 62 65 78 79 81 82

Межквартильный размах

Набор Величина отклонения

Половина значения Половина размаха ряда Ср. линейное отклонение

23 25 28 28 32 48 52 52 73 75 76 78 91 91 94 25 28 28 32 48 52 52 73 25 28 28 32 48 52 52 73 75 76 78 28 32 48 52 52

2 4 5 10 17 36 40 41 41 52 73 74 77 78 80 36 40 41 41 52 73 74 77 78 80 36 40 41 41 52 73 74 77 78 80 40 41 41 52 73 74 77 78 80

10 10 17 28 40 45 56 67 72 76 79 86 90 95 99 40 45 56 67 72 76 79 10 10 17 28 40 45 56 67 72 76 79 86 90 95 99 40 45 56 67 72 76 79

1 9 17 25 39 40 50 50 50 55 56 59 63 66 68 1 9 17 25 39 40 1 9 17 25 39 40 50 50 50 55 56 59 17 25 39 40

31 32 37 46 53 59 62 65 78 79 81 82 87 99 99 31 32 37 46 31 32 37 46 53 59 62 65 31 32 37 46

Будем именовать подходящими для исследования те из найденных диапазонов, которые не содержат первые два и последние два числа из исходного ряда. Анализ корректности диапазонов представлен в табл. 3.

Введём сокращения: пол.знач. - отход в обе стороны на половину анализируемого значения, пол.раз. - отход в обе стороны на половину размаха, сред.откл. - отход в обе стороны на значение среднего линейного отклонения.

Условие включение первых двух членов набора обозначим как А, а включение последних двух членов обозначим как В.

Таблица 3

Анализ найденных диапазонов средних значений наборов чисел, упорядоченных по возрастанию

№ набора Медиана Межквартильный размах

пол.знач. пол.раз. сред.откл. пол.знач. пол.раз. сред.откл.

А В А В А В А В А В А В

1 - - + - - - + - + - - -

2 - - + + + - - + - + - +

3 - + - + - - - - + + - -

4 - + - + - + + - + + - -

5 - - + - - - + - + - + -

Методикой, которая позволила ближе всего приблизиться к идеалу, оказалась методика, отделяющая члены набора, большие, чем разность среднего арифметического и среднего линейного отклонения, но в то же время меньшие, чем их сумма.

Список литературы

1. Тест по методике руки // Энциклопедия психодиагностики. [Электронный ресурс] URL: https://psylab.info/Тест руки#т9ЕД1.82тВ2тБ5Д1.82Д1.8Б .D0.BA.D0.B0.D1.82.D0.B5.D0.B3. D0.BE.D1.80.D0.B8.D0.B9 .C2.ABAgg.C2.BB .D0.B8 .C2.ABDir.C2.BB (дата обращения: 16.01.2023).

2. Среднее арифметическое, размах, мода и медиана // http://calcs.su [Электронный ресурс] URL: https://calcs.su/html/math/grade7/srednee-arif:meticheskoe.html (дата обращения: 16.01.2023).

3. Медиана ряда чисел // Изучаем статистику и математику вместе. [Электронный ресурс] URL: https://umath.ru/calc/mediana-chisel (дата обращения: 16.01.2023).

4. Вариация, размах, межквартильный размах, среднее линейное отклонение // Статистический анализ в MS Excel. [Электронный ресурс] URL: https://statanaliz.info/statistica/opisanie-dannYx/variatsiYa-razmakh-srednee-lineinoe-otklonenie (дата обращения: 16.01.2023).

5. Определение среднего значения, вариации и формы распределения. Описательные статистики // Статистика. [Электронный ресурс] URL: https://baguzin.ru/wp/opredelenie-srednego-znacheniYa-varia (дата обращения: 16.01.2023).

6. Обнаружение аномальных значений в данных сетевого мониторинга методами статистики // Сообщество IT-специалистов. [Электронный ресурс] URL: https://habr.com/ru/post/344762 (дата обращения: 16.01.2023).

Норокеску Марис Марсовна, аспирант, m.nor@ro.ru, Россия, Королёв, Технологический университет имени дважды Героя Советского Союза, летчика-космонавта А.А. Леонова

COMBINING AND OPTIMIZING METHODS FOR ANALYZING AN ORDERED SET OF NUMBERS

M.M. Norokesku

Based on the results of studying the team using psychological testing techniques in order to evaluate and consider various psychological indicators of the members of this team, the researcher-psychologist forms a set of numbers. These numbers demonstrate to him, in a form convenient for comprehensive analysis, the personal qualities of the people studied. In order to be able to mathematically and statistically assess the emotional atmosphere in the team and characterize the group, the researcher needs to divide people into three groups. The first is those who have indicators below the average for the team. The second is typical representatives, the so-called "average". The third is those who have increased the studied indicators. This study describes a methodology that is based on a combination of mathematical statistics tools and offers the researcher an unbiased purely mathematical assessment of the results of his research.

Key words: mathematical statistics, processing of empirical research results, statistical analysis.

Norokescu Maris Marsovna, postgraduate, m.nor@ro.ru, Russia, Korolyov, Technological University named after twice Hero of the Soviet Union, Cosmonaut A.A. Leonov

i Надоели баннеры? Вы всегда можете отключить рекламу.