Научная статья на тему 'РЕАЛИЗАЦИЯ МЕТОДОВ СТАТИСТИЧЕСКОГО АНАЛИЗА С ИСПОЛЬЗОВАНИЕМ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ'

РЕАЛИЗАЦИЯ МЕТОДОВ СТАТИСТИЧЕСКОГО АНАЛИЗА С ИСПОЛЬЗОВАНИЕМ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ Текст научной статьи по специальности «Социальные науки»

CC BY
4
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
случайные события / факторный и результативный параметры / корреляционный / регрессионный и дисперсионный анализ данных / статистика. / random events / factor and result parameters / correlation / regression and variance analysis of data / statistics.

Аннотация научной статьи по социальным наукам, автор научной работы — Чикин С.Н.

В связи с активным развитием цифровизации, использование информационных технологий в статистическом анализе приобретает особую актуальность. Автор выделяет основные преимущества использования информационных технологий в статистическом анализе, такие как повышение скорости обработки данных, улучшенная точность результатов и возможность автоматизации процессов анализа. Цель: практическое применение информационных технологий при проведении статистических исследований. Задачи: исследование методов и инструментов, которые позволяют современным исследователям эффективно проводить статистический анализ информации, а также практическое применение статистических методов на примере различных информационных технологий, таких как программное обеспечение для анализа данных, базы данных и средства визуализации результатов. Методы: научная диалектика, анализ и синтез, системный подход, систематизация научных исследований по реализации статистических методов анализа с использованием IT инструментов. Результаты. Обоснована необходимость успешной реализации методов статистического анализа с применением информационных технологий в различных областях, что подтверждает их значимость и перспективность.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по социальным наукам , автор научной работы — Чикин С.Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

IMPLEMENTATION OF STATISTICAL ANALYSIS METHODS USING INFORMATION TECHNOLOGIES

In connection with the active development of digitalization, the use of information technologies in statistical analysis is becoming particularly relevant. The author highlights the main advantages of using information technology in statistical analysis, such as increased data processing speed, improved accuracy of results and the ability to automate analysis processes. Object: practical application of information technology in statistical research. Research object: research of methods and tools that allow modern researchers to effectively conduct statistical analysis of information, as well as the practical application of statistical methods using the example of various information technologies, such as data analysis software, databases and results visualization tools. Methods: scientific dialectics, analysis and synthesis, systems approach, systematization of scientific research on the implementation of statistical methods of analysis using IT tools. Findings: The need for successful implementation of statistical analysis methods using information technologies in various fields is substantiated, which confirms their significance and promise.

Текст научной работы на тему «РЕАЛИЗАЦИЯ МЕТОДОВ СТАТИСТИЧЕСКОГО АНАЛИЗА С ИСПОЛЬЗОВАНИЕМ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ»

— ЭКОНОМИЧЕСКИЕ НАУКИ —

Научная статья

https://doi.org/10.23672/SAE.2024.4.4.043 УДК 311.2

РЕАЛИЗАЦИЯ МЕТОДОВ СТАТИСТИЧЕСКОГО АНАЛИЗА С ИСПОЛЬЗОВАНИЕМ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

Чикин С.Н.

Новосибирский государственный университет экономики и управления

Аннотация. В связи с активным развитием цифровизации, использование информационных технологий в статистическом анализе приобретает особую актуальность. Автор выделяет основные преимущества использования информационных технологий в статистическом анализе, такие как повышение скорости обработки данных, улучшенная точность результатов и возможность автоматизации процессов анализа.

Цель: практическое применение информационных технологий при проведении статистических исследований.

Задачи: исследование методов и инструментов, которые позволяют современным исследователям эффективно проводить статистический анализ информации, а также практическое применение статистических методов на примере различных информационных технологий, таких как программное обеспечение для анализа данных, базы данных и средства визуализации результатов.

Методы: научная диалектика, анализ и синтез, системный подход, систематизация научных исследований по реализации статистических методов анализа с использованием IT инструментов.

Результаты. Обоснована необходимость успешной реализации методов статистического анализа с применением информационных технологий в различных областях, что подтверждает их значимость и перспективность.

Ключевые слова: случайные события, факторный и результативный параметры, корреляционный, регрессионный и дисперсионный анализ данных, статистика.

IMPLEMENTATION OF STATISTICAL ANALYSIS METHODS USING INFORMATION TECHNOLOGIES

Sergey N. Chikin

Novosibirsk State University of Economics and Management

Abstract. In connection with the active development of digitalization, the use of information technologies in statistical analysis is becoming particularly relevant. The author highlights the main advantages of using information technology in statistical analysis, such as increased data processing speed, improved accuracy of results and the ability to automate analysis processes.

Object: practical application of information technology in statistical research.

Research object: research of methods and tools that allow modern researchers to effectively conduct statistical analysis of information, as well as the practical application of statistical methods using the example of various information technologies, such as data analysis software, databases and results visualization tools.

Methods: scientific dialectics, analysis and synthesis, systems approach, systematization of scientific research on the implementation of statistical methods of analysis using IT tools.

Findings: The need for successful implementation of statistical analysis methods using information technologies in various fields is substantiated, which confirms their significance and promise.

Keywords: random events, factor and result parameters, correlation, regression and variance analysis of data, statistics.

Введение.

Актуальность применения информационных технологий для статистического анализа данных обусловлена, в первую очередь, растущим объемом информации, которая поступает для обра© Чикин С.Н.

ботки из различных источников. Современное общество переживает этап цифровизации всех сфер жизнедеятельности, в результате которого появляется огромное количество структурированных и неструктурированных данных, требующих анализа. Эффективная обработка такого

— ЭКОНОМИЧЕСКИЕ НАУКИ —

массива информации без использования ИТ-инструментов становится практически невозможной. Кроме того, быстрота и точность анализа с использованием информационных технологий значительно превосходят традиционные методы обработки данных [4].

Второй аспект актуальности связан с необходимостью принятия обоснованных управленческих, экономических и социальных решений. В условиях высокой конкуренции и быстро меняющейся экономической ситуации, важность принятия правильных решений, основанных на анализе больших данных возрастает. Информационные технологии позволяют не только быстро собирать и анализировать данные, но и представлять их в удобном для восприятия виде, что является ключевым фактором в процессе принятия решений на всех уровнях управления [1].

В профессиональной деятельности, а также в научных исследованиях люди часто сталкиваются с событиями и явлениями с непредсказуемым исходом. При этом приходится принимать важные решения на их основе. В быту такие решения принимаются на основе здравого смысла, интуиции, предыдущего опыта. Однако в практической сфере решения принимаются на основе детального анализа имеющейся информации.

Результаты.

Разработанные математической статистикой методы анализа данных, связанные с влиянием случайных воздействий, позволяют выявлять закономерности на фоне случайности, делать обоснованные выводы и прогнозы, а также оценивать вероятность их выполнения.

В данной статье рассматривается реализация данных методов с использованием информационных технологий.

Стохастические зависимости отличаются непредсказуемостью, многие объекты имеют параметры, характеризуемые количественными показателями. Некоторые из показателей влияют друг на друга. Такие показатели называют факторными. Каждой величине факторного показателя или аргумента может соответствовать некоторое значение результативного показателя или функции [6].

При анализе факторных показателей, мы часто сталкиваемся с понятием корреляции. Корреляция позволяет нам оценить степень взаимосвязи между двумя количественными переменными. Сильная корреляция указывает на то, что изменение одного показателя склонно сопровождаться изменением другого в определённом направлении. Однако важно помнить, что корреляция не говорит нам о причинно-следственной связи -она только обнаруживает связь без объяснения причин такой зависимости.

Другой важной задачей корреляционного анализа является определение влияния факторов на

в ел и ч ину результата. Для решения этой задачи подбирается необходимый тип математической модели, которая лучше отражает характер исследуемой связи (прямой, обратной и других). Подбор математической модели или уравнения играет важную роль в корреляционном анализе, потому что от него зависит ход решения задачи и результаты расчетов [9].

Эффективным статистическим методом изучения взаимосвязей переменных, из которых одна рассматривается как зависимая, а другие - как независимые, является регрессионный анализ. В его основе лежит уравнение регрессии, которое показывает, каким будет в среднем изменение зависимой переменной у, если независимые переменные xi примут конкретные значения [8].

Регрессионный анализ не только выявляет силу взаимосвязи между переменными, но и предоставляет возможность проверки гипотез о характере этих взаимосвязей. Используя статистические тесты, такие как t-критерий Стьюдента для коэффициентов регрессии, исследователи могут оценить, насколько значимо влияние независимых переменных на зависимую переменную. Это позволяет отличать значимые предикторы от случайных колебаний, обеспечивая тем самым более надежное основание для прогнозирования и принятия решений [3].

С другой стороны, дисперсионный анализ (ANOVA) используется, когда необходимо оценить влияние одной или нескольких категориальных независимых переменных на непрерывную зависимую переменную. ANOVA позволяет нам проверить гипотезу о том, что средние значения групп, сформированных на основе категориальных переменных, различаются. Это критически важно во многих областях исследований, включая клинические испытания, где изучается эффективность лекарств, или в маркетинговых исследованиях, где анализируется влияние рекламных кампаний на поведение потребителей [5].

Обсуждение.

Для реализации методов математической статистики с помощью информационных технологий используется такой мощный инструмент проведения статистического анализа как табличный процессор Microsoft Excel.

На вкладке Данные ленты Microsoft Excel расположена надстройка Анализ данных, применяемая для проведения статистического анализа. Надстройка Анализ данных содержит такие статистические инструменты, как Корреляция, Регрессия, Однофакторный дисперсионный анализ и Двухфакторный дисперсионный анализ.

Кроме этого, при выполнении статистических расчетов применяются статистические функции табличного процессора.

— ЭКОНОМИЧЕСКИЕ НАУКИ —

Для корреляционного анализа данных используют статистическую функцию КОРРЕЛ (мас-сив1 ; массив2).

Здесь:

Массив1 - это интервал ячеек одной случайной величины.

Массив2 - это второй диапазон ячеек со значениями другой случайной величины.

Параметры a0 и al линейной регрессионной модели y = a0 + a1x, можно определить с помощью функций НАКЛОН и ОТРЕЗОК.

Функция НАКЛОН определяет угловой коэффициент наклона линии тренда, а функция ОТРЕЗОК - точку пересечения линии тренда с осью ОУ.

Для дисперсионного анализа данных, при котором происходит сравнение внутригрупповых и межгрупповых дисперсий, можно применять статистические функции Дисп.В, Дисп.Г, диспа, дис-пра для выборки или генеральной совокупности

[7].

Заключение.

Таким образом, табличный процессор Microsoft Excel предоставляет большое количество возможностей для определения статистических закономерностей массивов данных.

Сочетание мощного функционала и дружественного интерфейса привело к тому, что табличный процессор Microsoft Excel является одним из

Конфликт интересов

Не указан Рецензия

Все статьи проходят рецензирование в формате double-blind peer review (рецензенту неизвестны имя и должность автора, автору неизвестны имя и должность рецензента). Рецензия может быть предоставлена заинтересованным лицам по запросу.

наиболее популярных средств проведения статистических расчетов [1].

Microsoft Excel не только облегчает выполнение статистических расчётов, но и делает их визуализацию более наглядной за счёт широкого спектра инструментов для создания графиков и диаграмм. Так, для отображения трендов и изменений в данных во времени часто используются линейные графики. Гистограммы и круговые диаграммы позволяют наглядно представить распределение частот или пропорций. Также, с помощью условного форматирования можно выделять значимые статистические отклонения и тенденции прямо в таблицах данных [10].

Для более сложного и углубленного анализа данных, такого как многомерный статистический анализ или анализ временных рядов, могут потребоваться специализированные программные продукты, такие как SPSS, SAS, или программирование на языке R или Python с использованием библиотеки Pandas и других. Однако даже в таких случаях, предварительная обработка и первичный анализ данных часто осуществляются в Excel, благодаря его доступности и широкому распространению в бизнес-среде и академическом сообществе [2].

Исследование статистических показателей позволяет установить степень связи между ними, определить характер этой связи или показать достоверность различий между показателями. Вследствие этого определяется роль каждого влияющего параметра в формировании уровня исследуемых показателей, углубляются знания об изучаемых объектах и закономерностях их развития.

Conflict of Interest None declared

Review

All articles are reviewed in the double-blind peer review format (the reviewer does not know the name and position of the author, the author does not know the name and position of the reviewer). The review can be provided to interested persons upon request.

Литература:

1. Алиакберова Л.Ф. Современные программные продукты для анализа данных / Л.Ф. Алиакберова // Молодой ученый. 2021. № 37(379). С. 13-17.

2. Антипко А.В. Инструменты для анализа данных: сравнение Python, R и других популярных платформ / А.В. Антипко // Молодой ученый. 2023. № 33(480). С. 14-16.

3. Береснева И.В. Применение методов корреляционного анализа в Microsoft Excel для выявления зависимостей между выборками значений двух случайных величин / И.В. Береснева // Синтез науки и образования как инструмент решения глобальных проблем современности: Сборник статей Международной научно-практической конференции Екатеринбург, 10 июня 2023 г. Уфа : Аэтерна, 2023. С. 129-132.

4. Борздова Т.В. Основы статистического анализа и обработка данных с применением Microsoft Excel : учеб. пособие / Т.В. Борздова. Мн. : ГИУСТ БГУ, 2021. 75 c

5. Мамедова Н.Г. Анализ данных бизнес-аналитики для организаций в современном мире / Н.Г. Мамедо-ва // Молодой ученый. 2022. № 24(419). С. 63-65.

6. Математическая статистика / А.Н. Муратов, Р.Д. Бекасов, А.О. Нурутдинов, Р.Н. Нурисламов, Э.Р. Му-родов, А.Б. Нишонов // Мировая наука. 2020. № 7(40). С. 231-240.

— ЭКОНОМИЧЕСКИЕ НАУКИ —

7. Петяркина В.Н. Значение информационных технологий при обработке статистических данных / В.Н. Петяркина // Экономика и социум. 2015. №6 (19). С. 872-874.

8. Шаталина А.М. Использование корреляционно-регрессионного метода при анализе предприятий / А.М. Шаталина, Е.В. Родионова // Математическое и компьютерное моделирование в экономике, страховании и управлении рисками. 2018. № 3. С. 272-276.

9. Ширинкина Е.В. Методы интеллектуального анализа данных и образовательной аналитики / Е.В. Ши-ринкина // Современное образование. 2022. № 1. С. 51-67.

10. Яргин С.В. Использование математической статистики для выявления манипуляций с количественными данными и образцами / С.В. Яргин // Молодой ученый. 2012. № 9(44). С. 41-44.

1. Aliakberova L.F. Modern software products for data analysis / L.F. Aliakberova // Young scientist. 2021. № 37(379). P. 13-17.

2. Antipko A.V. Tools for data analysis: a comparison of Python, R and other popular platforms / A.V. Antipko // Young scientist. 2023. № 33(480). P. 14-16.

3. Beresneva I.V. Application of correlation analysis methods in Microsoft Excel to identify dependencies between samples of values of two random variables / I.V. Beresneva // Synthesis of science and education as a tool for solving global problems of our time: Collection of articles of the International Scientific and practical Conference Yekaterinburg, June 10, 2023. Ufa : Aeterna, 2023. P. 129-132.

4. Borzdova T.V. Fundamentals of statistical analysis and data processing using Microsoft Excel : tutorial. Mn. : GIUST BSU, 2021. 75 p.

5. Mammadova N.G. Analysis of business intelligence data for organizations in the modern world / N.G. Mam-madova // Young scientist. 2022. № 24(419). P. 63-65.

6. Mathematical statistics / A.N. Muratov, R.D. Bekasov, A.O. Nurutdinov, R.N. Nurislamov, E.R. Murodov, A.B. Nishonov // World science. 2020. № 7(40). P. 231-240.

7. Petyarkina V.N. The importance of information technologies in statistical data processing / V.N. Petyarkina // Economy and society. 2015. № 6(19). P. 872-874.

8. Shatalina A.M. The use of the correlation and regression method in the analysis of enterprises / A.M. Shatali-na, E.V. Rodionova // Mathematical and computer modeling in economics, insurance and risk management. 2018. № 3. P. 272-276.

9. Shirinkina E.V. Methods of data mining and educational analytics / E.V. Shirinkina // Modern education. 2022. № 1. P. 51-67.

10. Yargin S.V. The use of mathematical statistics to identify manipulations with quantitative data and samples / S.V. Yargin // Young scientist. 2012. № 9(44). P. 41-44.

References:

Информация об авторе

Чикин Сергей Николаевич

кандидат экономических наук, доцент,

доцент кафедры статистики, Новосибирский государственный университет экономики и управления uprav551@mail.ru

Sergey N. Chikin

Candidate of Economic Sciences, Associate Professor, Associate Professor of the Department of Statistics, Novosibirsk State University of Economics and Management uprav551@mail.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.