экономические Цыпин Александр Павлович, Сорокин Александр Сергеевич
науки ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ПРИ ПРОВЕДЕНИИ ...
УДК 519.25: 004.9
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ПРИ ПРОВЕДЕНИИ ЭКОНОМИКО-СТАТИСТИЧЕСКИХ ИССЛЕДОВАНИЙ НА ОСНОВЕ ИСТОРИЧЕСКИХ ВРЕМЕННЫХ РЯДОВ
© 2017
Цыпин Александр Павлович, кандидат экономических наук, доцент кафедры статистики и эконометрики
Оренбургский государственный университет (460018, Россия, Оренбург, проспект Победы, 13, e-mail: zipin@yandex.ru) Сорокин Александр Сергеевич, кандидат экономических наук, доцент кафедры математические методы в экономике РЭУ им. Г.В. Плеханова (117997, Россия, Москва, Стремянный переулок, 36, e-mail: alsorokin@mail.ru)
Аннотация. Цель: рост объемов информации (в том числе статистической) порождает необходимость в ее оперативном сборе, упорядочении, хранении и анализе, отсюда вытекает цель исследования, которая заключается в раскрытии возможных вариантов применения информационных технологий на различных стадиях экономико-статистического исследования макропоказателей на основе исторически временных рядов. Методы: для достижения поставленной цели использовались такие общенаучные методы как анализ и синтез, а также статистические методы: графический и табличный. Результаты: были рассмотрены основные источники информации, доступные исследователю, посредством всемирной сети Интернет; проанализированы методы получения данных, с перечнем программных средств помогающих превращать различные типы данных в цифровой эквивалент; указаны особенности применения статистических пакетов программ на каждом этапе исследования; рассмотрена возможность применения инфографики в анализе исторических временных рядов; в заключение была сформирована аналитическая таблица, в которой указаны программные продукты используемые на том или ином этапе исследования. Научная новизна: в ходе проведенного исследования впервые была предложена система программных и инфраструктурных средств направленная на ускорение (облегчение) процесса исследования макропоказателей. Практическая значимость: полученные результаты будут полезны исследователям социально-экономических явлений (процессов) представленных в форме временных рядов.
Ключевые слова: информационные технологии, статистика, эконометрика, статистический пакет программ, информация, браузеры, данные, Интернет, этапы статистического исследования, исторические временные ряды, инфографика.
INFORMATION TECHNOLOGIES WHEN CARRYING OUT ECONOMICAL AND STATISTICAL RESEARCHES ON THE BASIS OF HISTORICAL TIME SERIES
© 2017
Tsypin Aleksandr Pavlovich, candidate of economic sciences, associate professor of the statistics and econometrics
Orenburg State University (460018, Russia, Orenburg, PobedyAvenue, 13, e-mail: zipin@yandex.ru) Sorokin Alexander Sergeevich, candidate of economic sciences, associate professor at the department
of mathematical methods in economics Plekhanov Russian University of Economics (117997, Russia, Moscow, Stremyanny Lane, 36, e-mail: alsorokin@mail.ru)
Abstract. Purpose: growth of volumes of information (including statistical) generates need for her expeditious collecting, streamlining, storage and the analysis, the research objective which consists in disclosure of possible options of use of information technologies at various stages of an economical and statistical research of macroindicators on the basis of historically temporary ranks follows from here. Methods: for achievement of a goal such general scientific methods as the analysis and synthesis, and also statistical methods were used: graphic and tabular. Results: the main sources of information available to the researcher, by means of worldwide network the Internet were considered; data acquisition methods, with the list of the software helping to turn different data types into a digital equivalent are analyzed; features of application of statistical software packages at each investigation phase are specified; the possibility of application of infographics in the analysis of historical time series is considered; the analytical table in which program are specified was in conclusion created are blown used at this or that investigation phase. Scientific novelty: during the conducted research the system of program and infrastructure means directed to acceleration (simplification) of process of a research of macroindicators for the first time has been offered. Practical importance: the received results will be useful to researchers of the social and economic phenomena (processes) presented in the form of temporary ranks.
Keywords: information technologies, statistics, econometrics, statistical software package, information, browsers, data, Internet, stages of a statistical research, historical time series, infographics.
Огромное количество разноплановых программных продуктов в совокупности с оргтехникой и средствами связи, предоставляет ученым возможность автоматизировать этапы исследования. В отношении экономико-статистических исследований макроэкономических показателей, представленных в форме исторических временных рядов (ИВР), программные и инфраструктурные средства необходимо рассматривать в привязке к стадиям этого исследования (рисунок 1).Согласно предложенной последовательности (рисунок 1), первым этапом является «Работа с источниками информации», безусловно, для успешного прохождения этого этапа «жизненно» необходимы поисковые системы (Yandex, Google, Baidu, Yahoo!) и браузеры (Google Chrome, Safari, Opera, Mozilla Firefox, Internet Explorer, Яндекс. Браузер), эти средства необходимы для поиска в сети Интернет сетевых ресурсов содержащих базы с источниками статистических сведений (официальные статисти-
ческие службы, оф-лайн и он-лайн библиотеки, аналитические отчеты, публикации исследователей и т.д.) [1].
Рисунок 1 - Последовательность проведения статистического исследования исторических временных рядов социально-экономических явления и процессов (Примечание: авторская разработка)
Также на данном этапе необходимы программные
Цыпин Александр Павлович, Сорокин Александр Сергеевич! жтжт^ше
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ПРИ ПРОВЕДЕНИИ ... науки
продукты и организационная техника, способствующие увеличению скорости ввода информации в персональный компьютер (ПК) [2, 3, 4]. К данной группе можно отнести периферийные устройства (сканеры, копиры и т.д.) и соответствующее программное обеспечение.
В настоящее время реализованы следующие способы ввода информации: сканирование и распознавание текста; запись и распознавание голоса; готовые базы данных с он-лайн доступом; ручной ввод посредством планшетного компьютера; машинный сбор информации.
В качестве программы по оцифровки текстов бумажных документов, можно назвать следующие: ABBYY FineReader. - режим доступа: https://www.abbyy. com; CuneiForm. - режим доступа: https://launchpad. net/cuneiform-linux; Readiris Pro. - режим доступа: http://www.irislink.com/EN-US/c1462/Readiris-16-for-Windows—OCR-Software.aspx; Informatik Scan. - режим доступа: http://www.informatik.com/scanapp.html.
Рассматривая программы по оцифровке бумажных носителей, необходимо указать на возможность автоматическое формирование базы данных. В качестве примера реализации этого подхода рассмотрим один из продуктов компании ABBYY, а именно ABBYY FlexiCapture. По заявлению разработчиков данный комплекс позволяет обрабатывать любые типы документов: с жесткой структурой (бланки, формы, анкеты), слабоструктурированные (счета фактуры, чеки) и неструктурированные (статьи, контракты, письма). Несомненно, использование данного продукта ускорит ввод информации с бумажных носителей в несколько раз.
В контексте автоматизированного заполнения базы, необходимо упомянуть об использовании Росстатом оптико-механического сканирования форм переписных листов, этот инструмент позволяет вводить информацию с одновременным распознаванием рукописного текста и успешно применяется последние 30 лет.
Наряду с непосредственным вводом информации в персональный компьютер, в современных условиях можно прибегнуть к услугам всемирной сети Internet, содержащей массу информации разнообразного характера. В данном контексте необходимо указать на ресурсы, представленные в таблице 1.
Таблица 1 - Источники статистической информации в сети Интернет, позволяющие сформировать исторические временные ряды
н™« Адрес б сети Интернет Хар актернстика
Ресурсы, находящиеся в RU зоне
Федеральная служба РФ Р http:''.'www.gks.ru Статистика с начала 2000-х по настоящий период по всем направлениямжизни общества
Проект «исторические материалы':» http ://ibtmatinfo/statistic s Статистика по России до 2000-хгодов
Единый архив экономических и социологических данных http: .' s о p hi st .hse .ru/ Длинные временные ряды основных макроэкономических показателей. В основном с 1995 г. Помесячное, поквартальное игодичное пр едставление данных.
Единая межведомственная инфюрмационно- httpi'.fedstatiu Наибольшая доля материалов предоставлено Росстатом. Ведомственная статистика представлена скудно.
Министерство финансов РФ http: 'irimfmni' op endata Представлены исторические росписи государственного бюджета начиная с 1912 года
Центр альный б анк РФ Представлены макропоказатели характеризующие банковскую сферу и страхоБонрынок. Данные представлены с начала 1990-х годов.
Ресурсы, находящиеся за п ределами К17 зоны
Всемирный банк (The World Bank) http:' data v.'orldbank org Представлена информацияболее чем по 100 странам. Данные сопоставлены во времени и пространстве (применяетсяединая методология)
Отдел статистики Организации Объединенных Наций https:/'imstats.un.org Представлена информация по странаммира. в частности по ВВП. Для постсоветских стран точка отсчета 1990 г.
Примечание: составлено авторами Согласно представленной информации, накоплен обширный материал для формирования исторических временных рядов по основным социальным и экономическим показателям России.
Развитие цифровых технологий привело к тому, что распознавание речи человека достигло высоких результатов, соответственно можно «надиктовывать» информацию и специализированные программы будут превращать аудиопоток в текстовые или цифровые записи [5, 61. К таким программам можно отнести: Уосо. 300
Professional - Режим доступа: http://www.speechpro.ru/; RealSpeaker - Режим доступа: http://www.realspeaker.me/ ru; Горыныч - Режим доступа: http://www.nd.ru/voice/; Расширения для браузера Google Chrome: VoiceNote, Голосовой блокнот, Google Voice Search.
Еще один способ ввода информации, набирающий популярность, это внесение информации посредством планшетных компьютеров. В качестве примера можно назвать проводимую в 2016 году Росстатом Всероссийскую сельскохозяйственную перепись, в рамках которой наряду с бумажными анкетами, интервьюерами заполнялись электронные аналоги непосредственно с планшетов, далее в конце дня вся информация передавалась в территориальные подразделения статистики. Внедрение данной технологии позволило снизить продолжительность сбора информации и количество ошибок ввода, данный подход признан перспективным и планируется к повсеместному использованию при проведении Всероссийской переписи населения в 2020 году.
Также не стоит забывать про актуальное в настоящее время направление интеллектуального анализа «больших данных» (Big Data) [7, 8], формированию которых способствует повсеместное внедрение автоматических средств фиксации информации начиная от спутников на орбите Земли, заканчивая электронными микроскопами. Также нельзя забывать о человеке, который находясь в цифровом пространстве, порождает массу информации, это и геолокация местоположения, транзакции по банковским картам, аудио и видеозвонки, публикации и записи в социальных сетях и многое другое. Вся эта разноплановая, не структурированная, не равноценная информация фиксируется и хранится на серверах компаний, оказывающих информационные, телекоммуникационные, банковские и др. услуги.
Следующим этапом проводимого нами исследования является «Сопоставление уровней временного ряда». Для данной стадии наилучшим образом подойдут продукты, вошедшие в группу «по функциональности», а именно «табличные редакторы (процессоры)». Так как эти программы предназначенных для быстрого ввода числовых данных, их редактирования и преобразования в необходимый формат [9]. Что и требуется на данном этапе исследования. Стоит указать на тот факт, что специализированных пакетов непосредственно направленных на сопоставление уровней временных ярдов не существует, так как в каждом отдельном случае, исследователю приходится индивидуально подбирать способ приведения информации к единому базису.
Далее идет этап под названием «Периодизация уровней временного ряда» на этой стадии исследования перечень применяемых пакетов более разнообразен, но также можно ограничиться программными продуктами, вошедшими в группу «по функциональности».
Стоит отметить, что практические все методы периодизации можно реализовать на основе табличных редакторов, за исключением факторного анализа, так как это трудоемкая задача. Повсеместное использование табличных процессоров объясняется их гибкостью, но это уравновешивается значительными затратами времени на проведение процедур.
На следующем этапе «Анализ долговременной тенденции и цикличности развития. Моделирование и прогнозирование» наилучшим образом подходят «универсальные» пакеты, так как в них реализованы экономе-трические методы [10, 11, 12]. Стоит отдельно указать на пакеты прикладных программ EViews и STATA [13], так как данные продукты изначально разрабатывались для проведения эконометрических процедур (тестирование гипотез, моделирование, разработка вариантов предсказаний). Стоит отметить, что рассматриваемые программы рассчитаны в основном на профессионалов в области эконометрического моделирования.
Обобщая возможные эконометрические методы, АНИ: экономика и управление. 2017. Т. 6. № 2(19)
экономические науки
Цыпин Александр Павлович, Сорокин Александр Сергеевич ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ПРИ ПРОВЕДЕНИИ ...
применительно к историческим временным рядам, которые характеризуются сложной структурой, можно отразить основные возможности данных пакетов в этом направлении: парные и множественные (линейные и нелинейные) модели; эконометрические модели с фиктивными переменными; экспоненциальное сглаживание; ARIMA-модели; VAR-модели; регрессионные модели на панельных данных.
Стоит отметить, что оба рассматриваемых пакета программ предоставляют исследователю идентичный набор инструментов направленных на построение моделей на основе исторических временных рядов, поэтому в дальнейшем исследовании будем использовать эти продукты для оценки параметров эконометрических моделей.
Завершающим этапом исследования является -«Формирование выводов о влиянии качественных и количественных факторов на движение уровней ИВР». В первую очередь для формирования отчета о проделанной работе необходимо использовать текстовый редактор, в качестве таких пакетов можно назвать: Microsoft Word (офисный пакет Microsoft Office), Lotus WordPro (офисный пакет LibreOffice), Writer (офисный пакет StarOffice), WordPerfect (офисный пакет WordPerfect Office), Pages (офисный пакет iWork) и др. Все перечисленные продукты предоставляют пользователю примерно одинаковый функционал, направленный на создание и редактирование текста, поэтому не будем останавливаться на этих продуктах.
Также немаловажным моментом в представлении итогов является их подача с использованием мультимедиа и таких программных продуктов как Microsoft PowerPoint (офисный пакет Microsoft Office), Impress (офисный пакет StarOffice), Presentations (офисный пакет WordPerfect Office), Keynote (офисный пакет iWork) и др. Говоря о презентациях, необходимо сделать акцент на таком бурно развивающемся в настоящее время направлении, как инфографика [14, 15, 16], под которой понимают простое и доступное для большинства пользователей графическое представление сложного информационного потока (явления или процесса).
В качестве примера, можно указать на часто встречающуюся в сети Интернет инфографику динамики цен на нефть, с выделением ключевых событий повлиявших на флуктуацию уровней данного временного ряда (рисунок 2) [17, 18, 19].
указать на работу Н.А. Рубакина «Россия в цифрах» [20]. В данной работе автор активно использует прием иллюстрации цифрового материала посредством художественных образов, в качестве примера можно привести сопоставление численности населения исповедующих ту или иную религию в России.
Подводя итог рассмотрения программных и инфраструктурных средств для анализа ИВР, можно сделать вывод, что в рамках проводимого нами исследования невозможно обойтись одним продуктом, а необходимо использовать набор программ (таблица 2).
Таблица 2 - Система программных и инфраструктурных средств для проведения исследования
Этапы исследования исследования ИБР Программные и инфраструктурные средства
Статистическое наблюдение информации Поисковые системы: Yandex .Google Baiduajp.
Браузеры: Google Chrome, Safari, Opera и др.
Программы по оцифровки текстов с бумажных носителей: ABBYY FineReader: CuneiForm: Readiris Pro и др.
Программы по оцифровке аудиопотока: Voco.Professional; RealSpeake: Горыныч идр.
Сводка полученных Сопоставление уровней временного ряда Табличные редакторы: Excel; Numbers; QuattroPro идр.
Периодизация уровней временного ряда Универсальные пакеты программ: EViews; STATA; STATISTIC A, SPSS, К. и др
Табличные редакторы: Excel; Numbers; Quattro Pro идр.
Математические пакеты программ: MathCad,Maple, MATLAB идр.
Статистический Анализ долговременной тенденции и цикличности развития. Моделирование и прогнозиро ванне Универсальные пакеты программ: EViews; STATA; STATISTIC A, SPSS, R и др.
Формирование выводов о количественных факторов на движение уровней ИБР Текстовые редакторы: Word, Writer; Pages и др.
Редакторы презентаций: PowerPoint: Impress; Keynote и др.
Ресурсыпо созданию инфографики: Google Developers; EaseLly; PiktochartHдр.
Рисунок 2 - Инфографика изменения цен на нефть (Источник: «Цена на нефть Brent опустилась ниже $58»
[19])
Как видим на представленном рисунке, динамика цен не имеет четко выраженной долговременной составляющей и в значительной степени испытывает влияние качественных факторов, большинство из которых носит политический окрас.
Очевидно, что инфографика является мощным инструментом донесения результатов исследования до широких масс населения и является «новым прочтением» разработок статистиков 19-го века, в частности можно
Примечание: составлено авторами
Данная система полностью отражает автоматизацию исследования не только исторические временных рядов, но и с некоторыми поправками может быть применена в любом экономико-статистическом исследовании, основанном на временных рядах.
СПИСОК ЛИТЕРАТУРЫ:
1. Цыпин А.П. Информационное обеспечение процесса построения исторических временных рядов социально-экономических показателей России / А.П. Цыпин, А.Г. Ковалев // Интернет-журнал Науковедение. - 2014.
- № 6 (25). - С. 50.
2. Беркетов Г. А. Направления развития информационных технологий в экономической сфере / Г.А. Беркетов, А.А. Микрюков, С.В. Федосеев // НиКа. -2011. URL: http://cyberleninka.m/article/n/napravleniya-razvitiya-informatsionnyh-tehnologiy-v-ekonomicheskoy-sfere (дата обращения: 02.05.2017).
3. Карпычев В.Ю. Информационные технологии в экономических исследованиях / В.Ю. Карпычев // Экономический анализ: теория и практика. - 2013. -№20 (323). - С. 2-11.
4. Красильников Д. Е. Программное обеспечение эконометрического исследования econometric software / Д.Е. Красильников // Вестник ННГУ. - 2011. - №3-2. -С. 231-238.
5. Бабаринов С.Л. О распознавании речи / С.Л. Бабаринов, М.А. Будникова // Научные ведомости Белгородского государственного университета. Серия: Экономика. Информатика. - 2014. - №21-1 (192). - С. 182-185.
6. Жиляков Е. Г. Исследование сервиса компании Google inc.. По распознаванию русской речи / Е. Г. Жиляков, С. Л. Бабаринов, П. В. Чадюк // Научные ведомости Белгородского государственного университета. Серия: Экономика. Информатика. - 2013. - №15-1 (158).
- С. 247-255.
7. Аракелова И. В. Использование больших объемов данных в бизнесе / И. В. Аракелова, Д. Л Качалов // Известия ВолгГТУ. - 2015. - №3 (158). - С. 135-140.
8. Намиот Д.Е. Стандарты в области больших данных / Д.Е. Намиот, В.П. Куприяновский, Д.Е. Николаев, Зубарева Е.В. // International Journal of Open Information Technologies. - 2016. - №11. - С. 12-18.
9. Цыпин А. П. Статистика в табличном редак-
Цыпин Александр Павлович, Сорокин Александр Сергеевич ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ПРИ ПРОВЕДЕНИИ .
экономические науки
торе Excel: лабораторный практикум / А. П. Цыпин, Л. Р. Фаизова. - Оренбург: ОГУ, 2016. - 290 с.
10. Афанасьев В. Н. Эконометрика в пакете STATISTICA: учебное пособие / В. Н. Афанасьев, А. П. Цыпин. - Оренбург: ИП Кострицын, 2010. - 196 с.
11. Сорокин А.С. Планирование и статистическая обработка данных экспериментов в пакете R / А.С. Сорокин, Н.А. Моисеев, В.И. Митрофанов // Интеллект. Инновации. Инвестиции. - 2017. - № 1. - С. 58-64.
12. Цыпин А.П. Статистические пакеты программ в социально-экономических исследованиях / А.П. Цыпин, А.С. Сорокин // Азимут научных исследований: экономика и управление. - 2016. - Т. 5. - № 4 (17). - С. 379384.
13.Ратникова Т.А. Введение в эконометриче-ский анализ панельных данных / Т.А. Ратникова // Экономический журнал ВШЭ. - 2006. - №2. - С. 267317.
14. Беляев Н.А. Визуализация данных: инфографи-ка как инструмент маркетинга / Н.А. Беляев // Вестник ЮУрГУ. Серия: Экономика и менеджмент. - 2015. - №4.
- С. 125-130.
15. Симакова С.И. Инфографика как средство визуализации экономической информации в СМИ / С.И. Симакова // Вестник ЧелГУ. - 2014. - №23 (352). - С. 77-82.
16. Фролова М. А. История возникновения и развития инфографики / М.А. Фролова // Вестник Пермского государственного гуманитарно-педагогического университета. Серия: Информационные компьютерные технологии в образовании. - 2014. - №10. - С. 135-145.
17. Мельников Р.М. Влияние динамики цен на нефть на макроэкономические показатели российской экономики / Р. М. Мельников // Прикладная эконометрика.
- 2010. - №1 (17). - С. 20-29.
18. Сорокин А.С. Эконометрическое исследование конъюнктуры мирового рынка нефти: диссертация ... кандидата экономических наук : 08.00.12. - М., 2005. -185 с.
19. Цена на нефть Brent опустилась ниже $58 [Электронный ресурс] / Информационное агентство «Росбалт» - Режим доступа: http://www.rosbalt.ru/ business/2015/07/06/1416020.html
20. Рубакин Н.А. Россия в цифрах: Страна. Народ. Сословия. Классы / Н.А. Рубакин. - Санкт-Петербург: Изд-во «Вестника знания» (В.В. Битнера). 1912. - 216 с.
Работа выполнена при финансовой поддержке ФГБОУВО «РЭУ им. Г.В. Плеханова»
Статья поступила в редакцию 23.04.2017.
Статья принята к публикации 22.06.2017.