Научная статья на тему 'Информационные технологии в социологических исследованиях'

Информационные технологии в социологических исследованиях Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
447
54
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СИСТЕМА СБОРА / COLLECTING SYSTEM / БАЗЫ ДАННЫХ / DATABASE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Нямаахуугийн Батжаргал, Дармаев Тумэн Гомбоцыренович, Хабитуев Баир Викторович

Проведение масштабного тестирования означает большое количество проблем связанных как с непосредственным проведением тестирования, так и с последующим сбором, систематизацией и первоначальной обработкой данных. Внедрение современных информационных технологий в данный процесс позволит автоматизировать большую часть рутинной работы. В работе рассматривается опыт разработки прототипа системы сбора и анализа данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Нямаахуугийн Батжаргал, Дармаев Тумэн Гомбоцыренович, Хабитуев Баир Викторович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

IT solutions in sociological research

Global experiments involve some technical problems such as: testing, data collecting, systematization and data pre-processing. System of data collecting can automate routine in the process of data collection. The paper is dedicated to the experience of system for social data collecting development.

Текст научной работы на тему «Информационные технологии в социологических исследованиях»

УДК 004.67

О Н. Батжаргал, Т. Г. Дармаее, Б. В. Хабитуее

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В СОЦИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ1

Проведение масштабного тестирования означает большое количество проблем связанных как с непосредственным проведением тестирования, так и с последующим сбором, систематизацией и первоначальной обработкой данных. Внедрение современных информационных технологий в данный процесс позволит автоматизировать большую часть рутинной работы. В работе рассматривается опыт разработки прототипа системы сбора и анализа данных.

Ключевые слова: система сбора, базы данных.

О N. Batgargal, Т. G. Darmaev, В. V. Habituev IT SOLUTIONS IN SOCIOLOGICAL RESEARCH

Global experiments involve some technical problems such as: testing, data collecting, systematization and data pre-processing. System of data collecting can automate routine in the process of data collection.

The paper is dedicated to the experience of system for social data collecting development.

Keywords: collecting system, database.

Введение

В рамках проекта РГНФ №15-23-03001 «Общественное сознание современной молодежи Монголии» авторами была поставлена задача - определить в какой мере у молодёжи Монголии присутствуют знания и уважение к родной культуре, родным традициям, родному языку, уважение и терпимость к людям иной национальности и культур.

Для решения поставленной задачи необходимо провести социологическое исследование. При проведении подобного исследования одной из главных задач является обеспечение массовости. В ходе первоначального анализа задачи было вычислено необходимое число опрашиваемых, оно составило более 800 человек - с учётом разных социальных слоёв, районов проживания и т.д.

1. Требования к системе

На первом этапе выполнения проекта предстоит произвести первоначальный сбор данных с последующим анализом и корректировкой как

1 Исследование выполнено при финансовой поддержке РГНФ, проект № 15-2303001

самих опросников, так и контингента опрашиваемых. При таком числе респондентов стандартное анкетирование (при помощи бумажных носителей) порождает большое число проблем - возникает проблема сбора и первичной обработки данных. Поэтому было решено провести анкетирование при помощи системы тестирования размещённой в сети Интернет [1].

В ходе предварительного анализа тестовой анкеты авторами были выявлены требования к разрабатываемой системе [2], рассмотрим основные:

Использование авторизации респондентов через «агентов». Агент -специально проинструктированный человек, которому объяснены все вопросы в анкете, а также он обучен работе с системой. Идея состоит в том, что тестирование также проводится онлайн, но доступ к анкетам осуществляется через уникальные промокоды, генерируемые агентом в системе.

Примерная схема работы такова:

1) Агент запрашивает в своём личном кабинете промокоды;

2) Система генерирует запрашиваемое число промокодов и привязывает их к Агенту;

3) Агент производит инструктаж респондентов по работе с системой и по вопросам;

4) Агент раздаёт каждому респонденту промокод;

5) Респонденты авторизуются в системе, активируя промокод, и заполняют анкету.

Такая система авторизации имеет ряд плюсов:

1) Минимальная работа с системой авторизации респондентов - нужно только ввести промокод выданный Агентом;

2) Личная заинтересованность Агентов вкупе с подробными инструкциями Агентов (как по работе с системой, так и по вопросам анкеты) позволит с большой долей вероятности говорить о валидности заполнения анкет;

3) Возможность контроля работы Агентов - результаты анкет привязаны к Агентам через промокоды, в связи с этим существует возможность оценки работы Агентов и исключения ряда результатов в различных ситуациях (например, при соответствующем отчёте Агента);

4) Система активируемых промокодов позволяет исключить проблему с роботами, так как даже в случае если активация произведена не респондентом, нежелательные данные можно вычислить (ввиду привязанности кодов к Агентам).

Важно отметить, что в данном случае доступ в личный кабинет Агентов можно закрывать, используя любые доступные способы проверки (так как число Агентов гораздо меньше числа респондентов).

Изначально анкета содержала 49 вопросов. Среди них были как закрытые (выбор ответов из предложенного списка), так и открытые (с возможностью внесения своего варианта ответа). Часть вопросов позволяют выбирать несколько вариантов ответа, в то время как в других можно выбрать только один из предложенных или написать свой вариант.

Кроме того, для удобства прохождения анкеты было заявлено требование создания оптимизированных вопросов вида:

Общий вопрос: Дайте оценку государственному институту вашей страны Название института? Название института №1: Армия Название института №2: Органы безопастности Название института №3: Средства массовой информации Варианты ответов: Положител ъная Отрицательная

Для удобства респондентов подобные вопросы требуется выводить на

экран в виде таблицы:

Вопрос: Дайте оценку государственному институту вашей страны

Положительная Отрицательная

Армия

Органы безопасности

Средства массовой информации

Кроме того, система должна сохранять результаты анкетирования, при этом как отмечалось выше, должна сохраняться связь между результатами анкетирования и агентами, проводившими анкетирование.

Собранные данные будет необходимо обработать. Можно выделить два уровня обработки:

- «Базовый» уровень подразумевает наличие встроенной подсистемы анализа, для осуществления автоматического/полуавтоматического анализа данных анкетирования (например, по ключам), а также базовый статистический анализ (в том числе средствами СУБД). Для реализации данного вида обработки будет разработана подсистема базового анализа данных, встроенная в системе, которая позволит производить анализ «на лету» - сразу после внесения данных в систему.

- «Продвинутый уровень» - использование стороннего программного обеспечения для реализации затратных (по вычислительным ресурсам и времени) алгоритмов и методов анализа. Для использования подобного программного обеспечения требуется создать подсистему выгрузки данных (с выбором необходимых данных в таблицах). Анализ программных комплексов говорит о том, что данная подсистема должна выгружать в формат CSV, но также должна иметь возможность быстрого добавления выгрузки в любой нужный формат.

Исходя из перечисленных требований, разрабатываемая система должна включать в себя следующие подсистемы:

Подсистема Назначение, требования к реализации

Авторизация и регистрация Реализация схемы Агент - респонденты, с упрощённой авторизацией респондентов. Закрепление респондентов за агентами, с возможностью отслеживания работы агентов

Тестирование Создание, неограниченного числа анкет с разными типами вопросов. Сохранение результатов анкет.

Анализ данных «Базовый» анализ данных анкетирования.

Выгрузка Выгрузка данных в различные форматы с возможностью выбора необходимых данных. Масштабируемость - добавление новых форматов выгрузки без модификации базовых классов системы.

2. Тестирование системы

В соответствии с итерационной моделью разработки программного обеспечения [3] был реализован прототип системы сбора данных социо-логичесих опросов. Прототип реализован в виде информационного веб-ресурса на языке программирования PHP, для отображения в браузере используется язык HTML 5 и фреймворк bootstrap. При реализации системы использованы шаблоны проектирования Command, Data Mapper, Singleton. Для хранения данных используется база данных, в качестве СУБД была выбрана СУБД MySQL.

На данный момент прототип полностью реализован и размещён в сети Интернет по адресу rfhmong.net.

В ходе проекта планируется провести несколько масштабных опросов, на территории Монголии и России. В ходе первого этапа авторами проекта была разработана анкета. Данная анкета содержит 68 вопросов (в том числе и «оптимизированных» вопросов).

В ходе предварительного тестирования были заявлены дополнительные требования к системе:

1) Возможность пропуска вопросов - изначально в системе подразумевалось, что переход к следующему вопросу осуществляется только при условии ответа на текущий вопрос. Однако, учитывая большое число вопросов, а также требования методологии проведения опросов было решено дать возможность респондентам пропускать вопросы. Для этой цели реализована пагинация с номерами вопросов.

2) Досрочное завершение тестирования - изначально в системе можно было завершить опрос только в случае, если респондент отвечал на все вопросы, учитывая предыдущий пункт, данная опция потеряла смысл.

3) Изначально в системе при ответе на вопрос респондент автоматически переходил на следующий вопрос. В ходе тестирования авторами было выделено несколько вопросов, в которых номер следующего вопроса зависел от варианта ответа выбранного респондентом. Данные особенности

также были учтены.

4) Для удобства контроля над прохождением тестирования, было предложено создать дополнительную роль в системе с возможностью просмотра активированных промокодов.

Приведённые требования были учтены в системе. Кроме того, в ходе предварительного тестирования были выявлены ошибки в тексте вопросов и ответов, в типах вопросов, которые также были исправлены.

На данный момент все исправления внесены в серверную версию системы, проходит первый этап тестирования.

Заключение

Масштабные социологические исследования обычно сопровождаются большим числом рутинной работы, связанной с большим числом респондентов. В первую очередь это работы по сбору и первоначальной обработке анкет. Внедрение информационных систем по сбору данных анкетирования позволяет автоматизировать эти работы. Однако, внедрение подобных систем также влечёт за собой ряд проблем.

Авторами проанализированы задачи, возникающие перед подобными системами. Выделены и описаны основные подсистемы. Предложена общая архитектура системы.

На основании заявленных требований реализован и протестирован прототип системы. В ходе тестирования выявлены дополнительные требования, данные требования были учтены.

Авторами запланирован несколько этапов анкетирования, на данный момент реализуется первый этап - прохождение теста, состоящего из 68 вопросов. Тестирование проводится при помощи реализованного прототипа системы, который размещён в сети Интернет и доступен по адресу rfhmong.net.

Литература

1. Цыбиков A.C. Анализ объёма и структуры выборки социологического опроса молодёжи Монголии / Батжаргал Н., Дагбаев Э.Г., Дармаев Т.Г., Цыбиков A.C. // Вестник Бурятского государственного университета. - 2015. - Выпуск 9: Математика, информатика. - С. 25-32.

2. Хабитуев Б.В. Информационная система сбора социологических данных/ Очирбат Б., Дармаев Т.Г., Хабитуев Б.В. // Актуальные вопросы вещественного и функционального анализа: материалы семинара молодых учёных с международным участием в рамках Международной конференции «Дифференциальные уравнения и математическое моделирова-ние»(г.Улан-Удэ - оз. Байкал, 20-27 июня 2015 г.). - Улан-Удэ: Изд-во Бурятского госуниверситета, 2015. - С. 68-73.

3. Ларман К. Применение UML и шаблонов проектирования. 2-е издание. - М.: Издательский дом Вильяме, 2013. - 736 с.

References

1. Tsyibikov A.S. Analiz ob'Yoma i strukturyi vyiborki sotsiologicheskogo oprosa molodYozhi Mongolii/ Batzhagral N., Dagbaev E.G., Darmaev T.G., Tsyibikov A.S. // Vestnik Buryatskogo gosudarstvennogo universiteta. - 2015. - Vipusk 9: Matematika, informatika. - S. 25-32.

2. Habituev B.V. Informatsionnaya sistema sbora sotsiologicheskih dannyih/ Ochirbat В., Darmaev T.G., Habituev B.V.// Aktualnyie voprosyi veschestvennogo i funktsionalnogo analiza: materialyi seminara molodyih uchYonyih s mezhdunarodnyim uchastiem v ramkah Mezhdunarodnoy konfer-entsii «Differentsialnyie uravneniya i matematicheskoe modeliro-vanie»(g.Ulan-Ude - oz. Bay-kal, 20-27 iyunya 2015 g. ). - Ulan-Ude: Izd-vo Buryatskogo gosuniversiteta, 2015. - S. 68-73.

3. Larman C. Applying UML and Patterns: An Introduction to Object-Oriented Analysis and Design and Iterative Development (2th Edition). - M.: Publishing House Williams, 2013. - 736 p.

Нямаахуугийн Батжаргал, профессор Иниститута иностранного языка Монгольского университета науки и технологий; Монгольский университет науки и технологий, e-mail: [email protected].

Дармаев Тумэн Гомбоцыренович; к.ф.-м.н.; доцент; заведующий лабораторией Научно-образовательного и инновационного центра системных исследований и автоматизации, e-mail: [email protected].

Хабитуее Баир Викторович, научный сотрудник Научно-образовательного и инновационного центра системных исследований и автоматизации, e-mail: [email protected].

Nyamaahuugiin Batgargal, professor of Intitute of foreighn language of Mongolian Univercity of Science and Technology; Mongolian university of science technology, e-mail: [email protected].

Darmaev Tumen Gombotsyrenovitch, PhD in math; Associate Professor; chief of laboratory of Scientific and Educational Centre of System Research and Automatization; e-mail: [email protected].

Khabituev Bair Victorovitch, research associate of Scientific And Educational Centre of System Research and Automatization, e-mail: bairincO @gmail.com.

i Надоели баннеры? Вы всегда можете отключить рекламу.