Научная статья на тему 'Кадровый потенциал науки: пример разработки базы данных и метода оценки'

Кадровый потенциал науки: пример разработки базы данных и метода оценки Текст научной статьи по специальности «Математика»

CC BY
289
93
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
НАУКА / КАДРОВЫЙ ПОТЕНЦИАЛ / МЕТОД ОЦЕНКИ / МЕТОД НАИМЕНЬШИХ КВАДРАТОВ / БАЗА ДАННЫХ / ER-МОДЕЛЬ / СИСТЕМА УПРАВЛЕНИЯ БАЗАМИ ДАННЫХ / УРАВНЕНИЕ ТРЕНДОВ / SCIENCE / HUMAN POTENTIAL / EVALUATION METHOD / LEAST SQUARES METHOD / DATABASE / ER-MODEL / DATABASE MANAGEMENT SYSTEM / THE EQUATION OF THE TREND

Аннотация научной статьи по математике, автор научной работы — Абдуллин Айдар Риватович, Фаррахетдинова Альмира Риватовна, Кулешова Валентина Павловна

В статье изложены основные положения и результаты разработки базы данных (БД) «Наука»; БД содержит официальные статданные по всем регионам России начиная с 1992 г. ежегодно представляемые Росстатом в разделе «Научные исследования и инновации». БД содержит 40 показателей, которые разбиты на три группы: Кадры (19), Финансы (11) и Инновации (10); в скобках указано количество статистических показателей входящих в эти группы. В качестве основного объекта БД выступает «Регион России», а его идентификация производится по двум ключевым полям : «Год» (к которому относятся данные) и «Код региона». Вместо кода региона можно использовать и его название. В работе приводятся ER-модель и структура БД, а также скриншоты запросов к ней. Авторами предложен метод оценки динамики численности научного персонала учитывающий ее нелинейных характер. В соответствии с ним получены параметры уравнения трендов, характеризующих динамику численности научного персонала для республик Башкортостан, Татарстан, Челябинской области и в целом по России за 10 лет; при этом последние из них 4 года выделены дополнительно в качестве весового компонента. Это позволило более точно произвести количественную оценку ис-следуемого нелинейного процесса. Согласно полученной модели численность научного персонала России в период с 2000 по 2009 гг. ежегодно сокращалась в среднем на 2.3 % или более чем на 20 тысяч человек в год.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Абдуллин Айдар Риватович, Фаррахетдинова Альмира Риватовна, Кулешова Валентина Павловна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Fundamentals and outcomes of database (DB) «Science» have been described in the article; Database contains the official stats from all regions of Russia since 1992 being annually submitted in the «Research and Innovation» section by Rosstat. Database contains 40 indicators, which are divided into three groups: Personnel (19), Finance (11) and Innovations (10); the number of statistical indicators the included in these groups indicated in a parentheses. "Region of Russia" appears as the main object of database and its identification effected for two key fields: "Year" (to which the data) and "Region''s code". Instead "Region''s code" you can use its name. In the paper the ER-model and structure of the database have been adduced, as well as screenshots of requests for it. The authors propose a method for estimating the population dynamics of scientific personnel taking into account its non-linear character. In accordance with the parameters for the equation of trends in the population dynamics of scientific personnel for the republics of Bashkortostan, Tatarstan, Chelyabinsk Region and the whole of Russia for 10 years; with the last 4 years highlighted as a further part of the weight. This enabled more accurately to quantify the test, nonlinear process. According to the resulting model the number of scientific personnel in Russia between 2000 and 2009 have been annually declined by an average of 2.3% or more than 20 thousand people a year.

Текст научной работы на тему «Кадровый потенциал науки: пример разработки базы данных и метода оценки»

УДК 303.7

Абдуллин Айдар Риватович

ООО «Аррион-бизнес групп» Россия, Уфа1 Системный аналитик Доктор философских наук, профессор E-Mail: aydaar_fen@mail.ru

Фаррахетдинова Альмира Риватовна

ФГБОУ ВПО «Башкирский государственный аграрный университет»

Россия, Уфа

Доцент кафедры аудита и налогообложения Кандидат экономических наук E-Mail: farralm@mail.ru

Кулешова Валентина Павловна

ФГБОУ ВПО «Башкирский государственный аграрный университет»

Россия, Уфа

Доцент кафедры аудита и налогообложения Кандидат экономических наук E-Mail: kvp 1109@yandex.ru

Кадровый потенциал науки: пример разработки базы данных и метода оценки

Аннотация: В статье изложены основные положения и результаты разработки базы данных (БД) «Наука»; БД содержит официальные статданные по всем регионам России начиная с 1992 г. ежегодно представляемые Росстатом в разделе «Научные исследования и инновации». БД содержит 40 показателей, которые разбиты на три группы: Кадры (19), Финансы (11) и Инновации (10); в скобках указано количество статистических показателей входящих в эти группы. В качестве основного объекта БД выступает «Регион России», а его идентификация производится по двум ключевым полям : «Год» (к которому относятся данные) и «Код региона». Вместо кода региона можно использовать и его название.

В работе приводятся ER-модель и структура БД, а также скриншоты запросов к ней.

Авторами предложен метод оценки динамики численности научного персонала учитывающий ее нелинейных характер. В соответствии с ним получены параметры уравнения трендов, характеризующих динамику численности научного персонала для республик Башкортостан, Татарстан, Челябинской области и в целом по России за 10 лет; при этом последние из них 4 года выделены дополнительно в качестве весового компонента. Это позволило более точно произвести количественную оценку ис-следуемого нелинейного процесса.

Согласно полученной модели численность научного персонала России в период с 2000 по 2009 гг. ежегодно сокращалась в среднем на 2.3 % или более чем на 20 тысяч человек в год.

Ключевые слова: Наука; кадровый потенциал; метод оценки; метод наименьших квадратов; база данных; ER-модель; система управления базами данных; уравнение трендов.

Идентификационный номер статьи в журнале 171TVN214

1 450073, а/я 139.

Постановка задачи

Объектом данного исследования является кадровый потенциал науки, представленный набором различных статистических показателей(более подробно постановка данной проблемы изложена нами в работе [2]); предметом выступает метод оценки. На сегодняшний день разработано несколько способов оценки научного потенциала общества, без специального выделения его кадровой составляющий. Анализу этих методов авторы посвятили специальное исследование «Способы оценки потенциала науки и ее кадров» [4]. Как показал проведенный анализ, основу этих методов все же составляет именно оценка состояния научных кадров. Иными словами, научные кадры - это основа научного потенциала общества.

Изучение социально-экономических процессов представленных статистическими данными представляет особый интерес, потому что в этом случае исследователь имеет дело с количественными фактами. Однако общеизвестно, что статистические данные являются величинами, содержащими случайную компоненту. Это обстоятельство приводит к определённым математическим сложностям и может отрицательно повлиять на конечный результат исследования. Обычно и чаще всего в подобной ситуации используют всякого рода аналитические показатели ряда динамики такие, например как средние значения, абсолютный прирост, коэффициент роста, темпы роста и прироста и т.п. Основной их недостаток в том, что они не зависят от временных особенностей исследуемого процесса, т.е. не отражают характер его тренда. При более сложном «математизированном» подходе, для решения задач связанных с временными процессам предлагается использовать так называемый метод аналитического выравнивания [9, с. 212]. Его суть состоит в том, чтобы представить динамику процесса в виде математической модели, в частности в виде функции времени у = / (1). Получитьтакую функцию по имеющимся статданным можно при помощи численных методов, наиболее известным из которых является метод наименьших квадратов (МНК). Таким образом, получают уравнение тренда и с его помощью дают оценку направлению тенденции и динамики отдельно взятого процесса. К сожалению полученное таким способом уравнение тренда не всегда адекватно соответствует реальному процессу, на что указывает величина коэффициента детерминации ^2) отражающая степень их соответствия. Конечно, эту точность можно повысить. Но тогда возникает другая проблема, связанная с использованием МНК. Дело в том, что система алгебраических уравнений, с помощью которых получают искомое уравнение тренда «с увеличением степени п приближающего многочлена становится плохо обусловленной и решение ее связано с большой потерей точности» [8, с. 89]. Поэтому считается, что показатель степени полинома не должен превышать трех.

Учитывая вышесказанное, в данной работе рассматриваются полиномы только первой степени (п = 1); по параметрам полученного полинома (коэффициентам уравнения) предлагается оценить: а) динамику отдельно взятого процесса; б) сопоставить между собой несколько аналогичных процессов, например для разных регионов РФ по одному и тому же показателю. Поскольку в основе предлагаемой оценки статистических показателей лежат параметры уравнения, то данный метод можно назвать параметрическим.

При этом важно отметить, что предлагаемый метод - это попытка линеаризации кривой, т.е. замены какого-то нелинейного процесса, представленного в виде, например ветви параболы, прямой линией. Идея данного метода состоит в том, чтобы использовать не одну, а две прямые. Однако, если процесс имеет периодический колебательный характер, то такой подход будет лишен всякого смысла. Решение же такого рода задач с использование аппарата рядов Фурье, нами рассмотрено в работе [1].

Исходно объектом данного исследования послужила научная деятельность (наука) регионов РФ, в частности Республики Башкортостан. Для комплексного и многомерного анализа такого сложного социального объекта была разработана и создана база данных для различных социально-экономических показателей, в том числе и относящихся к сфере науки. При этом можно отметить, что создание базы данных является самой трудоемкой частью данного исследования.

Создание базы данных «Наука»

На основе подготовленных и изданных Росстатом статистических сборников был собран материал, охватывающий период за 1992-2009 гг.; при этом исходные таблицы были приведены в 3-ю нормальную форму (3НФ), как того требует методика построения базы данных (БД). Так, например, автор книги по разработке БДдляMicrosoftAccess 2010, Г.А. Гурвиц утверждает, что «если вы довели уровень нормализации таблиц вашей базы данных до третьей нормальной формы и ваша задача - разработка системы масштаба предприятия, то смело может переходить к разработке интерфейса» [5, с. 45]; последующие нормальные формы (НФ) такие как Бойса-Кодда, 4 и 5НФ нужны для «разработки суперхранилищ данных под Oracle или DB2» [там же]. Алгоритм нормализации базы данных до 5НФ, описанный в статье «Управление базами данных» [11, а479], представлен на рисунке 12.

Поясним, что подразумевается под видами НФ:

• таблица находится в первой нормальной форме (1НФ) тогда и только тогда, когда ни одна из ее строк не содержит в любом своем поле более одного значения и ни одно из ее ключевых полей не пусто;

• таблица находится во второй нормальной форме (2НФ), если она удовлетворяет определению 1НФ и все ее поля, не входящие в первичный ключ, связаны полной функциональной зависимостью с первичным ключом;

• таблица находится в третьей нормальной форме (3НФ), если она удовлетворяет определению 2НФ и не одно из ее неключевых полей не зависит функционально от любого другого неключевого поля;

• таблица находится в нормальной форме Бойса-Кодда (иначе - в усиленной третьей нормальной форме) тогда и только каждая ее нетривиальная и неприводимая слева функциональная зависимость имеет в качестве своего детерминанта некоторый потенциальный ключ;

• таблица находится в четвёртой нормальной форме (4НФ), если она находится в нормальной форме Бойса-Кодда и не содержит нетривиальных многозначных зависимостей;

• таблица находится в пятой нормальной форме (5НФ) (иначе - в проекционносоединительной нормальной форме) если каждая нетривиальная зависимость соединения в ней определяется потенциальным ключом (ключами) этого отношения.

Рис. 1. Алгоритм нормализации БД [2]

Существуют также шестая и, даже уже появилась седьмая нормальные формы.

Приведённые в 3НФ статданные были экспортированы из Excel в Access3 2010 (точнее импортированы Access ’ом).

Как уже было сказано выше, в данном исследовании речь пойдет не просто о социально-экономических показателях регионов включаемых в статсборники Росстата, а конкретно - относящихся к 22 разделу «Научные исследования и инновации»; этот раздел включает в себя 17 таблиц. В общей сложности получившаяся БД содержит 1656 строк (за 18 лет для 92 регионов и федеральных округов РФ) и 40 столбцов (показателей относящийся к научной деятельности).

Для оперативной работы с таким большим объемом статданных была разработана система управления базой данных (СУБД). Для этого вначале была спроектирована ER-модель (Рис. 2).

3 Как показал опыт, жесткие ограничения, накладываемые лицензионным соглашением Майкрософта на эту программу, делает ее практическое использование малоперспективным.

4

Рис. 2. ЕЯ-модель предметной области базы данных «Наука»4

Словосочетание «ЕЯ-модель» переводится как «модель сущность-связь». Считается что если построена ЕЯ-модель, то БД находится уже не в 3-ей, а в более высокой 4НФ. Так, автор учебника по проектированию БД С.М. Диго, излагая такой подход, пишет: «Существуют разные методы проектирования логической структуры реляционных баз данных. Среди них есть и строгие математические методы, обычно базирующиеся на теории нормализации. Они имеют очень большое значение в качестве теоретической основы проектирования БД, но в связи с вычислительной сложностью алгоритмов практически не используются в реальном проектировании систем. Рассмотрим метод проектирования, основанный на анализе ЕЯ-модели и переходе от нее к реляционным отношениям. В основу этого метода положен эмпирический подход. Предлагаемый метод является достаточно простым и наглядным и в то же время дает хорошие результаты. Базы данных, полученные в результате применения излагаемой ниже методики проектирования, находятся в 4-й нормальной форме» [7, с. 195]. Однако К. Дж. Дейт, автор фундаментального исследования по базам данных, в разделе «Является ли ЕЯ-модель моделью данных» [6, с. 523] оспаривает этот тезис. Так он пишет: «что “связи” лучше рассматривать просто как сущности определенного рода. И наоборот, обязательным условием использования ЕЯ-модели является то, что эти два понятия должны каким-то образом различаться. По мнению автора, любой подход, при котором преследуется

такое разделение, обладает серьёзными недостатками, поскольку, как отмечалось выше в разделе 13.2,.один и тот же элемент может совершенно справедливо рассматриваться как сущность одними пользователями и как связь - другими» [там же, с. 524].

Тем не менее, не смотря на эти острые дискуссии, все же была разработана ER-модель для проектируемой базы данных. В соответствии с этой моделью, в качестве основного объекта БД выступает «Регион РФ», а его идентификация производится по двум ключевым полям - Идентификационным объектам (ИО): «Год» (к которому относятся данные) и «Код региона» (в различных вариантах).Как видно из рисунка, статданные относящиеся к БД «Наука» разбиты на три группы: Кадры, Финансы и Инновации. В скобках указано количество показателей (столбцов) входящих в эти группы; всего их 40. В нижней части схемы приведены разделы «Образование», «Население», «Труд» и «ВРП». Показатели этих разделов также введены в БД, т.к. они необходимы для полноценного анализа научного потенциала и научных кадров. Например, количество научного персонала надо рассматривать на 100 000 человек населения, расходы на науку соотносить в ВРП региона и т.д.

Схема структуры раздела «Наука» в СУБД (Access) выглядит так, как показано на рисунке 3.

22_40_Наука_Кадры_19 ї Год i КодРе гОЭ КодРегЮ 221Ч и сОр гН И Р 222 ЧисПерсНИР 223ЧисИсслед 223ч и сТехн и ки 223ЧисВспомПерс 223ЧисПрочПерс 224ЧисИсслУчСтВсего 224ЧисИсслДокт 224ЧисИсслКанд 228ЧисОргПодгАспир 228ЧисАспир 229ПриемАспир 229ВыпАспир 229БыпАспирЗащДис 22ЮЧисОргП о дгД о кто р

2210 Ч и сД о кггр а н 2211ПриемДокт

2211 Вы п Д о кт 2211 ВыпЗащДокт

КодPer

'S' КодРегОЭ КодРегЮ КодАвт НазРег

ПолноеНазРег

ФедОкр

Рис. 3. Схема БД «Наука» в программе Access5

На этой схеме видно, какие сформированы таблицы в БД и какие конкретно показатели в них находятся. Перед показателями указаны номер раздела (для всех это 22) и исходные номера таблиц соответствующие статсборникам Росстата. Хотя структура БД предполагает 3 таблицы, на схеме их 4. Дополнительная таблица «Код регионов» связана с технологией создания БД и ее СУБД. На схеме видны ключевые поля (с изображением ключа) и способы

5 Разработано авторами

6

связи между таблицами («один-к-одному» и «один-ко-многим»).Благодаря СУБД из этой БД можно теперь извлечь все необходимые для исследования статданные.

Ниже, на рисунке 4, в качестве примера, показан Запрос на получение интересующих нас статданных. Так, из таблицы «22_40_Наука_Кадры_19» вначале выбирается поле «Год», оговаривается условие отбора и тем самым запрашиваются данные только за период с 2000 по 2009 гг.

Поле: Имя таблицы: Сортировка: Вывод на экран: Условие отбора: или:

Год КодАвт НазРег 222 ЧисПерсНИР 225БнЗатрИР

22_40_ Наука_ Кадр ы_: КодРег КодРег 22_40_Наука_Кадры_: 22_40_Наука_Финанс

0 0 0 0

>=2000 And <=2009 ■02’ Ог 16’ Ог 74’ Ог 'Г

|< 1111

22163атрНаТехнуіИнновИ

22_40_Наука_Иннов_10,*

Год

КодРег09 КодРегЮ 2212ПоданПатенЗаявИзо6р 2212ПоданПатенЗаяв Поле 2212ВыдПатенИзо6р 2212ВыдПатенПолезМодел 2213ЧисСоздПередПроизТе 2214ЧисИспПердПроизТехн 2215ИннАктОрг__________

22163атрНаТехнлИннов

221706ъемИннТовар

221706ъемИннТоварг%

Рис. 4. Запрос к БД «Наука»6

Далее из таблицы «КодРег» выбирается поле «КодАвт» и указываются автомобильные коды интересующих нас регионов (02, 16, 74-ый и «Р» для России в целом); из этой же таблицы в следующем столбце выбирается поле «НазРег». Далее из таблицы «22_40_Наука_Кадры_19» выбирается поле «ЧисПерсНИР» и т.д. В последнем столбце показано как это делается фактически. После выполнения этого Запроса, программа выдает данные показанные на рисунке 5. В целях экономии места скриншот ограничен 2006 г.

ЗИ ЗапросСтДзнньїеі

Год "■ КодАвт ▼ НазРег 222 ЧисПерсНИР - 225ВнЗатрИР - 22163атрНаТехнлИннов ’•

Р РФ 887729 76697101 62115.2

2000 02 РпБаш 10290 823637 613.3

2000 16 РпТатар 16243 1193337 3318.2

2000 74 ЧелябОб 16376 1920044 2925.9

2001 Р РФ 885568 105260732 68530142

2001 02 РпБаш 10241 1241917 1227900

2001 16 РпТатар 15785 1478583 5228018

2001 74 ЧелябОб 20021 2600118 3677163

2002 Р РФ 870878 135004492 94-046.2

2002 02 РпБаш 12226 1490934 2648.5

2002 16 РпТатар 15297 1802020 5219.1

2002 74 ЧелябОб 20181 2790776 7540.6

2003 Р РФ 858470 169862369 121606.1

2003 02 РпБаш 10090 1515693 6162.8

2003 16 РпТатар 14683 2314828 4548.4

2003 74 ЧелябОб 19705 3576845 4091

2004 Р РФ 839338 196039870 146015.7

2004 02 РпБаш 9279 1493188 1645.7

2004 16 РпТатар 14524 2420940 9298.4

2004 74 ЧелябОб 18756 4145223 12796.1

2005 Р РФ 813207 230785150 143222.6

2005 02 РпБаш 8415 1466637 2101.1

2005 16 РпТатар 14352 3026782 9887.4

2005 74 ЧелябОб 17839 4591871 12668.1

2006 Р РФ 807066 288805212 211392.7

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2006 02 РпБаш 8047 1908389 5856.7

2006 16 РпТатар 14227 4147607 17568.4

2006 74 ЧелябОб 17530 5164481 14637.7

Рис. 5. Результат Запроса к БД «Наука»7 При помощи СУБД эту таблицу можно привести в более удобный вид (см. Рис. 6).

6 Разработано авторами

7 Разработано авторами

' ЗапросСтДанньїеІ

Перетащите сюда поля фильтра

КодАві ▼ НазРег ▼

В 02 □ 16

РпБаш Итоги РпТатар

+ - +1-

Год 222 ЧисПерсНИР ▼ 225ВнЗатрИР ▼ 22163атрНаТехнлИннов ▼ Нет итогов 222 ЧисПерсНИР ▼ 225ВнЗатрИР ▼ 22163атрНаТехнлИннов ▼

2000 10290 823637 613.3 16243 1193337 3318.2

2001 10241 1241917 1227900 15785 1478583 5228018

2002 12226 1490934 2648.5 15297 1802020 5219.1

2003 10090 1515693 6162.8 14683 2314828 4548.4

2004 1 9279 1493188 1645.7 14524 2420940 9298.4

2005 ! 8415 1466637 2101.1 14352 3026782 9887.4

2006 ! 8047 1908389 5856.7 14227 4147607 17568.4

2007 ! 8281 2783152 5917.4 13289 4674049 18893.1

2008 * 8005 3352524 8179.5 12940 5554779 23731.3

2009 7543 3480884 11674.8 12783 5556422 8262.5

Общие итоги

Рис. 6. Запрос на создание сводной таблицы8

Для этого нужно сделать еще один новый Запрос, который называется «Перекрестный», а затем перейти в режим «Сводной таблицы». В результате этого происходит перегруппировка данных; теперь данные сгруппированы в соответствии с их регионами. Такие возможности являются одним из главных преимуществом реляционных БД.

Далее полученные данные можно экспортировать из БД в другие программы, например в Excel. Полученные таким образом данные были использованы для анализа научной деятельности РБпо предлагаемому методу. Рассмотрим данный метод более подробно.

Метод наименьших квадратов и его интерпретация

Исследование влияния одной или нескольких независимых переменных на зависимую называют регрессионным анализом. Такой анализ, в частности, позволяет прогнозировать экономические процессы с помощью, так называемых, трендовых моделей; в основе такого подхода лежит идея экстраполяции, под которой в литературе, посвященной экономикоматематическим методам и моделям, «обычно понимают распространение закономерностей, связей и соотношений, действующих в изучаемом периоде, за его пределы» [10, с. 208]

Примером такого анализа может послужить рассматриваемое нами изменение численности персонала НИР региона РФ, т.е. зависимой переменной от независимой, например, времени. Благодаря такому анализу между изучаемыми переменными можно получить количественное отношение. Естественно, что такое представление будет аппроксимацией, т.е. приближением. Самым простым и удобным (зачастую и лучшим) представлением является линейная зависимость (прямая линия) уравнение которой имеет вид:

У = а * Х + в, (1)

где Х и У - независимая и зависимая переменные; «а» и «в» - параметры (коэффициеты) уравнения; в качестве Х чаще всего выступает фактор времени - t.

Если рассматривается всего одна независмая переменая то такую регрессию называют парной, а если больше то - множественной. Задача сводится к нахождению параметров уравнения регресси. Делается это с помощью так называемого метода наименьших квадратов (МНК, OLS, Ordinary Least Squares). Суть МНК заключается в поиске таких значений параметров регрессии, при которых сумма квадратов отклонений теоретического распределения от распределения эмпирического была бы наименьшей. Математически это записывается так:

8 Разработано авторами 8

2(Y, - f(t))2 ^ min

' . (2)

Этим же методом определяются параметры не только линейной, но и для нелинейных функций, например параболы:

2

Ух = а0 + а1Х + a2X , (3)

или ряда Фурье:

_ m

y = а0 + ^ (akcoskt + bksinkt). (4)

k=1

Последний вариант используются в том случае, если изучаемый процесс происходит с периодическими (сезонными) колебаниями.

Таким образом, любой изучаемый процесс можно представить пусть приближенно, но все же в аналитическом виде. МНК позволяет найти самое лучшее приближение, ибо он находит такие параметры, которые дают минимальное расхождение с имеющимися эмпирическими данными. Но расхождение все же останется. Для того чтобы оценить степень этого расхождения применяется так называемый коэффициент детерминации, обозначаемый R2 (по сути это коэффициент корреляции возведенный в квадрат). Этот коэффициент может принимать значения от 0 до 1. Чем выше значение коэффициента, тем ближе полученное аналитическое (теоретическое, математическое) выражение к реальному процессу. Если R2 =

1, то это значит что произошло 100 % совпадение, а если R2 = 0, то связь между рассматриваемыми переменными отсутствует.

Формулы для расчёта указанных параметров и примеры их расчета приводятся далее.

Оценка динамики показателей науки

Используя рассмотренный выше МНК был проведен анализ динамики научной деятельности по показателю «Численность персонала, занятого научными исследованиями и разработками, (человек)» для трех регионов и РФ в целом за период 2000-2009 гг. (Другие статистические показатели научной деятельности, такие как, например, «Внутренние затраты на научные исследования и разработки (тыс. руб.)» или «Затраты на технологические инновации (млн. руб.) нами рассматриваются в работе [3].)

Графическая иллюстрация этих данных, дающая общее представление о характере протекания рассматриваемого процесса, приведена ниже на рисунке 7.

Как отмечалось ранее, для сопосотавления изучаемых процессов предлагается использовть параметры уравнений трендов, полученные методом наименьших квадратов (МНК). Как известно, в общем виде уравнение линейного тренда вглядит так:

У = а *Х+в. (5)

В нашем случае коэффициет «а» показывает на сколько человек ежегодно изменяется численность персонала. Причем, если этот коэфициет отрицательный, то численность падает, если положительный, то растет. Коэффициент «в» показывает с какого уровня начался отсчет рассматриваемого процесса, т.е. сколько человек научного персонла было на начальный момент времени. Значенияэтих коэффициентов (параметров), а так же коэффициент детерминации R2вычисляются с помощью МНК.

Рис. 7. Сопоставление динамики изменения численности персонала занятого НИР, для трех

регионов РФ за период с 2000 по 2009 гг.9

Особенность предлагаемого метода состоит в том, что расчеты проводятся в два этапа, а именно за периоды: а) с 2000 по 2009 года; б) с 2006 по 2009 года (Табл.1 и 2).

Таблица 1

Расчет параметров уравнения численности персонала НИР, чел10

За 10 лет

Год Численность персонала НИР (чел)

Российская Федерация Республика Башкортостан Республика Татарстан Челябинская область

2000 887 729 10 290 16 243 16 376

2001 885 568 10 241 15 785 20 021

2002 870 878 12 226 15 297 20 181

2003 858 470 10 090 14 683 19 705

2004 839 338 9 279 14 524 18 756

2005 813 207 8 415 14 352 17 839

2006 807 066 8 047 14 227 17 530

2007 801 135 8 281 13 289 15 174

2008 761 252 8 005 12 940 14 627

2009 742 433 7 543 12 783 14 246

а -16 405.66 -406.62 -379.61 -541.85

в 916 939 11478 16500 20426

Я2 0.9689 0.71145 0.9724 0.5314

9 Выполнен авторами

10 Составлена авторами

Таблица 2

Расчет параметров уравнения численности персонала НИР, чел.11

За последние 4 года

Год Численность персонала НИР (чел)

Российская Федерация Республика Башкортостан Республика Татарстан Челябинская область

2006 807 066 8 047 14 227 17 530

2007 801 135 8 281 13 289 15 174

2008 761 252 8 005 12 940 14 627

2009 742 433 7 543 12 783 14 246

а -23 378.20 -178.80 -468.10 -1 039.90

в 836 417 8 416 14 480 17 994

Я2 0.93408 0.55852 0.87231 0.82966

Ниже представлен пример расчета параметров уравнения тренда и его коэффициента детермниации по Республике Башкортостан за период 2000-2009 г.г.

п п

¡хі і=1 і=1

і=1

55*92417 -10*474747 335465

( п V

2>і -п•хх2

V і=1 у і=1

3025 -10*385

825

-406,62.

Ь=

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

п

ґ п п Л 1 1

Xу - а 2 х = — * (92417 + 406,62 * 55)= — * 114781,1 = 11478,1 = 11478.

V і=1 і=1 у 10 10

я2=

II

X (хі- х) • (Уі- у)

V і=1

у -

112516639325

12516639325

2 (Хі - X)2 •Х (Уі - У)

_.2 82,5*19173278,1 1581795443,25

= 0,7113.

і = 1

і=1

Следовательно, уравнение тренда для РБ за 10-летний период будет иметь вид:

У = — 406.62 * Х + 11 478.

Полученная таким образом прямая линия описывает график, построенный по фактическим статданным на 71.1 %.

На рисунке 8 представлены графики трендов отражающие динамику численности научного персонала РФ и РБ - фактическую и полученную аналитическим путем - за оба периода.

На что указывают параметры полученного уравнения тренда (У = — 406.62*Х + 11 478) ? Согласно этой модели (уравению), на начальном этапе (2000 г.), в РБ как бы было 11 478 человек научного персонала, и ежегодно эта численность уменьшается на 407 человек. Если же посмотреть по таблице, то фактически в 2000 г. в РБ было 10 290 человек персонала. Поскольку разница между ними существенная, то для расчета лучше принять среденее

п

а

1

2

п

п

значение, т.е. (11 478 + 10 490) / 2 = 10 984 человек. Таким образом мы получили абсолютные значения изменения численности научного персонала региона за указанный период.

Рис. 8. Линии и уравнения трендов динамики численности научного персонала РФ и РБ за 10

лет и последние 4 года12

Однако можно получить и относительные значения . Более того такая вличина гораздо значимее, ибо позволяет уже сравнить между собой различные регионы, т.е. делает их соспоставимыми что в конечном счете позволит произвести численную оценку изучаемого

процесса. Для этого надо выяснить, на сколько процентов ежегодно изменяется численность персонала от исходного уровня. Для РБ это будет выгляетдь так: 10 984 это 100 %, а 407 - Х %. Из этой пропорции следует, что ежегодно численность научного персонала в РБ падает от исходного уровня на 3,7 %. Однако, такой подход будет слишком усреденным. Поэтому, для того чтобы выделить и учесть динамику последних лет, надо также расчитать этот показтель отдельно за последние годы, например 4 года, как это было уже сделано выше. Как показывает расчет, в последине 4 года численность научного персонала в РБ ежегодноснижается на 2,2%. Этот показатель является своего рода весовым коэффициентом; учитывая его можно получить уточненное среднее значение. Для РБ это будет ( 3,7 + 2,2) / 2 = 2,95 %. Данный, уточненный результат свидетельсвует о том, что темп снижения численности научного персонала в РБ в последние годы все же немного уменьшился, ибо его величина составляет уже не 3,7 %, а 2,95 %.Аналогично производятся расчеты для других регинов РФ. Результаты этих расчетов приведены в таблице 3.

Таблица 3

Расчет темпа снижения (роста) численности научного персонала13

10 лет 4 года Итого

НазРег а в а/(в+с) % а в 2а/(в+d) % Сред %

РпБаш -407 11 478 -3.7 -179 8 416 -2.2 -2.95

РпТатар -380 16 372 -2.3 -468 14 480 -3.3 -2.8

ЧелябОб -542 18 401 -3.1 -1 040 17 994 -5.9 -4.5

РФ -16 406 902334 -1.8 -23 378 836417 -2.8 -2.3

В этой таблице «а» и «в» - это коэффициенты уравнений тренда за периоды в 10 лет и 4 года; «с» и «й» - это фактические данные за 2000 и 2006 гг. соответственно. В формулах 2а /(в + с)и 2а / (в + й) непосредственно расчитываются значения динамики изменения числености научного персонала (в % ) за 10 лет и 4 года. В последнем столбце подсчитаны

уточненные средние значения за эти два периода.

Как следудет из этой таблицы, ежегодно численность научного персонала, начиная с 2000 г., в среднем по РФ падает на 2,3%. При этом во всех трех рассмотренных регионах уменьшение численности персонала идет быстрее (!) чем по РФ в среднем. Из этого можно предположить, что в каких-то регионах РФ, численность научного персоанала, не только не уменьшается, а наооборт, возможно, даже увеличивается. Чтобы проверить это предположение нужно просчитать этот показатель для всех 83 регионов РФ.

Выводы

Созданная база данных наука и предложенный метод оценки динамики потенциала науки позволяет исследовать широкий круг социально-экономических процессов, и в первую очередь тех, изучение которых осложнено наличием случайной составляющей и нелинейным характером. Это достигается за счет того, что используя МНК вычисляются параметры этого процесса, а затем в рассматриваемом процессе выделяется качестве весового компонента наиболее значимая его часть (чаще всего последний период). Выделение в одном процессе двух составляющих, их аналитическое выравнивание позволяет более точно произвести количественную оценку сложного социально-экономического явления. В соответствии с проведенной методикой численность научного персонала РФ в период с 2000 по 2009 гг. ежегодно сокращалась в среднем на 2.3 % или более чем на 20 тысяч человек в год.

ЛИТЕРАТУРА

1. Абдуллин А. Р. Статистическое имитационное моделирование случайных процессов: методика и конкретная реализация // Социология и общество: глобальные вызовы и региональное развитие: Материалы IV очередного Всероссийского социологического конгресса. - Уфа. 2012. - С.2784-2795.

2. Абдуллин А.Р. Кадровый потенциал науки: введение в проблематику и

постановка задачи исследования // Интернет-журнал «Науковедение». 2013 №1 (14) [Электронный ресурс]. - М. 2013. - Режим доступа:

http://naukovedenie.ru/sbomik14/1.pdf, свободный - Загл. с экрана. (С. 1-24.)

3. Абдуллин А.Р., Казакбаева Г.М. Динамика статистических показателей науки региона: метод оценки и пример реализации \\ Вестник ВЭГУ.- 2013. - №4 (66). - С.225-234.

4. Абдуллин А.Р., Фаррахетдинова А.Р. Способы оценки потенциала науки и ее кадров// Интернет-журнал «Науковедение». 2013 №4 (17) [Электронный ресурс]. - М. 2013. - Режим доступа: http://naukovedenie.ru/pdf/20evn413.pdf, свободный - Загл. с экрана. (С. 1-38.).

5. ГурвицГ.А. Microsoft Access 2010. Разработка приложений на реальном примере. - СПб.: БХВ-Петербург, 2010. - 496 с.

6. Дейт К. Дж. Введение в системы баз данных. - М.: Вильямс, 2001. - 1072 с.

7. Диго С.М. Базы данных: проектирование и использование. - М.: Финансы и статистика, 2005. - 592 с.

8. Пирумов У.Г. Численные методы: теория и практика. - М.: Юрайт, 2012. - 412 с.

9. Улитина Е. В., Леднева О.В., Жирнова О.Л.. Статистика. - М.: Московская финансово-промышленная академия. 2011. - 312 с.

10. Экономико-математические методы и прикладные модели: Учеб. пособие для вузов / В. В. Федосеев, А. Н. Гармаш, Д.М. Дайитбегов и др.; Под ред. В.В. Федосеева. - М.: ЮНИТИ, 1999. - 391 с.

11. Dr. Vinod Kumar, Er. Gagandeep Raheja, Mrs. Shalini Sachdeva. Database management // International Journal of Computers & Technology, Volume 3 No. 3, Nov-Dec, 2012. С. 474-480 - [Электронный ресурс] / - Режим доступа: http://cirworld.com/index.php/ijct/article/view/697/pdf, свободный.

Рецензент: Гизатуллин Хамид Нурисламович, чл.-корр.РАН, Советника РАН,д.э.н., профессор, Институт социально-экономических исследований УНЦ РАН.

Aydar Abdullin

LLC «Arreon-business group» Russia, Ufa E-Mail: aydaar_fen@mail.ru

Almira Farrakhetdinova

Bashkir state agrarian university Russia, Ufa E-Mail: farralm@mail.ru

Valentina Kuleshova

Bashkir state agrarian university Russia, Ufa E-Mail: kvp1109@yandex.ru

rersonnel potential of science: example database development and evaluation methods

The Abstract: Fundamentals and outcomes of database (DB) «Science» have been described in the article; Database contains the official stats from all regions of Russia since 1992 being annually submitted in the «Research and Innovation» section by Rosstat. Database contains 40 indicators, which are divided into three groups: Personnel (19), Finance (11) and Innovations (10); the number of statistical indicators the included in these groups indicated in a parentheses. "Region of Russia" appears as the main object of database and its identification effected for two key fields: "Year" (to which the data) and "Region's code". Instead "Region's code" you can use its name.

In the paper the ER-model and structure of the database have been adduced, as well as screenshots of requests for it.

The authors propose a method for estimating the population dynamics of scientific personnel taking into account its non-linear character. In accordance with the parameters for the equation of trends in the population dynamics of scientific personnel for the republics of Bashkortostan, Tatarstan, Chelyabinsk Region and the whole of Russia for 10 years; with the last 4 years highlighted as a further part of the weight. This enabled more accurately to quantify the test, nonlinear process.

According to the resulting model the number of scientific personnel in Russia between 2000 and 2009 have been annually declined by an average of 2.3% or more than 20 thousand people a year.

Keywords: Science; human potential; evaluation method; least squares method; the database; ER-model; database management system; the equation of the trend.

Identification number of article 171TVN214

REFERENCES

1.

2.

3.

4.

5.

6.

7.

8.

9.

10. 11.

Abdullin A. R. Statisticheskoe imitacionnoe modelirovanie sluchajnyh proces-sov: metodika i konkretnaja realizacija // Sociologija i obshhestvo: global'nye vyzovy i re-gional'noe razvitie: Materialy IV ocherednogo Vserossijskogo sociologicheskogo kongressa. - Ufa. 2012. - S.2784-2795.

Abdullin A.R. Kadrovyj potencial nauki: vvedenie v problematiku i postanovka zadachi issledovanija // Internet-zhurnal «Naukovedenie». 2013 №1 (14) [Jelektronnyj resurs]. - M. 2013. - Rezhim dostupa: http://naukovedenie.ru/sbornik14/1.pdf, svobodnyj - Zagl. s jekrana. (S. 1-24.)

Abdullin A.R., Kazakbaeva G.M. Dinamika statisticheskih pokazatelej nauki re-giona: metod ocenki i primer realizacii \\ Vestnik VJeGU.- 2013. - №4 (66). - S.225-234.

Abdullin A.R., Farrahetdinova A.R. Sposoby ocenki potenciala nauki i ee kadrov// Internet-zhurnal «Naukovedenie». 2013 №4 (17) [Jelektronnyj resurs]. - M. 2013. -Rezhim dostupa: http://naukovedenie.ru/pdf/20evn413.pdf, svobodnyj - Zagl. s jekrana. (S. 1-38.).

Gurvic G. A. Microsoft Access 2010. Razrabotka prilozhenij na real'nom primere. -SPb.: BHV-Peterburg, 2010. - 496 s.

Dejt K. Dzh. Vvedenie v sistemy baz dannyh. - M.: Vil'jams, 2001. - 1072 s.

Digo S.M. Bazy dannyh: proektirovanie i ispol'zovanie. - M.: Finansy i sta-tistika, 2005. - 592 s.

Pirumov U.G. Chislennye metody: teorija i praktika. - M.: Jurajt, 2012. - 412 s.

Ulitina E. V., Ledneva O.V., Zhirnova O.L.. Statistika. - M.: Moskovskaja finansovo-promyshlennaja akademija. 2011. - 312 s.

Jekonomiko-matematicheskie metody i prikladnye modeli: Ucheb. posobie dlja vu-zov / V. V. Fedoseev, A. N. Garmash, D.M. Dajitbegov i dr.; Pod red. V.V. Fedoseeva. - M.: JuNITI, 1999. - 391 s.

Dr. Vinod Kumar, Er. Gagandeep Raheja, Mrs. Shalini Sachdeva. Database management // International Journal of Computers & Technology, Volume 3 No. 3, Nov-Dec, 2012. S. 474-480 - [Jelektronnyj resurs] / - Rezhim dostupa:

http://cirworld.com/index.php/ijct/article/view/697/pdf, svobodnyj.

i Надоели баннеры? Вы всегда можете отключить рекламу.