Научная статья на тему 'Информационно-аналитическое обеспечение создания наукоемкой продукции'

Информационно-аналитическое обеспечение создания наукоемкой продукции Текст научной статьи по специальности «Информатика»

CC BY
430
64
Поделиться
Журнал
Прикладная информатика
ВАК
RSCI
Область наук

Аннотация научной статьи по информатике, автор научной работы — Желтухин Павел Сергеевич, Лавринов Геннадий Алексеевич, Хрусталёв Евгений Юрьевич

Традиционно считается, что информационная технология это приемы, способы и методы применения средств вычислительной техники при выполнении функций хранения, обработки, передачи и использования данных. Под компьютерно-ориентированной технологией формирования научно-технической государственной программы (НТГП) на государственном уровне понимается метод организации и решения перечисленных выше функциональных задач. Разрабатываемые технологии должны обеспечивать: снижение нагрузки налицо, принимающее решение (за счет осуществления первичной фильтрации данных и освобождения от рутинной работы по их систематизации); преобразование данных о рассматриваемых вариантах развития наукоемкой продукции (НП) к виду, обеспечивающему системность их восприятия; повышение эффективности процесса принятия решений при формировании НТГП (за счет алгоритмизации и стандартизации информационно-аналитических процедур); авто матизацию поиска аргументации в подтверждение или опровержение выдвигаемых гипотез. С учетом того, что разработка специального программного обеспечения для формирования НТГП является достаточно сложной и трудоемкой задачей. В статье основное внимание уделено вопросам автоматизации сбора данных, их первичной обработки, классификации, оценки дублирования и представления.

Похожие темы научных работ по информатике , автор научной работы — Желтухин Павел Сергеевич, Лавринов Геннадий Алексеевич, Хрусталёв Евгений Юрьевич,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Текст научной работы на тему «Информационно-аналитическое обеспечение создания наукоемкой продукции»

№ 3 2006

П. С. Желтухин, Г. А. Лавринов, Е. Ю. Хрусталёв

Информационно-аналитическое обеспечение создания наукоемкой продукции1

В настоящее время проблемы разработки и распространения наукоемких продуктов и услуг весьма актуальны, в силу их особой значимости для поступательного развития экономики и общества. Такие продукты способствуют повышению жизненного уровня за счет интенсивных факторов: роста производительности труда, снижения относительного уровня потребления и повышения эффективности использования невосполнимых природных ресурсов [1, 2].

Современная практика стратегического планирования в специфических условиях переходного периода и длительного кризиса реального сектора экономики выдвигает новые задачи в области управления крупными научно-производственными комплексами [3-5]. К ним следует отнести и проблему технико-экономического обоснования реализуемости наукоемких проектов в условиях интенсивной деградации научно-технического и производственного потенциала наукоемких отраслей. Его состояние и устойчивые тенденции угасания в различных отраслях таковы, что использование традиционных методов оценки показателей реализуемости является необходимым, но не достаточным требованием для объективного и достоверного анализа воздействующих факторов и принятия комплекса мер по его сохранению и развитию.

Процесс формирования научно-технической государственной программы (НТГП) создания наукоемкой продукции (НП) разного назначения включает следующие основные этапы:

• разработка базы исходных данных;

• определение диапазона ассигнований, которые могут быть направлены на развитие НП в рассматриваемый плановый период;

• формирование вариантов развития научно-технических систем для разных уровней финансирования;

• оценка эффективности принимаемых решений;

• формирование проекта НТГП под выделенный объем ассигнований [6].

Таким образом, в рамках процесса принятия решений при формировании НТГП решаются следующие функциональные задачи:

• расчет диапазона возможного финансирования развития НП в предстоящий программный период, который должен учитывать широкий спектр показателей (прогнозные показатели развития экономики РФ, аналогичные расходы зарубежных стран, нормативно-правовые требования);

• оценка предложений в НТГП, которая должна учитывать потребности промышленного производства для решения задач социально-экономического развития, а также прогноз динамики убыли НП вследствие выработки ее технического ресурса;

• оперативное формирование исследовательских вариантов развития НП для различных уровней финансирования;

• агрегированная оценка и номенклатурный анализ предложений в НТГП, которые должны обеспечивать проведение взаимосвязанного, многоаспектного анализа

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 Статья подготовлена при поддержке Российского гуманитарного научного фонда (проект № 05-02-02300).

№ 3 2006

предлагаемых проектов с возможностью пересечения агрегированных показателей рассматриваемых вариантов по различным основаниям.

Для повышения обоснованности и оперативности подготовки решений при наполнении НТГП проектами создания наукоемкой продукции, а также снижения трудоемкости этого процесса, необходима разработка комплекса специализированных компьютерно-ориентированных технологий, реализующих ключевые информационно-аналитические задачи обработки предложений производителей и потребителей НП.

Роль создаваемого комплекса технологий заключается в методическом и инструментальном обеспечении процесса подготовки и принятия управляющих решений [7]. Анализ содержания работ, выполняемых в рамках этапов программного управления развитием НП, показывает, что на каждом из них необходимо формулировать и реализовывать разнообразные задачи. Это требует использования соответствующего программно-математического и информационного обеспечения.

Информационная технология — это приемы, способы и методы применения средств вычислительной техники при выполнении функций хранения, обработки, передачи и использования данных [8]. Под компьютерно-ориентированной технологией формирования НТГП на государственном уровне понимается метод организации и решения перечисленных выше функциональных задач.

Разрабатываемые технологии должны обеспечивать:

• снижение нагрузки на лицо, принимающее решение (ЛПР), за счет осуществления первичной фильтрации данных (освобождение от рутинной работы по их систематизации);

• преобразование данных о рассматриваемых вариантах развития НП к виду, обеспечивающему системность их восприятия;

• повышение эффективности процес- ,§3

са принятия решений при формировании <8 НТГП за счет алгоритмизации и стандарти- ■£, зации информационно-аналитических про- £ цедур; 52

• автоматизацию поиска аргументации в ^

подтверждение или опровержение выдви- о гаемых гипотез. Ц

СП

Разработка специального программно- ^ го обеспечения для формирования НТГП и является достаточно сложной и трудоемкой | задачей. Поэтому, в рамках данной статьи, область автоматизации целесообразно ог- § раничить сбором, первичной обработкой, ^ классификацией, оценкой дублирования и Ч представлением данных.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Информационной основой и объединяющим элементом разработанного комплекса компьютерно-ориентированных технологий является единая база данных реляционного типа. Разработанные технологии обеспечивают решение конкретных задач определенных этапов формирования НТГП (рис. 1).

Технология классификации данных

Разработка технологии классификации данных обусловлена необходимостью решения следующих частных информационно-аналитических задач формирования НТГП на государственном уровне:

• при расчете диапазона возможного финансирования развития НП в предстоящий программный период;

• при оценке предложений в НТГП;

• при оперативном формировании вариантов развития НП для различных уровней финансирования:

□ анализ базовых вариантов развития НП в интересах выделения их ключевых составных элементов в структуре задач научно-технического сотрудничества;

□ аенерация множества вариантов развития НП;

• при агрегированной оценке и номенклатурном анализе предложений в НТГП:

Информационно-аналитическое обеспечение создания наукоемкой продукции

№ 3 2006

Перечень используемых технологий

Перечень решаемых задач

Оперативное формирование вариантов развития НП для различных уровней ______финансирования_______

комплексное интегрированное применение экспертных и семантических методов оценки схожести параметров программных мероприятий

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Агрегированная оценка и номенклатурный анализ предложений в НТГП

Эргономически сбалансированное представление многомерных массивов информации

Рис. 1. Соответствие технологий и задач, решаемых при формировании НТГП

□ алассификация программных мероприятий;

□ аластеризации выбранных показателей.

Порядок использования технологии классификации покажем на примере структуризации массива программных мероприятий (работ).

Работы, предлагаемые к включению в НТГП, помимо технико-экономических ха-рактеристи, имеют также и характеристики принадлежности к узлам различных классификаторов. Так как классификация проводится по нескольким классификаторам, в итоге для каждой работы будет сформирован п-мерный вектор классификационной

№ 3 2006

направленности N (р г1,...,рт) г-й работы, координаты которого — классификационные признаки рг1,...,рт г-й работы. Измерениями для вектора классификационной направленности будут являться классификаторы, по которым проводится классификация работ.

Присвоение классификационных признаков может проводиться автоматически или экспертно.

Автоматическая классификация

При автоматической классификации присвоение работам классификационных признаков производится путем анализа смыслового содержания атрибутов работ (под атрибутами работы подразумеваются шифр, наименование, тактико-техническое задание и др.) и нахождения наиболее подходящего узла классификатора. Для увеличения вероятности правильной классификации работ существует режим обучения классификатора. Этот режим подразумевает сохранение предыстории классификации. В режиме обучения к атрибутам узла классификатора добавляются атрибуты каждой работы, подчиненной этому узлу. Таким образом накапливается информация, характеризующая данный узел, и, как следствие, увеличивается эффективность классификации работ.

Для автоматической классификации данных разработано два подхода.

Первый заключается в автоматическом присвоении классификационных признаков наиболее близкого узла классификатора работе на основе смыслового анализа ее атрибутов. Достоинством этого подхода является скорость классификации. Недостатками: относительно небольшая вероятность правильной классификации работ при работе с новыми классификаторами, а также с классификаторами без режима обучения. Поэтому использовать этот метод при высоких требованиях к качеству классификации рекомендуется только при достаточно большой предыстории обучения классификатора и относительно большом объеме атрибутов работ.

Второй подход к автоматической клас- .¡8 сификации работ проводится в три этапа. |

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 этап (первичная классификация). Про- ■£,

изводится подчинение работы нескольким £ наиболее близким узлам классификатора 2 (их количество варьируется в зависимос- ^ ти от поставленных задач и требований к о качеству классификации). Таким образом, Ц формируется массив наиболее приемле- ® мых вариантов классификации работ. ^

2 этап. Производится экспертная оцен- и

ка результатов первичной классификации, | для каждой работы ЛПР подтверждает не 5, более одного варианта классификации. §

3 этап. Проводится экспертная клас- ^ сификация работы, для которых ЛПР не Ч подтвердил ни одного варианта первичной классификации, при помощи средств графической визуализации.

Достоинствами этого подхода к автоматической классификации являются:

• точность классификации, достигаемая за счет предоставления ЛПР большего количества степеней свободы;

• простота обнаружения ошибок первичной классификации;

• простота корректировки результатов классификации, так как все работы, от-классифицированные ошибочно, будут принадлежать самому верхнему уровню.

Основными недостатками этого подхода являются:

• сравнительно большое время классификации, так как классификация в этом подходе полуавтоматическая;

• высокие требования к квалификации ЛПР, так как все возможные ошибки классификации могут возникать только по его вине.

Экспертный способ классификации

При создании новых классификаторов и классификации работ по ним возникают сложности, связанные с невозможностью учесть все особенности массива работ,

Информационно-аналитическое обеспечение создания наукоемкой продукции

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

№ 3 2006

подлежащих классификации. Существует два подхода к решению этой задачи. Первый подход заключается в подчинении каждой работы узлу классификатора. Удобно при создании классификаторов одновременно классифицировать работы. В этом случае массив работ служит подсказкой для создания новых узлов классификатора. Например, сначала формируется первый уровень классификатора, работы распределяются по его узлам. Затем каждый из узлов первого уровня делится на подчиненные узлы, по которым распределяются работы, принадлежащие верхнему узлу, и т. д. Достоинством этого подхода является качество классификации. Основные недостатки подхода: низкая скорость и большая сложность классификации.

Второй подход при экспертной классификации заключается в подчинении узлов одного классификатора узлам другого. Таким образом, работы, подчиненные узлам одного классификатора, автоматически подчиняются узлам другого. При выборе способа связывания классификаторов необходимо учитывать, что степень детализации (количество узлов) подчиненного классификатора должно быть больше, чем у того, которому он будет подчинен. Достоинствами второго подхода к экспертной классификации работ является простота и высокая скорость классификации. Недостаток — возникновение ошибок из-за неполной совместимости классификаторов, имеющий место в случае, когда нельзя однозначно подчинить все узлы одного классификатора узлам другого.

Достоинствами способа экспертной классификации являются гибкость в использовании и возможность корректировки классификатора на этапе классификации. Основным недостатком является низкая скорость классификации. При высоких требованиях к скорости классификации и относительно большой предыстории обучения классификатора целесообразно использовать автоматический способ классификации. При тех же условиях, но при

высоких требованиях к качеству классификации рекомендуется использовать способ полуавтоматической классификации. В остальных случаях следует использовать экспертный способ.

Технология оценки дублирования данных

Технология оценки дублирования данных является логическим продолжением технологии классификации данных и призвана решить задачу анализа предложений в НТГП на предмет дублирования данных при выполнении следующих процедур:

• оперативное формирование вариантов развития НП для различных уровней финансирования;

• агрегированная оценка и номенклатурном анализе предложений в НТГП.

Алгоритм выявления дублирующихся данных применительно к анализу предложений в НТГП и исследовательских вариантах на предмет дублирования работ представлен на рис. 2.

На первом этапе выбирается способ определения дублирующихся работ. Разработано два подхода к решению данной задачи. Первый подход — выявление дублирующихся данных путем создания классификационных групп в нескольких измерениях (классификаторах) с последующим анализом результатов классификации.

Второй подход — выявление дублирующихся данных путем анализа смыслового содержания информации (семантического анализа) и сравнения записей с расчетом коэффициента схожести. Второй подход основывается на расчете коэффициентов схожести работ. При этом используется метод частотного семантического анализа [9, 10]. В результате выполнения этого этапа будет сформировано информационное пространство работ, в котором каждая работа связана с другими, а степень взаимосвязи определяется коэффициентом схожести. Как показывает практика, рабо-

1Т в государственных программах ♦ Технологии формирования

________Массив исходных данных по работам^

На основе формирования классификационных групп

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Новый

Создание нового классификатора или выбор существующего

Существующий

Выбор варианта классификации работ

Экспертная классификация

Формирование классификационных групп (неболее 10 работ в группе)

/

Выбор "способа определения" .дублирующихся работ..

Автоматическая классификация работ

На основе семантического анализа

Обновление БД семантического анализа на основе массива данных о работах, подлежащих анализу

Подчинение новой работы узлу, которому принадлежит отклассиф ици рован ная работас максимальным коэффициентом схожести и не меньшим, чем пороговый

Семантический анализ массива работ и расчет коэффициента схожести

І

Выбор порога коэффициента схожести

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Коэффициент не меньше порогового

т

Анализ

коэффициента

схожести

работы

Экспертная классификация работ с коэффициентом схожести не меньшим чем пороговый, которым не нашлось аналога

Выявление схожих работ в сформированных группах

Коэффициент меньше порогового

Экспертный анализ результатов, принятие решения о схожести работ, учитывая коэффициент схожести

Выдача предложений по координации работ Рис. 2. Алгоритм определения дублирующихся работ

Со

I

П. С. Желтухин, Г. А. Лаври нов, Е.Ю. Хрустал ёв

ПРИКЛАДНАЯ ИНФОРМАТИКА

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Информационно-аналитическое обеспечение создания наукоемкой продукции

№ 3 2006

ты следует признать дублирующимися при коэффициенте схожести больше 0,8.

Технология представления данных

Разработка технологии представления данных обусловлена необходимостью решения следующих частных задач при формировании НТГП:

• расчет диапазона возможного финансирования развития НП в предстоящий программный период;

• оценка предложений в НТГП в пространстве комплектов НП:

□ представление потребностей в НП;

□ представление динамики убыли НП;

□ п редставление потребностей в до-оснащении НП;

• оперативное формирование вариантов развития НП для различных уровней финансирования:

□ п редставление множества сгенерированных исследовательских вариантов;

□ представление зависимости эффективности научно-технической системы от вкладываемых ассигнований;

• агрегированная оценка и номенклатурный анализ предложений в НТГП:

□ представление рассчитанных показателей;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

□ п редставление принимаемых решений.

Одним из подходов к разработке технологии представления данных является визуализация, благодаря которой любой тип данных, используемых при поддержке принятия решений, если это целесообразно, может быть преобразован и представлен в форме как неподвижных, так и движущихся изображений. В данном исследовании под визуализацией результатов формирования НТГП понимается проектирование и генерация изображений в устройствах

отображения на основе исходных данных, а также правил и алгоритмов их преобразования.

Для визуализации данных могут быть использованы одно-, двух- и трехмерные пространства отображений [11]. Функция одной переменной — это кривая в двухмерном пространстве. Например, распределение ассигнований на конкретную работу по годам программного периода. Функция двух переменных изображается в форме псевдовыпуклого изображения, либо с помощью раскрашивания переменных. Например, распределение ассигнований по элементам системы по годам программного периода и по фазам жизненного цикла. Один из способов представления функции трех переменных — использование объемного изображения с пространственными срезами.

Одномерная визуализация результатов — это такой способ представления многомерного распределения на двумерной плоскости, при котором, по крайней мере, качественно отражены основные закономерности, присущие исходному распределению. К таким закономерностям относятся: кластерная структура распределения, его топологические особенности, внутренние зависимости, информация о расположении данных в исходном пространстве и т. д.

Рассмотрим один из способов постановки задачи представления данных в виде двумерной картинки. Требуется найти такое отображение (способ проецирования) из исходного пространства на двумерную плоскость, которое бы оптимизировало заданный критерий качества — некоторый функционал от координат точек данных до и после процедуры проецирования (фактически, масштаб представляемой диаграммы).

В настоящее время выделяется два варианта решения этой задачи [12].

Вариант 1. Вид отображения и известен заранее и является, как правило, линейным отображением на плоскость. Оптимизируе-

№ 3 2006

мый функционал в данном случае называется проекционным индексом и обозначается О (и, X), где X — весь набор многомерных данных, а О зависит от параметров отображения. Могут быть использованы следующие проекционные индексы:

• минимизирующий расстояние от точек данных до их проекций (метод снижения размерности с помощью главных компонент);

• максимизирующие расстояния между кластерами (один из вариантов таких индексов максимизирует энтропию конечного двумерного распределения данных);

• максимально разделяющие заранее заданные классы для построения линейного классификатора;

• используемые для выделения аномальных наблюдений, далеко отстоящих от основной массы распределения точек данных;

• выделяющие нелинейные структуры в многомерных данных.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Явный вид этих проекционных индексов приведен в литературе по прикладной статистике [13].

Вариант 2. Вид отображения заранее неизвестен. Тогда оптимизируемый критерий является функцией от набора двумерных координат, приписанных каждой точке данных. Задачей в этом случае является назначение каждой из точек исходного набора данных пары координат таким образом, чтобы минимизировать функционал, описывающий меру искажения структуры данных.

Структура программноинформационного обеспечения процесса формирования НТГП

Перспективным направлением развития программно-информационного обеспечения процесса формирования НТГП является создание систем, позволяющих автоматизировать все этапы рассматриваемого процесса. Для качественного решения пос-

тавленной задачи предлагается разработать автоматизированную информационнорасчетную систему формирования НТГП, которая должна обеспечить:

• концентрацию информационных ресурсов, необходимых для процесса формирования НТГП, на единых программно-технических и информационных технологиях;

• унификацию программных средств при формировании НТГП;

• реализацию электронного (безбумажного) документооборота в рамках распределенной системы;

• управление информационными потоками и ресурсами системы и их защиту от несанкционированного доступа.

Как отмечено ранее, информационной основой и объединяющим элементом разработанного комплекса компьютерно-ориентированных технологий (а соответственно и перспективной автоматизированной системы) является единая база данных реляционного типа. Проведенные исследования показали, что информацию целесообразно хранить в единой базе данных реляционного типа под управлением СУБД SОL 8.0.

Единая база данных, полученная в результате объединения уже разработанных баз данных, доработки их под задачи формирования НТГП и добавления недостающих элементов, состоит из следующих компонентов:

• классификаторы и справочники;

• мониторинг технического состояния НП;

• типовые комплекты НП;

• варианты развития НП.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Существующая система научно-методического обеспечения обоснования, формирования, реализации программ и планов создания наукоемкой продукции различного назначения, а также контроля за ходом их исполнения характеризуется высоким уровнем проработки. Вместе с тем остаются не полностью решенными некоторые

П.С. Желтухин, Г.А. Лавринов, Е.Ю. Хрусталёв

Информационно-аналитическое обеспечение создания наукоемкой продукции

№ 3 2006

частные (но в то же время достаточно важные и ресурсоемкие) задачи программного управления научно-техническим развитием. Одной из них является задача формирования государственной программы разработки и производства современных высокотехнологичных продуктов и услуг.

Подготовка необходимых управляющих решений определяется содержанием комплекса современных компьютерно-ориентированных технологий, обеспечивающих научно и ресурсно обоснованное формирование программных (плановых) документов.

В настоящее время имеется объективная необходимость дальнейшего совершенствования существующего программно-математического и технологического инструментария программного управления развитием НП в интересах учета современных условий формирования НТГП. Такие программные продукты позволят повысить оперативность и снизить трудоемкость подготовки решений. Для достижения этой цели были получены следующие результаты:

• определен новый подход к формированию НТГП, который заключается в объединении существующих методов в единый взаимосвязанный комплекс;

• разработана обобщенная процедура формирования НТГП, использование которой обеспечивает решение всего спектра задач, обусловленных сложившейся практикой обоснования и формирования научно-технических программ развития высокотехнологичных производств (функциональная полнота разработанного комплекса технологий), а также уменьшает используемые организационные и временные ресурсы (эффективность разработанного комплекса).

Литература

1. Васин В.А, Миндели Л.Э. Национальная инновационная система: предпосылки и механизмы функционирования. М.: ЦИСН, 2002.

2. Комков Н.И. Роль инноваций и технологий в развитии экономики и общества // Проблемы прогнозирования. 2003. № 3.

3. Бендиков М. А., Хрусталёв Е. Ю. Основы государственной политики инновационного развития российской экономики // Федеративные отношения и региональная социальноэкономическая политика. 2006. № 3.

4. Хрусталёв Е.Ю. Современные принципы долгосрочного планирования наукоемких производств //Консультант директора. 2002. № 15.

5. Хрусталёв Е.Ю. Проблемы организации и управления в наукоемких отраслях экономики России//Менеджмент в России и за рубежом. 2001. № 1.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Желтухин П. С., Лавринов Г. А. Методология формирования государственной программы создания продукции военного назначения// Промышленная политика. 2006. № 4.

7. Емельянов А.А. Технология создания компьютерных моделей для систем поддержки принятия решений / / Прикладная информатика. 2006. № 1.

8. Воройский Ф. С. Информатика. Новый систематизированный толковый словарь-справочник. М.: Физматлит, 2003.

9. Морозов В.П., Хрусталёв Е.Ю. Гипертекстовая форма представления семантической информации / / Проектирование информационных систем. М.: МЭСИ, 1989.

10. Морозов В.П., Тихомиров В.П., Хрус-талёв Е. Ю. Гипертексты в экономике: информационная технология моделирования. М.: Финансы и статистика, 1997.

11. Зиновьев А. Ю., Питенко А. А. Система визуализации произвольных данных/2-я Всероссийская научно-техническая конференция «Нейроинформатика-2000». Часть 1. М.: МИФИ, 2000.

12. Айвазян С. А., Бежаева З.И, Староверов О.В. Классификация многомерных наблюдений. М.: Статистика, 1974.

13. Айвазян С.А., Бухштабер В.М., Еню-ков И. С., Мешалкин Л. Д. Прикладная статистика. Классификация и снижение размерности. М.: Финансы и статистика, 1989.