Научная статья на тему 'К вопросу о разработке системы автоматизированной проверки качества научных работ'

К вопросу о разработке системы автоматизированной проверки качества научных работ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
131
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕТОДОЛОГИЯ ДИССЕРТАЦИОННОГО ИССЛЕДОВАНИЯ / КОМПОНЕНТЫ ДИССЕРТАЦИИ / КАЧЕСТВО ДИССЕРТАЦИОННОЙ РАБОТЫ / МЕТОДЫ ОЦЕНКИ НАУЧНОЙ ДЕЯТЕЛЬНОСТИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ахметгалеев Рустам Рамилевич

В статье рассматриваются аспекты разработки автоматизированной системы оценивания компонентов научной работы. Приводятся результаты статистического анализа и формализации компонентов научной работы. Представлены примеры алгоритмов оценки некоторых компонент.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ахметгалеев Рустам Рамилевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «К вопросу о разработке системы автоматизированной проверки качества научных работ»

К вопросу о разработке системы автоматизированной проверки качества

научных работ Ахметгалеев Р. Р.

Ахметгалеев Рустам Рамилевич /Akhmetgaleev Rustam Ramilevich - аспирант, кафедра вычислительной техники, факультет информатики и вычислительной техники, Ижевский государственный технический университет им. М. Т. Калашникова, г. Ижевск

Аннотация: в статье рассматриваются аспекты разработки автоматизированной системы оценивания компонентов научной работы. Приводятся результаты статистического анализа и формализации компонентов научной работы. Представлены примеры алгоритмов оценки некоторых компонент.

Ключевые слова: методология диссертационного исследования, компоненты диссертации, качество диссертационной работы, методы оценки научной деятельности.

Методология научного исследования сегодня - это активно развивающаяся область науки, одной из задач которой является решение проблем, связанных с эффективной организацией процесса проведения научного исследования. Помимо задач, посвященных эффективной организации процессов научного исследования, также актуальны проблемы поиска путей повышения качества научных работ [1]. Анализ трудов по методологии научного исследования показывает, что на данный момент основным способом решения проблемы повышения качества является организация исследования посредством последовательной разработки компонентов научной работы, которые, как правило, представлены в виде иерархической схемы. Однако проверка ряда научных работ, разработанных с использованием современных методологий научного исследования, выявила отсутствие проработанной системы критериев и оценок компонентов научной работы. Также было замечено, что большое количество ошибок было допущено в компонентах, составляющих основу научной работы, т.е. были некорректно сформулированы объект, предмет и цель и др. Ошибки, допущенные в данных компонентах, могут негативно сказаться на внутреннем единстве и целостности научной работы. С целью повышения качества научных работ, предлагается способ оценки текстов основных компонентов научной работы, реализованной в виде автоматизированной системы, основанной на методах обработки естественного языка.

Разработка системы оценивания основных компонент научной работы была разделена на несколько этапов: формулирование критериев оценивания компонентов, разработка алгоритмов и апробация полученной системы. На первом этапе разработки были проведены работы по анализу литературы по методологии научного исследования с целью поиска и обобщения критериев оценки компонент исследования. В результате анализа было выявлено, что, несмотря на высокий уровень формализации компонент, отсутствуют четко выраженные требования и критерии к ним. Вследствие этого актуальной становится задача разработки системы критериев оценивания компонент научной работы. Для решения данной задачи было выполнено статистическое исследование массива научных работ. В результате статистического исследования были сформированы требования, которым должны соответствовать компоненты научной работы, так например цель научной работы должна соответствовать следующей формуле:

¡А ф Dprohib

А з О bj V A=>Subj (1), А з Cond

где А - множество слов, описывающих цель научной работы, Dprohib - множество слов, не рекомендуемых к использованию, Obj - множество слов, выражающих объект, Subj -множество слов, выражающих предмет, Cond - множество слов, выражающих условие достижение цели. Для оценки остальных компонент диссертации также были сформированы формулы и правила.

Еще одним важным фактором оценивания является способ представления результатов проверки. Так как основным назначением разрабатываемой системы оценивания является не интерпретация качества работы в набор баллов, а выдача рекомендаций по улучшению текстов работы, то отображение результатов реализуется в виде комментариев по каждому компоненту.

Следующий этап работы заключался в проектировании архитектуры и алгоритмов функционирования автоматизированной системы оценивания. Для оценки каждого компонента научной работы требуется свой набор уникальных критериев. Вследствие уникальности

15

критериев оценивания возникает необходимость в составлении отдельных методик для каждого компонента и её представления в виде алгоритмов для разработки программы. Так например, алгоритм одной из процедур проверки компонента «Цель» научной работы выглядит следующим образом.

Начало

_1_

Построение синтаксического дерева

по тексту компонента «объект исследования)«

Определение коэффициентов веса слова в дереве

_▼

Семантический поиск слова с наибольшим коэффициентом веса в тексте компонента «цель»

Рис. 1. Блок-схема алгоритма проверки компонента «Цель»

Архитектура системы реализуется по модульному принципу, так что логика системы и представления могут разрабатываться параллельно. В основу каждого модуля закладывается набор процедур проверки компонент, который опирается на методы обработки текстовой информации на естественном языке. На данный момент в системе реализованы следующие методы:

■ латентно-семантический анализ;

■ анализатор текста, основанный на контекстно-свободных грамматиках (ОЬЯ);

■ механизм векторного представления слов.

Основным назначением латентно-семантического анализа является поиск скрытых связей между набором терминов и массивом текстов [2]. Данный метод был переработан для первоначальной проверки ряда компонент научной работы на соответствие паспорту специальности. Еще одним важным алгоритмом, обеспечивающим работу системы, является ОЬЯ-анализатор текста [3]. Данный алгоритм выбран из-за наличия таких возможностей, как разрешение недетерминированности и неоднозначности, которые отсутствуют в других подходах. С помощью данного алгоритма в разрабатываемой системе решаются задачи разбора предложений на естественном языке и построения синтаксических деревьев. Также на данный момент в системе реализован механизм векторного представления слов, предназначенный для обеспечения семантического поиска по тексту компонент научной работы.

На данный момент автоматизированная система оценивания находится в стадии активной разработки. Проводится тестирование разработанных модулей.

и

Литература

1. Селетков С. Г. Теоретические положения диссертационного исследования. Ижевск: Изд-во ИжГТУ, 2011. 346 с.

2. Николаева И. С., Митрениной О. В., Ландо Т. М. Прикладная и компьютерная лингвистика. М.: URSS, 2016. 320 с.

3. Маннинг К. Д., Прабхакар Р., Шютце Х. Введение в информационный поиск. М.: Вильямс, 2011. 528 с.

Обзор мирового опыта геолого-геомеханического моделирования

Соболев А. А.

Соболев Алексей Анатольевич / Sobolev Alexey Anatolevich — магистрант, кафедра разработки и эксплуатации нефтяных и газовых месторождений, Институт геологии и нефтегазодобычи Тюменский индустриальный университет, г. Тюмень

Аннотация: в статье рассмотрена задача построения трехмерной геолого-геомеханической модели месторождения. Возможность прогнозирования изменения свойств модели во времени. Ключевые слова: геолого-геомеханическое моделирование, геологические модели в геомеханическом симуляторе, ГРП.

На сегодняшний день геолого-геомеханическому моделированию посвящены сотни российских и зарубежных публикаций. В ходе анализа литературы выявлены следующие классы решаемых задач:

• проседание дневной поверхности над разрабатываемой залежью вследствие снижения пластового давления;

• влияние эффективных напряжений на ФЕС вследствие сжимаемости порового пространства, что проявляется в виде изменения долговременного тренда накопленной добычи;

• перераспределение главных напряжений, влияющих на условия стабильности бурящихся скважин, ориентации трещин ГРП, пескопроявлений и т. д.;

• возникновение скольжений пластов вдоль поверхностей напластования, приводящих к нарушению целостности цементного камня и обсадных колонн существующих скважин.

Анализ публикаций по геолого-геомеханическому моделированию выявил следующую тенденцию в решении полученных классов задачи. Идея заключается в построении трехмерной геолого-геомеханической модели месторождения с возможностью прогнозирования изменения ее свойств во времени. В процессе построения модели возникают следующие проблемы:

1. До сих пор актуальна проблема создания единого программного комплекса, способного проводить проектные технологические расчеты на совместных гидродинамико-геомеханических моделях. Отсутствует единый пакет программ, позволяющий реализовать данную модель. Существующие на данный момент пакеты можно условно разбить на две категории:

• Геомеханическая модель (ANSYS, Abaqus);

• Геологическая модель (ECLIPSE, IRAP MRS).

Программы, представленные в этих категориях, наиболее распространены в проанализированных публикациях. Следует отметить, что каждый пакет обладает рядом своих достоинств и недостатков. ANSYS, например, ориентирован на широкий профиль задач. Abaqus, наоборот, больше популярен для линейной постановки задачи. В обоих пакетах производится расчет методом конечных элементов. В Eclipse и Irap MRS хорошо производился расчет поровых давлений, пористости и проницаемости в каждой ячейке области с помощью метода конечных объемов [1]. В связи с этим возникает следующая проблема.

2. Проблема, основанная на переносе (импорте) гидродинамических полей в геомеханическую модель. Обязательным в данном процессе является перенос геологических свойств с сетки, построенной методом конечных объемов на сетку метку, построенную методом конечных элементов. В ходе анализа было выявлено, что задача переноса сетки и свойств из геологической модели в геомеханический симулятор решается в индивидуальном порядке: скрипт на языке Python RMS2ABA (создает inp файл для Abaqus), скрипт на встроенном языке APDL для ANSYS, скрипт на языке VBA, скрипт на языке Matlab (MRST-

i Надоели баннеры? Вы всегда можете отключить рекламу.