К вопросу о разработке системы автоматизированной проверки качества
научных работ Ахметгалеев Р. Р.
Ахметгалеев Рустам Рамилевич /Akhmetgaleev Rustam Ramilevich - аспирант, кафедра вычислительной техники, факультет информатики и вычислительной техники, Ижевский государственный технический университет им. М. Т. Калашникова, г. Ижевск
Аннотация: в статье рассматриваются аспекты разработки автоматизированной системы оценивания компонентов научной работы. Приводятся результаты статистического анализа и формализации компонентов научной работы. Представлены примеры алгоритмов оценки некоторых компонент.
Ключевые слова: методология диссертационного исследования, компоненты диссертации, качество диссертационной работы, методы оценки научной деятельности.
Методология научного исследования сегодня - это активно развивающаяся область науки, одной из задач которой является решение проблем, связанных с эффективной организацией процесса проведения научного исследования. Помимо задач, посвященных эффективной организации процессов научного исследования, также актуальны проблемы поиска путей повышения качества научных работ [1]. Анализ трудов по методологии научного исследования показывает, что на данный момент основным способом решения проблемы повышения качества является организация исследования посредством последовательной разработки компонентов научной работы, которые, как правило, представлены в виде иерархической схемы. Однако проверка ряда научных работ, разработанных с использованием современных методологий научного исследования, выявила отсутствие проработанной системы критериев и оценок компонентов научной работы. Также было замечено, что большое количество ошибок было допущено в компонентах, составляющих основу научной работы, т.е. были некорректно сформулированы объект, предмет и цель и др. Ошибки, допущенные в данных компонентах, могут негативно сказаться на внутреннем единстве и целостности научной работы. С целью повышения качества научных работ, предлагается способ оценки текстов основных компонентов научной работы, реализованной в виде автоматизированной системы, основанной на методах обработки естественного языка.
Разработка системы оценивания основных компонент научной работы была разделена на несколько этапов: формулирование критериев оценивания компонентов, разработка алгоритмов и апробация полученной системы. На первом этапе разработки были проведены работы по анализу литературы по методологии научного исследования с целью поиска и обобщения критериев оценки компонент исследования. В результате анализа было выявлено, что, несмотря на высокий уровень формализации компонент, отсутствуют четко выраженные требования и критерии к ним. Вследствие этого актуальной становится задача разработки системы критериев оценивания компонент научной работы. Для решения данной задачи было выполнено статистическое исследование массива научных работ. В результате статистического исследования были сформированы требования, которым должны соответствовать компоненты научной работы, так например цель научной работы должна соответствовать следующей формуле:
¡А ф Dprohib
А з О bj V A=>Subj (1), А з Cond
где А - множество слов, описывающих цель научной работы, Dprohib - множество слов, не рекомендуемых к использованию, Obj - множество слов, выражающих объект, Subj -множество слов, выражающих предмет, Cond - множество слов, выражающих условие достижение цели. Для оценки остальных компонент диссертации также были сформированы формулы и правила.
Еще одним важным фактором оценивания является способ представления результатов проверки. Так как основным назначением разрабатываемой системы оценивания является не интерпретация качества работы в набор баллов, а выдача рекомендаций по улучшению текстов работы, то отображение результатов реализуется в виде комментариев по каждому компоненту.
Следующий этап работы заключался в проектировании архитектуры и алгоритмов функционирования автоматизированной системы оценивания. Для оценки каждого компонента научной работы требуется свой набор уникальных критериев. Вследствие уникальности
15
критериев оценивания возникает необходимость в составлении отдельных методик для каждого компонента и её представления в виде алгоритмов для разработки программы. Так например, алгоритм одной из процедур проверки компонента «Цель» научной работы выглядит следующим образом.
Начало
_1_
Построение синтаксического дерева
по тексту компонента «объект исследования)«
Определение коэффициентов веса слова в дереве
_▼
Семантический поиск слова с наибольшим коэффициентом веса в тексте компонента «цель»
Рис. 1. Блок-схема алгоритма проверки компонента «Цель»
Архитектура системы реализуется по модульному принципу, так что логика системы и представления могут разрабатываться параллельно. В основу каждого модуля закладывается набор процедур проверки компонент, который опирается на методы обработки текстовой информации на естественном языке. На данный момент в системе реализованы следующие методы:
■ латентно-семантический анализ;
■ анализатор текста, основанный на контекстно-свободных грамматиках (ОЬЯ);
■ механизм векторного представления слов.
Основным назначением латентно-семантического анализа является поиск скрытых связей между набором терминов и массивом текстов [2]. Данный метод был переработан для первоначальной проверки ряда компонент научной работы на соответствие паспорту специальности. Еще одним важным алгоритмом, обеспечивающим работу системы, является ОЬЯ-анализатор текста [3]. Данный алгоритм выбран из-за наличия таких возможностей, как разрешение недетерминированности и неоднозначности, которые отсутствуют в других подходах. С помощью данного алгоритма в разрабатываемой системе решаются задачи разбора предложений на естественном языке и построения синтаксических деревьев. Также на данный момент в системе реализован механизм векторного представления слов, предназначенный для обеспечения семантического поиска по тексту компонент научной работы.
На данный момент автоматизированная система оценивания находится в стадии активной разработки. Проводится тестирование разработанных модулей.
и
Литература
1. Селетков С. Г. Теоретические положения диссертационного исследования. Ижевск: Изд-во ИжГТУ, 2011. 346 с.
2. Николаева И. С., Митрениной О. В., Ландо Т. М. Прикладная и компьютерная лингвистика. М.: URSS, 2016. 320 с.
3. Маннинг К. Д., Прабхакар Р., Шютце Х. Введение в информационный поиск. М.: Вильямс, 2011. 528 с.
Обзор мирового опыта геолого-геомеханического моделирования
Соболев А. А.
Соболев Алексей Анатольевич / Sobolev Alexey Anatolevich — магистрант, кафедра разработки и эксплуатации нефтяных и газовых месторождений, Институт геологии и нефтегазодобычи Тюменский индустриальный университет, г. Тюмень
Аннотация: в статье рассмотрена задача построения трехмерной геолого-геомеханической модели месторождения. Возможность прогнозирования изменения свойств модели во времени. Ключевые слова: геолого-геомеханическое моделирование, геологические модели в геомеханическом симуляторе, ГРП.
На сегодняшний день геолого-геомеханическому моделированию посвящены сотни российских и зарубежных публикаций. В ходе анализа литературы выявлены следующие классы решаемых задач:
• проседание дневной поверхности над разрабатываемой залежью вследствие снижения пластового давления;
• влияние эффективных напряжений на ФЕС вследствие сжимаемости порового пространства, что проявляется в виде изменения долговременного тренда накопленной добычи;
• перераспределение главных напряжений, влияющих на условия стабильности бурящихся скважин, ориентации трещин ГРП, пескопроявлений и т. д.;
• возникновение скольжений пластов вдоль поверхностей напластования, приводящих к нарушению целостности цементного камня и обсадных колонн существующих скважин.
Анализ публикаций по геолого-геомеханическому моделированию выявил следующую тенденцию в решении полученных классов задачи. Идея заключается в построении трехмерной геолого-геомеханической модели месторождения с возможностью прогнозирования изменения ее свойств во времени. В процессе построения модели возникают следующие проблемы:
1. До сих пор актуальна проблема создания единого программного комплекса, способного проводить проектные технологические расчеты на совместных гидродинамико-геомеханических моделях. Отсутствует единый пакет программ, позволяющий реализовать данную модель. Существующие на данный момент пакеты можно условно разбить на две категории:
• Геомеханическая модель (ANSYS, Abaqus);
• Геологическая модель (ECLIPSE, IRAP MRS).
Программы, представленные в этих категориях, наиболее распространены в проанализированных публикациях. Следует отметить, что каждый пакет обладает рядом своих достоинств и недостатков. ANSYS, например, ориентирован на широкий профиль задач. Abaqus, наоборот, больше популярен для линейной постановки задачи. В обоих пакетах производится расчет методом конечных элементов. В Eclipse и Irap MRS хорошо производился расчет поровых давлений, пористости и проницаемости в каждой ячейке области с помощью метода конечных объемов [1]. В связи с этим возникает следующая проблема.
2. Проблема, основанная на переносе (импорте) гидродинамических полей в геомеханическую модель. Обязательным в данном процессе является перенос геологических свойств с сетки, построенной методом конечных объемов на сетку метку, построенную методом конечных элементов. В ходе анализа было выявлено, что задача переноса сетки и свойств из геологической модели в геомеханический симулятор решается в индивидуальном порядке: скрипт на языке Python RMS2ABA (создает inp файл для Abaqus), скрипт на встроенном языке APDL для ANSYS, скрипт на языке VBA, скрипт на языке Matlab (MRST-