Научная статья на тему 'РАЗРАБОТКА ЭЛЕКТРОННОГО КОРПУСА ТЕКСТОВ ПУБЛИКАЦИЙ ПО ТЕХНИЧЕСКОЙ ЭКСПЛУАТАЦИИ СЕЛЬСКОХОЗЯЙСТВЕННОЙ ТЕХНИКИ РАЗДЕЛЕНИЕМ ИХ КОНТЕНТОВ'

РАЗРАБОТКА ЭЛЕКТРОННОГО КОРПУСА ТЕКСТОВ ПУБЛИКАЦИЙ ПО ТЕХНИЧЕСКОЙ ЭКСПЛУАТАЦИИ СЕЛЬСКОХОЗЯЙСТВЕННОЙ ТЕХНИКИ РАЗДЕЛЕНИЕМ ИХ КОНТЕНТОВ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭЛЕКТРОННАЯ ВЕРСИЯ / РАЗРАБОТКА / КОНТЕНТ ПУБЛИКАЦИИ / ТАБЛИЦА-КОНТЕНТ / ТЕХНИЧЕСКАЯ ЭКСПЛУАТАЦИЯ СЕЛЬСКОХОЗЯЙСТВЕННОЙ ТЕХНИКИ / МЕТАИНФОРМАЦИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Иванов Н.М., Криков А.М., Коротких В.В.

У специалиста инженерной службы может быть определенный набор актуальных публикаций в электронном формате с тем, чтобы необходимую информацию по сфере своей деятельности он мог бы найти и использовать из этого набора с помощью компьютера. Но для этого потребуются разработка и использование электронного корпуса текстов публикаций по технической эксплуатации сельскохозяйственной техники. В развитие данного подхода в статье рассматриваются приемы разработки и использования электронного корпуса текстов публикаций разделением их контентов в виде рисунков и таблиц. Их содержание не всегда может интересовать специалиста, особенно при первом просмотре публикации, но увеличивает затраты времени. С целью сокращения таких затрат предлагается тексты публикаций в компьютере представить разделением контента путем перенесения указанных составляющих в другую часть текста, одновременно предусматривая возможность обратиться к ним в случае потребности. Этим приемом формируется многоуровневая структура представления информации пользователю. Разработаны и реализованы методики формирования метатаблиц-контент и метарисунков-контент, а также дополнительно для каждой публикации двух файлов, соответственно для хранения совокупности контентов таблиц и контентов рисунков с организацией гиперссылок к указанным файлам для осуществления автоматизированного перехода к ним. Описанный прием реализован на примере обстоятельной публикации по техническому сервису машин (основной автор - М.И. Юдин). Сделан вывод, что такие корпусы могут быть как сформированы в отдельности, так и использованы в составе специализированных информационных систем для удовлетворения потребностей в знаниях специалистов АПК. Более того, предлагаемый подход к формированию электронного варианта корпуса тестов публикаций применим к другим сферам знаний и публикаций.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Иванов Н.М., Криков А.М., Коротких В.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE DEVELOPMENT OF THE ELECTRONIC TEXT CORPUS OF PUBLICATIONS ON THE TECHNICAL OPERATION OF THE AGRICULTURAL EQUIPMENT DIVISION OF THEIR CONTENTS

Engineer service expert can have a certain set of topical publications in digital format in order to find and use necessary information about his field of activity via computer. We have found that one way to achieve such situation is to develop and use the digital collection of presentation articles on agricultural machinery maintenance. In the development of this approach the examples of developing and using digital collection of publications are discussed below by separating their contents in figures and tables. Their content may not always interest the expert, especially at the first viewing, but increases the time required. In order to decrease such costs it is offered to provide the publication texts in the computer by transferring the indicated components to the other part of text, at the same time providing the possibility of referring to them if necessary. Multilevel structure of providing the information to the user is formed by this approach. Tech niques of formation of tables content and figures content, as well as additionally for each publication of the two files, accordingly for storage of aggregate tables content and figures content with the organization of hyperlinks to indicated files for automated switch to them are developed and implemented. Method described is implemented as an example publication of technical service machines (principal author M.I. Yudin). It was concluded that these collections may be formed separately and used as part of specialized information systems to meet the needs of experts in the agribusiness knowledge. Moreover, proposed approach to formation an electronic version collection of publications applicable to other areas of knowledge and publications.

Текст научной работы на тему «РАЗРАБОТКА ЭЛЕКТРОННОГО КОРПУСА ТЕКСТОВ ПУБЛИКАЦИЙ ПО ТЕХНИЧЕСКОЙ ЭКСПЛУАТАЦИИ СЕЛЬСКОХОЗЯЙСТВЕННОЙ ТЕХНИКИ РАЗДЕЛЕНИЕМ ИХ КОНТЕНТОВ»

Н.М. Иванов, д-р техн. наук, проф.

А.М. Криков, д-р техн. наук, проф.

В.В. Коротких, канд. техн. наук Сибирский научно-исследовательский институт механизации и электрификации сельского хозяйства (ФГБНУ СибИМЭ) Новосибирская область, р.п. Краснообск E-mail: sibime@ngs.ru

УДК 631.3.004.58

РАЗРАБОТКА ЭЛЕКТРОННОГО КОРПУСА ТЕКСТОВ ПУБЛИКАЦИЙ ПО ТЕХНИЧЕСКОЙ ЭКСПЛУАТАЦИИ СЕЛЬСКОХОЗЯЙСТВЕННОЙ ТЕХНИКИ

РАЗДЕЛЕНИЕМ ИХ КОНТЕНТОВ

У специалиста инженерной службы может быть определенный набор актуальных публикаций в электронном формате с тем, чтобы необходимую информацию по сфере своей деятельности он мог бы найти и использовать из этого набора с помощью компьютера. Но для этого потребуются разработка и использование электронного корпуса текстов публикаций по технической эксплуатации сельскохозяйственной техники. В развитие данного подхода в статье рассматриваются приемы разработки и использования электронного корпуса текстов публикаций разделением их контентов в виде рисунков и таблиц. Их содержание не всегда может интересовать специалиста, особенно при первом просмотре публикации, но увеличивает затраты времени. С целью сокращения таких затрат предлагается тексты публикаций в компьютере представить разделением контента путем перенесения указанных составляющих в другую часть текста, одновременно предусматривая возможность обратиться к ним в случае потребности. Этим приемом формируется многоуровневая структура представления информации пользователю. Разработаны и реализованы методики формирования метатаб-лиц-контент и метарисунков-контент, а также дополнительно для каждой публикации двух файлов, соответственно для хранения совокупности контентов таблиц и контентов рисунков с организацией гиперссылок к указанным файлам для осуществления автоматизированного перехода к ним. Описанный прием реализован на примере обстоятельной публикации по техническому сервису машин (основной автор - М.И. Юдин). Сделан вывод, что такие корпусы могут быть как сформированы в отдельности, так и использованы в составе специализированных информационных систем для удовлетворения потребностей в знаниях специалистов АПК. Более того, предлагаемый подход к формированию электронного варианта корпуса тестов публикаций применим к другим сферам знаний и публикаций.

Ключевые слова: корпус текстов публикаций, электронная версия, разработка, контент публикации, таблица-контент, рисунок-контент, техническая эксплуатация сельскохозяйственной техники, метаинформация.

N.M. Ivanov, Dr. Sc. Engineering, Prof.

A.M. Krikov, Dr. Sc. Engineering, Prof.

V.V. Korotkih, Cand. Sc. Engineering

THE DEVELOPMENT OF THE ELECTRONIC TEXT CORPUS OF PUBLICATIONS ON THE TECHNICAL OPERATION OF THE AGRICULTURAL EQUIPMENT DIVISION OF THEIR CONTENTS

Engineer service expert can have a certain set of topical publications in digital format in order to find and use necessary information about his field of activity via computer. We have found that one way to achieve such situation is to develop and use the digital collection of presentation articles on agricultural machinery maintenance. In the development of this approach the examples of developing and using digital collection of publications are discussed below by separating their contents in figures and tables. Their content may not always interest the expert, especially at the first viewing, but increases the time required. In order to decrease such costs it is offered to provide the publication texts in the computer by transferring the indicated components to the other part of text, at the same time providing the possibility of referring to them if necessary.

Multilevel structure of providing the information to the user is formed by this approach. Techniques of formation of tables content and figures content, as well as additionally for each publication of the two files, accordingly for storage of aggregate tables content and figures content with the organization of hyperlinks to indicatedfiles for automated switch to them are developed and implemented. Method described is implemented as an example publication of technical service machines (principal author M.I. Yudin). It was concluded that these collections may be formed separately and used as part of specialized information systems to meet the needs of experts in the agribusiness knowledge. Moreover, proposed approach to formation an electronic version collection ofpublications applicable to other areas of knowledge and publications.

Key words: collection of presentation articles, electronic version, development, publication content, table content, figure content, agricultural machinery maintenance, meta information.

Введение

В современных условиях информационное обеспечение специалистов инженерно-технической сферы может быть эффективно осуществлено с использованием специально сформированного комплекса электронных версий публикаций. Идеальным можно считать такое положение, когда у специалиста имеется полный набор публикаций по сфере его деятельности в электронном формате и необходимую информацию он может найти и использовать из такого набора с помощью компьютера [1, 2]. Однако до настоящего времени такие возможности используются не в полной мере. Для восполнения этого пробела сельскохозяйственной инженерной науки в нашем институте ведутся исследования по разработке электронного корпуса текстов публикаций в области технической эксплуатации сельскохозяйственной техники [3].

Цель работы - разработка методического приема сокращения затрат времени специалистов инженерных служб хозяйств на оперирование знаниями и информацией из технической документации и публикаций, представленных электронным корпусом их текстов.

Материал и методы

Множество публикаций, объединенных общностью тематики, следуя [4], было названо корпусом текстов. Исходя из этого, электронный корпус текстов определен как совокупность публикаций по выбранной тематике, которая имеет определенную смысловую целостность и представлена в электронном виде. В рамках создания такого корпуса был изыскан методический подход [5], позволяющий формировать логические, информационные и иные связи между публикациями корпуса технической литературы. В развитие данного подхода ниже рассматриваются приемы разработки электронного корпуса текстов публикаций разделением их контентов по видам и использования такого корпуса применительно к тематике технической эксплуатации сельскохозяйственной техники.

Как известно, в тексте публикации виды контента чередуются в некоторой последовательности. Так, читатель нередко сталкивается с различными таблицами и рисунками, содержание которых его не всегда может интересовать, особенно при первом просмотре материала, но в то же время увеличивает затраты времени на просмотр публикации. Например, в обстоятельной работе [6] более 500 таблиц. Сокращения указанных затрат времени можно добиться, если тексты публикаций в компьютере представить разделением контента, т.е. перенесением некоторых составляющих в другую часть текста, одновременно предусматривая возможность обратиться к ним весьма быстро в случае потребности, используя для такого обращения сформированную гиперссылку к соответствующему фрагменту публикации.

По сути, этим приемом формируется многоуровневая структура представления информации пользователю. Кроме того, будут осуществлены формирование некоторого набора ме-таинформации о контентах публикаций и определенная трансформация самого их текста. Реализация такого подхода к формированию информационного фонда уже была отражена в [7]. Однако в данной работе идеология разделения контента еще не была рассмотрена.

В дальнейшем изложении будем различать такие составляющие публикации, как таблица-контент и рисунок-контент, предусматривая для них формирование соответствующих метаконтентов. Тем самым организуются пары контентов видов: «метатаблица-контент -таблица-контент» и «метарисунок-контент - рисунок-контент». Вестник ВСГУТУ. № 1 (58). 2016 32

Заметим, что от указанных метаконтентов формируются гиперссылки к соответствующим таблицам-контентам и рисункам-контентам с использованием вышеуказанных пар кон-тентов.

С учетом возможных видов контентов возникает необходимость формирования ме-тафрагментов видов: метатаблица-контент и метарисунок-контент. Кроме того, с учетом идеологии представления публикаций в электронном корпусе путем их расчленения на разделы и главы усматривается целесообразность формирования на компьютере дополнительно для каждой публикации еще двух файлов, соответственно для хранения совокупности контентов-таб-лиц и контентов-рисунков, включая вышеуказанные пары контентов. Одновременно с этим в оглавлении публикации необходимо организовать гиперссылки к указанным файлам, позволяющие осуществить быстрый (автоматизированный) переход к ним.

Результаты исследования и их обсуждение

Обращаясь к приемам формирования метафрагментов типа текст - таблица, заметим, что назначение ее тематического заголовка - дать возможность воспринять материал таблицы иногда и без обращения к тексту документа.

При формировании метаинформации о контенте данного типа целесообразно оперировать шаблоном - структурной записью вида: <Наим-Таблица, наим-содерж-строки, наим-1-кол-табл, наим-2-кол-табл, ..., наим-я-кол-

табл, ссылки, АРТ, ДСК >; где Наим-Таблица - стандартизованное (унифицированное) название (заголовок) таблицы; наим-содерж-строки - название столбца таблицы, содержащего наименования строк таблицы (обычно в виде боковика таблицы); наим-1-кол-табл, наим-2-кол-табл, ..., наим-я-кол-табл -стандартизованные названия 1 -й, 2-й, ..., n-й колонок таблицы соответственно, содержащих сведения по ее строкам: n - число информационных колонок таблицы без учета ее боковика; АРТ - адрес расположения (размещения) таблицы, записываемый в виде гиперссылки с учетом директории размещения модуля: ДСК - дата создания метаконтента.

В модуль-контенте «Таблица» в качестве содержательной части будет выступать сама таблица с типизированными (унифицированными) наименованиями строк и колонок, а в качестве наим-содерж-строки - содержащий информацию боковик таблицы, исключая имеющие вид «порядковый номер» и т.п.

Воспользовавшись параметром АРТ, в компьютере можно перейти к просмотру самой таблицы, т.е. к ее контенту. По каталогу наименований таблиц и систематизацией метасведе-ний о них можно установить наличие или отсутствие нужных данных в системе и соответственно получить их или оперировать ими.

При формировании метаинформации о модуле типа рисунок целесообразно оперировать шаблоном - структурной записью вида:

<Наим-Рисунок, вид-рис., 1ПРН, ЫПРН, АРР, ДСК >; где Наим-Рисунок - стандартизованное (унифицированное) название рисунка; вид-рис - смысловой типизированный вид рисунка. 1ПРН - 1-я подрисуночная надпись; ЫПРН - n-я (последняя) подрисуночная надпись; АРР - адрес расположения (размещения) рисунка в виде гиперссылки с учетом директории размещения модуля; ДСК - дата создания метаконтента.

Параметры 1ПРН и ЫПРН могут и отсутствовать.

В контент-модуле «Рисунок» в качестве содержательной части будет выступать сам рисунок с типизированным (унифицированным) наименованием, а ссылки на внешний источник информации организуют связывание с данными, приведенными в других контент-модулях.

Обратимся теперь к публикации [6] и на ее примере представим некоторые результаты реализации описанных приемов.

Оглавление публикации после дополнения в него двух дополнительных файлов, с учетом вышесказанного, будет иметь вид:

По учебнику «Тех сервис машин и основы проектирования предприятий» под редакцией М.И. Юдина представлены следующие рубрики оглавления 1-го уровня:

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ - тех сервисО

1. ТЕХ СЕРВИС В АГРОПРОМЫШЛЕННОМ КОМПЛЕКСЕ И ЕГО СТРУКТУРА - тех сервис

2. НАДЕЖНОСТЬ МАШИН И МАСШТАБЫ РЕМОНТНО-ОБСЛУЖИВАЮЩЕГО ПРОИЗВОДСТВА - тех сервис2

3. ПРОГНОЗИРОВАНИЕ РЕСУРСНОГО ОБЕСПЕЧЕНИЯ ТЕХНИЧЕСКОГО ОБСЛУЖИВАНИЯ И РЕМОНТА МАШИН - тех сервисЗ

4. ТЕХНИЧЕСКОЕ НОРМИРОВАНИЕ РЕМОНТНЫХ РАБОТ - тех сервис4

5. РАЦИОНАЛЬНАЯ КОНЦЕНТРАЦИЯ РАБОТ ПО ТЕХНИЧЕСКОМУ ОБСЛУЖИВАНИЮ И РЕМОНТУ МАШИН - тех сервис5

9. ЭКОНОМИЧЕСКАЯ ЭФФЕКТИВНОСТЬ ПОВЫШЕНИЯ ГОТОВНОСТИ СЕЛЬСКОХОЗЯЙСТВЕННОЙ ТЕХНИКИ - тех сервис9

ПРИЛОЖЕНИЯ - прилож

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ - литер

Таблицы из Юдина -Таб из Юдина

Рисунки из Юдина - Рис из Юдина

Здесь в наименованиях глав после символов "-" приведены кнопки гиперссылок к рубрикам книги, сформированные с учетом требований тестового редактора Word. В частности, указанные выше дополнительные файлы представлены с наименованиями "Таблицы из Юдина" и "Рисунки из Юдина", а гиперссылки для перехода к ним - это символы Таб из Юдина и Рис из Юдина соответственно.

Результирующие последствия разделения контента публикации можно показать на примере текста главы 4 "Техническое нормирование ремонтных работ" вышеупомянутой публикации. В исходном состоянии (до разделения контента) она была представлена текстовым материалом на 227 страницах формата А4, а после разделения контентов таблиц и рисунков эта же глава стала иметь 89 страниц текста того же формата. Ниже приведены два отрывка из текста главы, полученных в результате разделения контентов в виде таблиц и рисунков.

Зависимость увеличения нормы выработки от уменьшения нормы времени и обратная зависимость приведены в таблицах 4.1 - Зави и 4.2 - мость. Указанные зависимости могут быть определены аналитически. (Здесь Зави и мость - гиперссылки).

Если производится обработка плоской поверхности, то определяют площадь плоской поверхности торца инструмента (рис. 4.5а - делен). Для фасонных поверхностей расчетная величина Fp определяется путем измерения сечений и их проекций на плоскость, перпендикулярную к направлению подачи (рис. 4.5б). (Здесь делен - гиперссылка).

В [5] мы отмечали, что данным приемом можно представить на обозрение более насыщенную информацию о публикации, чем при оперировании вторичной информацией в виде оглавлений журналов. Поэтому он более предпочтителен в случаях, когда необходимо найти (отыскать) вполне конкретную информацию. Кроме того, корпус можно регулярно корректировать, удаляя из него устаревшие публикации и дополняя новыми. Использование приема разделения контентов публикаций в виде таблиц и рисунков в значительной мере сокращает затраты времени пользователя, одновременно сохраняя все указанные преимущества электронного корпуса тестов публикаций.

Основные аспекты маневрирования в электронном корпусе публикации приведены в [5] и остаются в силе и для данного варианта формирования корпуса текстов. Кратко их суть сводится к следующим действиям.

Для входа в электронный корпус текстов пользователю достаточно открыть файл «A_Список публикаций», расположенный в списке файлов в директории «Эл.корп.тек-стов», содержащей все публикации корпуса. Выбором наименования публикации пользователь по гиперссылке сможет перейти к самой публикации, в которой открывается меню таких возможных действий, как просмотр непосредственно электронного текста книги, перечней

Вестник ВСГУТУ. № 1 (58). 2016

34

таблиц и рисунков книги, оглавления и подробного содержания книги. Переходы к выбранным компонентам информации из этого меню осуществляются нажатием соответствующей гиперссылки.

Выводы

Разработан методический прием сокращения затрат времени специалистов инженерных служб хозяйств на оперирование знаниями и информацией из технической документации и публикаций путем представления их электронным корпусом текстов, модифицированных разделением контентов. Такие корпусы могут быть как сформированы в отдельности, так и использованы в составе специализированных информационных систем для удовлетворения потребностей специалистов АПК в знаниях. Более того, предлагаемый подход к формированию электронного варианта корпуса тестов публикаций применим к другим сферам знаний и публикаций.

Библиография

1. Криков А.М. Методические основы формирования электронного корпуса текстов публикаций по технической эксплуатации сельскохозяйственной техники // Актуальные вопросы научного обеспечения производства сельскохозяйственной продукции в Сибири: материалы междунар. науч.-практ. конф. - Новосибирск: РАСХН. Сиб. отд-ние. СибИМЭ. - 2011. - С. 271-280.

2. Повышение эффективности технического обслуживания и ремонта сельскохозяйственной техники в условиях Сибири: учеб.-метод. пособие / науч. ред. А.Е. Немцев, Н.М. Иванов. - Новосибирск, РАСХН. Сиб. отд-ние. СибИМЭ. - 2011. - 108 с.

3. Криков А.М., Немцев А.Е., Лялякин В.П. Электронный корпус текстов публикаций ГОС-НИТИ-СибИМЭ по технической эксплуатации сельскохозяйственной техники: тр. ГОСНИТИ. -М.: Изд-во ГОСНИТИ, 2013. - Т. 112, ч. 2. Техническое обслуживание. Ремонт. - C. 77-80.

4. Казакевич О.А. Использование текстовых баз данных в лингвистических исследованиях // НТИ. - 1988. - Сер. 2, № 6. - С. 9-17.

5. Иванов Н.М., Криков А.М., Немцев А.Е. и др. Электронный корпус текстов публикаций по технической эксплуатации сельскохозяйственной техники / Механизация и электрификация сельского хозяйства. - 2014. - № 4. - С. 27-30.

6. ЮдинМ.И., КузнецовМ.Н., Кузовлев А.Т. и др. Технический сервис машин и основы проектирования предприятий: учебник для вузов. - Краснодар: Совет. Кубань, 2007. - 968 с.

7. Криков А.М., Бердникова Р.Г. Формирование многоуровневой информации для технической диагностики и технического обслуживания энергонасыщенных тракторов // Вестник НГАУ. - 2012. -№ 2. - С. 112-116.

Bibliography

1. Krikov A.M. Methodological Basis for the Formation of Electronic text corpus of Publications on Technical maintenance of Agricultural machinery // Actual questions of Scientific Support of Agricultural Production in Siberia: mA-Ter. Intern. sci.-practical. Conf. - Novosibirsk: RAASN. Sib. -Dep. Sibima. - 2011. - P.271-280.

2. Improving the Efficiency of Maintenance and Repair of Agricultural equipment in the conditions of Siberia: educational-method. a manual / tutorial. edited by A.E. Nemtsev, N.M. Ivanov. - Novosibirsk: RAASN. Sib. Dep. Sibima. - 2011. - 108 p.

3. Krikov A.M., Nemcev A.E., Ljaljakin B.P. Electronic Corpus of Publications GOSNITI-Cibima for technical maintenance of agricultural machinery: Proceedings GOSNITI. - M.: GOSNITI, 2013. - Vol. 112, p. 2. Maintenance. Repair. - P. 77-80.

4. Kazakevith O.A. The Use of Text Databases in Linguistic Research // NTI. - 1988. - Ser. 2, N 6. -P. 9-17.

5. Ivanov N.M., Krikov A.M., Nemcev A.E. et al. Electronic Corpus of Publications on Technical Maintenance of Agricultural machines // Mechanization and electrification of agriculture. - 2014. - N 4. -P.27-30.

6. Yudin M.I., Kuznetsov M.N., Kuzovlev A.T. et al. Technical service of machinery and Foundation design companies: proc. for universities. - Krasnodar: Sovet. Kuban, 2007. - 968 p.

7. Krikov A.M., Berdnikova R.G. Formation of Multi-level information for Technical diagnostics and Maintenance of power tractors // Bulletin of NSAU. - 2012. - N 2. - P. 112-116.

i Надоели баннеры? Вы всегда можете отключить рекламу.