Научная статья на тему 'Автоматизированная система подготовки слабоструктурированной информации'

Автоматизированная система подготовки слабоструктурированной информации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
183
42
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АВТОМАТИЗИРОВАННАЯ СИСТЕМА ОБРАБОТКИ ТЕКСТОВ / ТЕКСТОВЫЕ ДОКУМЕНТЫ / ВЕРСТКА / СТИЛЬ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Клюкин А.А., Широков А.А.

В статье рассматривается автоматизированная система подготовки связанных документов, решающая задачи организации коллективной работы над сложными документами, имеющими несколько вариантов, в том числе на иностранных языках, а также интерактивной верстки доку-ментов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Автоматизированная система подготовки слабоструктурированной информации»

nauki i praktiki. Universitet im. V.I. Vernadsko-go. 2012. Spets. vyp. (43). S. 41-46.

4. Teoreticheskoe obosnovanie metoda nerazru-shayuschego kontrolya teplofizicheskih svoystv materialov / N.P. Zhukov [i dr.] // Vestnik Tam-bovskogo gosudarstvennogo tehnicheskogo un-iversiteta. 2010. T. 16. № 2. S. 296-302.

MEASURING SYSTEM NDT SOLID PHASE TRANSITIONS IN POLYMERIC MATERIALS

O.N. Popov, N.P. Zhukov

Tambov State Technical University, Russia, Tambov. e-mail:popov_oleeg@mai.ru; teplotehnika@nnn.tstu.ru

The article presents a block diagram of the measuring system that implements algorithms for determining thermo-physical properties, control the temperature characteristics of the structural transitions in polymeric materials, mode control experiment, experimental data processing.

Key words: measurement system, nondestructive testing, polymeric materials, structural transition, thermophysical properties.

УДК 004.912

АВТОМАТИЗИРОВАННАЯ СИСТЕМА ПОДГОТОВКИ СЛАБОСТРУКТУРИРОВАННОЙ ИНФОРМАЦИИ

А.А. Клюкин, А.А. Широков

Пермская государственная академия искусства и культуры Пермский национальный исследовательский политехнический университет, Россия, г. Пермь.

e-mail: shirokov@pstu.ru

В статье рассматривается автоматизированная система подготовки связанных документов, решающая задачи организации коллективной работы над сложными документами, имеющими несколько вариантов, в том числе на иностранных языках, а также интерактивной верстки документов.

Ключевые слова: автоматизированная система обработки текстов, текстовые документы, верстка, стиль.

В практике часто встречаются задачи подготовки научно-исследовательских отчетов, формирования сводных отчетов организаций на основе отчетов подразделений, создания аналитических справок и т.д. Получаемые при этом выходные документы должны быть выполнены в заданном стиле, соответствовать требованиям по оформлению, и, кроме того, часто требуются различные формы отчетов на основании одних и тех же данных, например на разных языках, полный и сокращенный варианты, буклет и т.п.

Существует значительное количество научных работ, предлагающих методику и научные основы обработки текстовой информации. Основные проблемы, рассматриваемые в данных работах, - это генерация и перевод текстов, аннотирование и реферирование документов, поиск необходимых данных в больших массивах информации и некоторые другие [1].

Эти проблемы не без основания считаются сложными в реализации и на сегодняшний день нерешенными. Тем не менее,

уже сегодня можно предложить специализированные средства, позволяющие облегчить процесс коллективной работы над сложными документами (отчеты корпораций, научно-технические отчеты и пр.) с возможностью параллельного создания дочерних документов (рефератов, сокращенных документов, версий).

Авторами разработана и реализована автоматизированная система создания отчетов, которая решает следующие задачи:

управление процессом работы над документами;

организацию групповой работы над текстовыми документами большой сложности;

автоматизацию работы с цифровыми данными в единой с текстами среде;

автоматическое создание дочерних документов на основе основного документа;

- верстку документов.

Основные задачи подсистемы управления процессом работы над документом приведены в предыдущей статье авторов [2]. Следует, пожалуй, добавить, что опытная

эксплуатация системы позволила сформулировать целый ряд востребованных задач, в том числе контроль за процессом редактирования текста (реализации замечаний руководителя проекта) в реальном времени. Подсистема также позволяет оперативно перераспределить фрагменты между исполнителями. Основным пользователем данной подсистемы является руководитель проекта, имеющий наивысшие права по управлению процессом.

Достаточно часто организация, специализирующаяся на создании подобных документов, одновременно выполняет несколько проектов, что требует контроля распределения исполнителей между данными проектами, что также предусмотрено в системе.

Отчеты отличаются от большинства других текстовых документов насыщенностью цифровыми данными, которые могут быть организованы в таблицы или использоваться

непосредственно в тексте, причем практически все цифровые данные взаимосвязаны. Причем связи существуют между текстовыми данными и цифровыми данными в любом сочетании.

В разработанной системе используется структурирование документа на:

именованные главы (подглавы любой степени вложения);

- абзацы;

- таблицы;

цифровые данные, причем любой из вышеперечисленных объектов может включать в себя цифровые данные как в виде констант, так и математических и логических формул, на значения которых могут накладываться контролируемые граничные условия. Индикация достижения границ условий позволяет пользователю решать задачи оптимизации внутри разрабатываемого документа;

- фрагменты на языке ТеХ для написания математических, химических и других выражений и подобных элементов подготавливаемого к печати документа;

- рисунки, которые включаются в тело документа из заранее подготовленных сторонним программным обеспечением графических файлов.

Вспомогательные расчеты производятся в отдельных электронных таблицах, также реализованных в системе, но не включаемых в печатные копии документов. Существует также возможность импорта документов из OpenOffice с автоматическим разбиением на элементы, соответствующие оглавлению импортированного документа.

На основе имеющихся в системе таблиц могут быть построены необходимые диаграммы, которые включаются в тело документа подобно рисункам.

Подсистема автоматического создания дочерних документов на основе основного документа предназначена для исключения рутинной работы внесения изменений в несколько документов в процессе правки текста (что бывает достаточно часто). Под дочерним документом понимается один или несколько документов, содержание которых представляет измененную версию основного документа, а также версии на иностранных языках, причем дочерние документы сохраняют связи со всеми необходимыми данными родительского документа.

Дочерний документ создается пользователем путем копирования с сохранением связей фрагментов любого размера основного документа. Связи позволяют редактировать информацию только в одном документе и автоматически вносить необходимые изменения во все дочерние документы.

Более сложная проблема возникает при внесении изменений в иностранные тексты. Существующие программы-переводчики до сих пор не могут дать удовлетворительный результат. Поэтому основная работа ложится на человека-переводчика. Однако система в помощь переводчику отслеживает фрагменты, подвергшиеся правке в оригинальной версии. Таким образом, переводчику достаточно выполнить перевод только данных фрагментов, не просматривая весь текст.

Для автоматизации создания документов, содержащих как текстовые (иногда очень значительные), так и цифровые составляющие, необходимо на раннем этапе создания документов использовать средства разметки потока данных, например широко применяемый XML - расширяемый язык

разметки, рекомендованный Консорциумом W3C. XML-документ содержит данные, но не информацию о том, как должен выглядеть печатный документ.

Подсистема верстки документов используется для окончательной обработки подготовленных документов перед их печатью. При этом необходимо соблюсти независимость подготовленных документов от характеристик и настроек печатающих устройств.

Для описания внешнего вида документа, готового к печати, Консорциумом W3C предложен язык разметки типографских материалов XSL-FO (объекты форматирования языка таблиц стилей для XML). Файл XSL-FO хранит все данные документа (в том числе и разметку) внутри себя. При таком подходе пользователь создает XML-документ, а затем применяет XSLT-преобразование, либо написав его самостоятельно, либо взяв готовое. Для выполнения XSLT-преобразования используются:

один или несколько исходных XML-документов;

одна или несколько таблиц стилей

XSLT;

- XSLT-процессор;

- один или несколько выходных документов.

XSLT-преобразование чаще всего используется для генерации HTML-доку-ментов, а для получения печатных копий необходим PDF формат. Поэтому для всего процесса получения печатных отчетов требуются следующие преобразования: XML ^ HTML ^ PDF с использованием двух таблиц стилей XSLT. Поддержка двух таблиц стилей для каждого из документов - это непростая задача, а если учесть трудности отображения таблиц, то сложность ее существенно увеличивается. Существуют подходы, заменяющие одну из таблиц стилей XSLT на известную CSS [3], но это не сильно упрощает задачу. Кроме того, готовых таблиц стилей XSLT не так много.

Для подготовки качественных печатных документов издавна используется система компьютерной верстки TeX, для которой создано огромное количество шаблонов документов. На ее базе был предложен процесс TeXML [4] - как альтернатива XSL-FO, из-

бегающая двойного преобразования документа и использующая многочисленные наработки шаблонов.

Все перечисленные системы предназначены для автоматической генерации PDF-до-кументов, однако далеко не во всех случаях автоматическая генерация приводит к получению качественного документа. Самым, пожалуй, серьезным камнем преткновения являются таблицы: практически невозможно разработать шаблон, в котором будут учтены все возможные случаи ликвидации «некрасивого» размещения и форматирования таблиц. В существующих системах пользователю в случае обнаружения неправильного представления требуется возврат к правке исходного XML-документа. Для поддержки этого процесса используется программное обеспечение [5], которое помогает найти место в исходном документе, требующем изменений.

В большинстве случаев пользователь при написании документа знает и предполагает, что таблицы должны вмещаться в печатный размер листа и не делает их слишком большими. А если таблицы автором сделаны невыводимыми, то он будет вынужден их изменить во входном документе. Но часто встречаются случаи, когда таблица не может быть автоматически размещена по причине незначительного выхода за ограничения, налагаемые шаблоном, например масштабирование шаблоном ограничено величиной ±10%, а требуется -11%. В таких случаях разработанная система предлагает для пользователя варианты решения проблемы на выбор: изменить ограничения для данной таблицы или вернуться к редактированию исходного документа. В каждом конкретном случае пользователю видны ограничения шаблона, которые не выполняются, что позволяет осознанно сделать выбор из нескольких предложенных вариантов.

Для реализации предложенной интерактивной верстки были использованы LaTeX и парсер XML собственной разработки, что позволило использовать давние наработки шаблонов для TeX и разрабатывать новые в известных стандартах TeX.

Разработанная авторами автоматизированная система подготовки слабоструктури-

рованной информации имеет возможности

расширения заложенных в нее функций.

Литература

1. Ильвовский Д., Черняк Е. Системы автоматической обработки текстов // Открытые системы. 2014. № 1. С. 51-53.

2. Клюкин А.А., Широков А.А. Автоматизация обработки слабоструктурированной информации // Гаудеамус. Тамбов, 2011. № 2 (18). С. 128-129.

3. Теодореску К. Публикация XML-данных в форматах HTML и PDF с помощью одной таблицы стилей XSLT [Электронный ресурс]. URL: http://www.ibm.com/developerworks/ru/library/x-xmlxsltpdf/.

4. TeXML: an XML syntax for TeX (LaTeX, ConTeXt) [Электронный ресурс]. URL: http:// getfo.org/texml/.

5. iTeXMac [Электронный ресурс]. URL: http:// itexmac.sourceforge.net/pdfsync.html

References

1. Il'vovskiy D., Chernyak E. Sistemy avtomati-cheskoy obrabotki tekstov // Otkrytye sistemy. 2014. №1. S. 51-53.

2. Klyukin A.A., Shirokov A.A. Avtomatizatsiya obrabotki slabostrukturirovannoy informatsii // Gaudeamus. Tambov, 2011. № 2 (18). S. 128-129.

3. Teodoresku K. Publikatsiya XML-dannyh v formatah HTML i PDF s pomosch'yu odnoy tablitsy stiley XSLT [Elektronnyj resurs]. URL: http://www.ibm.com/developerworks/ru/library/x-

xmlxsltpdf/.

4. TeXML: an XML syntax for TeX (LaTeX, ConTeXt) [Elektronnyj resource]. URL: http://getfo. org/texml/.

5. ITeXMac [Elektronnyj resource]. URL: http:// itexmac.sourceforge.net/pdfsync.html.

AUTOMATED SYSTEM TRAINING SEMISTRUCTURED INFORMATION

A.A. Klyukin, A.A. Shirokov

Perm State Academy of Art and Culture Perm National Research Polytechnic University, Perm, Russia. e-mail: shirokov@pstu.ru

The article deals with the automated system of training-related documents, the crucial tasks of the organization of collective work on complex documents that have several options, including in foreign languages, as well as interactive layout of documents.

Key words: automated system for word processing, text documents, layout, style.

УДК 519.688

РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ СИСТЕМЫ УПРАВЛЕНИЯ ПРИБОРАМИ ДЛЯ АСТРОНОМИЧЕСКИХ НАБЛЮДЕНИЙ

К.Н. Кириллов, Т.Ю. Китаевская

Тамбовский государственный университет имени Г.Р. Державина, Россия, г. Тамбов. е-mail: kirillov-tmb@yandex.ru, kita68@rambler.ru

В статье рассматривается проблема моделирования систем управления приборами для астрономических наблюдений. Решена задача разработки программного обеспечения для системы управления, позволяющей управлять как экваториальными, так и альт-азимутальными монтировками и не зависящей от параметров механических узлов монтировки.

Ключевые слова: моделирование, программное обеспечение, управление приборами для астрономических наблюдений.

Знания о Вселенной составляют фундамент научной картины мира, и роль этих знаний в дальнейшем будет расти. Несмотря на то, что астрономия имеет научную, образовательную и досуговую ценность, долгое время любительская астрономия была непопулярна в основном из-за отсутствия материальной базы. Но в последнее время ситуация изменилась - появились программы-планетарии, позволяющие спланировать наблюде-

ния, появились цифровые фотокамеры, и астрофотография стала доступней, но главное, стали доступны телескопы - основной инструмент для астрономических наблюдений. Однако при этом ручное управление телескопом по ряду причин неэффективно и сложно, что приводит к необходимости использовать автоматические системы управления.

Наиболее распространен случай, когда у астронома-любителя имеется телескоп ма-

i Надоели баннеры? Вы всегда можете отключить рекламу.