Научная статья на тему 'К вопросу о разработке универсального тест-объекта для определения насыщенности текстового набора русскоязычных текстов'

К вопросу о разработке универсального тест-объекта для определения насыщенности текстового набора русскоязычных текстов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
101
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕКСТОВОЙ НАБОР / НАСЫЩЕННОСТЬ ТЕКСТОВОГО НАБОРА / ПРОГРАММНО-ИНСТРУМЕНТАЛЬНЫЙ МЕТОД ОПРЕДЕЛЕНИЯ НАСЫЩЕННОСТИ / ТЕКСТОВОГО НАБОРА ПЕЧАТНЫХ И ЭЛЕКТРОННЫХ ПУБЛИКАЦИЙ / УНИВЕРСАЛЬНЫЙ ТЕСТ-ОБЪЕКТ / TEXT SET / SATURATION OF TEXT SET / PROGRAM-INSTRUMENTAL METHOD OF DETERMINING / THE SATURATION OF THE TEXT SET OF PRINT AND ELECTRONIC PUBLISHING / UNIVERSAL TEST-OBJECT

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Сысуев Игорь Александрович, Пруд Ирина Валерьевна, Державина Екатерина Александровна

В статье рассматривается программно-инструментальный метод определения насыщенности текстового набора печатных и электронных публикаций по показателю уровень яркости (0-255) с использованием инструментария программы для создания и обработки растровой графики Photoshop. Рассматривается возможность модернизации метода, обеспечивающей универсализацию его использования относительно русскоязычных текстов, и вопросы разработки соответствующего тест-объекта.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Сысуев Игорь Александрович, Пруд Ирина Валерьевна, Державина Екатерина Александровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The question about development of universal test-object to determine saturation of Russian-language text set

The article considers the program-instrumental method of determining the saturation of a text set of printed and electronic publications on parameter of brightness (0-255) using instrumentation program for creating and processing bitmap graphics Photoshop. The possibility of modernization of the method and question of development of appropriate test-object is considered which provide the universalization of its use relative to Russian texts.

Текст научной работы на тему «К вопросу о разработке универсального тест-объекта для определения насыщенности текстового набора русскоязычных текстов»

УДК 681.3/655.244

И. А. СЫСУЕВ И. В. ПРУД Е. А. ДЕРЖАВИНА

Омский государственный технический университет

К ВОПРОСУ О РАЗРАБОТКЕ УНИВЕРСАЛЬНОГО ТЕСТ-ОБЪЕКТА ДЛЯ ОПРЕДЕЛЕНИЯ НАСЫЩЕННОСТИ ТЕКСТОВОГО НАБОРА РУССКОЯЗЫЧНЫХ ТЕКСТОВ

В статье рассматривается программно-инструментальный метод определения насыщенности текстового набора печатных и электронных публикаций по показателю уровень яркости (0—255) с использованием инструментария программы для создания и обработки растровой графики Photoshop. Рассматривается возможность модернизации метода, обеспечивающей универсализацию его использования относительно русскоязычных текстов, и вопросы разработки соответствующего тест-объекта.

Ключевые слова: текстовой набор, насыщенность текстового набора, программно-инструментальный метод определения насыщенности текстового набора печатных и электронных публикаций, универсальный тест-объект.

Одним из важнейших показателей, определяющих привлекательность внешнего облика страницы печатной или электронной публикации и удобочитаемость размещенного на ней текста, является контраст. Практика показывает, что публикации с высоким контрастом воспринимаются во всех отношениях лучше малоконтрастных.

Контраст графического образа страницы текстового документа определяется наличием и соотношением на странице белого (фон, поля), серого (основной текст) и черного (заголовки, выделения жирным шрифтом, графические элементы и изображения) пространств (при использования цветовых решений — светлого, среднего по светлоте и темного). Поскольку основного текста на странице всегда больше, серое пространство является самым значительным фактором, определяющим контраст публикации.

Текст (текстовой набор) создаёт на странице определённый оттенок серого цвета, называемый также в русскоязычной типографике «цветом шрифта» («цветом набора»). Указанный оттенок серого цвета зависит не только от насыщенности используемого шрифта (тонкий, светлый, книжный, нормальный, средний, полужирный, жирный, тёмный, чёрный, сверхжирный), но и от параметров текстового набора (кегль, интерлиньяж, величина трекинга). Для описания оттенка серого цвета, создаваемого текстовым набором, введено понятие «насыщенность текстового набора» [1].

Насыщенность текстового набора не может быть измерена приборно, поскольку оттенок серого цвета, создаваемый блоком текста, как параметр применим только к значительной площади (порядка кв. дм; для сравнения апертура фотометра имеет порядок кв. мм).

В Омском государственном техническом университете был разработан программно-инструментальный метод определения насыщенности текстового набора печатных и электронных публикаций с использованием инструментария программы для обработки изображений Adobe Photoshop [ 1 — 4], а совместно с коллегами из Белорусского государственного технологического университета — основанный на вышеуказанном методе способ определения степени заполнения полосы набора текстом [5, 6].

Сущность метода заключается в оценке оттенка серого цвета, создаваемого текстовым набором, посредством показателя «уровень яркости» (0 — 255), определяемого с помощью инструмента «Гистограмма» в программе для обработки изображений Photoshop. В импортированном в программу изображении страницы текста выделяют произвольную прямоугольную область площадью не менее 100 000 пикселей и, используя фильтр «Размытие» — «Среднее», осуществляют размытие выделенной области, в результате чего она приобретает однородный по площади оттенок серого цвета. После этого считывают значение уровня яркости («Среднее»).

На основании проведенных исследований был разработан способ определения контраста графического образа полосы набора [7, 8].

Контраст графического образа страницы печатных и электронных публикаций определяется как К=Нот—Нз, где К — контраст страницы публикации; Нот — насыщенность текстового набора основного текста (единицы уровня яркости — ед. ур. ярк.); Нз — насыщенность текстового набора заголовка (ед. ур. ярк.).

Зная конкретные числовые значения, можно на основе объективных данных добиваться

требуемого контраста при оформлении печатных публикаций.

Целью данного исследования является модернизация метода определения насыщенности текстового набора печатных и электронных публикаций, обеспечивающая универсализацию его использования относительно русскоязычных текстов.

Первым этапом реализации метода являются определение базовых требований к тексту и параметры его набора, а также подготовка текстового тест-объекта в прикладной программе. С целью обеспечения однородности составляющих текст символов выбирают сплошной (без выделений) текст на одном языке (русском) на общую тему (без использования специальных символов). Текст набирается исследуемым шрифтом с заданными кеглем, интерлиньяжем и трекингом (для обеспечения однородности межсимвольных пробелов) с выключкой влево (для обеспечения однородности межсловных

Рис. 1. Окно инструмента «Статистика», содержащее информацию о количестве символов в тексте с учетом и без учета межсловного пробела

[Толстой Лев Николаевич О жизни

Вступление

Представки себе человека, которого единственным средством к жизни была бы мельница. Человек этот - сын я внук мельника и по преданию твердо знает, как надо во всех частях ее обращаться с мельницей, чтобы она хорошо молола. Человек этот, не зная механики, прилаживал, как умен, все части мельницы так, чтобы размол был спорый, хороший, и человек жил и кормился.

Но случилось этому человеку ра 1000 здуматься над устройством мелышцы, услыхать кое-какие неясные толки о механике, и он стал наблюдать, что oí чего вертится.

И от порхлицы до жернова, от жернова до вала, от Бала до колеса, от колка до заставок, плотины и воды, дошел до того, что ясно понял, что все дело в плотине и в реке. И человек так обрадовался этому открытию, что вместо того, чтобы, по-прежнему, сличая качество вьподящей муки, опускать и поднимать жернова, ковать их. натягивать и ослаблять ремень, стал изучать реку. И мельница его совсем разладилась. Стали мельнику говорить, что он не то делает. Он спорил и продолжал рассуждать о реке И так много и долго работал над этим, так горячо и много спорил с теми, которые показывали ему неправильность его приема мысли, что под конец и сам убедился в том, что река и есть самая мельница.

На все доказательства неправильности его рассуждений такой мельник будет отвечать: никакая мельница не мелет без воды; следовательно, чтоб знать мельницу, надо знать, как пускать воду, надо знать силу ее движения и откуда она берется. - следовательно, чтобы знать мельницу, надо познать реку.

Логически мельник неопровержим в своем рассуждении. Единственное средство вывести его нз его заблуждения состоит в том, чтобы показать ему, что в каждом рассуждении не столько важно само рассуждение, сколько занимаемое рассуждением место, т е. что для того, чтобы плодотворно мыслить, необходимо знать, о чем прежде надо мыслить и о чем после; показать ему, что разумная деятельность отличается от безумной только тем, что разумная деятельность распределяет свои рассуждения по порядку их важности: какое рассуждение должно быть 1-м, 2-м, 3-м, 10-м н т. д. Безумная же деятельность состоит в рассуждениях без этого пордцка. Нужно показать ему и то, что определение этого порядка не случайно, а зависит от той цели, для которой и производятся рассуждения.

Цель всея рассуждений н устанавливает порядок, в котором должны располагаться отдельные рассуждения, для того чтобы быть разумными.

цель всех рассуждений оставлена н рассуждается о жизни независимо от ее цели; н под словом жизнь разумеют уж не жизнь, а то, отчего она происходит, или то, что ей

сопутствует.

Теперь, не только в научных книжках, но и в разговорах, говоря о жизни, говорят не о той, которую мы все знаем, - о жнзнн, сознаваемой мною теми страданиями, которых х боюсь н которые ненавижу. и теми наслаждениями и радостями, которых я желаю; а о чем-то таком, что, может быть, возникло нз игры случайности по некоторым физическим законам, а может быть и от того, что имеет в себе таинственную причину.

Теперь слово "жизнь" приписывается чему-то спорному, не имеющему в себе главных признаков жнзнн: сознания страданий и наслаждений, стремления к благу.

"La vie est l'ensemble des fonctions, qui resistent a la mort. La vie est l'ensemble des phenomenes, qui se succedent pendant un temps limite dans un etre organise"

"Жизнь есть двойной процесс разложения и соединения, общего и вместе с тем непрерывного. Жизнь есть известное сочетание разнородных изменений, совершающихся последовательно Жизнь есть организм в действии, Жизнь есть особенная деятельность органического вещества. Жизнь есть приспособление внутренних отношений к внешним".

Не говоря о неточностях, тавтологиях, которыми наполнены все эти определения, сущность нх всех одинакова, именно та, что определяется не то, что все пищи одинаково бесспорно разумеют под словом "жизнь", а какие-то процессы, сопутствующие жнзнн н другим явлениям.

Под большинство этнх определений подходит деятельность восстанавливающегося

Рис. 2. Окно инструмента «Найти и заменить» с выбранной для замены буквой «а»

Толстой Лев Никол@евич О жизни

Вступление

Представим себе человек®, которого единственным средством к жнзнн был® бы мельниц® Человек этот - сын н внук мельник® и по преданию твердо зн®ет, к®к и® до во всех частях ее обр@щ®ться с мельницей, чтобы он® хорошо молол®. Человек этот, не зн®я мехйннын. приложив®л, к@к умел, все ч®стн мельницы т@к, чтобы р®змол был спорый, хороший, и человек жнлн кормился.

Но случилось этому человеку р@ 1000 здум®ться н2д устройством мельницы, услых@ть кое-к®кие неясные толки о механике, и он ст@л н®блюд®ть, что от чего вертится.

И от порхлицы до жернов2, от жернов® до в®л@, от в®л® до колес®, от колес® до з@ст@вок, плотины и воды, дошел до того, что ясно понял, что все дело в плотине и в реке. И человек т®к обр@дов®лся этому открытию, что вместо того, чтобы, по-прежнему, слнч®я качество выходящей муки, опускать и поднимать жернов®, ков®ть нх, н®тягнв®ть и осл@блять ремень, ст®л изучать реку. И мельниц® его совсем р@зл@днл®сь. Ст@лн мельнику говорить, что он не то дел@ет. Он спорил и продолж®л р@ссужд®ть о реке. И т@к много и долго р®бот®л н@д этим, т®к горячо и много спорил с теми, которые пок@зыв2лн ему неправильность его прием® мысли, что под конец и с®м убедился в том, что рек® н есть с@м@я мельниц®.

Н® все док®з@тельств® неправильности его р® осуждений т®кой мельник будет отвеч®ть: ннк®к®я мельниц 3 не мелет без воды: следов®тельно, чтоб зн®ть мельницу, н®до зн®ть, к®к пуск®ть воду, н®до зн®тъ силу ее движения и откуд® он® берется, -следовательно, чтобы зн®гь мельницу, н®до позн®ть реку

Логически мельник неопровержим в своем р®осуждении Единственное средство вывести его из его з®блуждения состоит в том, чтобы пок®з®ть ему, что в к@ждом р® осуждении не столько ьйжно с@мо р®ссужденне, сколько з@ннм®емое р®ссужденнем место, т. е. что для того, чтобы плодотворно мыслить, необходимо зи@тъ, о чем прежде н@до мыслить н о чем посте: покйзйть ему, что р®зумн®я деятельность отлнч®ется от безумной только тем, что р@зумн®я деятельность р®спределяет свои р® осуждения по порядку нх важности: к®кое р®ссужденне должно быть 1-м, 2-м, 3-м, 10-м и т. д. Безумн®я же деятельность состоит в р®ссуждениях без этого порядк®. Нужно пок®з®ть ему и то, что определение этого порядк® не елуч®нно, @ зйвнент от той цели, для которой н производятся р®осуждения.

Найти и вменить а*™ Заменит

пз

Заменить | Заменить gee j Нацти далее | Отмене

Microsoft Word

SB

Приложегме Word завершило гк

Справка

If. H

ее п.

•ды, -я все

от п соднт

что ей оворят

которых я боюсь н которые нен®внжу, и темн н®сл®жденнямн и радостями, которых я жел®ю; ® о чем-то г®ком, что, может быть, возникло нз игры случ®йносш по некоторым физическим з®кои@м, ® может быть и от того, что имеет в себе т®инственную причину

Теперь слово "жизнь" приписывается чему-то спорному, не имеющему в себе гл®вных прнзн®ков жнзнн: созн®ннястр®д®ний нн®сл®жденнй, стремления кбл@гу.

"La vie est l'ensemble des fonctions, qui résistent a la mort. La rie est l'ensemble des phenomenes, qui se succedent pendant un temps limite dans un etre organise"

"Жизнь есть двойной процесс р®зложения и соединения, общего н вместе с тем непрерывного Жнзнь есть известное сочетание р®знородных изменений, совершающихся последовательно Жизнь есть организм в действии. Жнзнь есть особенная деятельность органического веществ®. Жизнь есть приспособление внутренних отношений к внешним"

Не говоря о неточностях, тавтологиях, которыми наполнены все эти определения, сущность их всех одинаков®, именно т®, что определяется не то, что все люди однн®ково бесспорно р@зуыеют под словом "жнзнь", ®j к@кде-го процессы, сопутствующие жизни и

Рис. 3. Всплывающее окно (нижнее) с указанием количества символов «а»

пробелов) с программным делением на строки и без переносов в последних словах строк, без деления на абзацы (для обеспечения однородности заполнения строк текстом).

Недостатком в данном случае является использование выбираемых для исследования русскоязычных текстов, посимвольное содержание которых является различным. Модернизацией метода являлось бы использование текстового тест-образца, содержащего такие количества символов русскоязычного текста, включая межсловные пробелы, которые соответствовали бы частоте их встречаемости. Это позволит сделать метод универсальным и избавит от необходимости выбирать в качестве образцов конкретные тексты для исследования.

Для реализации проблемы универсализации требуется определить частоту встречаемости символов в составе русскоязычных текстов на общую тему и среднестатистическую длину русского слова —

для определения частоты встречаемости межсловных пробелов.

Определение частоты встречаемости символов в русскоязычных текстах на общую тему. Определение общего количества и количества отдельных символов производится с использованием программы для набора текстов Microsoft Word.

Для обеспечения статистической достоверности выбираются не менее пяти русскоязычных произведений на общую тему с общим содержанием символов не менее 1 млн.

Отбор производится по параметрам: длина произведения свыше 100 тыс. символов, отсутствие или малое количество диалогов в тексте, отсутствие стихотворений.

Для исследования выбираются строчные и прописные символы русского алфавита (66 символов), а также наиболее часто встречающиеся знаки препинания: точка, запятая, дефис и межсловный пробел.

Таблица 1

Средняя частота встречаемости символов в русскоязычных текстах на общую тему

Символ Произведения* Суммарное количество символов Средняя частота встречаемости символа

1 2 3 4 5

1 2 3 4 5 6 7 8

а 13206 13686 9997 21281 15722 73892 0,06143

б 3627 2886 2360 4053 3545 16471 0,01369

в 9888 5949 5157 9714 9336 40044 0,03329

г 3734 2657 2443 4676 4047 17557 0,01460

д 5929 4588 4080 7281 6708 28586 0,02376

е 22080 11795 10430 19524 19353 83182 0,06915

ё 6 5 1 1 2 15 0,00001

ж 3894 1483 1303 2531 2238 11449 0,00952

з 4541 2633 1948 4079 3101 16302 0,01355

и 17184 10594 8048 19186 15078 70090 0,05827

й 1955 1587 1379 2572 2281 9774 0,00813

к 5520 6833 4218 9429 7407 33407 0,02777

л 8043 8746 6545 11325 9549 44208 0,03675

м 7261 4223 4252 6730 6988 29454 0,02449

н 16011 8650 7909 15161 13796 61527 0,05115

о 25007 15906 13852 26661 26379 107805 0,08962

п 3851 4376 3275 6057 5746 23305 0,01937

р 7225 6890 5171 10689 9421 39396 0,03275

с 11560 7796 6625 11714 11702 49397 0,04106

т 16013 8572 7178 14576 13515 59854 0,04976

у 5402 5282 3854 6927 5559 27024 0,02247

ф 81 227 11 346 232 897 0,00075

х 1585 1473 1082 1955 2389 8484 0,00705

ц 261 418 359 857 707 2602 0,00216

ч 4236 2146 1909 4127 3288 15706 0,01306

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ш 1167 1507 1046 2265 1505 7490 0,00623

щ 1294 603 515 805 765 3982 0,00331

ъ 56 40 15 72 73 256 0,00021

ы 3118 2899 3006 4249 4053 17325 0,01440

ь 4113 3394 2781 4673 4000 18961 0,01576

э 766 257 262 440 825 2550 0,00212

ю 2145 865 576 1345 1624 6555 0,00545

я 5296 3338 2711 4524 4090 19959 0,01659

1630 2501 1839 4071 2025 12066 0,01003

5782 3790 3537 6881 5321 25311 0,02104

528 409 300 587 357 2181 0,00181

пробел 41909 29956 25701 47660 41079 186305 0,15488

Окончание табл. 1

1 2 3 4 5 6 7 8

А 35 171 187 383 209 985 0,00082

Б 29 121 40 219 56 465 0,00039

В 154 321 245 666 224 1610 0,00134

Г 49 82 36 554 90 811 0,00067

Д 65 261 72 302 164 864 0,00072

Е 88 43 54 121 53 359 0,00030

Ё 0 0 0 0 0 0 0,00000

Ж 79 22 9 67 20 197 0,00016

З 34 93 44 117 53 341 0,00028

И 187 849 219 558 226 2039 0,00170

Й 0 0 1 394 1 396 0,00033

К 56 148 248 223 124 799 0,00066

Л 75 138 56 443 58 770 0,00064

М 58 234 200 716 122 1330 0,00111

Н 204 387 259 483 359 1692 0,00141

О 89 328 340 388 226 1371 0,00114

П 95 264 205 76 278 918 0,00076

Р 58 152 80 520 48 858 0,00071

С 110 297 154 246 213 1020 0,00085

Т 141 283 225 141 155 945 0,00079

У 22 97 45 45 45 254 0,00021

Ф 1 28 0 40 64 133 0,00011

Х 17 49 18 11 26 121 0,00010

Ц 5 3 0 127 4 139 0,00012

Ч 99 69 28 52 46 294 0,00024

Ш 3 34 8 1 56 102 0,00008

Щ 0 4 0 0 2 6 0,00000

Ъ 0 0 0 0 0 0 0,00000

Ы 0 0 0 0 0 0 0,00000

Ь 0 0 0 0 0 0 0,00000

Э 33 41 140 108 77 399 0,00033

Ю 0 0 1 6 0 7 0,00000

Я 32 42 34 110 76 294 0,00024

Суммарное количество знаков в произведении 269094 195791 159923 307005 271111 1202924 0,9917

Суммарное количество знаков в пяти произведениях Средняя сумма частот встречаемости

*Примечание. Здесь и в табл. 2 использованы данные, полученные при исследовании следующих произведений:

1 — Л. Н. Толстой, рассказ «О жизни»;

2 — В. П. Астафьев, повесть «Перевал»;

3 — Ч. Айтматов, повесть «Пегий пес, бегущий краем моря»;

4 — Ю. В. Трифонов, роман «Исчезновение»;

5 — Н. С. Лесков, очерк «Мелочи архиерейской жизни».

На первом этапе проводится определение общего количества символов, содержащихся в выбранном тексте с помощью инструмента «Статистика» (рис. 1).

Количество каждого конкретного символа определяется с применением инструмента «Замена», с помощью которого последовательно выполняется замена каждого символа на гарантированно незадействованный в тексте символ «@» (рис. 2). Во всплывающем окне инструмента отображается количество произведенных замен, т. е. количество N. данного символа в составе текста (рис. 3). Количество межсловных пробелов определяется в диалоговом окне инструмента «Статистика» (рис. 1).

Частота встречаемости Р. символа рассчитывается: P=N. г , где Р. — частота встречаемости

I I общ ^ I 1

1-го символа, N. — количество 1-го символа в со-

1 I

ставе текста, N , — количество символов во всем

' общ

тексте.

Результаты исследования частоты встречаемости символов представлены в табл. 1.

Определение длины слов в русскоязычных текстах на общую тему. После всех проведенных замен весь текст состоит из символов «@», разделенных межсловными пробелами, т. е. из слов различной длины, каждое из которых состоит только из символов «@» (рис. 4). (Помимо этого в тексте крайне редко втречаются также и символы, не задействованные в исследовании, например, цифры и тире, но их общее количество (0,0073, табл. 1) настолько мало, что не влияет на достоверность полученных результатов.)

Рис. 4. Текст после полной замены всех символов на незадействованный в тексте символ «@ и окно «Найти и заменить» с выбранной длиной слова, состоящего из символов «@»

Таблица 2

Суммарное количество слов различной длины, содержащихся в текстах пяти выбранных произведений, и их средняя длина

Количество букв в слове Количество слов различной длины в произведениях* Суммарное количество слов

1 2 3 4 5

1 5046 3199 2798 5147 5111 21301

2 4375 3287 2964 4955 4879 20460

3 5113 2689 2890 4753 4852 20297

4 3547 2527 2509 4071 3384 16038

5 5053 3886 3615 5547 4449 22550

6 4683 4114 3191 5635 4187 21810

7 3242 3392 2461 5239 3894 18228

8 3214 2576 1784 4027 3422 15023

9 2564 1911 1246 2669 2397 10787

10 1782 1170 895 1873 1745 7465

11 1209 750 605 1277 1255 5096

12 875 395 395 792 924 3381

13 596 185 196 479 498 1954

14 345 96 142 224 299 1106

15 97 43 45 95 191 471

16 70 20 13 60 74 237

17 25 14 10 32 41 122

18 10 9 0 21 22 62

19 7 2 3 8 21 41

20 4 3 2 5 21 35

21 1 - 1 2 11 15

22 - 1 1 4 1 7

23 1 - 1 3 1 6

24 - - - 1 2 3

25 - - - - - -

26 - - - - 1 1

27 - 1 - - - 1

Сумма букв 41859 30270 25767 46919 41682 186497

Средняя длина слова 5,394 5,404 5,180 5,445 5,418 5,368

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 5. Всплывающее окно с указанием количества слов с длиной в 30 символов («@»)

Рис. 6. Диаграмма, отражающая содержание количества слов различной длины в текстах пяти выбранных произведений (см. примечание к табл. 1)

Для определения количества слов определенной длины снова используется инструмент «Замена», но в данном случае производится замена целых слов на единичный пробел введением поискового запроса: «Заменить «@...«@» на межсловный пробел».

Замена производится с учетом того, что исследование необходимо начинать со слов наибольшей длины — с наибольшим количеством символов

«@» в своем составе, в противном случае исследуемый текст начнет видоизменяться по составу п-символьных слов. В результате пилотных исследований было установлено, что наибольшая длина слова составляет 30 символов, поэтому вначале выполняется замена 30-символьных слов на пробел, количество найденных слов отображается во всплывающем окне инструмента «Замена» (рис. 5). Затем производится определение количества 29-символь-ных, 28-символьных слов и т. д.

Результаты исследования длины слов в русскоязычных текстах на общую тему представлены в табл. 2 и на рис. 6.

Таким образом получены данные для составления универсального текстового тест-образца, содержащего такие количества символов русскоязычного текста, включая межсловные пробелы, которые соответствовали бы реальной частоте их встречаемости.

Модернизированный метод определения насыщенности текстового набора печатных и электронных публикаций приобрел универсальность использования относительно русскоязычных текстов.

Библиографический список

1. Сысуев, И. А. Программно-инструментальный метод определения насыщенности текстового набора электронных публикаций / И. А. Сысуев // Динамика систем, механизмов, машин : материалы VII Междунар. науч.-техн. конф. - Омск : ОмГТУ, 2009. - С. 327-330.

2. Григорова, Ю. С. Программно-инструментальный метод определения насыщенности текстового набора печатных публикаций / Ю. С. Григорова, О. А. Зырянова, И. А. Сысуев, О. А. Тимощенко // Полиграфия: технология, оборудование, материалы : материалы заоч. науч.-практ. конф. с междунар. участием. - Омск : ОмГТУ, 2010. - С. 54-58.

3. Воробьева, А. С. Насыщенность текстового набора электронных публикаций / А. С. Воробьева, И. А. Сысуев // Полиграфия: технология, оборудование, материалы : материалы заоч. науч.-практ. конф. с междунар. участием. - Омск : ОмГТУ, 2010. - С. 39-45.

4. Воробьева, А. С. Программно-инструментальный метод определения насыщенности текстового набора печатных

и электронных публикаций / А. С. Воробьева, Ю. С. Григоро-ва, О. А. Зырянова, И. А. Сысуев, О. А. Тимощенко // Омский научный вестник. Сер. Приборы, машины и технологии. — Омск. - 2010. - № 2 (90). - С. 228-231.

5. Пат. 17388 Белоруссия, МПК С 01 Б 21/00. Способ определения степени заполнения полосы набора текстом / Косова М. М., Зильберглейт М. А., Токарь О. В., Сысуев И. А., Григо-рова Ю. С., Тимощенко О. А. ; заявитель и патентообладатель Белорус. гос. технолог. ун-т. № а 20110681 ; заявл. 17.05.2011 ; опубл. 30.08.2013. - 3 с.

6. Пат. 17390 Белоруссия, МПК С 01 Б 21/00. Способ определения степени заполнения полосы набора текстом / Косова М. М., Зильберглейт М. А., Токарь О. В., Сысуев И. А., Григо-рова Ю. С., Тимощенко О. А. ; заявитель и патентообладатель Белорус. гос. технолог. ун-т. № а 20110943 ; заявл. 07.07.2011 ; опубл. 30.08.2013. - 3 с.

7. Сысуев, И. А. Определение оптимального контраста графического образа страницы печатных публикаций / И. А. Сысуев, О. А. Тимощенко, Ю. С. Григорова // Динамика систем, механизмов, машин : материалы VIII Междунар. науч.-техн. конф. - Омск : ОмГТУ, 2012. - Кн. 1. - С. 282-285.

8. Сысуев, И. А. Определение оптимального контраста графического образа страницы печатных и электронных публикаций / И. А. Сысуев, О. А. Тимощенко, Ю. С. Григорова //

Омский научный вестник. Сер. Приборы, машины и технологии. - Омск. - 2013. - № 2 (120). - С. 328-331.

9. Сысуев, И. А. Модернизация метода определения насыщенности текстового набора печатных и электронных публикаций / И. А. Сысуев, Е. А. Державина, И. В. Пруд // Инновационные решения при реструктуризации логистических систем : материалы заоч. науч.-практ. конф. с междунар. участием. - Омск, 2014. - С. 44-48.

СЫСУЕВ Игорь Александрович, кандидат технических наук, доцент (Россия), доцент кафедры «Оборудование и технологии полиграфического производства».

ПРУД Ирина Валерьевна, ассистент кафедры «Оборудование и технологии полиграфического производства», магистрант гр. ТПП-514 факультета элитного образования и магистратуры. ДЕРЖАВИНА Екатерина Александровна, магистрант гр. ТПП-514 факультета элитного образования и магистратуры. Адрес для переписки: [email protected]

Статья поступила в редакцию 17.12.2014 г. © И. А. Сысуев, И. В. Пруд, Е. А. Державина

УДК 655303 И. А. СЫСУЕВ

И. В. ПРУД Е. А. ДЕРЖАВИНА О. Е. СЕРДЮК В. В. СКИТЧЕНКО

Омский государственный технический университет

ВЛИЯНИЕ ЦВЕТА БУМАГИ НА НАСЫЩЕННОСТЬ ТЕКСТОВОГО НАБОРА И КОНТРАСТ ГРАФИЧЕСКОГО ОБРАЗА СТРАНИЦЫ ПЕЧАТНЫХ ПУБЛИКАЦИЙ

В статье рассматриваются вопросы, относящиеся к созданию привлекательного и удобочитаемого внешнего графического облика страницы печатных публикаций. Оценка графического образа страницы производится по одному из существенных параметров — контрасту. Приводится усовершенствованный программно-инструментальный метод оценки насыщенности текстового набора печатных публикаций, позволяющий учитывать цвет подложки (бумаги). Показано изменение контраста графического образа страницы при использовании цветной бумаги.

Ключевые слова: графический образ страницы, печатные публикации, контраст, насыщенность текстового набора, метод оценки насыщенности текстового набора печатных публикаций.

Возможности современной печатной техники ношение начертаний шрифта, кегля, интерлиньяжа

и разнообразие запечатываемых материалов поз- и величины трекинга, так как от этого зависит на-

воляют реализовать различные дизайнерские ре- сыщенность текстового набора и, как следствие,

шения. контраст и качество восприятия.

При работе с цветными подложками специ- На сегодняшний день оценка типографического

алисту необходимо подобрать оптимальное соот- оформления текста на цветной бумаге (подложке)

i Надоели баннеры? Вы всегда можете отключить рекламу.