УДК 681.3/655.244
И. А. СЫСУЕВ И. В. ПРУД Е. А. ДЕРЖАВИНА М. В. ВДОВИНА
Омский государственный технический университет
Санкт-Петербургский государственный университет
К РАЗРАБОТКЕ ТЕСТОВОГО ОБРАЗЦА СРЕДНЕСТАТИСТИЧЕСКОГО ТЕКСТА НА РУССКОМ ЯЗЫКЕ: ОПРЕДЕЛЕНИЕ НАСЫЩЕННОСТИ ТЕКСТОВОГО НАБОРА, СОЗДАННОГО ЕДИНИЧНЫМИ СИМВОЛАМИ
В статье описывается программно-инструментальный метод определения насыщенности текстового набора электронных и печатных публикаций. Показана возможность модернизации метода, обеспечивающей универсализацию его использования относительно русскоязычных текстов, рассмотрены вопросы разработки соответствующего тест-объекта.
Ключевые слова: текстовой набор, насыщенность текстового набора, программно-инструментальный метод определения насыщенности текстового набора печатных и электронных публикаций, универсальный тест-объект.
В Омском государственном техническом университете был разработан программно-инструментальный метод определения насыщенности текстового набора печатных и электронных публикаций с использованием инструментария программы для обработки изображений Adobe Photoshop [1—4], а совместно с коллегами из Белорусского государственного технологического университета — основанный на вышеуказанном методе способ определения степени заполнения полосы набора текстом [5, 6].
Недостатком в данном случае является использование выбираемых для исследования русскоязычных текстов, посимвольное содержание которых является различным. Модернизацией метода являлось бы использование текстового тест-образца, содержащего такие количества символов русскоязычного текста, включая межсловные пробелы, которые соответствовали бы частоте их встречаемости. Это позволит сделать метод универсальным и избавит от необходимости выбирать в качестве образцов конкретные тексты для исследования.
Для реализации проблемы универсализации на первом этапе были определены частоты встречаемости символов в составе русскоязычных текстов на общую тему и среднестатистическая длина русского слова — для определения частоты встречаемости межсловных пробелов [7, 8].
Целью данного исследования — второго этапа реализации проблемы универсализации метода и разработки тестового образца — являлось определение насыщенности текстового набора, создаваемого единичными символами. Это необходимо для расчета насыщенности текстового набора тестового образца,
набранного конкретным шрифтом с конкретными параметрами набора.
Методика создания тестового образца текстового набора, сформированного единичными символами, заключалась в следующем.
Набор текста единичными символами осуществлялся в прикладной программе для набора и форматирования текста Microsoft Office Word. Набор текста производится в колонке шириной 165 мм и высотой 257 мм определенной гарнитурой шрифта заданного начертания и кегля с заданным интерлиньяжем. Для обеспечения однородности межсловных пробелов текст набирается с выключкой влево с программным делением на строки. Однородность заполнения строк достигается за счет набора текста без деления на абзацы. Пример тестового образца текста, набранного единичным символом, показан на рис. 1.
Насыщенность текстового набора электронных и печатных публикаций, созданного единичными символами, производилась согласно [4]. Данные измерений сгруппированы в таблицы, аналогичные табл. 1.
На основании проведенного исследования установлены:
— значения насыщенности L( электронного текстового набора 24 сочетаний вариантов гарнитур, насыщенности, кегля шрифта и интерлиньяжа (табл. 2). Среднеквадратичное отклонение установленных значений не превышает 0,6 усл. ед., что составляет 0,23 %;
— значения насыщенности L( текстового набора печатных публикаций 4 сочетаний вариантов гарнитур, начертаний, кегля шрифта, интерлиньяжа (табл. 3).
ТЕХНИЧЕСКИЕ НАУКИ
ОМСКИИ НАУЧНЫЙ ВЕСТНИК № 2 (140) 2015
ч I
<< я
^ я сз\ ч
> (Т)
Н со
о к
И
О О
Ч И
К п К ^
Я
а>
„ Л
О) Р
в а
I к
' р)
р I
00 < ьо
I
> Е •
о! >
^ о ^
00 п> 2 3 3 К V
и
и
я
О
я
> *
К п
Я н
р) о
К §
§ О
п М
ы №
п о\
ЙГ1
о\ >
О ч
чз
№ &
Л
О
п Я
п
а а
К
г?» ^ р-1
О В X
^ ^ н
^ ш 2
н я
о о
> н
0) о
о «
я >
^ >
%
Й я
я я я я я
« ьЯ Р О
о я о о
^ й
Б н Р я о
Р й п
в р>
^ и § >
о
№ н Я Ч
О §
П ^
я к
О Ъ го
>
со Е ч й я о
§ I
Ю
о\ О
о ю
Я
2 0
Я 2
I о
к й
п ^
ьо ^ и
ьо Е "
03 - о
1 в ^
ьо § >
Ч
К Е
О
В
(Т>
К Я
га
о ч о о\
о\ о
О ^ £ к
п
я
К
Я<
п ^
я °
ГО и
О о;
Н щ
Я
О
Я § &
Я
Р о
Я О
я
и * о 2 о я
Ю ЬТ4 __
* * я
о Р
о ^
О» р)
^ О р) л
со О» М X3
Я
р
о
о
И р
я
_ . Я
я м
° 2 ° О Я >
н >8
П) 5 Я Я О Я
¿У § Ё ^ >8 ^
со Р
в ^
О 0)
И н
и р)
я о я
ьн ^
Я Ъ
Р О)
о» н о я
&4
и р
о
о» р
я
0
1 О)
я я
Е
о» Е н ь4
о >
Я И
н ^
я
а>
% та
И К
Е я В о
а>
н о
рЯ
О) >
^ о я
О)
-
Л о
н н
О Р
« й
° 2
О И
н >
р Я)
и я
> •
п> га
о
о о\
3
о
3 £ Р
Р> н . 2 £ >
I
1 я
О ^
оо § ^ §
сл
О
м к Е
и
я
о\
я
О) >
О
я
о я ч
(Т) ьо > •
(Т)
Я
>"1 О
ч
о
п
я
> р
га
о ч о о\
м -I
о я
> ^
Я О
Ч О
0) И
# р
я п
Е О
В п
аз П
I Я
о Й
а, ^
Я
I я
I о
Сп Я
03 ф
п
Л К«
я 2 Е о и >
О
аз г
§ 5 > ^
о Э я
я о
Й и
р>
§ ^ > ^
я ^
я сЗ
я я
8
В Н
п О Н п Й
ъ № о
Л Ч О) ч я тз
^ Н й я И м
^^ з
Н Н Я
п » 2
^ Я но? я 2
Н № Я л р •а я ®
> 43 тз - й ц
3
о
я 2
Г о
> о
г з
6 й я г
■Я §
Ш ш
шиш ш ы Б В В Н и ш ш ы ш Е В Н Ш Ш щ и щ ш Ш V V Ш щ Б В В Б В В ш ш ш ш ш ШШиШШ&Шш ^ ш т
№ (к1 № № № и1 Ц' № № И1 (1р № и1 О' № № № и1 № № № № № и' И1 Цр (!' № Цр И1 Ц' № О' № Ш № И' № (I1 И1 № (!' и1 О' И1 Ц'
111 Н1 I ■ Г Ц| [д| Г[| 1)1 11< <11 I ■ г Г11 Ц| и> Ц| Ц| 111 41 |,г Г[| [|| Ц( Ц| (|| Ц| (д| ГЦ Ц| (|| Ц( 1|| Ц1 |,г Ц| (|| Ц1 Ц| Щ 1|| Ц1
Щ Ш Щ IV Щ Ш (И Ш и' (1< и Ш № Ш II' Ш № III и* и< Ш Ш Ш II' Ш и< Ш Ш Ш II' и< № (11 № (1' и< и< и! Ш № и< Ш (II И< И' и<
^ (д* [д| ш Ц< (д! 1|< Ц1- (д! 11' (1р Ц1" Ц1 II' СД1 Ц1 Ц!" (Д1 (I1 Ц.' 11р Ц1" и1 ^^ С^1 Ц'
Ц1 Ц| I ^ да Ц| цУ I д! > ^ > 01 > Ц| 01 >
II1 11< № 1)1 11' (I1 IV (|1 IV V (|1 II1 II' О1 (II Ц1 II1 II' № II1 11' 1(1 № III II1 Ш № 1|1 |1' ^ Ц1 III (I1 Ш (|1 Ш Ц' (I1 II' Щ1 (V № IV Ш V Ц1 И' I)1 11<
I)1 и1 и1 и* и1 ^ и* и1 и1 и1 и' ц* и1 и1 и* Ц1 № № и1 ц* и1 и1 (1р и1 и1 ир № и' ир и1 и* и1 Ц| и< Ц* и1 (1р и1 и1 ир № № ир и1 и* и* и<
I)' и1 и1 и' и* [I1 и' и* II1 и1 и1 Ц1 и* и1 (I1 ир и1 и1 б1 (1' № и1 и1 (Д* II1 (I1 (1> (1р и1 V (I1 ир и1 и1 и1 (I1 иг А' и* 11> (I1 и> и' и* № ир и1 и1
Ц| ц* (и Ц| ш ш ш ш -Ц1 ц* (и |и гу си ц| Ш -Ц1 Ц* Ц| Ш Ц| Ш Ц| ш ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш Ш
и' и' II' С!1 II II' II' 141- С11 II' С1р и' Ц1 (Д!" С11 11' (1' С1' (11 ир 11' С11 11' Ш 5Д1 и-1" С11 II' 11' С1' и^ 11* и' 11' Ш 11' С!' II' №№№№№№№№№№№№№№№№№№№№№№№№№№
Ц* 5* ц! Д1 П* Ц1 Д* П1 дй Н| т Ц| п I ¿1 йа т Ы I Е| ?|| у» т т ЦI т ш т т т Ц| т ц I Ев т т цл Ц| ф 7д>
СшшшщшшшшЬшшш
(I1 (к' и1 (1^ II1 II-1 (1' С11 (к' (I1 (I1 (I' '(I1 ш (I' С11 1x1 (I1 (I1 (1' £1в (к' (I' С11 (к' ш (I1 (I1" и1 и1 (1' и1 и1 (I1 и1 и.1 ч1 и1 (к' Е11 и1 ир и1 и.1 и1 11' 11' и1 (с
и* (Д1 ^ 1У и^ (*р Ш (д^ (и Ц' (V Ш (I1 (V (У (I' (М (*' и' (д^ (*' ^ 1*' (к' (и (У (I' (М (I' (д* (1' и' (д^ (и ир (1> 11' Ь'
Ш щ ш т ^ ¿м т щ -Ц1 ш Ш Ш ¿и Ц| ш Ш ш Ш |И Ш Ш Ш ш -Ц1 ш Ш Ш Ш Ш Ш Ш Ш ДО Ш Ш Ш (Ы Ш Ш Ш Ц* Ш Ш Ц* Ш Ш ЦР Ш Ш
до |и Ш ш ш ^ Ш ДО Ш (I' (I1 II' Ш 11' (I1 11' (I* (!' (1' Ш Ц! [I1 II* 11' (¿1 II' II* (II- (1' (|1 (1' и' (Д1 (I1 II' 11' С1' (1'
Д! до Ц| ||1 ц. <¡1 Ц| ||1 щ Ц| Д! III ц. Д| ц. ||1 Ц| т ц» Д| т Ц| (ц| Л1 Ц| ц> Ц| т Ц1 т Ц| д ■ Ц| т В' ДО (ц| т Ц| Л1 Ц'
шдодош&Сдодошдодоф&Сдо&шдоС
ш до до ш до щ Ш ДО ДО ДО Ш ДО ^ Ш ДО Ш ДО ДО Ш ДО [I1 ДО (I' С11 (Д' 1Д1 Ц!- СД1 (Д1 (1' С!1 (1' 11' (I1" С11 ДО С11 ДО (1' (Я1 11' ч1 ДО ДО С!1 до
¡^^ ¡^ ^^а ^^р и* с^ ¡ь* и!' и^- и!-^ "¡^ и!^ "С!' и!^ и!^ и!^ с^ ¡ь* и!^ {ь^ ¡Е' (х^ "¡^^ и!^ и!^ ъь^ и!* и!^ чЕ' и!* Ск* ¡^^ и!^ (х^ "¡ь* и!*
ДО и' ДО ДО ДО ДО ДО и' (1р До ДО До и' ир ДО ДО Ш ДО и' и' ДО и' и' и' (II ДО и' ДО ДО и' и' ДО ДО ДО и> III ДО и' ДО ДО и' ДО и' ДО ДО До и> № до
до до до до до до до до до до до до до до до до [¿I до до до до до ДО (I' ДО (к' 11' ДО ДО (I' (1' (Д| (1' 11' ДО ДО (I1 II' 11' (I1 ДО 11' ДО ДО ДО ДО (1' ДО (1'
ДО до до ДО ДО ДО ДО ДО ДО ДО ДО ДО ДО ДО ш ш ДО до ш ш до ш ш ш ш до
В В В В Б В Б Б Б Б Бдодододододододододододододододо до ш и ш Б до Б Б до до до ш до
(1' 11' и' ДО 11' С1р ДО (I' С1р и' и' и' (1^ (1р и' и' и< и' и' и' ин ДО Ц' и' С1' ДО и' и' ДО (Д| и' ДО С11 и' (Д' ДО и! До ДО (Д| до до до до до до до до до
Ц| ДО Ц' Ц1 ДО ДО Ц1 Ц| ДО ДО ДО ДО ДО ДО ДО Ц1 до до до до до до ДО СД1 (I' (1' ДО (к1 ДО ДО ДО ДО Ш ДО ДО ДО до до до до ш до до ДО ДОДОДОДОДОДОДОшДОДО
до до до [II до цр до до до до до [II до до до до до до до до ДО ДО ДО ДО ш ДО Л* Л' № (У Л' (У Л' V (Д* Ед( ДО ДО ДО ДО ДО ДО ДО ДО ДО
(I1 II1 II' ДО 11' С!1 II1 Т1р [I1 II1 ДО (I1 ДО ДО и' ДО Ч1 II1 II1 51' II1 [I1 (I1 Цр [I1 (I1 (I1 С!1 1.1.1 [|1 ДО ДО ДО ДО ДО ДО ДО ДО ш ДО ДО Ш Ш Ш и! [I1 II1 Ц' [I1 и1
ДО ДО ир ДО (!' ир ДО ДО ДО ДО ДО ДО ДО ДО ДО а' ДО ДО ДО ДО ДО ДО ДО ДО ДО ДО ДО ДО ДО ДО ДО ДО ДО ДО ДО ДО ДО Ир (1' до до до до до до до до до до до
[II ДО ДО ДО ДО Ц| ДО ||1 ЦР ДО [Д1 ДО ДО Ць [Д1 ДО ДО Ц| ДО Ц| ДО Цг Ц| ДО Ц| [Д| ДО Ц| Цн [|1 ДО ДО ДО Ц| ДО до
ир до до до до до до до ир до ир до и' до до до ир ДО ДО ДО 11' до до до до до до (и ДО (У & 5* до V IV до до до до до до до до до до до ДО (V до
додошшшшдошшшшш
ДО До и1 ДО ДО ДО ДО (1' ДО ДО И1 ДО И' ДО ДО И1 С11 До ДО До И' ДО ДО и' И1 ДО ДО ДО (1' и1 ДО ир Чр ДО и» ДО ДО и1 ДО (1' И1 ДО ДО ДО (1' И1 ДО ДО И1 до
и**- ^др (V ^др и^ ^Д| и^ ^Др (У СД' ХДР (V СМ (У ^Д' 1У СД' (Д' ^ ^Д' 1Д^ ^ ^Д' IV (Д' ^ ^Д' ^ ^Д' ^ (Д' 1Д1 ^ ^Д' ЧД' (М СД'
[!< и' До 11' ДО ДО и' II' ДО ДО и' ДО ДО ДО И' и' ДО ДО ДО ДО ДО И' И' До ДО ДО и' ДО 11р И' ДО ДО ДО и' ДО ДО ДО И' ДО ДО ДО ДО ДО ДО ир до до до до
Таблица 1
Насыщенность (уровень яркости) текстового набора электронного текста, набранного единичными символами, шрифтом гарнитуры Тахома прямого светлого начертания кегля 12 пт с интерлиньяжем 14,4 пт
Символ Насыщенность (средний уровень яркости), усл. ед. Символ Насыщенность (средний уровень яркости), усл. ед.
а 197,4±0,56 А 194,3±0,50
б 185,7±0,37 Б 185,8±0,42
в 193,3±0,47 В 178,3±0,42
г 216,3±0,37 Г 210,5±0,34
д 189,2±0,51 Д 177,9±0,31
е 197,5±0,62 Е 190,3±0,30
ё 190,4±0,37 Ё 183,9±0,28
ж 202,3±0,50 Ж 189,9±0,43
з 203,5±0,40 З 193,6±0,37
и 202,7±0,37 И 186,9±0,46
й 189,4±0,50 Й 175,6±0,37
к 203,1 ±0,38 К 192,6±0,40
л 206,5±0,34 Л 197,5±0,62
м 202,9±0,43 М 187,7±0,50
н 207,1 ±0,50 Н 196,5±0,40
о 203,9±0,48 О 197,1 ±0,48
п 206,6±0,45 П 197,6±0,37
р 190,5±0,34 Р 193,5±0,40
с 208,7±0,37 С 203,9±0,46
т 215,9±0,46 Т 211,6±0,40
у 202,3±0,37 У 203,8±0,47
ф 183,6±0,48 Ф 189,8±0,55
х 205,6±0,50 Х 196,5±0,40
ц 201,2±0,42 Ц 190,8±0,39
ч 213,1 ±0,46 Ч 205,9±0,28
ш 202,4±0,60 Ш 192,2±0,51
щ 198,5±0,58 Щ 187,5±0,34
ъ 203,8±0,61 Ъ 199,5±0,40
ы 203,6±0,37 Ы 190,2±0,51
ь 206,1 ±0,48 Ь 195,1 ±0,46
э 202,5±0,62 Э 192,9±0,43
ю 201,8±0,47 Ю 192,8±0,39
я 199,4±0,37 Я 186,8±0,47
244,5±0,17 - 244,5±0,17
, 232,5±0,17 пробел 255
Таблица 2
Параметры текстового набора электронных тестовых образцов
№ п/п Гарнитура шрифта Начертание Кегль, пт Интерлиньяж, пт
1 Тахома прямое светлое 12 14,4
2 Тахома прямое светлое 12 14
3 Тахома прямое светлое 12 15
4 Тахома прямое светлое 13 15,6
5 Тахома прямое светлое 13 15
6 Тахома прямое светлое 13 16
7 Джорджия прямое светлое 12 14,4
8 Джорджия прямое светлое 12 14
9 Джорджия прямое светлое 12 15
10 Джорджия прямое светлое 13 15,6
11 Джорджия прямое светлое 13 15
12 Джорджия прямое светлое 13 16
13 Тахома прямое полужирное 12 14,4
14 Тахома прямое полужирное 12 14
15 Тахома прямое полужирное 12 15
16 Тахома прямое полужирное 13 15,6
17 Тахома прямое полужирное 13 15
18 Тахома прямое полужирное 13 16
19 Джорджия прямое полужирное 12 14,4
20 Джорджия прямое полужирное 12 14
21 Джорджия прямое полужирное 12 15
22 Джорджия прямое полужирное 13 15,6
23 Джорджия прямое полужирное 13 15
24 Джорджия прямое полужирное 13 16
Таблица 3
Параметры текстового набора тестовых образцов печатных публикаций
№ п/п Гарнитура шрифта Начертание Кегль, пт Интерлиньяж, пт
1 Таймс прямое светлое 10 11
2 Таймс прямое светлое 10 12
3 Таймс прямое полужирное 14 14,5
4 Таймс прямое полужирное 14 15
ва М. М., Зильберглейт М. А., Токарь О. В., Сысуев И. А., Гри-горова Ю. С., Тимощенко О. А ; заявитель и патентообладатель Белорус. гос. технолог. ун-т. — № а 20110681 ; заявл. 17.05.2011 ; опубл. 30.08.2013. - 3 с.
6. Пат. 17390 Белоруссия, МПК в 01 Б 21/00. Способ определения степени заполнения полосы набора текстом / Косова М. М., Зильберглейт М. А., Токарь О. В., Сысуев И. А., Гри-горова Ю. С., Тимощенко О. А. ; заявитель и патентообладатель Белорус. гос. технолог. ун-т. — № а 20110943 ; заявл. 07.07.2011 ; опубл. 30.08.2013. - 3 с.
7. Сысуев, И. А. Модернизация метода определения насыщенности текстового набора печатных и электронных публикаций / И. А. Сысуев, Е. А. Державина, И. В. Пруд // Инновационные решения при реструктуризации логистических систем : материалы заоч. науч.-практ. конф. с междунар. участием. — Омск, 2014. — С. 44 — 48.
8. Сысуев, И. А. К вопросу о разработке универсального тест-объекта для определения насыщенности текстового набора русскоязычных текстов / И. А. Сысуев, И. В. Пруд, Е. А. Державина // Омский научный вестник. Сер. Приборы,
машины и технологии. С. 101-107.
Омск, 2015.
№ 1 (137).
СЫСУЕВ Игорь Александрович, кандидат технических наук, доцент (Россия), доцент кафедры «Оборудование и технологии полиграфического производства» Омского государственного технического университета (ОмГТУ).
ПРУД Ирина Валерьевна, ассистент кафедры «Оборудование и технологии полиграфического производства», магистрант гр. ТПП-514 нефтехимического института ОмГТУ.
ДЕРЖАВИНА Екатерина Александровна, магистрант гр. ТПП-514 нефтехимического института ОмГТУ.
ВДОВИНА Мария Владимировна, кандидат филологических наук, старший преподаватель кафедры английской филологии и лингвокультурологии Санкт-Петербургского государственного университета.
Адрес для переписки: [email protected]
Статья поступила в редакцию 02.04.2015 г. © И. А. Сысуев, И. В. Пруд, Е. А. Державина, М. В. Вдовина
УДК 681.3/655.244
И. А. СЫСУЕВ И. В. ПРУД Е. А. ДЕРЖАВИНА М. В. ВДОВИНА
Омский государственный технический университет
Санкт-Петербургский государственный университет
ТЕСТОВЫЙ ОБРАЗЕЦ СРЕДНЕСТАТИСТИЧЕСКОГО РУССКОЯЗЫЧНОГО ТЕКСТА ДЛЯ ОПРЕДЕЛЕНИЯ НАСЫЩЕННОСТИ ТЕКСТОВОГО НАБОРА ЭЛЕКТРОННЫХ И ПЕЧАТНЫХ ПУБЛИКАЦИЙ_
В статье рассматривается программно-инструментальный метод определения насыщенности текстового набора печатных и электронных публикаций. Показана возможность модернизации метода, обеспечивающей универсализацию его использования относительно русскоязычных текстов за счет использования специального тестового образца. Приведена методика формирования универсального тест-объекта. Ключевые слова: текстовой набор, насыщенность текстового набора, программно-инструментальный метод определения насыщенности текстового набора печатных и электронных публикаций, универсальный тест-объект.
В [1-2] были рассмотрены вопросы модернизации программно-инструментального метода определения насыщенности текстового набора электронных и печатных публикаций с использованием инструментария программы для обработки изображений Adobe Photoshop [3-6].
Модернизация метода заключается в использовании текстового тест-образца, содержащего такие количества символов русскоязычного текста, включая межсловные пробелы, которые соответствуют частоте их встречаемости. Это позволяет сделать метод универсальным и избавляет от необходимости выбирать в качестве образцов конкретные тексты для исследования.
Для реализации проблемы универсализации на первом этапе были определены частоты встречаемости символов в составе русскоязычных текстов на общую тему и среднестатистическая длина рус-
ского слова — для определения частоты встречаемости межсловных пробелов [1, 2]. На втором этапе определены насыщенности текстового набора, создаваемого единичными символами, что необходимо для расчета насыщенности текстового набора тестового образца, набранного конкретным шрифтом с конкретными параметрами набора.
Целью данного исследования — третьего этапа реализации проблемы универсализации метода и разработки тестового образца — являлось формирование тестового образца и определение его расчетной и фактической насыщенности.
Методика формирования тестового образца текстового набора среднестатистического русскоязычного текста заключалась в следующем.
После задания параметров текстового набора: гарнитуры, насыщенности, кегля шрифта и интерлиньяжа необходимо определить количество сим-