Научная статья на тему 'СТАНДАРТИ, СТРУКТУРА ТА ТЕХНОЛОГіЯ СТВОРЕННЯ КНИГ, ЩО «РОЗМОВЛЯЮТЬ»'

СТАНДАРТИ, СТРУКТУРА ТА ТЕХНОЛОГіЯ СТВОРЕННЯ КНИГ, ЩО «РОЗМОВЛЯЮТЬ» Текст научной статьи по специальности «Экономика и бизнес»

CC BY
313
76
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЦИФРОВА КНИГА / ЩО «РОЗМОВЛЯє» / ЛЮДИ З ВАДАМИ ЗОРУ / ШРИФ БРАЙЛЯ / МУЛЬТИМЕДіА / КОНТЕНТ / DIGITAL TALKING BOOK / VISUALLY IMPAIRED / BRAILLE / MULTIMEDIA / CONTENT

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Лозицький О. А., Пасічник В. В.

Стаття описує процес створення цифрової книги, що «розмовляє», у форматі DAISY. Розглянуто основні механізми побудови зв’язків між текстовими та аудіо-блоками книги, файлову структуру та основні характеристики книги у форматі DAISY.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Standards, structure and technology to create books that "talk"

This paper presents a framework for the conversion of text books to full featured DTBs. The introduction of search, cross-referencing and annotation mechanisms, with multimedia and trough multimodal capabilities are considered.

Текст научной работы на тему «СТАНДАРТИ, СТРУКТУРА ТА ТЕХНОЛОГіЯ СТВОРЕННЯ КНИГ, ЩО «РОЗМОВЛЯЮТЬ»»

Литература

1. Губинский А.И. Надежность и качество функционирования эргатических систем. Л.: Наука, 1982. 270с.

2. Информационно-управляющие человеко-машинные системы: Исследование, проектирование, испытания: Справочник/ Адаменко А.Н., Ашеров А.Т., Лавров Е.А. и др.. под общ. ред. Губинского А.И. и Евграфова Е.Г.- М., Машиностроение, 1993.

- 528с.

3. Адаменко А.Н., Медынцев А.Л. Автоматизация анализа функциональных сетей на основе использования языка исчисления предикатов и системы логического вывода «ПРОЛОГ-СМ»//Изв. ЛЭТИ.Вып. 337. 1985. С.14-21.

4. Ротштейн А.П., Штовба С.Д. Нечеткая надежность алгоритмических процессов. - Винница: Континент - ПРИМ, 1997г.

- 142с.

5. Гриф М.Г., Цой Е.Б. Автоматизация проектирования процессов функционирования человеко-машинных систем на основе метода последовательной оптимизации. Новосибирск: Изд-во НГТУ,2005.- 264 с.

6. Пасько Н.Б. Редукція функціональних сіток в ергономічному проектуванні / Вісник Сумського національного аграрного університету. Серія “Механізація та автоматизація виробничих процесів”. - Суми: СНАУ, 2006. - Вип. 9(15). - С. 55-67.

7. Лавров Е.А., Пасько Н.Б. Моделирование надежности человеко-машинных систем: учет ошибок разных типов // ВосточноЕвропейский журнал передових технологий. Сер. Системы управления. - Харьков, 2007 - 2/2 (26) -2007.С.-58-62.

8. Ашеров А.Т., Сажко Г.И., Лавров Е.А., Хоменко В.Г., Полякова Ю.Н.. Эргономика информационных технологий в примерах и задачах: Учебное пособие. - Горловка: ЧП «Видавництво Ліхтар», 2007. - 214с.

9. Е.А. Лавров, Н.Б. Пасько. Информационная модель для поддержки принятия решений оператором-руководителем// Восточно-Европейский журнал передовых технологий. Сер. Информационные технологии. - Харьков, 2009- 6/2 (42) с.49-53.

-------------------□ □----------------------

Стаття описує процес створення цифрової книги, що «розмовляє», у форматі DAISY. Розглянуто основні механізми побудови зв’язків між текстовими та аудіо-бло-ками книги, файлову структуру та основні характеристики книги у форматі DAISY Ключові слова: Цифрова книга, що «розмовляє», люди з вадами зору, шриф Брайля, мультимедіа, контент

□------------------------------------□

Статья описывает процесс создания цифровой книги, которая «разговаривает», в формате DAISY. Рассмотрены основные механизмы построения связей между текстовыми и аудио-блоками книги, файловая структура и основные характеристики книги, в формате DAISY

Ключевые слова: Цифровая книга, которая «разговаривает», люди с изъянами зрения, шриф Брайля, мультимедиа, контент

□------------------------------------□

This paper presents a framework for the conversion of text books to full featured DTBs. The introduction of search, cross-referencing and annotation mechanisms, with multimedia and trough multimodal capabilities are considered Key words: Digital Talking Book, visually impaired, Braille, multimedia, content -------------------□ □----------------------

УДК 004.652.4+004.827

СТАНДАРТИ, СТРУКТУРА ТА ТЕХНОЛОГІЯ СТВОРЕННЯ КНИГ, ЩО «РОЗМОВЛЯЮТЬ»

О.А. Лозицький

Аспірант*

В.В. Пасічник

Доктор технічних наук, професор, завідувач кафедри* Контактний тел.: 093-500-02-13 Е-mail: netexpo@yahoo.com *Кафедра інформаційних систем та мереж Національний університет «Львівська політехніка» вул. С. Бандери 12, м. Львів,79013

1. Вступ

У світі нараховують щонайменше 161 мільйон незрячих людей та осіб з вадами зору, з них понад 37 мільйо-

нів повністю сліпих. Ця кількість є суттєво більшою за рахунок осіб, які не можуть читати друковані матеріали, або не мають доступу до Інтернет ресурсів. Водночас менше ніж 5% опублікованого матеріалу і менш як 20% веб-сайтів є доступними для цієї категорії людей.

З

Цифрові книги, що «розмовляють» (DTB - Digital Talking Book), охоплюючи як аудіо-, так і текстові дані, є неоціненним мультимедійним інформаційним ресурсом для людей з вадами зору.

Стандарт ANSI/NISO (American National Standards Institute/National Information Standards Organization) встановлює специфікації для цифрових книг, що «розмовляють» (DTB), для осіб з повною або частковою втратою зору, людей з обмеженою дієздатністю або іншими фізичними вадами при читанні. Його метою є забезпечення користувачів спеціальним інформаційним контентом у поєднанні із системою підтримки його відтворення на базі різноманітних сервісів та їх організації.

Цей стандарт забезпечує специфікації файлів книг DTB і їх взаємозв’язків. Він також містить специфікації для DTB-пристроїв відтворення у двох сферах: робота програвача відповідно до вимог файла і поведінка програвача в ситуаціях, визначених вимогами користувача.

Стандарт ANSI/NISO розроблений для узагальнення широко використовуваних стандартів і специфікацій, у тому числі від WWW (World Wide Web Consortium, W3C) Консорціуму Всесвітньої павутини і Open eBook Forum™ (Форум вільних електронних книг). Використання цих специфікацій і технологій має за мету реалізувати швидке і послідовне прийняття цього стандарту широким користувацьким загалом.

Цифрові книги, що «розмовляють», аудіо-потоки, процеси перетворення, програвачі і синтезатори розробляють та створюють для можливості донесення їх вмісту до людей з фізичними обмеженнями і відхиленнями. Їх проектують, щоб подавати інформацію у відмінних від звичайного друкованого тексту форматах, адже далеко не всі користувачі з фізичними вадами можуть читати надруковані документи.

Такі формати забезпечують подання інформації за допомогою голосового аудіо-запису, абетки Брайля (Braille), мовного синтезатора, широкоформатного друку, спеціальних програвачів з можливістю зворотного повернення та перезавантаження для людей з вадами зору та з іншими фізичними обмеженнями.

Цифрова книга, що „розмовляє (DTB), - це набір електронних файлів відповідної тематики для подання інформації за допомогою альтернативних засобів відображення та відтворення інформації, а саме синтезованих мовних текстів, рельєфно-крапковою алфавіту Брайля, візуальних зображень і, зокрема, широкоформатного друку. Коли файли сформовані і подані в DTB відповідно до зазначеного стандарту, вони створюють широкий спектр можливостей, як, наприклад, швидка, гнучка навігація; маркування і використання закладок; пошук за ключовими словами; пошук слів за звуковим запитом; користувацький контроль відібраного за запитом контенту (наприклад, зноски, номери сторінок тощо). Такі способи подання інформації вирішують чимало проблем для читачів з вадами зору. Контент книг, що «розмовляють» DTBs, подається за допомогою аудіо-сигналів, комбінації аудіо, тексту і зображень або лише за допомогою тексту.

Програвачі DTB можуть мати у своєму складі велику кількість різних опцій. Найпростішими є мобільні пристрої з можливістю відтворення аудіо-файлів,

складніші мобільні пристрої містять у своєму складі мовні синтезатори. Сучасні системи програвачів, що створюються, підтримуватимуть візуальний і звуковий супровід, синтез мовних сигналів і виведення інформації за допомогою абетки Брайля на відповідний дисплей.

2. Розроблення стандарту книг, що «розмовляють»

Система керування цифровим доступом DAISY (Digital Accessible Information System) - це відкритий міжнародний стандарт для мультимедійного доступу, розроблений DAISY-Консорціумом разом із працівниками бібліотек для осіб з фізичними недоліками та вадами зору у співпраці з передовими науковцями і користувачами з усього світу.

Ядро технології DAISY - це синхронізація тексту, графіки і аудіо-записів на базі рекомендацій W3C відповідно до потреб людей, які вимагають особливого доступу до інформації.

Найсучасніша специфікація DAISY відома як ANSI/NISO Z39.86-2005 [1].

На сьогодні до Консорціуму входять 14 рівноправних країн-учасників, у яких реалізуються цифрові книги, що „розмовляють” , у форматі DAISY. Також зареєстровано біля 60 країн-учасників, які не мають права голосу.

Станом на 2006 рік приблизна кількість книг, доступних у DAISY-форматі, сягала 145 тисяч. Виробники, які займаються виготовленням книг із підтримкою стандарту DAISY, приєднуються до Консорціум як “друзі”, наприклад, 25 світових компаній, включаючи Microsoft та SONY у 8 країнах, є друзями консорціуму DAISY.

Початкова версія DAISY створена у Швецькій національній бібліотеці Брайля у вигляді книги, що „розмовляє”, як цифрова система, основана на аудіо-інформації, яка мала б відповідати вимогам звичайної книжки, але на електронному носії (касеті). На той момент вимогою до такої книжки була таблиця зі змістом і вказівник, за допомогою якого можна виконувати на-віґацію сторінками книги, що „розмовляє”. Якість звуку, тривалий час програвання, зручність і сумісність з розмовними книгами міжнародних бібліотек були запозичені у видавців професійних аудіо-книг.

Одним із ключових моментів у процесі розроблення та еволюції технології DAISY була участь самих користувачів.

Ще у грудні 1995 року Педро Зуріта (Pedro Zurita), Генеральний секретар Всесвітньої спілки сліпих, приєднався до підготовчої наради зі створення DAISY-Консорціуму і звернувся із закликом від імені групи сліпих користувачів. Норма Тоукедо (Norma Toucedo) з Уругваю, Йаап (Yaap) з Нідерландів, Єва Бйорк і Кікі Нордстрім (Eva Bjork and Kicki Nordstrom) зі Швеції та багато інших дослідників надали велику підтримку для розвитку DAISY від імені всесвітнього товариства сліпих (The World Blind Union, WBU) [2].

Відділ бібліотек для сліпих/ IFLA взяв участь у конференції IFLA General Conference 1996 року у Токіо, щоб провести міжнародний симпозіум щодо книг, які «розмовляють», для вивчення цифрових технологій, які б відповідали всім вимогам користувачів, а також

£

послугам провайдерів. Висновок симпозіуму полягав у тому, що жодна із цифрових аудіо-технологій на тому етапі не відповідала вимогам розповсюдження книг, що «розмовляють».

На підставі угоди DAISY-Консорціуму, затвердженої у Цюріху в квітні 1997 року, Консорціум провів міжнародну технічну нараду за тематикою стандарту DTB, яка відбулася в Сігтуні, недалеко від аеропорту Арланда у Стокгольмі. Як результат, для DAISY-Кон-сорціуму було запропоновано проаналізувати веб-технології і стандарти, зокрема, HTML (Hyper Text Markup Language) та SMIL (Synchronized Multimedia Integration Language).

Із часом фахівці DAISY-формату почали досліджувати стандарти, які базуються на веб-технологіях (HTML, SMIL та інші). Одним з унікальних розроблень DAISY-Консорціуму в технологічному напрямі є проектування та створення безкоштовного програмного інструменту, який підтримуватиме всі мови згідно з DAISY-форматом і надасть користувачам можливість навігації в аудіо-чи відео-контенті у структурованому вигляді.

Технічні специфікації книг, що «розмовляють», у форматі DAISY, які розроблені на основі рекомендацій наради у Сігтуні, затверджено як версію DAISY 2.0 у вересні 1998 року.

DAISY-Консорціум у співпраці з IFLA/LBS, а також IFLA/LSDP та громадськими організаціями інвалідів, зустрілися на саміті Організації Об’єднаних Націй з питань інформаційного суспільства (World Summit on the Information Society, WSIS). WSIS з проблем інвалідів успішно додали універсальну концепцію розроблень у документи саміту [3]. DAISY є одним з найбільш яскравих прикладів універсальних розроблень, що задовольняють потреби кожного, у тому числі і людей з обмеженими можливостями.

Подальшим технічним кроком розвитку DAISY є введення повного доступу до об’ємних рисунків, переосмислення прав інтелектуальної власності, збереження і розвиток культури первісного змісту, і передавання різноманітності людських знань для майбутніх поколінь.

Використовуючи технологію DAISY, бібліотеки і бібліотекарі мають змогу розширювати та впроваджувати на практиці досягнення і здобутки Консорціуму, багатьох вчених і науковців. Вони дають змогу неповносправним людям краще „бачити” досягнення людства, вивчати інформаційні, гуманітарні й інші дисципліни, „йти в ногу” з розвитком суспільства, досягнути результатів, які під силу здоровим людям. Синхронізована мультимедіа - це ключова бібліотечна технологія бібліотек у цьому напрямі найближчого майбутнього.

3. Структура книги, що «розмовляє», та її стандартизація

Одна із переваг книги, що „розмовляє”, поданої в DAISY-форматі, полягає у можливості індексування і пошуку інформації за ключовими словами. Користувачі можуть прослухати всю книгу лінійно, не перевертаючи касету, а засоби навігації дозволяють швидко переходити від одного розділу до іншого, від абзацу до абзацу або відзначати закладкою відповідні

місця в тексті для повторного прослуховування (прочитання).

Узагальнено можна сказати, що на аудіо-книгу накладається спеціальна навігаційна оболонка, і „читач” може не тільки прослухати текст, але й працювати з ним: робити закладки, примітки, оперативно отримувати потрібну інформацію.

Залежно від жанру визначається власне структура DAISY-книги. Так, для популярних романів і інших книг з простою лінійною структурою, які рідко використовуються в освітніх цілях і зазвичай читаються послідовно від початку до кінця, цілком достатньою є наявність аудіо-запису з можливістю переходу від розділу до розділу. Цифрові аудіо-записи окремих неху-дожніх творів будуть значно зручнішими для читання, якщо користувач матиме змогу „пересуватися” структурними поділами книги (наприклад, частинами, розділами, підрозділами) і при цьому зможе обійтися без перегляду повного текстового файла.

Зазвичай, книги, що „розмовляють”, зберігаються на компакт-дисках або картах пам’яті (flash memory cards). Карти пам’яті є зручнішими і надійнішими у порівнянні з CD, адже вони набагато менших розмірів, мають більший об’єм пам’яті для зберігання інформації, в них відсутні рухомі частини.

Однією з проблем стандарту книги, що „розмовляє”, є переклад та опис малюнків, діаграм, формул, адже при перекладі результат може суттєво відрізнятися. Альтернативою є використання спеціальних додатків, наприклад, для перекладу математичних формул використовується Markup Language (MathML), для діаграм і графіків - Scalable Vector Graphics (SVG). Ці формати дають змогу користувачам „переглядати” рисунки, чути їх опис за допомогою синтезатора голосу, конвертувати їх в інші формати, такі як формат шрифту Брайля чи тактильні дисплеї.

Специфікація DAISY 2.02 використовує багато перехресних посилань між текстовим XHTML-файлом і контрольним файлом формату SMIL. Використання таких перехресних посилань у звичайних книгах є неможливим. Отже, для остаточного використання формату DAISY треба було чекати на розроблення інструментів, які б спростили створення контенту у форматі DAISY. Вперше такий професійний інструмент був репрезентований 2000 року. Створення контенту у форматі DAISY розпочалося трохи згодом.

Відгуки користувачів, редакторів і виробників DA-ISY-програвачів, одночасно з наданням формату DAISY формального стандарту, призвели до перегляду версії стандарту 2.02, який став стандартом ANSI/ NISO Z39.86-2002. Цей стандарт був оновлений 2005 року і одержав назву Z39.86-2005, або ж DAISY 3. На відміну від стандарту DAISY 2, у якому використовувалася мова XHTML, стандарт DAISY 3 базувався на використанні мови XML, що дозволило значно багатше використовувати елементи формату. Підсумовуючи, скажемо, що формат DAISY 3 став функціональним розширенням формату DAISY 2.

Важливою особливістю специфікації формату DAISY 3 є те, що вона надає можливість модульного розширення. Одним з перших такого роду розширень стало використання математичних формул, яке було затверджене 2007 року. Математичне розширення, яке базується на MathML [4], рекомендується W3C для

З

кодування математичних формул в XML. Додавання математичного модуля до формату DAISY показує, що формат DAISY може розвиватися за рахунок об’єднання стандартів з інших областей. Керування відео та цифровими правами є власне такими областями. DAISY-Консорціум уважно стежить за розвитком мови XML і постійно розглядає вимоги для майбутніх версій.

Книга у форматі DAISY може складатися лише з аудіо, лише з тексту і зображень, або їх комбінації. Всі книги формату використовують спільний набір файлових типів, хоча деякі файли є необов’язковими. Практично всі типи файлів базуються на основі XML. Нижче перелічені основні типи файлів, які входять до складу книги формату DAISY З:

• пакетний файл;

• файл текстового контенту;

• файл зображення;

• аудіо-файл;

• файл синхронізації;

• файл навігаційного контролю;

• ресурсний файл;

• файл презентації стилю;

• файл перетворень.

Нижче наведені базові специфікації та структури файлів за стандартом DAISY З [5].

Пакетний файл DTB (The DTB Package File)

Пакетний файл DTB містить загальну інформацію про книгу, а також про файли, які забезпечують відповідні зв’язки у структурі книги, що «розмовляє».

У структурі публікації описуються основні частини пакетного файла, а саме :

• ІДЕНТИЧНІСТЬ ПАКЕТУ (PACKAGE IDENTITY) - унікальне ім’я для публікації Open eBook;

• МЕТАДАНІ (METADATA) - метадані публікації (заголовок, автор, видавець і т.ін.);

• МАНІФЕСТ (MANIFEST) - список файлів (документи, зображення, таблиці стилів шрифтів тощо), з яких формується публікація; МАНІФЕСТ також включає опис типів файлів, які не підтримуються цією специфікацією;

• ПОРЯДОК (SPINE) - впорядкування документів, що забезпечує їх лінійне читання;

• ДОДАТКОВІ ЛАНЦЮГИ (TOURS) - набір додаткових послідовностей для читання публікації;

• ОПИС (GUIDE) - набір посилань на головні конструктивні елементи публікації, як, наприклад, зміст, передмова, бібліографія і т.ін.

Наведемо приклад пакетного файл:

<?xml version="1.0"?>

<!DOCTYPE package PUBLIC "+//ISBN 0-9673008-1-9//DTD OEB 1.2 Package//EN"oebpkg12.dtd">

<package xmlns-"http://openebook.org/namespaces/oeb-package/1.0/" unique-identifier-"foo">

<metadata>...</metadata>

<manifest>...</manifest>

<spine>...</spine>

<tours>...</tours>

<guide>...</guide>

</package>

Цифрова книга, що «розмовляє», відповідно до цього стандарту повинна містити лише один пакетний файл у форматі XML 1.0, що узгоджується з OEBF (Open eBook Forum) структурою публікації. Пакетний

файл зберігається з розширенням «.opf». Якщо ж DTB містить додаткові медіа-елементи, то аналогічний пакетний файл має створюватися для кожного такого елементу.

ID -схема книги, що «розмовляє» (DTB ID Scheme)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для ідентифікації цифрових публікацій допускаються різні схеми. У випадку з цифровою книгою, що «розмовляє», завданням ідентифікатора є проста ідентифікація публікації з урахуванням її унікальності. Головною метою вимоги унікальності є запобігання колізії імен файлів у закладках. Саме для цього і використовується проста DTB id-схема. Відповідно до цієї схеми, ідентифікатор книги DTB містить рядок, відокремлений дефісом, в якому вказується код країни відповідно до стандарту [ISO 3166], унікальний код видавництва в межах його країни, і унікальний ідентифікатор у межах видавництва. Наприклад, us-afb-x12345. Ця схема забезпечує просте вирішення проблеми унікальності, яка постає перед видавцями DTB.

X-метадані (X-Metadata)

Кожне ім’я х-метаданих в подальшому відображається або як «Повторюване» (яке вживається більше як однин раз), або «Не повторюване». Також можливе введення інших типів х-метаданих, відповідно до потреб видавців книг, що «розмовляють». Проте, імена метаданих за цим стандартом не можуть починатися з префіксу «dtb:». Програвачі не повинні видавати помилки, стикаючись з невідомими метаданими. У такому випадку реалізований принцип їх ігнорування.

У табл. 1 подані всі можливі типи і розширення файлів, які можуть використовуватися в маніфесті (декларації) пакету.

Таблиця 1

Типи і розширення файлів, які можуть використовуватися в маніфесті

Тип файла (формат) Тип медіа-файла MIME (Комплексні розширення для інтернет-пошти) Розширення файла

MPEG-4 AAC audio/mpeg4-generic .mp4

MPEG-1/2 Layer III ^З) audio/mpeg .mp3

Linear PCM - RIFF WAVE audio/x-wav .wav

JPEG image/jpeg .jpg

PNG image/png .png

Масштабована векторна графіка (Scalable Vector Graphics, SVG) image/svg+xml .svg

Каскадні таблиці стилів (Cascading Style Sheets, CSS) text/css .css

Файли SMIL application/smil .smil

Пакетний файл text/xml .opf

DTD та фрагменти DTD (об’єкти або модулі) application/xml-dtd [no requirement]

Файл навігаційного контролю (Navigation Control File, NCX) application/x- dtbncx+xml .ncx

Текстові файли контенту (Textual content files, dtbook) application/x- dtbook+xml .xml

Файл ресурсу application/x- dtbresource+xml .res

Е

Нижче наведений приклад маніфесту (декларації) для книги, що «розмовляє», з використанням аудіо, структури і тексту:

<і1еш id=llopfl Ь^="ге.орГ media-type=lltext/xmГl />

<йет id="text" hгef="гs.xml" media-type="text/x-dtbook+xml" />

<йет id="text_style" href="dtbbase.css" media-type="text/css" />

<item id="ncx" href="rs.ncx" media-type="application/x-dtbncx+xml" /> <item id="ncx_style" href="ncx16.css" media-type="text/css" />

<item id="SMIL" href="rs.smil" media-type="application/smil" />

<item id="foreword" href="rs_fwdx.mp3" media-type="audio/mpeg" />

<item id="standards" href="rs_stdx.mp3" media-type="audio/mpeg" />

<item id="appendices" href="rs_app.mp3" media-type="audio/mpeg" />

<item id="index" href="rs_index.mp3" media-type="audio/mpeg" />

<item id="fig_01" href="fig1.png" media-type="image/png" />

<item id="resource" href="rs.res" media-type="application/x-dtbresource+xml" />

<item id="resource_audio" ^^='^^3" media-type="audio/mpeg" /> <Уmamfest>

Щоб забезпечити сумісність, переносячи книги DTB між різними платформами, символи в іменах файлів мають бути обмежені і визначені згідно зі стандартом RFC2396 (Uniform Resource Identifiers (URI): Generic Syntax) [6] і його підмножиною.

Це фактично обмежує множину дозволених символів до [A-Za-z0-9._-].

digit ::= [#x0030-#x0039] lowalpha ::= [#x0061-#x0o7A] upalpha ::= [#x0041-#x005A] alphanum ::= digit|lowalpha|upalpha hyphen ::= [#x002D] underscore ::= [#x005F] period ::= [#x002E]

filename ::= (alphanum|hyphen|underscore|period)+ foldemame ::= (alphanum|hyphen|underscore)+

Опис (guide), визначений структурою публікації (OEBF Publication Structure), за суттю є підрівнем пакетного елемента і складається зі списку ключових конструктивних складових DTB, таких як зміст, передмова, список літератури тощо, щоб надати доступ до них відтворювальним пристроям.

Контент у текстовому форматі (Content Format for Text)

Цей фрагмент стандарту визначає тип документу аудіо-книги XML 1.0 для маркування текстових файлів книг та інших публікацій, поданих у книжковому форматі книги, що «розмовляє». Відповідно до цього стандарту текстовий контент-файл DTB має бути XML файлом, який узгоджується з dtbook-2005-1.dtd.

Формати аудіо-файлів (Audio File Formats)

Нижче наведений перелік форматів файлів. Звичайний аудіо-програвач повинен мати змогу програвати записи хоча б в одному із перелічених звукових форматів. Хоча, рекомендацією для програвачів є можливість програвання записів у всіх аудіо-форматах. Контент книги має бути поданий за допомогою одного із перелічених нижче форматів:

- MPEG-4 AAC [MPEG] - ISO/IEC 14496-3 (набір кодеків для стиснення звуку і голосу, включаючи Advanced Audio Coding (AAC) і декілька інструментів для опрацювання звуку та голосу);

- MPEG-1/2 Layer III (MP3) [MPEG] - ISO/IEC 11172-3, ISO/IEC 13818-3 (третій формат кодування звукової доріжки MPEG, ліцензований формат файла для зберігання аудіо-інформації);

- лінійний формат PCM - RIFF WAVE;

- WAVE (формат аудіо-файла, Waveform Audio Format).

Запис і кодування книги дозволяється одночасно здійснювати в декількох різних форматах. Наприклад, коли виробник хоче кодувати список літератури з нижчою швидкістю передавання звуку або за допомогою інших кодексів ніж головна частина книги. Програвачі повинні підтримувати плавний перехід між різнокодованими секціями такої книги.

Підтримка мультиканального передавання даних при цьому не є обов’язковою. Стерео сигнали мають розпізнаватися і відтворюватися щонайменше в моно-фонічному форматі.

Формати графічних файлів (Image File Formats)

Зображення, що входять у DTBs, мають подаватися в одному або декількох форматах: JPEG (JFIF V 1.02) [JPEG], PNG [RFC 2083] або форматі масштабованої векторної графіки [SVG]. Програвачі, які підтримують демонстрацію зображення повинні мати можливість відображення у форматах JPEG та PNG; підтримка формату SVG при цьому є рекомендованою, але не обов’язковою.

Синхронізація медіафайлів (Synchronization of Media Files)

Мова синхронізованої інтеграції мультимедіа (The Synchronized Multimedia Integration Language, SMIL 2.0) розроблена консорціумом WWW як стандарт для визначення і відтворення мультимедійних елементів в Інтернет-середовищі. SMIL визначає послідовність відтворення одного або декількох об’єктів мультимедіа. У випадку книги, що «розмовляє», первинними є об’єкти мультимедіа - звукові і текстові файли контенту; SMIL передбачає їх паралельне і синхронізоване відтворення. Будь-яка книга, що «розмовляє», створена на основі мови SMIL і з використанням контенту, що кодується у стандартних текстових і звукових медіа-типах, придатна для програвання на будь-якому пристрої або платформі, яка містить програвач з підтримкою SMIL такої самої або новішої версії.

Книга, що «розмовляє», повинна містити щонайменше один файл SMIL. Усі файли SMIL, які містяться в книзі, мають відповідати стандартам XML, що узгоджуються з dtbsmil-2005-1.dtd.

Файл навігаційного контролю (Navigation Control File, NCX)

Файл навігаційного контролю для XML-додатків (NCX) задає ієрархічну структуру DTB, щоб дозволити користувачу певну навігацію. NCX подібний до змісту друкованої книги, адже він дає можливість читачу переходити безпосередньо до будь-якого з головних структурних елементів документу (розділу, підрозділу, параграфа, секції). Інші елементи книги, такі як сторінки, виноски, формули, таблиці тощо можуть бути включені в окремий не ієрархічний список і також можуть бути доступними користувачу.

Закладки і маркери (Portable Bookmarks and Highlights)

3

Цей розділ стандарту встановлює специфічний формат файла XML, який підтримує закладки, а також імпорт та експорт виділених фрагментів (маркерів) тексту.

Файл ресурсу (Resource File)

Файл ресурсу забезпечує текстові і/або аудіо-сеґ-менти і необов’язкові зображення, які можуть допомогти читачеві при користуванні книгою, що «розмовляє». Ці об’єкти мультимедіа або «ресурси» забезпечують інформацією, яка відсутня в самому документі, або яка міститься виключно у формі, недоступній для читача. Ресурс може забезпечувати підтримку багатьох мов, дозволяючи програвачу або користувачу визначати, на якій мові буде відтворюватися книга.

Восьмий та дев’ятий типи файлів за стандартом DAISY третьої версії, а саме : файл презентації стилю і файл перетворень, дозволяють реалізувати наступні функції:

- специфікацію стилістичного опрацювання відео, аудіо або Брайлівської презентації;

- специфікацію процедур спрощення формату повідомлень у випадках, коли пристрій відтворення не в змозі опрацювати більш складний (сучасний) формат подання даних;

- специфікацію багатотомності подання книги, що «розмовляє», а саме: випадків, коли книга подана на декількох однотипних або різнотипних носіях;

- специфікацію розбиття подання книги по файлах за різними типами даних, а саме, закладками та читацькими коментарями.

На базі кафедри ІСМ Національного університету „Львівська політехніка” обладнано лабораторію спеціалізованими технічними засобами для начитування і запису книг, що „розмовляють”, для друкування книг шрифтом Брайля, а також портативними програвачами так званих DAISY-книг (Digital Accessible Information System). Комп’ютери обладнані брайлівськими дисплеями, відповідним програмним забезпеченням, синтезаторами мови, інстальованими програмними оболонками для роботи зі структурованими книгами у форматі DAISY. У рамках форматування освітнього контенту для цього класу сформовано ряд навчальних підручників в аудіо-форматі, зокрема:

• „Основи веб-дизайну” (О.Г. Пасічник, О.В. Пасічник, І.В. Стеценко: Навч. посібник - К.: Вид. група BHV. - 2008);

• „Основи візуального програмування” (І.О. За-вадський, Р.І. Заболотний: Навч. посібник - К.: Вид. група BHV. - 2009);

• „Основи Інтернету” (О.М. Левченко, І.О. Завадсь-кий, Н.С. Прокопенко: Навч. посібник - К.: Вид. група BHV. - 2009).

У процесі виконання проекту проаналізовано основні класи програмних засобів, методи та інформаційні технології (ІТ), які спрощують створення комп’ютерного контенту для навчання людей з вадами зору; оптимізацію, класифікацію за ієрархією та способи зберігання даних. На основі проаналізованих авторами статті матеріалів відповідно до стандарту DAISY/NISO створено і передано у центр для незрячих дітей три підручники, що „розмовляють”, з основ інформаційних технологій, які є цифровим поданням матеріалів освітньої серії видавництва BHV „Професійне навчання” за профілем ІТ для 12-річної школи [7].

Робота над аудіо-книгою „Основи веб-дизайну” у форматі DAISY починалася з етапу підготовки програмного середовища та налаштування спеціалізованих технічних засобів для аудіо-запису. Наступним кроком був власне процес начитування. Книга формувалася протягом тривалого часу, що визначався із врахуванням її розбиття на структурні розділи. Так, начитавши та нормалізувавши сім розділів навчального посібника, було сформовано відповідну інформаційну таблицю зі змістом. Створена інформаційна таблиця являє собою відповідну навігаційну карту книги, за якою незрячий користувач має змогу активно пересуватися від розділу до розділу, від сторінки до сторінки (рис. 1).

Формування інформаційної таблиці зі змістом книги, що „розмовляє”, відбувається в автоматичному режимі за допомогою програми PLEXTALK Recording Software Pro.

Після цього, кожен з розділів та підрозділів таблиці змісту зв’язується гіперпосиланням з відповідним розділом чи підрозділом начитаного матеріалу, які слугують мітками в процесах навігації (показано на рис. 1 та стрілками).

4. Технологічний процес створення DTB

Розроблення гнучкого і багатоопційного автоматизованого інструментарію створення DTB книг обумовлена доступністю даних для DTB і формою бажаних вихідних результатів.

Укрупнена структура технологічного процесу подана на рис. 2.

Рис. 1. Процес формування навігаційної карти навчального посібника „Основи веб-дизайну”

Е

Рис. 2. Структурна схема процесу створення книги, що «розмовляє»

Звук формується на основі цифрового аудіо-за-пису, або шляхом конвертування аналогових стрічок у цифрові медіафайли. Контент для книги береться із падруковаппх робіт або від редакторів кппг. Осповпа навігаційна інформація, може бути доступною разом з текстом. Структура виробництва DTB має передбачати автоматичний процес генерування книг, які б задо-вольпялп впмогп різппх користувачів, з різппх тематик та для різних цілей. Всі зазначені чинники впливають на процес створення книги, що «розмовляє».

Вхідними початковими даними для створення структури DTB є звукові файли та надрукований текст (рис. З). Першою фазою виробничого процесу створення книги, що «розмовляє», є позиціонування звукових і текстових файлів. Структурною одпппцею, що використовується для позиціонування, є слово, яке використовується, щоб запобігти синхронізації символів. Процес створення DTB має бути орієнтованим на опрацювання текстових файлів різної складності

- від найпростіших, що пе містить жодної структурної інформації, до більш складних.

Книги, що «розмовляють», створюються для різних груп людей. Для сліпих і людей з вадами зору головний акцент робиться на звукове подання контенту з можливістю використання тактильних інтерфейсів. Для людей, які пе мають можливості писати або про-слуховувати матеріал, пропонується візуальний інтерфейс з різноманітними додатковими модулями.

Як правило, виготовлення книги у форматі DAISY починається з наявної друкованої книги. Існують різні типи процесу виготовлення книги: процес починається з опрацювання тексту або ж з опрацювання аудіо.

Для кппг, які містять тільки текст та зображення, матеріал має бути доступний в електронному вигляді. Видавець може подати коптепт кппгп як у падруко-ваній, так і у відсканованій формі. Далі, текст маркується набором елементів DTB. Деякі інструменти дозволяють автоматизувати цей крок, інші вимагають втручаппя людппп. Зображення мають перетворюватись у формати SVG, PNG або JPEG, а також, має додаватися текстовий опис, якщо його немає. Накладання докладної навігації надає більше зручності для читача, але вимагає довшої роботи над створенням книги. Директиви структури книги у форматі DAISY (Daisy Structure Guidelines, DSG) забезпечують вимоги і рекомендації щодо використання елементів DTB. Зрештою, накладання навігації (маркування) па кппгу створює прототип файла DTBook. Програма читає цей файл для створення фактичного файла DTBook і всіх пов’язаних з форматом DAISY файлів (пакетний файл, SMIL, NCX та іпші).

Усі необхідні дапі, такі як навігаційні маркерп, сторінки, вппоскп тощо, взяті з маркованого тексту.

Як правило, кппгп, що «розмовляють» у форматі DAISY, які виготовляються таким чппом, пе містять аудіо-запису. Тим не менше, механізм перетворення тексту в мову (синтезатор мови) може генерувати звукові файли у процесі виготовлення кппгп. Цифрові аудіо-книги, що «розмовляють» у форматі DAISY, як правило, не містить тексту та зображень. Проте вони мають певну структуру у вигляді заголовків і сторінок, які дають можливість навігації.

Для виготовлення книг, що «розмовляють» у форматі DAISY, в якпх поєднаний текст і аудіо, необхідно робптп поділ па текстовий і аудіо-файлп та забезпечити синхронізацію між ними (рис. 4). Згенерований файл SMIL містить посилання на кожен текстовий блок, а також па кожен звуковий фрагмент кппгп. Отже, аудіо- і текстові блоки у підсумковій кппзі можуть бути використані в поєднанні для більшої зручності і результативності.

Рис. 3. Процес створення книг, що «розмовляють»

Рис. 4. Процес доступу DAISY-програвача до контенту книги

Э

5. Прототип системи створення книг, що «розмовляють»

Основною метою є створення прототипу програмної оболонки, яка б дозволяла подавати в DAISY-форма-ті контент книг, журналів або інших електронних ресурсів і накладала б базову навігацію на документ, використовуючи закладки і маркери.

Пропонується використати два способи подання контенту, а саме: за допомогою лінійки Брайля і збільшуваного дисплея та звукового подання з використанням синтезаторів мови. Ці способи можуть бути використані в поєднанні або окремо. Для синхронізації тексту, аудіо та інших медіа-форматів буде використано формат HTML, а також мову синхронізації мультимедіа SMIL.

Щоб накласти навігаційну схему на такі книги, використовується спеціальна схема, яка забезпечує розбиття контенту на секції (розділи) та фрази, які, своєю чергою, подані за допомогою звукозапису або синтезованого комп’ютером голосу. На рис. 5 подана схема навігації по книзі.

Особливої уваги при розробленні прототипу системи створення книг, що «розмовляють», зорієнтованої на книги технічного та фізико-математичного профілю, заслуговує введення до її складу мовних засобів математичної розмітки формул та подання різноманітних типів об’ємно-графічних матеріалів. Такі модульні інкапсуляції у прототипі згадуваної вище системи базуються на використанні засобів відомих фахівцям під назвами MathML та ін.

6. Побудова інструментального середовища для виготовлення книг, що «розмовляють»

Алгоритм створення книги, що „розмовляє”, має чітку логічно сформовану структуру. Він відтворює процес, який умовно розділений на два етапи. Пер-

ший етап включає вибір програмного забезпечення та обладнання для роботи, а також налаштування програмного середовища відповідно до умов і методу начитування книги (рис. 6).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Другий етап складається власне з начитування матеріалів та їх опрацювання. Після начитування матеріалів книги зазвичай відбувається аналіз отриманих аудіофайлів у форматі .wav або ^рЗ. На цьому етапі функціонує система опрацювання та нормалізації звукозаписів.

Результатом виконання цих етапів є готова книга, що „розмовляє”, яка може бути записана в подальшому на компакт-диск або карту пам’яті і є придатною для використання.

Кімната N4

Рис.7. Структурна схема процесу запису аудіо-книги

На рис. 7 наведена схема підключення апаратури для запису аудіо в так званій студії аудіо-запи-су, що складається за двох кімнат, в Кімнаті №2 розташоване робоче місце, обладнане мікрофоном, з допомогою якого начитується інформація та колонки, за допомогою яких читач чує команди, які подаються з Кімнати №1 (наприклад, „Запис”, „Стоп”, „Пауза” та ін.). У першій кімнаті розміщується оператор, який контролює запис за допомогою комп’ютерного пульта, мікшера і т. ін. Для уникнення сторонніх шумів кімната, в якій відбувається начитування, має бути звукоізольованою.

Алгоритм, який покладений в основу формування книги в DAISY-форматі, є за своєю суттю деком-позиційним поданням складних процесів у формі простіших, які вимагають мінімальних затрат часу і

1 ЕТАП 2 ЕТАП

Рис. 6. Структурна схема процесу створення книги, що „розмовляє”

Рис. 5. Накладання навігаційної схеми на книгу

дозволяють при цьому досягти максимуму ефективності.

На думку експертів, попередні технології подання аудіо-книг поступаються DAISY тим, що в новому цифровому форматі можливий запис книг до 9 рівнів ієрархії, що полегшує навігацію і дозволяє знаходити потрібний розділ, підрозділ і навіть відповідні слова за текстом. Для незрячих людей це найзручніша система. DAISY-форматовані матеріали є незамінними помічниками у навчанні, а також у науковій роботі. Японія, США, Швеція і Великобританія активно використовують книги, подані у цьому форматі. Нині у світовій практиці аудіо-книга є однією з форм подання літературного твору та проходить етап свого становлення. В Україні ринок аудіо-книги лише формується.

7. Висновки

У світі ведеться активна робота над розроблення спеціалізованих комп’ютерних систем і засобів, пристосованих для користувачів з обмеженими фізичними можливостями. Такі ноу-хау дають можливість неповносправним людям реалізовувати свої права, допомагають їм належно забезпечувати себе необхідними інформаційними ресурсами.

Застосування сучасних інформаційних технологій для надання інформації незрячим є актуальною проблемою, для якої постійно опрацьовуються нові підходи та методи. Читаючи за Брайлем, слухаючи аудіо-записи, покладаючись на власну пам’ять і навики роботи з комп’ютером, лише небагатьом незрячим людям вдавалося здобути хорошу освіту, реалізувати себе як професіонала. Процес та комп’ютеризовані засоби навчання незрячих людей є власне проблемною галуззю наших досліджень. Новизна пропонованого підходу полягає в розробленні, апробації та практичному впровадженні нових комп’ютерних технологій для опрацювання та подання інформаційного контенту у процесах навчання осіб з вадами зору.

Люди з вадами зору потребують альтернативної версії книг і журналів. Подання книг у спеціальних форматах, апаратні та програмні розроблення брайлівських дисплеїв і синтезаторів мови для незрячих дають величезні можливості таким людям, які прагнуть реалізувати себе у цьому комп’ютеризованому, насиченому інформацією світі.

Наші подальші дослідження та розроблення будуть націлені на створення програмно-алгоритмічного комплексу, який дозволяв би ефективно реалізовувати всі технологічні процеси створення, опрацювання та відтворення мультимедійного контенту книг, що «розмовляють».

Література

1. NISO. File Specifications for the Digital Talking Book: ANSI/NISO Z39.86-200X.- Режим доступу: http://www. daisy.org/z3986/2005/Z3986-2005.html.

2. Kawamura Hiroshi DAISY: a better way to read, a better way to publish - a contribution of libraries serving persons

with print disabilities/ Hiroshi Kawamura // Proceedings of the World Library and Information Congress: 72nd IFLA General Conference and Council. Meeting 91: Information Technology with Audiovisual and Multimedia and National Libraries (part 1), 20-24 August 2006 y, Korea, Seoul.-Режим доступу: http://archive.ifla.org/IV /ifla72/ pape-rs/091-Kawamura-en.pdf.

3. Режим доступу: http://www.itu.int/wsis/index.html.

4. David Carlisle, Patrick Ion, Robert Miner, Nico Poppeli-er / Mathematical Markup Language (MathML) Version 2.0.- W3C Recommendation 21 February 2001 y.- Режим доступу: http://www.w3.org/TR/2001/REC-MathML2-20010221/PDF-p-MathML-20010221.pdf.

5. Dennis Leas / Daisy 3: A Standard for Accessible Multimedia Books / Dennis Leas, Emilia Persoon, Neil Soiffer, Michael Zacherle // IEEE MultiMedia.-2008.- Oct.-Dec.( Vol 15, №4): Accessibility and Assistive Technologies.- Режим доступу: http://www.dessci.com/en/reference/articles/da-isybooks.pdf.

6. T. Berners-Lee, R. Fielding, U.C. Irvine, L. Masinter / Uniform Resource Identifiers (URI): Generic Syntax, August 1998.- Режим доступу: http://www.apps.ietf.org/rfc/ rfc2396.html.

7. Лозицький О.А. / Формування навчальних інформаційних ресурсів для людей з вадами зору / Лозицький О.А., Пасічник О.В. // Інформаційні технології в освіті: Збірник наукових праць. Випуск 3. - Херсон: Видавництво ХДУ, 2009.

8. The Ubiquitous Library for the Blind and Physically Handicapped - A Case Study of the LG Sangnam Library/ Kyung-Jae Bae, Yoon-Seok Jeong, Woo-Sub Shim, Kyou-ng-Geun Oh, Ji-Hei Kang, Hye-Yeon, Seung-Jin Kwak // Proceedings of the World Library and Information Congress: 72nd IFLA General Conference and Council. Meeting 140: Science and Technology Libraries with Information Technology, 20-24 August 2006 y, Korea, Seoul.- Режим доступу: http://archive.ifla.org/IV/ifla72/papers/140-Bae-en.pdf.

9. Rae Julie Breaking New Ground: a virtual global library service to widen access for people with print disabilities/ Julie Rae // Proceedings of the World Library and Information Congress: 75th IFLA General Conference and Council. Meeting 199: Libraries Serving Persons with Print Disabilities, 23-27 August 2009 y, Italy, Milan.-Режим доступу: http:// www.ifla.org/files/hq/papers/ifla75/199-rae2-en.pdf.

10. Audiobooks and Access to Information for Canadians with Print Disabilities / Public library services.- Режим доступу: http://www.slais.ubc.ca/COURSES/libr500/06-07-t2/ www2/S_LaBelle/toc.htm.

11. Fineberg G. NLS pushes conversion to digital books // Libr. of Congr. inform, bull. - 2002. - Vol. 61, N 10. - P. 223 - 225.

12. О.А. Лозицький, В.В. Пасічник / Комп’ютерні засоби освітніх процесів для людей з вадами зору. Аналітичний огляд // Вісник Національного університету «Львівська політехніка». Серія «Інформаційні системи та мережі». Львів.- 2010р. (в друці).

З

i Надоели баннеры? Вы всегда можете отключить рекламу.