Научная статья на тему 'ПРОГРАММНЫЙ КОМПЛЕКС «АВТОМАТИЧЕСКОЕ РЕДАКТИРОВАНИЕ ТЕКСТА» И ЕГО ПРИМЕНЕНИЯ'

ПРОГРАММНЫЙ КОМПЛЕКС «АВТОМАТИЧЕСКОЕ РЕДАКТИРОВАНИЕ ТЕКСТА» И ЕГО ПРИМЕНЕНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

13
8
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — А. М. Норов, И. Б. Тогаев, Л. С. Сафаров, Ш. А. Муродов

Одним из первых важных шагов использования информационных технологий в лингвистике является дигитализация текстов – переведение языкового материала, существующего в печатном или устном виде, в цифровую форму. Именно в этом случае появляется возможность привлечения компьютеров для выполнения определенных операций над текстами на естественном языке: их преобразования, выделения их них отдельных элементов и создания (синтеза) аналогичных текстов [1].

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ПРОГРАММНЫЙ КОМПЛЕКС «АВТОМАТИЧЕСКОЕ РЕДАКТИРОВАНИЕ ТЕКСТА» И ЕГО ПРИМЕНЕНИЯ»

Chirchik State Pedagogical University Effectiveness of Introduction of Digital Technologies in the Educational Process

Volume 4 | CSPU Conference 1 | 2023 Ta'lim jarayonida raqamli texnologiyalarni

etish samaradorligi

g

ПРОГРАММНЫЙ КОМПЛЕКС «АВТОМАТИЧЕСКОЕ РЕДАКТИРОВАНИЕ ТЕКСТА» И ЕГО ПРИМЕНЕНИЯ

А. М. Норов

Каршинский государственный университет, Карши, Узбекистан

И. Б. Тогаев

Ташкентский университет информационных технологий, Ташкент, Узбекистан

Л. С. Сафаров

Каракалпакский государственный университет, Нукус, Узбекистан

Ш. А. Муродов

Каршинский международный университет, Карши, Узбекистан

Одним из первых важных шагов использования информационных технологий в лингвистике является дигитализация текстов - переведение языкового материала, существующего в печатном или устном виде, в цифровую форму. Именно в этом случае появляется возможность привлечения компьютеров для выполнения определенных операций над текстами на естественном языке: их преобразования, выделения их них отдельных элементов и создания (синтеза) аналогичных текстов [1].

Тезис посвящен разработке программного обеспечения Sillabema, Smart Transliteration, Phonetic Analyzer, TimeParserUz, NumParserUz и их интеграции в системы баз данных (БД) и MS Office под программным комплексом «Автоматическое редактирование текста».

На основе созданных лингво-математических моделей и алгоритмов были созданы программы: Sillabema, Smart Transliteration, Phonetic Analyzer по автоматическому редактированию текста и программы TimeParserUz и NumParserUz для семантико-синтаксического анализа текста и базы данных. Их интеграция привела к разработке программного комплекса под названием «Автоматическое редактирование текста» (рис. 1).

https://cspi.uz/

Republican Scientific and Practical Conference

October 20, 2023

Chirchik State Pedagogical University Effectiveness of Introduction of Digital

Technoogies^n^hemmucaiiommimrocmm

Volume 4 | CSPU Conference 1 | 2023 Ta'lim jarayonida raqamli texnologiyalarni

etish samaradorligi

gi

Рис. 1. Архитектура программного комплекса «Автоматическое

редактирование текста»

Хотя модули (программные средства), составляющие единый программный комплекс взаимосвязаны друг с другом, также существует возможность использования каждого из них в отдельности (рис. 2).

Рис. 2. Структура программного комплекса «Автоматическое редактирование текста»

https://cspi.uz/

October 20, 2023 Republican Scientific and Practical Conference

419

Chirchik State Pedagogical University Effectiveness of Introduction of Digital

Volume 4 | CSPU Conference 1 | 2023 Ta'lim jarayonida raqamli texnologiyalarni

etish samaradorli

Программные средства в программном комплексе «Автоматическое редактирование текста» имеет большое значение для узбекского языка, поэтому эти модули должны быть интегрированы в MS Office. Есть два способа интеграции [2]:

1) можно загрузить файл, подготовленный программным обеспечением MS Office (например, файл с расширением RTF);

2) модуль макроса, содержащийся в программном обеспечении, может быть установлен в MS Office, не выходя из среды приложения.

Программный комплекс «Автоматическое редактирование текста», в свою очередь, также требует интеграцию с БД, состоящей из различных лингвистических объектов (рис. 3).

Рис. 3. Интеграция программного комплекса с БД

Существует 5 типов баз данных для модулей, содержащихся в программном комплексе. База данных состоит из: БД-1 - база слов, освоенных с русского языка, а также слов с буквой «ц» и <^»; БД-2 - база слов, для случаев, когда слова «нг» и «^» встречаются в середине и в конце слова; БД-3 - база слов, заканчивающаяся буквами «у», «ю», <ш» и «уш>; БД-4 - база для аудио произношения гласных и согласных; БД-5 - база ключевых слов суток времени и математических выражений.

Кроме того, была также рассмотрена реализация модели Силлабема, разработанной в ходе данного исследования, в отношении тюркских языков (каракалпакский, казахский, киргизский), и были получены положительные результаты. Для интеграции этих языков на

https://cspi.uz/

October 20, 2023 Republican Scientific and Practical Conference

420

Chirchik State Pedagogical University Effectiveness of Introduction of Digital Technologies in the Educational Process

g

Volume 4 | CSPU Conference 1 | 2023 Ta'lim jarayonida raqamli texnologiyalarni joriy etish samaradorligi

g

программном комплексе требуются внести некоторые изменения в содержимое базы данных БД-1, БД-2 и БД-3.

REFERENCES

[1] Щипицина Л.Ю. Информационные технологии в лингвистике. - М.: ФЛИНТА: Наука, 2013. - 128 с.

[2]. Норов А.М. Компьютерно-ориентированные модели узбекской лингвистики: автореф. дис. ...д-ра тех. наук : 05.01.04 / А.М.Норов; Каршинский госуниверситет. - Карши., 2020. - 46 с.

https://cspi.uz/

Republican Scientific and Practical Conference

October 20, 2023

i Надоели баннеры? Вы всегда можете отключить рекламу.