Научная статья на тему 'РАЗРАБОТКА ПРИЛОЖЕНИЯ ДЛЯ РАСПОЗНАВАНИЯ И ГЕНЕРАЦИИ УСТНОЙ КАЗАХСКОЙ РЕЧИ В УСЛОВИЯХ ЦИФРОВОЙ ЭПОХИ'

РАЗРАБОТКА ПРИЛОЖЕНИЯ ДЛЯ РАСПОЗНАВАНИЯ И ГЕНЕРАЦИИ УСТНОЙ КАЗАХСКОЙ РЕЧИ В УСЛОВИЯХ ЦИФРОВОЙ ЭПОХИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
распознавание речи / казахский язык / малые языки / глубокое обучение / языковая модель / цифровая эпоха / сохранение языка / искусственный интеллект / разработка приложений / интеграция технологий / speech recognition / Kazakh language / minority languages / deep learning / language model / digital era / language preservation / artificial intelligence / application development / technology integration

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Абдуллаев О.У., Остаева А.Б.

В данной статье рассматривается разработка приложения для распознавания устной казахской речи и предоставления ответов на казахском языке. Важность данной работы обусловлена необходимостью поддержания актуальности и сохранения малых языков в условиях цифровой эпохи. Для создания приложения использовались корпус казахского языка и методы глубокого обучения, что позволило достичь высокой точности и надежности системы. В статье описаны основные этапы разработки, включая обучение языковой модели, использование открытого исходного кода и интеграцию приложения в различные устройства. Представленные результаты демонстрируют, что использование современных технологий и подходов позволяет эффективно поддерживать малые языки и их интеграцию в цифровое пространство. Приложение способствует не только упрощению взаимодействия с казахским языком, но и его сохранению и развитию в современных условиях.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Абдуллаев О.У., Остаева А.Б.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEVELOPMENT OF AN APPLICATION FOR RECOGNITION AND GENERATION OF SPOKEN KAZAKH SPEECH IN THE DIGITAL ERA

This article examines the development of an application for recognizing spoken Kazakh speech and providing responses in Kazakh. The importance of this work is due to the need to maintain the relevance and preservation of minority languages in the digital age. The creation of the application used the Kazakh language corpus and deep learning methods, which allowed for achieving high accuracy and reliability of the system. The article describes the main stages of development, including training the language model, using open-source code, and integrating the application into various devices. The presented results demonstrate that the use of modern technologies and approaches allows for effectively supporting minority languages and their integration into the digital space. The application not only facilitates interaction with the Kazakh language but also contributes to its preservation and development in modern conditions.

Текст научной работы на тему «РАЗРАБОТКА ПРИЛОЖЕНИЯ ДЛЯ РАСПОЗНАВАНИЯ И ГЕНЕРАЦИИ УСТНОЙ КАЗАХСКОЙ РЕЧИ В УСЛОВИЯХ ЦИФРОВОЙ ЭПОХИ»

УДК 004.9 Абдуллаев О.У., Остаева А.Б.

Абдуллаев О.У.

магистрант кафедры информатики Кызылординский университет им. Коркыт Ата (г. Кызылорда, Казахстан)

Остаева А.Б.

канд. педагог. наук, доцент кафедры информатики Кызылординский университет им. Коркыт Ата (г. Кызылорда, Казахстан)

РАЗРАБОТКА ПРИЛОЖЕНИЯ ДЛЯ РАСПОЗНАВАНИЯ И ГЕНЕРАЦИИ УСТНОЙ КАЗАХСКОЙ РЕЧИ В УСЛОВИЯХ ЦИФРОВОЙ ЭПОХИ

Аннотация: в данной статье рассматривается разработка приложения для распознавания устной казахской речи и предоставления ответов на казахском языке. Важность данной работы обусловлена необходимостью поддержания актуальности и сохранения малых языков в условиях цифровой эпохи. Для создания приложения использовались корпус казахского языка и методы глубокого обучения, что позволило достичь высокой точности и надежности системы. В статье описаны основные этапы разработки, включая обучение языковой модели, использование открытого исходного кода и интеграцию приложения в различные устройства. Представленные результаты демонстрируют, что использование современных технологий и подходов позволяет эффективно поддерживать малые языки и их интеграцию в цифровое пространство. Приложение способствует не только упрощению взаимодействия с казахским языком, но и его сохранению и развитию в современных условиях.

Ключевые слова: распознавание речи, казахский язык, малые языки, глубокое обучение, языковая модель, цифровая эпоха, сохранение языка, искусственный интеллект, разработка приложений, интеграция технологий.

Цифровая эпоха предъявляет новые вызовы и требования к сохранению и развитию языков, особенно малых, таких как казахский язык. В качестве специалиста в области программного обеспечения и носителя казахского языка, я осознал необходимость создания приложения, способного распознавать устную казахскую речь и предоставлять ответы на этом языке. Основной целью данной работы является разработка и исследование приложения для распознавания речи, которое не только облегчает взаимодействие пользователей с казахским языком, но и способствует его сохранению и развитию в цифровом пространстве.

Многие малые языки, включая казахский, сталкиваются с угрозой утраты своего места в цифровом мире. С ростом интернет-коммуникаций и повсеместного использования технологий, поддержка актуальности малых языков становится все более важной задачей. Однако существует недостаток приложений, удовлетворяющих потребности носителей и изучающих малые языки, что затрудняет их ориентацию и функционирование в цифровом мире. Это подталкивает к необходимости создания специализированных программных решений, которые смогут заполнить этот пробел. Для разработки приложения была использована обширная языковая база данных - корпус казахского языка Института умных систем и искусственного интеллекта (188Л1), Данный корпус включает в себя огромное количество данных на казахском языке, таких как тексты, аудиозаписи речи и другие лингвистические ресурсы. Применяя эти данные, удалось создать надежную языковую модель, способную точно распознавать казахский язык. Использование такого корпуса позволило значительно повысить точность и надежность создаваемого приложения для распознавания речи.

В процессе разработки также был использован открытый исходный код, доступный на ОйНиЬ. Код основан на моделях глубокого обучения и адаптирован для работы с корпусом казахского языка. Применение открытого исходного кода позволило ускорить процесс разработки и обеспечить высокую эффективность системы распознавания речи, не начиная создание с нуля. В

результате была создана система, способная точно распознавать казахскую речь и генерировать соответствующие ответы.

Разработка приложения для распознавания речи является важным шагом на пути сокращения разрыва между цифровым миром и малыми языками. Использование технологий для поддержки малых языков гарантирует, что они останутся актуальными и доступными в цифровую эпоху. Приложение, созданное в рамках данного проекта, не ограничивается только казахским языком, с некоторыми изменениями в языковой модели, оно может быть адаптировано для распознавания и ответа на других малых языках. Это открывает новые возможности для языковых сообществ по всему миру, позволяя создавать свои собственные приложения для распознавания речи и поддерживать усилия по сохранению языков.

Одним из ключевых аспектов разработки приложения стало использование различных технологий и инструментов. В частности, для программирования был выбран язык Python, который предоставляет широкий спектр возможностей для разработки и интеграции систем машинного обучения. Применение методов глубокого обучения и передовых алгоритмов позволило создать мощную и эффективную языковую модель, способную точно распознавать устную речь на казахском языке и генерировать соответствующие ответы. Кроме того, для реализации приложения были использованы платформы и инструменты, такие как TensorFlow и Keras, которые предоставляют мощные возможности для обучения и оптимизации моделей машинного обучения. Эти инструменты позволили значительно ускорить процесс разработки и обеспечить высокую точность и надежность создаваемой системы.

В процессе разработки приложения были проведены многочисленные исследования и эксперименты, направленные на оптимизацию работы системы и повышение ее точности. Одной из главных задач стало обеспечение корректного распознавания казахской речи и генерации адекватных ответов. Для этого были использованы различные методы и подходы, такие как

улучшение качества обучающих данных, оптимизация архитектуры модели и настройка параметров системы.

Рис. 1. Реализация приложении в мессенджере Telegram и в среде разработки Pycharm.

Особое внимание было уделено также вопросам интеграции системы в различные устройства и платформы. В результате была разработана версия приложения, способная работать на платформе Raspberry Pi, что позволяет использовать его в качестве самостоятельного смарт-динамика. Это решение открывает новые возможности для использования приложения в различных условиях и сценариях, делая его доступным для широкой аудитории пользователей.

В результате проделанной работы было создано приложение для распознавания речи, которое понимает устную казахскую речь и отвечает на казахском языке. Это приложение является важным инструментом для

носителей казахского языка и изучающих его, способствуя сохранению и развитию казахского языка в цифровую эпоху.

Таким образом, разработка приложения для распознавания речи является важным шагом на пути поддержки и сохранения малых языков в цифровом мире. Использование передовых технологий и методов машинного обучения позволяет создавать эффективные и точные системы, способные распознавать устную речь и генерировать соответствующие ответы. Это открывает новые возможности для языковых сообществ по всему миру, позволяя поддерживать и развивать свои языки в условиях стремительно развивающегося цифрового пространства.

Заключая данное исследование, можно отметить, что разработка приложения для распознавания речи на казахском языке является важным и значимым шагом на пути сохранения и развития этого языка. Использование современных технологий и подходов позволяет создавать мощные и эффективные инструменты, способствующие поддержке малых языков и их интеграции в цифровой мир. Надеюсь, что результаты данного проекта вдохновят других разработчиков и исследователей на создание аналогичных инициатив, направленных на сохранение и развитие малых языков в условиях глобализации и цифровизации.

СПИСОК ЛИТЕРАТУРЫ:

1. International Institute of Central Asia. Corpus of the Kazakh Language [Электронный ресурс]. URL: https://issai.nu.edu.kz/ru/корпус-казахского-языка/ (дата обращения: 08.06.24);

2. Python Software Foundation. Python [Электронный ресурс]. URL: https://www.python.org/ (дата обращения: 08.06.24);

3. Raspberry Pi Foundation. Raspberry Pi [Электронный ресурс]. URL: https://www.raspberrypi.org/ (дата обращения: 08.06.24);

4. TensorFlow. TensorFlow [Электронный ресурс]. URL: https://www.tensorflow.org/ (дата обращения: 08.06.24;

5. Keras. Keras [Электронный ресурс]. URL: https://keras.io/ (дата обращения: 08.06.24);

6. OpenAI. OpenAI [Электронный ресурс]. URL: https://openai.com/ (дата обращения: 08.06.24)

Abdullaev O. U, Ostaeva A.B.

Abdullaev O.U

Korkyt Ata Kyzylorda University (Kyzylorda, Kazakhstan)

Ostaeva A.B.

Korkyt Ata Kyzylorda University (Kyzylorda, Kazakhstan)

DEVELOPMENT OF AN APPLICATION FOR RECOGNITION AND GENERATION OF SPOKEN KAZAKH SPEECH IN THE DIGITAL ERA

Abstract: this article examines the development of an application for recognizing spoken Kazakh speech and providing responses in Kazakh. The importance of this work is due to the need to maintain the relevance and preservation of minority languages in the digital age. The creation of the application used the Kazakh language corpus and deep learning methods, which allowed for achieving high accuracy and reliability of the system. The article describes the main stages of development, including training the language model, using open-source code, and integrating the application into various devices. The presented results demonstrate that the use of modern technologies and approaches allows for effectively supporting minority languages and their integration into the digital space. The application not only facilitates interaction with the Kazakh language but also contributes to its preservation and development in modern conditions.

Keywords: speech recognition, Kazakh language, minority languages, deep learning, language model, digital era, language preservation, artificial intelligence, application development, technology integration.

i Надоели баннеры? Вы всегда можете отключить рекламу.