РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ АВТОМАТИЗАЦИИ ДЕЙСТВИЙ ПРИ ПРОВЕДЕНИИ ИССЛЕДОВАНИЙ ГОЛОСОВЫХ ПАРАМЕТРОВ ЧЕЛОВЕКА

Иниватов Д.П.

4. Гайфулин Н.В. Современные тенденции потребления основного капитала // Статистика и экономика. - 2014. - №6.

5. Кружкова И.И., Шабанникова Н.Н., Михайлова Ю.Л. Анализ инвестиций в основной капитал и направления активизации инвестиционной деятельности в России // Вестник ВГУ. Серия: экономика и управления. -2017. - № 3. - С. 39-44.

УДК 004

Иниватов Д.П. студент 3 курса, группа БИТ-151 Радиотехнический факультет Омский Государственный Технический Университет

Россия, г. Омск РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ АВТОМАТИЗАЦИИ ДЕЙСТВИЙ ПРИ ПРОВЕДЕНИИ ИССЛЕДОВАНИЙ ГОЛОСОВЫХ ПАРАМЕТРОВ ЧЕЛОВЕКА

Аннотация: В статье сделано описание программного обеспечения, созданного для автоматизации научных исследований в области голосовых параметров человека, описан алгоритм работы программы, возможности разработанного ПО, сделано описание структуры звукового файла.

Ключевые слова: звуковой файл, исследование голосовых параметров, программное обеспечение.

Inivatov D.P.

The student

Group BIT-151, Radio Engineering Faculty Omsk State Technical University

Russia, Omsk

SOFTWARE DEVELOPMENT FOR AUTOMATION OF ACTIONS FOR HUMAN VOICE RESEARCH

Abstract: The article describes software designed to automate scientific research in the field of human voice parameters, describes the algorithm of the program, the capabilities of the software developed, and describes the structure of the sound file.

Key words: sound file, study of voice parameters, software.

Программное обеспечение «Разрез файлов формата WAV» создано для людей, ведущих научную работу, связанную с изучением голосовых параметров человека с целью автоматизации действий при проведении исследований. Как правило, научная деятельность, связанная с изучением голосовых параметров человека, подразумевает под собой сбор этих самых голосовых параметров с немалочисленного круга лиц в виде записей, в которых «исследуемые» многократно повторяю идентичные слова, фразы или текст для более точных результатов изучения. Производить разрезку

этих вычислений вручную является очень длительной и кропотливой работой. Именно поэтому появилась идея о создании специальной программы, упрощающей данную работу.

Рис. 1. Пользователь открыл WAV файл.

Для реализации всех действий программы был создан класс, ответственный за корректное представление и обработку заголовка звуковых файлов. Он реализует работу со структурой файлов формата wav, которая из себя представляет следующие элементы:

Таблица 1. Представление структуры файлов формата wav

Название поля Описание Местоположение (байты)

chunkId Содержит символы в кодировке ASCII «RIFF». Начало RIFF-цепочки 0-3

chunkSize Размер цепочки с этой позиции заголовка 4-7

format Символы «WAVE» 8-11

subchunk1Id Символы «fmt » 12-15

subchunk1Size Размер цепочки с этой позиции заголовка 16-19

audioformat Формат аудио, представляет из себя число 20-21

numChannels Количество каналов 22-23

sampleRate Частота дискретизации 24-27

byteRate Количество байт, использующихся за 1 секунду во время воспроизведения 28-31

blockAlign Количество байт для одного семпла 32-33

bitsPerSample Количество бит в 1 семпле 34-35

subchunk2Id Символы «data» 36-39

subchunk2Size Количество байт в области данных 40-43

Программа представляет собой одну форму, с помощью которой пользователь может осуществлять следующие действия:

1. Открыть файл формата WAV. Программа представит его в виде двух звуковых дорожек с целью зрительного удобства. Также будут показаны основные данные о файле: размер, количество разрядов, количество каналов, частота дискретизации и длительность. Звуковые дорожки отображаются в поле диаграмм chartbox. Информация о файле представляется в текстовом поле textbox.

2. Выбрать подходящую Амплитуду и Длину участков тишины. Исходя из этих настроек, программа будет производить расчёт мест, в которых будут сделаны разрезы. Алгоритм нахождения участков, на которых будут произведены разрезы, следующий:

Пусть N - число семплов в данном файле.

L - Длина участка тишины в семплах, настроенная пользователем вручную.

А - Амплитуда, настроенная пользователем. Она производит поиск участков, у которых средняя громкость будет не более величины «А».

Изначально происходит суммирование первых L семплов (с 1 по L элемент). Затем идёт сравнение средней величины этой суммы с величиной «А», если оказывается, что средняя величина этой суммы меньше «А», то в этом месте ставится разрез, в противном случае - к нашей сумме семплов от 1 до L добавляется семпл с порядковым номером L+1 и отнимается первый элемент. Работа продолжается до тех пор, пока не будут пройдены все семплы.

Данный алгоритм способен с высокой точностью находить паузы в речи любого человека, а так как испытуемый, как правило, делает паузы между повторением одной и той же фразы, то применение именно этого метода было наиболее актуально в данной программе.

3. Пользователь также может сделать дополнительную корректировку мест разрезов, добавить новые разрезы, которые программа не смогла распознать или удалить ненужные разрезы. Добавление нового разреза происходит с помощью ползунка возле надписи справа «Добавить разрез вручную можно с помощью двух ползунков», которую можно найти на рис. 1. При перемещении ползунка в поле диаграммы chartbox будет представлено предполагаемое место будущего разреза. Пользователю будет легко определить его по характерной фиолетовой линии, находящейся прямо над положением ползунка на диаграмме chartbox. Если пользователю будет необходимо удалить какой-либо разрез, то он может воспользоваться черным ползунком, находящимся левее от кнопки «Сохранить», Перемещая положение ползунка, программа будет перекрашивать предполагаемые места будущего разреза на другой цвет. Изначально места разрезов имеют зелёный цвет. Расчёт удаляемого разреза идёт следующим образом: Места всех

разрезов хранятся в массиве. Положение ползунка задаёт индекс массива. Если ползунок находится в положении 1, то и будет соответственно перекрашен разрез с порядковым номером 1. После нажатия кнопки «удалить» этот разрез будет удалён, и автоматически перекрасится следующий разрез для предполагаемого удаления.

4. После всех действий пользователю необходимо будет нажать на кнопку «Сохранить». Результатом работы программы будет являться наличие в папке с исходным файлом всех новых разрезанных файлов в количестве N+1, где N - количество разрезов. Каждый файл будет сохранён с соответствующим ему индексом. Например, если изначальное имя файла было «Звуковой файл» и его разрезали на 5 файлов, то новые имена будут следующими: «Звуковой файл-1», «Звуковой файл-2», «Звуковой файл-3», «Звуковой файл-4» и «Звуковой файл-5».

Рис. 2. Основные функциональные элементы программы. На рисунке 3 представлено содержание папки до работы программы, а на рисунке 4 содержание папки после работы программы, которая разрезала исходный файл на 56 новых.

Рис. 3. Содержимое папки перед работой программы

О Згг'жо3

И Г з Г^ШЮЛ ■"

•ДГ

Й 1«,»оарЛ & 1||ТОИН фчЛч Н

Ч- Эглфиф*

>1 «м.1-43 ■ ■'у 1г,у.:л-ч ечи^1!

Г.-

421 мо^оин- 1,! >1 ^чгмсй ф*<г-1 <

151 «тяпИ*»*. п >1 ЗмммАф«!»-!!

>.1 фйЛг-Л

:.'_! Зцпон^ф^г :1

ЗвдомЭ **№» ■5.1 Р Ц^ц^цП Я

■Л.' ] ■ ,-ш ь: 1 фм 1 -4' Я! = 1 Им аи и а 4*31-41

■!0 опЛя-М ^шнАфви-Ч

■■¿г Л ■ и * 5 * £1 Зкугн1*+*»>-Н

чй

>1 лКангЙфвЛЛ-? (■I

Г»1 Зорыс**!'- I»

¡Л! Щми-й фоЛл-.Ч

I.-! Ъг.Т = »ЕЙф«1г-.Д III

Л п ДОл-Я

А -гЬ.ищ.) фжЛ.^ц

¿1 .-г.сийфм? -г,

Рис. 4. Содержимое папки после работы программы. Использованные источники:

1. Бабенко, М. А. Введение в теорию алгоритмов и структур данных / М.А. Бабенко. - М.: МЦНМО, 2016. - 146 а

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Иниватов Д.П.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Иниватов Д.П.

SOFTWARE DEVELOPMENT FOR AUTOMATION OF ACTIONS FOR HUMAN VOICE RESEARCH

Текст научной работы на тему «РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ АВТОМАТИЗАЦИИ ДЕЙСТВИЙ ПРИ ПРОВЕДЕНИИ ИССЛЕДОВАНИЙ ГОЛОСОВЫХ ПАРАМЕТРОВ ЧЕЛОВЕКА»