Описание формализации характерных задач нейросетевой
технологии
Н.В. Решетникова, Л.А. Жуков Красноярский государственный технический университет Сибирский государственный технологический университет E-mail: [email protected], [email protected]
В работе предложено описание упрощенной методики для прикладных исследований с использованием нейросетевой технологии на основе разработанной модели [5][6] с помощью формальных языков и грамматик [4]. Изначально использовалась описательная модель на естественном языке методики обработки данных нейросетевыми методами, применительно для нейроимитатора NeuroPro v. 0.25 [3], которая была расширена до общей абстрактной методики при использовании нейросетей с учителем [1][2].
Цель работы: разработать формальное описание основных задач прикладных исследований при использовании нейросетевой технологии. Привести примеры слов соответствующей грамматики для данной методики.
Рассматривались следующие три группы технологических операций при нейросетевой обработке данных: предварительные, основные и вспомогательные [7]. Предварительные операции условно разделим на несколько подгрупп: операции представления данных (сбор данных, структура таблицы базы данных, предварительный выбор поля ответа), предобработка (преобразование символьных полей и полей типа дата, поиск и заполнение пробелов, нормирование), операции считывания файлов данных. Основные операции представляют создание/чтение и обучение нейронной сети. Вспомогательные операции - это тестирование, упрощение нейросетей, определение значимостей входных параметров, вербализация, открытие и сохранение сети.
Данное описание использовано при составлении нетерминального алфавита соответствующей грамматики, который имеет следующие иерархические уровни:
0 уровень
B Предварительные Before main Операции сбора данных, создания таблицы,
операции считывания, предобработки данных
M Основные Main Создание / чтение сети и обучение сети
операции operations
A Вспомогательные Auxiliary тестирование, упрощение нейросетей,
операции operations определение значимостей входных и внутренних
параметров, вербализация, сохранение сети
(проекта)
1 уровень
I Представление Data сбор данных, создание структуры таблицы базы
данных introducing данных, выбор поля ответа (предварительный)
P Предобработка Preprocessing Изменение структуры таблицы, преобразование
символьных полей и полей типа дата и других
нечисловых полей, поиск и заполнение пробелов,
нормирование
L Обучение сети Learn Обучение сети
C Упрощение Contrasting Упрощение структуры сети, например, операции
структуры сети контрастирования и бинаризации
N Нормирование Normalization Преобразование данных для приведения
значений к определенному диапазону
E Заполнение Empty data Заполнение пробелов по некоторому алгоритму
пробелов
T Тестирование Test / Validate Тестирование по примеру и по выборке
D Предварительное Data Создание структуры таблицы, предварительный
описание данных выбор поля ответа
Основные правила вывода для данной грамматики без детализации (на 0 уровне):
S ® B M A K | B M K (1)
A®A M A | A M A K | A M (2)
K ® B M K | B M A K | B A K | B M | B M A | B A | 1 (3)
Для задач пользователей определены следующие простейшие варианты методики нейросетевой обработки данных прикладной области:
A) Обучение по общей выборке;
Б) Простое обучение по обучающей выборке и тестирование по тестовой выборке;
B) Перекрестное обучение и тестирование;
Г) Дополнительные операции (определение значимостей, упрощение структуры и т.п.).
Задача В и часть подзадач Г являются дополнительными и пользователи могут их не выполнять. Задача А выполняется всегда и является обязательной.
Содержание каждой из задач используемой методики:
Задача Составляющие операции 0 уровень
Обучение по общей выборке
Простое обучение и тестирование
Перекрестное тестирование
Дополнительные операции
Открыть файл, нормировать В М
данные, создать сеть, обучить
сеть
Открыть файл, нормировать В М А
данные, создать сеть, обучить сеть, открыть другой файл, протестировать
Открыть 1-ый файл, нормировать В М А М В А
данные, создать сеть, обучить
сеть, открыть 2-й файл,
протестировать, создать сеть,
обучить по 2-ому файлу, открыть
1-й файл, протестировать
Определить значимости после В М А
обучения, упростить сеть
(контрастирование внешней или
внутренней структуры сети,
бинаризация), получить
вербальное описание после
обучения
Приведем несколько примеров слов, принадлежащих данному языку и характеризующих описанные задачи:
Задача А (обучение)
Га П1 шк 18 Открыли файл данных, выполнили нормирование,
создали сеть, обучили сеть
Задача Б (простое обучение и тестирование)
Га п Шк 18 Га tt Открыли файл данных, выполнили нормирование,
создали сеть, обучили сеть, открыли другой файл
данных, протестировали по нему
Задача В (перекрестное тестирование)
Га П[ шк 18 Га tt Га п шк 18 Га tt Открыли 1-й файл данных, выполнили
нормирование, создали сеть, обучили сеть,
открыли 2-й файл данных, протестировали по
нему, создали сеть, обучили по 2-ому файлу,
открыли 1-й файл, протестировали
Задача Г (дополнительные операции)
Га П1 Шк 18 с V Открыли файл данных, выполнили нормирование,
создали сеть, обучили сеть, выполнили
контрастирование синапсов, получили вербальное
описание сети
Га f Па Гр Ь1 1 V Открыли файл данных, выполнили преобразование
полей и нормирование, открыли сеть, бинаризовали веса синапсов, определили значимости параметров, получили вербальное описание
Га па Гр Ь1 1 V 1г Ь1 V Открыли файл данных, выполнили нормирование,
открыли сеть, бинаризовали веса синапсов на множество [-1,1], определили значимости параметров, получили вербальное описание, обучили сеть методом случайного поиска,
Га f Па Гр i rd lr Ci i
бинаризовали веса синапсов, получили вербальное описание
Открыли файл данных, выполнили преобразование полей и нормирование, открыли сеть, определили значимости параметров, открыли файл данных, обучили сеть, провели контрастирование входных параметров, определили значимости параметров Открыли файл данных, выполнили нормирование, создали сеть, обучили сеть, определили значимости параметров, получили вербальное описание, выполнили контрастирование входных параметров, определили значимости параметров, получили вербальное описание Га па тк 1г V 8 Га ^ га с8 сп си V Открыли файл данных, выполнили нормирование,
rd па mk lr i v с; i v
Га tt Га bi v Га tt
создали сеть, обучили сеть, получили вербальное описание, сохранили сеть, открыли другой файл данных, протестировали по нему, открыли исходный файл данных, выполнили контрастирование синапсов, нейронов и неоднородных входов, получили вербальное описание, открыли другой файл данных, протестировали по нему, открыли исходный файл данных, провели бинаризацию, получили вербальное описание, открыли другой файл данных, протестировали по нему
Данный подход может быть использован в дальнейшем начинающими
исследователями не знакомыми, либо слабо знакомыми с нейросетевыми методами.
Полезен пользователям среднего уровня подготовки для продолжения исследований и
более детальных дополнительных экспериментов. Предложенное описание
систематизирует и уточняет методику и задачи исследования прикладных данных с
помощью нейросетевой технологии с учителем.
108
Список литературы
1. Горбань А.Н., Россиев Д. А. Нейронные сети на персональных компьютерах. Н.: Наука, 1996. - 276 с.
2. Горбань А.Н. Обучение нейронных сетей. М.: СП «Paragraph», 1990. - 160 с.
3. Царегородцев В.Г. Взгляд на архитектуру и требования к нейроимитатору для решения современных индустриальных задач // Научная сессия МИФИ-2004: Сб. науч. тр. Ч.2. М.: МИФИ, 2004. С. 160-167.
4. Гордеев А.В., Молчанов А.Ю. Системное программное обеспечение. - СПб.: Питер, 2003. - 736 с.
5. Решетникова Н.В., Жуков Л.А. Формальное определение языка технологии обработки данных нейронных сетей с учителем // Нейроинформатика и ее приложения: Материалы XII Всероссийского семинара, 1-3 октября 2004 г. / Под ред. А.Н.Горбаня, Е.М.Миркеса. Отв. за выпуск Г.М. Садовская, ИВМ СО РАН, Красноярск, 2004. С.109-111
6. Решетникова Н.В., Жуков Л.А. Графическое представление формальной грамматики технологии обработки данных с помощью нейронных сетей с учителем / Моделирование неравновесных систем// Материалы VII Всероссийского семинара, 8-10 октября 2004 г./ Под ред. В.И.Быкова. Отв. за выпуск М.Ю.Сенашова, ИВМ СО РАН, Красноярск, 2004. С.126-127
7. Жуков Л.А. Технология нейросетевого решения прикладных классификационных задач для использования в экологии, биологии и медицине: Научное издание / Красноярск. госуд. техн. ун-т. Красноярск, 2004. 148 с.: ил. 26. - Библиогр.: 399 назв. - Рус. - Рукопись деп. в ВИНИТИ 13.05.2004, № 800-В2004