Научная статья на тему 'Большие данные и глубокое машинное обучение в искусственных нейронных сетях'

Большие данные и глубокое машинное обучение в искусственных нейронных сетях Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
2304
314
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНАЛИЗ / БОЛЬШИЕ ДАННЫЕ / ГЛУБОКОЕ МАШИННОЕ ОБУЧЕНИЕ / ВИЗУАЛИЗАЦИЯ / НЕЙРОННАЯ СЕТЬ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Тихонов Алексей Анатольевич

В статье раскрываются понятия Больших данных и глубокого машинного обучения искусственных нейронных сетей, а также описание областей их применения. Затрагивается проблема необходимости эволюции нейронных сетей посредством изменения их архитектуры и принципа работы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Большие данные и глубокое машинное обучение в искусственных нейронных сетях»

«Аркос» разработанный белорусским институтом «БелНИИС», французский сборно-монолитный каркас «Сарет».

3. Отечественная система сметной документации в отечественном строительстве (основанное на базисном или нормативном подходе с учетом единого коэффициента индексации), к сожалению, не учитывает рыночных реалий, поэтому реальная эффективность от внедрения сборно-монолитного каркасного домостроения определенная с учетом ресурсного метода определения сметной стоимости, по-моему, мнению, будет существенно выше.

Список литературы

1. Шембаков В.А. Сборно-монолитное каркасное домостроение: руководство к принятию решений / В.А. Шембаков. Чебоксары: Яблоня, 2005. 119.

2. ЕНиР. Сборник 4. Монтаж сборных и устройство монолитных железобетонных и бетонных конструкций. Выпуск 1. Здания и промышленные сооружения. /М.: Стройиздат, 1987. 64.

3. Сборно-монолитная каркасная система МВБ-01 с плоскими перекрытиями для зданий различного назначения. Выпуск 0-1. Указания по проектированию каркаса /Минск: БелНИИС, 1999. 21.

4. Великжанин Г.М. Домостроительная система КУБ-3У / Г.М. Великжанин. Нижний Новогород: Система-Строй, 2010. 119.

БОЛЬШИЕ ДАННЫЕ И ГЛУБОКОЕ МАШИННОЕ ОБУЧЕНИЕ В ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЯХ Тихонов А.А.

Тихонов Алексей Анатольевич — бакалавр, Институт математики, физики и информатики, Красноярский государственный педагогический университет им. В.П. Астафьева, г. Красноярск

Аннотация: в статье раскрываются понятия Больших данных и глубокого машинного обучения искусственных нейронных сетей, а также описание областей их применения. Затрагивается проблема необходимости эволюции нейронных сетей посредством изменения их архитектуры и принципа работы.

Ключевые слова: анализ, большие данные, глубокое машинное обучение, визуализация, нейронная сеть.

Под большими данными (англ. Big Data) подразумевают технологии обработки структурированных и неструктурированных данных, которые имеют постоянный прирост. В последнее время сформировалось отличие между обычными структурированными базами данных с чёткими и понятными обработками и большими данными, которые могут не иметь большой объём информации на начальном этапе, но обладают главной отличительной чертой - умение приспосабливаться под задачу в результате использования «машинного обучения». Вообще определяющими характеристиками больших данных являются объём, вариативность, скорость и ценность [1].

Большой объём данных (от 100 Тбайт) позволяет более точно находить различные связи для дальнейшего представления аналитики в агрегированном, понятном для чтения виде. В современных условиях объём информации может достигать сотен петабайт и даже эксабайт [1].

Вариативность данных позволяет выявить зависимости там, где на первый взгляд их не стоит искать. Например, зависимость активности покупателей от погоды или зависимость продолжительности сна от потребления лекарств.

Скорость обработки информации в больших данных близка к реальному времени.

Широкое распространение использования больших данных получили Интернет-ресурсы, занимающиеся продажей товаров и услуг. Прежде всего, это вызвано возможностью получения большого объёма информации о действиях пользователей на этих ресурсах. Рекомендованные к просмотру фильмы, к прослушиванию музыкальные композиции, к чтению книги и статьи, контекстная реклама и СПАМ-фильтры в почте, сайты знакомств [2, 3].

Данная технология использоваться в медицине, банковской и военной сферах, полиции, экономике государств, изучении социальных явлений и для управления большими и малыми социальными группами. На мой взгляд, большие данные являются относительно новым витком в

информационных технологиях и в ближайшее время проникнут во все сферы деятельности человека, вытесняя обычные базы данных с их бизнес-аналитиками.

Прежде всего, данные собираются на сетевых хранилищах, которые могут быть как разрозненными, так и объединены в единую систему. Информация в обязательном порядке дублируется для исключения возможных потерь и для неё характерно отсутствие структуры, т.е. это может быть текст, изображения в различных форматах, голос, музыка и т.п. В дальнейшем данные обрабатываются алгоритмом, написанным программистами для получения информации в удобном для человека виде. После работы алгоритма человек или группа людей делает аналитику в области обработанных данных и принимают решения о дальнейших действиях. Всё больше набирает популярность «черных ящиков» в технологии «машинного обучения», когда исключается человек при анализе данных и принятии решений о необходимых действиях.

Наука о данных (англ. Data Science), изучающая вопросы получения, обработки, анализа информации и предоставления этих данных в понятной форме набирает популярность [3, 4]. Одним из плодов развития науки о данных получила перспективная технология «машинного обучения», так называемые чёрные ящики. Существует множество разнообразных методик анализа массивов данных, в основе которых лежит инструментарий, заимствованный из статистики и информатики.

Глубинное или глубокое обучение (англ. Deep learning) — набор алгоритмов машинного обучения, основанный на нейросетях, которые пытаются моделировать высокоуровневые абстракции в данных, используя архитектуры, состоящие из множества нелинейных преобразований [5].

Глубокое обучение является частью более широкого семейства методов машинного обучения, которые подбирают представление данных. Наблюдение (например, изображение) может быть представлено многими способами, такими как вектор интенсивности значений на пиксель, или (в более абстрактной форме) как множество примитивов, областей определенной формы, и т. д. Некоторые представления позволяют легче решать поставленные задачи (например, распознавание лица или распознавание выражения лица). Применение глубокого обучения автоматизирует сам процесс выбора и настройки признаков, проводя обучение признаков без учителя или с частичным привлечением учителя, используя для этого эффективные алгоритмы и иерархическое извлечение признаков.

Искусственная нейронная сеть (ИНС) — математическая модель, а также её программное или аппаратное воплощение, построенная по принципу организации и функционирования биологических нейронных сетей — сетей нервных клеток живого организма. Также есть мнение, что ИНС и нейронная сеть живых организмов имеют гораздо меньше общего, чем об этом принято считать. Тем не менее, наблюдается увеличение сферы применения искусственных сетей [6, 7].

Метод глубокого машинного обучения получает всё большее распространение в сравнении с другими методами машинного обучения. Такая ситуация связана с тем, что в «традиционном» машинном обучении человеку необходимо самостоятельно выбрать из всего объёма информации только необходимые данные для решения конкретной задачи. Такие данные называются признаками. Если такие признаки выявить не удаётся, то машинное обучение работает плохо. Нейронные сети автоматически отделяют нужные данные от ненужных и умеют определяют правильные признаки. К минусам можно отнести потребность в больших вычислительных мощностях в связи с необходимостью обрабатывать большой объём данных.

Необходимо отметить, что для успешной работы нейронных сетей является необходимость их обучения на большом объеме данных.

На сегодняшний день глубокое обучение нейронных сетей получает всё большее распространение практически во всех областях деятельности человека.

Скорость обработки информации практически достигла реального времени и появилась возможность работы не со статичными данными, а с постоянно прибывающим потоком. Это позволяет использовать нейронные сети там, где по естественным причинам внимание человека может быть притуплено с течением времени по естественным биологическим причинам. Также это даёт возможность исключить массу человеческих ошибок в типичных ситуациях в таких областях как медицина, различные виды транспорта, систем безопасности, экономика и финансы, социология, педагогическая деятельность и т.п.

Текущий уровень развития не даёт возможности целиком и полностью автоматизировать управление многими процессами только искусственными нейронными сетями, тем более, когда речь идёт о нестандартных ситуациях, хотя, ситуация является нестандартной, пока человек или ИНС не научатся в ней действовать.

На мой взгляд, не смотря на серьёзные продвижения в области совершенствования искусственных нейронных сетей, человечество находится только в начале этого пути. Скорее всего, будут разрабатываться новые архитектуры и способы обучения ИНС более близких к работе биологических

36

нейронных сетей. Уже сейчас появляются отдельные мысли и работы о необходимости пересмотра имеющейся концепции искусственных сетей.

Научное и околонаучное сообщество осознаёт, что существующие искусственные нейронные сети очень далеки от биологических нейронных сетей даже по архитектуре. Новые исследования в области изучения мозга дают представление о векторе развития ИНС.

Одна из моделей принципа работы нейронной сети мозга, которая мне показалась очень перспективной для рассмотрения возможности применения в искусственных сетях, была представлена Алексеем Редозубовым [8, 9, 10, 11].

Согласно этой модели работа мозга ближе к принципу работы компьютера нежели к искусственной нейронной сети. Активность нейронов формирует код, с которым в дальнейшем работает всё нейронное пространство. Нет привязки активности конкретного нейрона при реакции на конкретную информацию, т.к. один и тот же нейрон может реагировать как на похожую информацию, так и на совершенно разную. Реакция биологических нейронов сравнивается с реакцией элементов компьютера, которые формируют код. Рассматривается понятие клеточных автоматов формирующие уникальные узоры из волны активных нейронов по всей сети и передача информации такими узорами. При этом каждые нейрон имеет свой «список» комбинаций соседних активных нейронов для «понимания» в каких случаях он сам должен активироваться.

Предполагается, что мозг работает не с аналоговыми, а с дискретными сигналами, таким образом, мозг (кора мозга) работает с конечным числом дискретных понятий. Вводится понятие интерференции информационной волны, способствующей формированию ключа воспоминаний (время, пространство, обстоятельства и пр.) для работы памяти с информацией, которую необходимо запомнить. Т.е. по аналогии с компьютером, когда для хранения информации используются различные метки (путь к файлу, время создания, различные теги и т.п.), для того, чтобы потом можно было легко найти файл даже по части имеющейся в ключе информации.

При этом сохранение информации происходит не в конкретном месте, а распределено по всему мозгу. Причём подразумевается распределение не частей информации по разным местам, а сохранение всего жизненного объёма информации во множестве мест в головном мозге в кортикальных столбах.

Одним из фактов, в пользу данной концепции являются эксперименты Карла Лешли в течение тридцати лет над обученными выходить из лабиринта крысами, которым последовательно удаляли части мозга в поиске места хранения информации с данным навыком. Эксперименты показали, что не существует отдельных частей мозга, где хранились бы конкретные воспоминания, вся память дублирована в различных частях мозга. Повторением экспериментов другими учёными также не удалось обнаружить, что целостная память находится в определённом месте мозга [12].

Становится очевидно, что эти сети будут иметь всё большее значение и участвовать в большем количестве процессов с нарастающей долей. И при дальнейшей эволюции искусственных нейронных сетей мы рано или поздно придём к созданию искусственного интеллекта.

Список литературы

1. Денисова О.О. и Мухутдинов Э.А. «Большие данные - это не только размер данных» // Вестник технологического университета, т. 18, № 4, p. 5, 2015.

2. Себрант А. «Что такое Big Data и почему это страшно интересно,» 06.03.2014. [Электронный ресурс]. Available: http s://www.youtube.c om/watch?v=z sUKYfXjpvo &list=WL&index=6, дата обращения: 22.03.2018.

3. Сербант А. «Data Science, черные ящики - и почему вам сильно повезло,» 15.09.2015. [Электронный ресурс]. Режим доступа: https://www.youtube.com/watch?v=zvGeLvWZ7yQ&list=WL&index=8/ (дата обращения: 22.03.2018).

4. «Большие данные (Big Data),» 24.10.2017. [Электронный ресурс]. Available: http://tadviser.ru/a/125096, дата обращения: 22.03.2018.

5. Хайкин С. Нейронные сети: Полный курс, 2-ое ред., Издательский дом Вильямс, 2006, p. 1104.

6. «Шпаргалка по разновидностям нейронных сетей. Часть первая. Элементарные конфигурации,» 03.10.2016. [Электронный ресурс]. Режим доступа: https://tproger.ru/translations/neural-network-zoo-1/ (дата обращения: 22.03.2018).

7. «Искусственная нейронная сеть,» 11.02.2018. [Электронный ресурс]. Режим доступа: https://ru.wikipedia.org/wiki/%D0%98%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0% B2%D0%B5%D0%BD%D0%BD%D0%B0%D1%8F_%D0%BD%D0%B5%D0%B9%D1%80%D0%B E%D0%BD%D0%BD%D0%B0%D1 %8F_%D1 %81 %D0%B5%D1 %82%D1 %8C/ (дата обращения: 22.03.2018).

8. Редозубов А.Д. «Мозг - это не нейронные сети,» 07.10.2016. [Электронный ресурс]. Режим доступа: http s://www.youtube.c om/watch?v=7c 6YUJ0JuqI&list=WL&t=1 s&index=27/ (дата обращения: 22.03.2018).

9. Редозубов А.Д. «Логика мышления. Часть 1,» 29.08.2012. [Электронный ресурс]. Режим доступа: https://www.youtube.com/watch?v=0v50wZxox7M, (дата обращения: 22.03.2018).

10. Редозубов А.Д. «Логика сознания. Вступление,» 22.08.2016. [Электронный ресурс]. Режим доступа: https://habrahabr.ru/po st/308268/, (дата обращения: 22.03.2018).

11. Редозубов А.Д. Логика эмоций, 2012, р. 317.

12. Развина Э. «Вспомнить все... А если это нереально?,» 27.12.2014. [Электронный ресурс]. Режим доступа: https://www.b17.ru/blog/15224/, (дата обращения: 22.03.2018).

АВТОМАТИЗИРОВАННЫЙ МИНИКОМПЛЕКС ХОЛОДНОГО

КОПЧЕНИЯ Новикова М.В.

Новикова Марина Викторовна — магистрант, кафедра электротехники, электроники и электромеханики, Электроэнергетический институт Дальневосточный государственный университет путей сообщения, г. Хабаровск

Аннотация: в данной статье описывается устройство, принцип работы автоматизированного миникомплекса холодного копчения. Данное устройство будет полезно малым фермерским хозяйствам и частным предпринимателям.

Ключевые слова: автоматизация, автоматизация копчения, фотометрический метод, холодное копчение, датчик, клапан.

На сегодняшний день в России весьма глобально стоят вопросы импортозамещения в производстве. Для содействия развитию фермерского хозяйства предлагается автоматический миникомплекс холодного копчения продуктов, который позволит улучшить сохранность, ассортимент и качество поставляемой на рынок продукции.

Холодное копчение — это обработка холодным дымом при определенных условиях (температура, влажность продукта и коптильной среды, скорость движения коптильного дыма). Способ холодного копчения занимает больше времени, чем горячее копчение, тем не менее, имеет свои плюсы. Самым главным их них является сохранение всех витаминов и полезных для человеческого организма веществ. При использовании данного метода не происходит сильного теплового воздействия. Именно благодаря этому пища, приготовленная таким способом, содержит максимальное количество различных минеральных и витаминных компонентов. Ещё один плюс холодного копчения — это более продолжительный срок хранения. Он составляет около двух недель, при этом на протяжении всего этого периода времени, пища сохраняет все полезные свойства. В коптильне очень важно выдержать постоянство и температуру дыма — он не должен быть выше 25 градусов [2]. Это предохраняет коптящиеся продукты от потери жира и от пересушки.

Для данного процесса в настоящее время применяются автоматизированные крупные установки, позволяющие осуществлять процесс копчения крупных партий продуктов [1]. Но они дорогостоящие и имеют большие габариты. Также на рынке представлены небольшие коптильни для домашнего использования, но они не автоматизированы и не могут использоваться малыми фермерскими хозяйствами. Поэтому, предлагается небольшая установка, которая благодаря конструктивным особенностям производит процесс копчения практически без участия человека. Её смогут приобрести малые фермерские хозяйства и индивидуальные предприниматели.

Особенностями данной установки являются автоматизация процесса при сравнительно небольших габаритах.

Рассмотрим принцип работы. На рисунке 1 изображена структурная схема миникомплекса холодного копчения.

i Надоели баннеры? Вы всегда можете отключить рекламу.