Научная статья на тему 'Интеллектуальный анализ геоданных'

Интеллектуальный анализ геоданных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1496
263
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИЯ / ДАННЫЕ / ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ / БОЛЬШИЕ ДАННЫЕ / ГЕОДАННЫЕ / ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / INFORMATION / DATA MINING / BIG DATA / GEODATA / ARTIFICIAL INTELLIGENCE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шайтура Сергей Владимирович

В статье рассмотрены особенности интеллектуального анализа данных. Показано, что в информационных системах применяется не информация, а информационные модели. Статья раскрывает проблемы интеллектуального анализа данных. отмечено применение информационных единиц как единиц анализа данных. Статья раскрывает особенности интеллектуального анализа геоданных (geodata mining). Описаны системы практического анализа, применяемые при интеллектуальном анализе геоданных. В частности, описан процесс интеллектуального анализа данных в трёх стадиях: выявление закономерностей; использование выявленных закономерностей для предсказания неизвестных значений; анализ исключений, предназначенный для выявления и толкования аномалий в найденных закономерностях. Описана организация геоданных с учетом семиотического подхода в виде семантической, синтаксической и прагматической частей. Приведена классификация ключевых компонент систем с краткой характеристикой для каждого класса: индустриальные системы, предметно-ориентированные аналитические системы, статистические пакеты, искусственные нейронные сети, пакеты, основанные на деревьях решений, системы рассуждений на основе аналогичных случаев, генетические алгоритмы, эволюционное программирование.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Geodata mining

This article describes the features of data mining. The article argues that in the information systems used not information, and information models. The article reveals the problem of data mining. It noted the use of information units as the units of analysis. This article describes the features of geo-mining (geodata mining). This article describes the practical analysis system used in the intellectual analysis of geodata. In particular, the data mining process in three stages: the detection of patterns; using the identified patterns to predict unknown values; analysis of exceptions intended to detect and interpret anomalies in the found regularities. Describes the organization of the geodatabase with consideration of semiotic approach in the form of semantic, syntactic and pragmatic parts. The classification of key component systems with a brief description for each class: industrial systems, subjectoriented analytical systems statistical packages neural networks, packets based on decision trees, a system of reasoning based on similar cases, genetic algorithms, evolutionary programming.

Текст научной работы на тему «Интеллектуальный анализ геоданных»

Международный электронный научный журнал ISSN 2307-2334 (Онлайн)

Адрес статьи: pnojournal.wordpress.com/archive15/15-06/ Дата публикации: 1.01.2016 № 6 (18). С. 24-30. УДК 004

С. В. Шайтура

Интеллектуальный анализ геоданных

В статье рассмотрены особенности интеллектуального анализа данных. Показано, что в информационных системах применяется не информация, а информационные модели. Статья раскрывает проблемы интеллектуального анализа данных. отмечено применение информационных единиц как единиц анализа данных. Статья раскрывает особенности интеллектуального анализа геоданных (geodata mining). Описаны системы практического анализа, применяемые при интеллектуальном анализе геоданных.

В частности, описан процесс интеллектуального анализа данных в трёх стадиях: выявление закономерностей; использование выявленных закономерностей для предсказания неизвестных значений; анализ исключений, предназначенный для выявления и толкования аномалий в найденных закономерностях.

Описана организация геоданных с учетом семиотического подхода в виде семантической, синтаксической и прагматической частей.

Приведена классификация ключевых компонент систем с краткой характеристикой для каждого класса: индустриальные системы, предметно-ориентированные аналитические системы, статистические пакеты, искусственные нейронные сети, пакеты, основанные на деревьях решений, системы рассуждений на основе аналогичных случаев, генетические алгоритмы, эволюционное программирование.

Ключевые слова: информация, данные, интеллектуальный анализ, большие данные, геоданные, искусственный интеллект

Perspectives of Science & Education. 2015. 6 (18)

International Scientific Electronic Journal ISSN 2307-2334 (Online)

Available: psejournal.wordpress.com/archive15/15-06/ Accepted: 12 November 2015 Published: 1 January 2016 No. 6 (18). pp. 24-30.

S. V. Shaitura

Geodata mining

This article describes the features of data mining. The article argues that in the information systems used not information, and information models. The article reveals the problem of data mining. It noted the use of information units as the units of analysis. This article describes the features of geo-mining (geodata mining). This article describes the practical analysis system used in the intellectual analysis of geodata.

In particular, the data mining process in three stages: the detection of patterns; using the identified patterns to predict unknown values; analysis of exceptions intended to detect and interpret anomalies in the found regularities.

Describes the organization of the geodatabase with consideration of semiotic approach in the form of semantic, syntactic and pragmatic parts.

The classification of key component systems with a brief description for each class: industrial systems, subject-oriented analytical systems statistical packages neural networks, packets based on decision trees, a system of reasoning based on similar cases, genetic algorithms, evolutionary programming.

Keywords: Information, data mining, big data, geodata, artificial intelligence

Введение

С„ I еоданными называют данные об объ-/ ектах, процессах и являениях на земной поверхности Земле, которые включают как основу пространственную информацию [1, 2]. На эту основу нанизывают разнообразные данные для последующего пространственного, экономического, регионального и других видов анализа. Геоданные являются не просто данными, а представляют собой систему данных и информационный ресурс [3]. Одной из особенностей геоданных является то, что они отражают реально существующие пространственные отношения. Множество геоданных собирается с помощью разных технологий и систем. Данные отражают различные характеристики и свойства. Они могут иметь различные размерности разное количество значащих цифр, разное число разрядов, разную точность и т.д. Собранные данные могут храниться в виде наборов или файлов. Кроме того, при сборе данные могут организовывать связанные совокупности, называемые моделями [4]. Для того чтобы разнородные данные и модели можно было обрабатывать в одной системе они должны быть упорядочены и сведены к единой информационной модели, в которой они будут дополнять друг друга.

Проблемы интеллектуального анализа

Современный информационный бум привел к проблеме "большие данные" [5, 6]. Это потребовало создания специальных технологий для быстрой переработки этих данных [7]. Необходимость автоматизированного интеллектуального анализа данных стала очевидной в первую очередь из-за огромных массивов исторической и вновь собираемой информации. Трудно, даже приблизительно, оценить объем ежедневных данных, накапливаемых различными компаниями, государственными, научными и медицинскими организациями. Человеческий ум, даже такой тренированный, как ум профессионального аналитика, просто не в состоянии своевременно анализировать столь огромные информационные потоки. Специфика современных требований к такой переработке следующая:

• данные имеют неограниченный объем;

• данные являются разнородными (количественными, качественными, текстовыми);

• результаты должны быть конкретны и понятны;

• технологии для обработки сырых данных должны быть просты в использовании.

В основу современной технологии интеллектуальной обработки данных положена концепция шаблонов, отражающих фрагменты многоаспектных взаимоотношений в данных [8, 9]. Эти шаблоны представляют собой закономерности, свой-

ственные под выборкам данных, которые могут быть компактно выражены в понятной человеку форме. Поиск шаблонов производится методами, не ограниченными рамками априорных предположений о структуре выборки и виде распределений значений анализируемых показателей.

Найденные шаблоны должны отражать неочевидные, неожиданные регулярности в данных, составляющие так называемые скрытые знания. Сырые данные содержат глубинный пласт знаний, при грамотной раскопке которого могут быть обнаружены настоящие самородки.

Интеллектуальный анализ данных (ИАД) (data mining) — это процесс обнаружения в "сырых" (первичных) больших массивах данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности [7, 8, 9]. Интеллектуальный анализ данных можно рассматривать также как проце^ трансформации неявных знаний [10].

В общем случае процесс ИАД состоит из трёх стадий:

• выявление закономерностей (свободный поиск в информационном поле [11]);

• использование выявленных закономерностей для предсказания неизвестных значений (ретроспективное, текущее и прогностическое моделирование);

• анализ исключений, предназначенный для выявления и толкования аномалий в найденных закономерностях (ликвидация семантических разрывов[12]).

Все методы интеллектуального анализа данных подразделяются на две большие группы по принципу работы с исходными обучающими данными.

В первом случае исходные данные могут храниться в явном детализированном виде и непосредственно использоваться для прогностического моделирования и/или анализа исключений; это так называемые методы рассуждений на основе анализа прецедентов [13]. Главной проблемой этой группы методов является затрудненность их использования на больших объемах данных, хотя именно при анализе больших хранилищ данных методы ИАД приносят наибольшую пользу.

Во втором случае информация вначале извлекается из первичных данных и преобразуется в некоторые формальные конструкции (их вид зависит от конкретного метода). Согласно предыдущей классификации, этот этап выполняется на стадии свободного поиска, которая у методов первой группы в принципе отсутствует. Таким образом, для прогностического моделирования и анализа исключений используются результаты этой стадии, которые гораздо более компактны, чем сами массивы исходных данных. При этом полученные конструкции могут быть либо "прозрачными" (ин-

терпретируемыми), либо "черными ящиками" (не трактуемыми). В обеих случаях при обработке применяют логические информационные единицы [14] и иные информационные единицы [15].

Особенно широко методы интеллектуального анализа данных применяются в бизнес-приложениях аналитиками и руководителями компаний. Для этих категорий пользователей разрабатываются инструментальные средства высокого уровня, позволяющие решать достаточно сложные практические задачи без специальной математической подготовки. Актуальность использования интеллектуального анализа данных в бизнесе связана с жесткой конкуренцией, возникшей вследствие перехода от «рынка производителя» к «рынку потребителя». В этих условиях особенно важно качество и обоснованность принимаемых решений, что требует строгого количественного анализа имеющихся данных. При работе с большими объемами накапливаемой информации необходимо постоянно оперативно отслеживать динамику рынка, а это практически невозможно без автоматизации аналитической деятельности.

Типовые задачи для методов интеллектуального анализа данных следующие: прогнозирование, маркетинговый анализ, анализ работы персонала, анализ эффективности продажи товаров по почте, профилирование клиентов, оценка потенциальных клиентов, анализ результатов маркетинговых исследований, анализ работы региональных отделений компании, сравнительный анализ конкурирующих фирм/

ИАД не исключает человеческое участие в обработке и анализе, но значительно упрощает процесс поиска необходимых данных из сырых данных, делая его доступным для широкого круга аналитиков, не являющихся специалистами в статистике, математике или программировании. Человеческое участие выражается в когнитивных аспектах участия [16] и применения информационных когнитивных моделей [17]. Очевидно, что перечисленные виды задач актуальны практически для многих отраслей бизнеса: банковского дела и страхования (выявление злоупотреблений с кредитными карточками, оценка кредитных рисков, оценка закладных, выявление профилей пользователей, оценка эффективности региональных отделений, вероятность подачи заявки на выплату страховки и др.), финансовых рынков (прогнозирование, анализ портфелей, моделирование индексов), производства (прогнозирование спроса, контроль качества, оценка дизайна продукции), торговли и т. д.

Интеллектуальный анализ геоданных основан на data mining, но с учетом особенностей пространственной информации и пространственных отношений. На первом этапе интеллектуального анализа геоданных происходит их формирование или организация.

Организацией данных (рис.1) называется процедура сведения разнородных данных и моделей

в единую непротиворечивую информационную модель, которую в дальнейшем можно будет эффективно применять в различных технологиях анализа и управления. Эту особую информационную модель называют информационной основой.

Результатом организации данных является создание только такой информационной модели [18], которая позволяет организовать хранение в базе данных и обладает синергетическим свойствами. Следовательно, организация геоданных дает возможности создания для БД и возможность их автоматизированной обработки. Геоданные для их использования должны быть классифицированы, унифицированы, интегрированы и стратифицированы. Последовательность этих процедур показана на рисунке 1. Первым этапом является сбор информации. Он формирует так называемые первичные данные. Исходная первичная информация включает множество параметров, многие из которых дублируют друг друга. Уменьшение числа данных о реальных объектах достигается применением разных моделей, сохраняющих основные свойства объектов исследования и не содержащих второстепенных свойств.

Рис.1. Общая схема организации геоданных

Одной из особенностей сбора данных в геоинформатике является то, что исходные данные могут иметь не только разные размерности, но и измеряться в разных шкалах измерений. Организация геоданных направлена на объединение данных разных размерностей и шкал измерений в единую систему данных для их хранения и последующей обработки. Именно это создает возможность комплексного анализа данных, при работе с разнородными исходными данными, измеренными в разных шкалах измерений.

Поэтому следующим этапом является классификация собранной информации, которая служит основой дальнейших действий. Классификация данных позволяет соотносит различные модели и их характеристики к разным классам, подклассам и типам, что дает возможность систематизировать исходные наборы данных и

использовать свойства классов при анализе конкретных данных. Как дополнительный этап классификации геоданных в геоинформатике присутствует процедура локализации данных.

После того, как данные классифицированы, осуществляется их унификация. Разнообразие технологий и методов сбора данных порождает разнообразие типов данных, которые впоследствии необходимо обрабатывать. Обрабатывать множество различных данных неудобно и неэффективно. Для упрощения процесса обработки, хранения и обмена разнородные данные приводят к единому структурному виду, который используется при последующей обработке информации. Такие данные называют унифицированными.

Процедура сведения разнородных видов и структур данных к единому виду и структуре называется унификацией. В ходе унификации данных осуществляется построение единой формы данных.

После этих процедур возможно построение интегрированной модели. Унификация не создает систему данных, преобразует исходную совокупность разнородных и несогласованных данных в другую, но уже более согласованную и менее разнородную.

Для обработки по единой технологической системе и в единой информационной среде модели должны быть объединены на основе правила или метода, отвечающего требованиям оптимального хранения и обработки. Таким объединяющим методом является интеграция данных. интеграция данных и создает систему данных вместо совокупности данных

Необходимо отметить, что геоданные образуют естественную информационную систему данных [3]. Это обусловлено тем, что они отображают реальные объекты и явления земной поверхности, которые расположены не произвольно, а организовано и имеют объективные связи друг с другом. Можно говорить, что информация об объектах и явлениях земной поверхности образует некую систему. Отдельные модели или данные являются элементами такой системы.

Интеграцией называют восстановление и (или) повышение качественного уровня взаимосвязей между элементами системы, а также процесс создания из нескольких разнородных систем единой системы, с целью исключения (до технически необходимого минимума) функциональной и структурной избыточности и повышения общей эффективности функционирования [19].

Таким образом, интеграция данных приводит к установлению дополнительных связей между данными и эти связи можно назвать системными. Можно сказать, что именно интеграция данных приводит к появлению геоданных как системы. Можно также сказать, что интеграция данных создает интегрированную модель геоданных. Интегрированная модель не является просто суммой информационных частей ее образующих. Она, как правило, имеет меньший объем физической па-

мяти при сохранении информационной емкости по сравнению с информационными моделями, ее составляющими, хотя включает данные о связях и дополнительную служебную информацию. Кроме того, она включает дополнительные связи между исходными данными, что создает синерге-тический эффект. Как следствие появляется возможность решения большего количества задач, в частности комплексного анализа данных и коррелятивного анализа [20].

В реальности многие модели можно отнести к интегрированным. Поэтому говорят о степени интеграции, однако другим важным параметром являет критерий или аспект интеграции. Он служит основой объединения данных в интегрированную модель. Важным свойством интеграции является то, что интеграция это не просто объединение данных, а приобретение этой моделью дополнительных свойств. В результате интеграции данных создается модель, обладающая дополнительными свойствами или, говоря языком синергетики, имеющая синергетический эффект.

Интегрированная модель является развитием информационной модели. Она более сложная, но по этой причине не только описывает информационные свойства объекта, но позволяет проводить эффективную обработку данных, относящихся к исследуемому объекту. В этом преимущество интегрированной модели.

Аспект интеграции связан с выбором устойчивого критерия интеграции. В геоинформатике имеется особенность аспекта интеграции данных. Она заключается в том, что геоданные рассматривают с учетом трех аспектов: пространственного, временного и тематического. Это означает, что данные, собираемые и хранимые в базе геоданных (БГД), группируют по трем характеристикам: "место", "время", "тема".

Данные, которые выбирают для интеграции, должны быть наиболее устойчивыми или наименее изменяющимися. Временные данные по определению изменяющиеся и поэтому не могут служить основой интеграции. Тематические данные также изменчивы, они могут меняться могут исчезать или появляться в новых видах, поэтому и они не могут служить основой интеграции.

Пространственные данные - наиболее устойчивые и наименее меняющиеся, поэтому в этой группе следует искать основу для интеграции. Среди пространственных данных наиболее устойчивыми (наименее изменчивыми) являются координаты. Именно они являются основой для объединения различных данных, т.е. основой для интеграции.

Характеристика "место" является наиболее устойчивой в системе координат земной поверхности, в то время как характеристики "время" и "тема" являются изменчивыми от объекта к объекту. Глобальная устойчивость характеристики "место" и послужила основой интеграции других видов информации на этой основе.

Таким образом, если локализация создает совокупность данных с вертикальными связями, то интеграция создает систему унифицированных данных с вертикальными и горизонтальными связями. Именно системность организации данных на основе интеграции обеспечивает эффективность анализа и обработки геоданных как в геоинформатике, так и в других научных направлениях.

В результате интеграции получается некая система данных напоминающая таблицу или "универсальное отношение" из теории реляционных баз данных. Работать с такой одной таблицей неудобно и как следует из теории баз данных, ее разбивают, используя процедуры нормализации.

Другими словами, в полученной системе геоданных целесообразно задать некую структуру для удобства анализа и обработки. Для структуризации системы геоданных применяю процесс называемый стратификацией. Стратификация означает разбиение совокупности или системы на части, называемые стратами или слоями.

Стратификация координатных данных основана на важной функции координатных моделей отображать пространственные свойства объектов. Пространственные объекты характерны тем, что имеют графическую форму представления. При стратификации данные организуются в слои, а слои группируются в соответствии с задаваемыми темами, которые соответствуют объектам. Группировка может быть по некой теме, например "транспорт" или "подземные коммуникации".

Самый нижний слой называют элементным [21]. Он разбивает геоданные на три пространственных типа. Это данные ареальные - А, линейные -Л, точечные Т. Далее слои группируются в соответствии с задаваемыми темами, которые соответствуют объектам.

Таким образом, стратификация это не просто структуризация геоданных, а создание инструмента анализа и обобщения данных на разных территориальных или админстративно-террито-риальных уровнях.

Кроме того, стратификация превращает геоданные в уникальный информационный ресурс. В целом геоданные можно рассматривать как систему данных. Но на нижнем уровне стратификации геоданные предстают в виде информационных единиц [15]. Это дает возможность организации геоинформационного моделирования с уровня информационных единиц на глобальный уровень.

Особенностью геоданных является наличие динамической связи между графическими данными и атрибутивными данными. Изменение атрибутивных данных влечет автоматическую замену графической информации. Это создает хорошую основу для пространственного анализа и управления. Геоданные организовывают с учетом семиотического подхода, а именно в виде семантической, синтаксической и прагматиче-

ской частей.

Семантическая часть содержит информацию об объектах и способ ее кодирования. Синтаксическая часть включает правила построения моделей объектов и способ их отнесения к классу известных моделей. Прагматическая часть определяет ценность информации или дает возможность ее оценить. При отсутствии любой их этих трех частей информационная модель геоданных не пригодна для использования.

_Классы систем ИАД

При интеллектуальном анализе геоданных они анализируются на тех же системах. что и обычные данные. ИАД является мульти-дисциплинарной областью, возникшей и развивающейся на базе достижений прикладной статистики, распознавания образов, методов искусственного интеллекта, теории баз данных и др. [7]. Отсюда обилие методов и алгоритмов, реализованных в различных действующих системах ИАД. Многие из таких систем интегрируют в себе сразу несколько подходов. Тем не менее, как правило, в каждой системе имеется какая-то ключевая компонента, на которую делается главная ставка. Приведем классификацию указанных ключевых компонент с краткой характеристикой для каждого класса.

Индустриальные системы ИАД [22]. В настоящее время большинство ведущих в мире производителей программного обеспечения предлагает свои продукты и решения в области ИАД. Как правило - это масштабируемые системы, в которых реализованы различные математические алгоритмы анализа данных. Они имеют развитый графический интерфейс, богатые возможности в визуализации и манипулирования с данными, предоставляют доступ к различным источникам данных.

Предметно-ориентированные аналитические системы [23]. Предметно-ориентированные аналитические системы очень разнообразны. Эти системы решают узкий класс специализированных задач. Наиболее широкий подкласс таких систем, получивший распространение в области исследования финансовых рынков, носит название "технический анализ". Он представляет собой совокупность нескольких десятков методов прогноза динамики цен и выбора оптимальной структуры инвестиционного портфеля, основанных на различных эмпирических моделях динамики рынка.

Статистические пакеты [24]. Это мощные математические системы, предназначенные для статистической обработки данных любой природы. Они включают многочисленные инструменты статистического анализа, имеют развитые графические средства. Главный недостаток систем этого класса - их невозможно эффективно применять для анализа данных, не имея глубоких знаний в области статистики. Неподготовлен-

ный пользователь должен пройти специальный курс обучения.

Искусственные нейронные сети [25]. Это широкий класс разнообразных систем, представляющих собой иерархические сетевые структуры, в узлах которых находятся так называемые нейроны. Сети тренируются на примерах, и во многих случаях дают хорошие результаты предсказаний. Основными недостатками нейронных сетей являются необходимость иметь очень большой объем обучающей выборки, а также трудности в интерпретации результатов. Тренированная нейронная сеть представляет собой "умный черный ящик", работу которого невозможно понять и контролировать

Пакеты, основанные на деревьях решений [26]. Деревья решений являются одним из наиболее популярных подходов к решению задач ИАД. Этот метод используется только для решения задач классификации. Это является его серьезным ограничением. Результатом работы метода является иерархическая древовидная структура классификационных правил типа "1Г..ТНЕ№..". Достоинством метода является естественная способность классификации на множество классов.

Системы рассуждений на основе аналогичных случаев [27]. Для того чтобы сделать прогноз на будущее или выбрать правильное решение, эти системы находят в прошлом близкие аналоги наличной ситуации и выбирают тот же ответ, который был для них правильным. Поэтому этот метод еще называется методом "ближайшего соседа". Эти системы показывают очень хорошие результаты в самых разнообразных задачах.

Генетические алгоритмы [28]. Строго говоря, интеллектуальный анализ данных - далеко не основная область применения генетических алгоритмов, которые, скорее, нужно рассматривать как мощное средство решения разнообразных комбинаторных задач и задач оптимизации. Тем не менее, генетические алгоритмы вошли сейчас

в стандартный инструментарий методов ИАД. Этот метод назван так потому, что в какой-то степени имитирует процесс естественного отбора в природе.

Эволюционное программирование [29]. Проиллюстрируем современное состояние данного подхода на примере системы Ро1уАпа^ — отечественной разработке, получившей сегодня общее признание на рынке ИАД. В данной системе гипотезы о виде зависимости целевой переменной от других переменных формулируются в виде программ на некотором внутреннем языке программирования. Процесс построения программ строится как эволюция в мире программ (этим подход немного похож на генетические алгоритмы).

Заключение

Причиной роста популярности ИАД является объективность получаемых результатов. Человеку-аналитику, в отличие от машины, всегда присущ субъективизм, он в той или иной степени является заложником уже сложившихся представлений. Иногда это полезно, но чаще приносит большой вред. Геоданные являются одним из многих универсальных средств анализа пространственных объектов и явления и инструментом познания окружающего мира. Они применяются не только в геоинформатике, но и в других научных направлениях, включая искусственный интеллект [30]. Проблема интеллектуального анализа геоданных сводится к решению ряда проблем. Однако организация геоданных приводит к созданию интегрированной системы данных, включающей систему моделей и систему информационных единиц. Это определяет геоданные как уникальный информационный ресурс который применяют в науке образовании и на производстве для получения новых знаний.

ЛИТЕРАТУРА

1. Омельченко А. С. Геоданные как инновационный ресурс // Качество, инновации, образование. 2006. № 1. С.12-14.

2. Цветков В.Я., Домницкая Э.В. Геоданные как основа цифрового моделирования // Современные наукоёмкие технологии. 2008. № 4. С.100-101.

3. Савиных В.П., Цветков В.Я. Геоданные как системный информационный ресурс // Вестник Российской Академии Наук, 2014, том 84, № 9, С.826-829. DOI: 10.7868/S0869587314090278

4. Омельченко А. С. Информационные модели пространственных объектов в геоинформационных системах // Качество, инновации, образование. 2006. №3. С.14-17.

5. Tsvetkov V. Yа., Lobanov A. A. Big Data as Information Barrier // European Researcher, 2014, Vol.(78), № 7-1, p. 1237-1242

6. Черняк Л. Большие данные - новая теория и практика // Открытые системы. СУБД. 2011. №10. С.18-25.

7. Шайтура С.В. Интеллектуальный анализ данных // Славянский форум. 2010. № 2(8). С.341-350.

8. Berry M. J., Linoff G. Data mining techniques: for marketing, sales, and customer support. John Wiley & Sons, Inc., 1997.

9. Hall M. et al. The WEKA data mining software: an update //ACM SIGKDD explorations newsletter. 2009. Т. 11. №. 1. С. 10-18.

10. Цветков В.Я. Неявные знания в космических исследованиях // Перспективы науки и образования. 2015. №4. С.19-27.

11. Tsvetkov V.Ya. Information field. // Life Science Journal. 2014. № 11(5). рр.551-554.

12. Tsvetkov V. Ya. Information Interaction as a Mechanism of Semantic Gap Elimination // European Researcher, 2013, Vol.(45), № 4-1, p.782-786.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Й.3. Ожерельева Т. А. Организационное эвристическое управление // Государственный советник. 2014. №4. С. 69-75. ЕЙ. Ожерельева Т.А. Логические информационные единицы // Славянский форум, 2015. № 2(8). С.240-249.

15. Цветков В. Я. Информационные единицы сообщений // Фундаментальные исследования. 2007. №12. С.123-124.

16. Болбаков Р.Г. Анализ когнитивности в науке и образовании // Перспективы науки и образования. 2014. № 4. С. 15-19. |;7. Tsvetkov V.Ya. Cognitive information models // Life Science Journal. 2014. № 11(4). pр. 468-471.

18. Цветков В.Я. Информационная модель как основа обработки информации в ГИС // Известия высших учебных заведений. Геодезия и аэрофотосъемка. 2005. №2. С.118-122.

19. Соловьев И.В. Применение модели информационной ситуации в геоинформатике Науки о Земле. 2012. № 01. С. 54-58.

20. Цветков В.Я., Оболяева Н.М. Использование коррелятивного подхода для управления персоналом учебного заведения // Дистанционное и виртуальное обучение. 2011. №8 (50). С.4-9.

21. Ковальчук А.К, Шайтура С.В., и др. Геоинформационные системы в управлении двуногими шагающими роботами. Часть 3. Интеллектуальные аналитические системы. 2009. М.: Рудомино, 160 с.

g2. Перминов Г.И. УМК - «Системы интеллектуального анализа данных» (Business Intelligence). Тема 15. ГУ-ВШЭ, 2007.

ЦЗ Поляков В.И. Предметно-ориентированные экономические информационные системы. М.: Горячая линия-Телеком, 2013. 244 с.

Ц4. Орлов А.И. Статистические пакеты-инструменты исследователя // Заводская лаборатория. Диагностика материалов. 2008. Т. 74. №. 5. С. 76-78.

25. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая линия-Телеком, 2004. 452 с.

26. Чернов В.Г. Нечеткие деревья решений (нечеткие позиционные игры) // Информационно-управляющие системы. 2010. № 5.(48). С.8-14.

27. Варшавский П.Р., Еремеев А.П. Моделирование рассуждений на основе прецедентов в интеллектуальных системах поддержки принятия решений // Искусственный интеллект и принятие решений. 2009. № 2. С. 45-57.

28. Дюк В.А. Data Mining-интеллектуальный анализ данных. СПб: Санкт-Петербургский институт информатики и автоматизации РАН. 2006.

§9. Курейчик В.М., Родзин С.И. Эволюционные вычисления: генетическое и эволюционное программирование // Новости искусственного интеллекта. 2003. Т. 5. С. 13-20.

30. Савиных В.П., Цветков В.Я. Развитие методов искусственного интеллекта в геоинформатике // Транспорт Российской Федерации. 2010. № 5. С. 41-43.

REFERENCES

Omel'chenko A. S. GEODATA as an innovative resource. Kachestvo, innovatsii, obrazovanie - Quality, innovation, education, 2006, no. 1, pp.12-14 (in Russian).

Tsvetkov V.Ia., Domnitskaia E.V.GEODATA as a basis for digital modelling. Sovremennye naukoemkie tekhnologii - Modern high technologies, 2008, no. 4, pp.100-101 (in Russian).

Savinykh V.P., Tsvetkov V.Ia. GEODATA as an system information resource. Vestnik Rossiiskoi Akademii Nauk - Bulletin of the Russian Academy of Sciences, 2014, V. 84, no. 9, pp.826-829. DOI: 10.7868/S0869587314090278

Omel'chenko A. S. Information models for spatial objects in geographic information systems. Kachestvo, innovatsii, obrazovanie

- Quality, innovation, education, 2006, no. 3, pp.14-17 (in Russian).

5. Tsvetkov V. Ya., Lobanov A. A. Big Data as Information Barrier. European Researcher, 2014, Vol.(78), no. 7-1, pp. 1237-1242

6. Cherniak L. Big data - a new theory and practice. Otkrytye sistemy. SUBD - Open systems. DBMS, 2011, no. 10, pp.18-25 (in Russian).

7. Shaitura S.V. Intelligent data analysis. Slavianskii forum - Slavic forum, 2010, no. 2(8), pp.341-350 (in Russian).

8. Berry M. J., Linoff G. Data mining techniques: for marketing, sales, and customer support. John Wiley & Sons, Inc., 1997.

9. Hall M. et al. The WEKA data mining software: an update // ACM SIGKDD explorations newsletter. 2009. V. 11. no. 1. pp. 10-18.

10. Tsvetkov V.Ia. Tacit knowledge in space research. Perspektivy nauki i obrazovaniia - Perspectives of science and education, 2015, no. 4, pp.19-27 (in Russian).

11. Tsvetkov V.Ya. Information field. Life Science Journal, 2014, no. 11(5), pp.551-554.

12. Tsvetkov V. Ya. Information Interaction as a Mechanism of Semantic Gap Elimination. European Researcher, 2013, Vol.(45), no. 4-1, pp.782-786.

13. Ozherel'eva T. A. OOrganizational heuristic management. The State Counsellor, 2014, no. 4, pp. 69-75 (in Russian).

14. Ozherel'eva T.A. Logical information units. Slavianskii forum - Slavic forum, 2015, no. 2(8), pp.240-249 (in Russian).

15. Tsvetkov V. Ia. Information items reports. Fundamental'nye issledovaniia - Fundamental research, 2007. no. 12, pp.123-124 (in Russian).

16. Bolbakov R.G. Analysis of cognition in science and education. Perspektivy nauki i obrazovaniia - Perspectives of science and education, 2014, no. 4, pp. 15-19 (in Russian).

17. Tsvetkov V.Ya. Cognitive information models. Life Science Journal, 2014, no. 11(4), pp. 468-471.

18. Tsvetkov V.Ia. Information model as the basis for information processing in GIS. Izvestiia vysshikh uchebnykh zavedenii. Geodeziia i aerofotos"emka - Proceedings of higher educational institutions. Geodesy and aerial photography, 2005, no. 2, pp.118-122 (in Russian).

19. Solov'ev I.V. Application of model information situation in Geoinformatics. Nauki o Zemle - Earth Sciences, 2012, no. 1, pp.54-58 (in Russian).

20. Tsvetkov V.Ia., Oboliaeva N.M. The use of the correlative approach to personnel management of the educational institution. Distantsionnoe i virtual'noe obuchenie - Distance and virtual learning, 2011, no. 8 (50), pp.4-9 (in Russian).

21. Koval'chuk A.K, Shaitura S.V., i dr. Geoinformatsionnye sistemy v upravlenii dvunogimi shagaiushchimi robotami. Chast' 3. Intellektual'nye analiticheskie sistemy. 2009. M.: Rudomino, 160 s.

22. Perminov G.I. UMK- «Sistemyintellektual'nogo analizadannykh» (Business Intelligence). Tema 15 [CMD - "System for intelligent data analysis" (Business Intelligence). Theme 15]. GU-VShE, 2007.

23. Poliakov V.I. Predmetno-orientirovannye ekonomicheskie informatsionnye sistemy [Subject-oriented economic information systems]. Moscow, Goriachaia liniia-Telekom Publ., 2013. 244 p.

24. Orlov A.I. Statistical packages-the tools of the researcher. Zavodskaia laboratoriia. Diagnostika materialov - Factory laboratory. Diagnostics of materials, 2008, V. 74, no. 5, pp. 76-78 (in Russian).

25. Rutkovskaia D., Pilin'skii M., Rutkovskii L. Neironnye seti, geneticheskie algoritmy i nechetkie sistemy [Neural networks, genetic algorithms and fuzzy systems]. Moscow, Goriachaia liniia-Telekom Publ., 2004. 452 p.

26. Chernov V.G. Fuzzy decision trees (fuzzy positional games). Informatsionno-upravliaiushchie sistemy - Information and control systems, 2010, no. 5.(48), pp.8-14 (in Russian).

27. Varshavskii P.R., Eremeev A.P. Modeling of reasoning on the basis of precedents in intellectual systems of decision support. Iskusstvennyi intellekt i priniatie reshenii, 2009, no. 2, pp. 45-57 (in Russian).

28. Diuk V.A. Data Mining-intellektual'nyi analiz dannykh [Data Mining-data mining]. Saint-Petersburg, SPIIA RAN Publ., 2006.

29. Kureichik V.M., Rodzin S.I. Evolutionary computation: genetic and evolutionary programming. Novostiiskusstvennogo intellekta

- News of artificial intelligence, 2003, V. 5, pp. 13-20 (in Russian).

30. Savinykh V.P., Tsvetkov V.Ia. Development of artificial intelligence methods in Geoinformatics. Transport Rossiiskoi Federatsii -Transport of the Russian Federation, 2010, no. 5, pp. 41-43 (in Russian).

Информация об авторе Information about the author

Шайтура Сергей Владимирович Shaitura Sergei Vladimirovich

(Россия, Москва) (Russia, Moscow)

Кандидат технических наук, доцент PhD in Technical Sciences

Московский финансово-промышленный университет Associate Professor

«Синергия» Moscow Financial-Industrial University "Synergy"

E-mail: [email protected] E-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.