Научная статья на тему 'ОБ ИСПОЛЬЗОВАНИИ МЕТОДОВ DATA MINING ДЛЯ ОБРАБОТКИ ДАННЫХ'

ОБ ИСПОЛЬЗОВАНИИ МЕТОДОВ DATA MINING ДЛЯ ОБРАБОТКИ ДАННЫХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
17
6
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
DATA PROCESSING / DATA MINING / STATISTICS / INFORMATION / SYSTEM

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Базов А.В.

В работе анализируются особенности применения методов data mining. Отмечаются закономерности, позволяющие распознать подобный вид данных. Указано в каких сферах используют такие методы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ABOUT THE USE OF DATA MINING METHODS TO PROCESS DATA

The paper analyzes the peculiarities of application of data mining methods. The regularities which allow to recognize such kind of data are marked. It is Indicated in what areas are using such methods.

Текст научной работы на тему «ОБ ИСПОЛЬЗОВАНИИ МЕТОДОВ DATA MINING ДЛЯ ОБРАБОТКИ ДАННЫХ»

УДК 681.3

Базов А.В. студент

4 курс, факультет информационных технологий Воронежский институт высоких технологий

Россия, г. Воронеж

ОБ ИСПОЛЬЗОВАНИИ МЕТОДОВ DATA MINING ДЛЯ ОБРАБОТКИ

ДАННЫХ

В работе анализируются особенности применения методов data mining. Отмечаются закономерности, позволяющие распознать подобный вид данных. Указано в каких сферах используют такие методы.

Ключевые слова: обработка данных, data mining, статистика, информация, система.

Bazov A.V. student

4 course, the faculty of information technology Voronezh institute of high technologies

Russia, Voronezh

ABOUT THE USE OF DATA MINING METHODS TO PROCESS DATA

The paper analyzes the peculiarities of application of data mining methods. The regularities which allow to recognize such kind of data are marked. It is Indicated in what areas are using such methods.

Keywords: data processing, data mining, statistics, information, system.

Электронная информация применяется сейчас все в большей степени во всех областях жизни в современном обществе. В информационных хранилищах, которые распределены по всему миру, содержатся миллионы терабайт данных текстового типа [1, 2]. Но при этом происходящее развитие ресурсов Интернета весьма сильно ухудшило решение проблем по информационной перегрузке. Неподготовленные неструктурированные данные входят в состав не менее 90% информации, по которой проводят работу пользователи. Понятно, что обнаружить полезную информацию среди нескольких тысяч терабайт в электронных текстах весьма трудно. В этой связи даже очень ценные для каких-либо пользователей документы в течение длительного времени могут быть невостребованными, так как провести их поиск очень часто не представляется возможным [3, 4].

С другой стороны, параллельно с ростом всемирной сети идет рост и мощностей для средств поиска содержащейся в ней требуемой информации. Причем увеличивающаяся эффективность для информационно-поисковых систем (ИПС) имеет дело не только с увеличением производительности их аппаратной части и ростом пропускной способности по каналам связи, но и с применением новых алгоритмов поиска и упорядочиванием данных, формированием схем по запросу, которые необходимы для того, чтобы максимально точно провести определение информационных потребностей

по каждому конкретному пользователю [5, 6], кроме того, идут внедрения новых поисковых сервисов.

Ясно, что без проведения продуктивных переработок потоков сырых данных возникает бесполезный информационный шум. Исходя из таких проблем появилось направление Text Mining, которое включает в свой состав технологию Data Mining, что в переводе означает добычу или раскопку данных. Бывает, что рядом с Data Mining идут слова, связанные с обнаружением знаний, которые находятся в базах данных и проведением интеллектуального анализа данных. Их можно рассматривать как синонимы Data Mining. Появление всех указанных терминов обусловлено с тем, что идет новый виток в развитии средств и способов обработки данных

[7].

Область использования Data Mining ничем не ограничивается - она есть везде, где имеются какие-либо данные. Отмечают пять стандартных типов закономерностей, которые дают возможности выявления методов Data Mining: на основе ассоциации, последовательности, классификации, кластеризации и прогнозирования: ассоциация появляется тогда, когда несколько событий имеют связь друг с другом; в том случае, когда есть цепочка событий, которые имеют связь то говорят о последовательности; на основе классификации происходит выявление признаков, характеризующих группу, к которой относится тот или иной объект. Это происходит на основе анализа уже классифицированных объектов и проведения формулировок определенных наборов правил; есть отличие кластеризации от классификации тем, что нет задания групп заранее. На основе кластеризации средства Data Mining самостоятельно делают выделение различных однородных групп данных; в качестве основы для различных систем прогнозирования является историческая информация, которая хранится в БД в виде временных рядов. В том случае, когда можно провести построение шаблонов, адекватно отражающих динамику поведения целевых показателей, можно говорить о вероятности, что на их основе можно провести предсказание и поведения системы в будущем.

Возникающие проблемы не всегда возможно решить на основе традиционной математической статистики. В качестве главной причины можно назвать концепцию усреднения по выборке, при которой приходят к тому, что рассматривают операции над фиктивными величинами.

Использование методов математической статистики оказывается полезным в основном при проведении проверок по заранее сформулированным гипотезам и для того, чтобы вести грубый разведочный анализ, который составляет основу для того, чтобы осуществлять оперативную аналитическую обработку данных.

В качестве основы рассматривают концепции шаблонов (паттернов), в которых отражаются фрагменты различных взаимоотношений среди данных.

Такие шаблоны являются закономерностями, которые свойственны подвыборкам данных, которые можно компактно выражать в понятной человеку форме. Проведение поиска шаблонов идет на основе способов, которые не ограничены в рамках априорных предположений о том, какова структура выборок и какой вид распределений значений по анализируемым показателям.

Можно рассмотреть еще другие примеры разных областей знания, в которых решение задач методами Data Mining играет или будет играть ведущую роль. В качестве особенности таких областей можно отметить их сложную системную организацию. Они имеют дело в основном с надкибернетическим уровнем организации систем, закономерности которого трудно достаточно точно описать в рамках статистических или других аналитических математических моделей. Для указанных областей данные рассматриваются как неоднородные, гетерогенные, нестационарные и часто отличающиеся высокой размерностью.

Идет экспоненциальное развитие систем. В таком развитии участвуют различные крупные корпорации. Например, Microsoft непосредственным образом осуществляет руководство большими секторами данных рынков (издается специальный журнал, проводятся конференции, идет разработка собственных продуктов).

Системы Data Mining используются для двух основных направлений:

-как массовые продукты в бизнес-приложениях;

-как инструменты для того, чтобы проводить уникальные исследования (в генетике, химии, медицине и др.).

Использованные источники: 1.Чопоров О.Н., Агарков А.И., Куташова Л.А., Коновалова Е.Ю. Методика преобразования качественных характеристик в численные оценки при обработке результатов медико-социального исследования / Вестник Воронежского института высоких технологий. 2012. № 9. С. 96-98.

2.Преображенский Ю.П. Разработка методов формализации задач на основе семантической модели предметной области / Вестник Воронежского института высоких технологий. 2008. № 3. С. 075-077.

3.Иванов М.С., Преображенский Ю.П. Разработка алгоритма отсечения деревьев / Вестник Воронежского института высоких технологий. 2008. № 3. С. 031-032.

4.Зяблов Е.Л., Преображенский Ю.П. Разработка лингвистических средств интеллектуальной поддержки на основе имитационно-семантического моделирования / Вестник Воронежского института высоких технологий. 2009. № 5. С. 024-026.

5.Зазулин А.В., Преображенский Ю.П. Особенности построения семантических моделей предметной области / Вестник Воронежского института высоких технологий. 2008. № 3. С. 026-028.

б.Ермолова В.В., Преображенский Ю.П. Методика построения семантической объектной модели / Вестник Воронежского института высоких технологий. 2012. № 9. С. 87-90.

7.Черников С.Ю., Корольков Р.В. Использование системного анализа при управлении организациями / Моделирование, оптимизация и информационные технологии. 2014. № 2 (5). С. 16.

УДК 330

Базова В.А. студент магистратуры 1 курс, финансово-экономический факультет Оренбургский государственный университет

Россия, г. Оренбург СОВРЕМЕННОЕ СОСТОЯНИЕ И ПРОБЛЕМА СОВЕРШЕНСТВАВАНИЯ УПРАВЛЕНИЯ ОСНОВНЫМИ

СРЕДСТВАМИ

В статье рассматриваются теоретические и практические аспекты совершенствования управления основными средствами для повышения эффективности производства на предприятии. Раскрыта сущность и дана сравнительная характеристика понятий «основные средства», «основные фонды», «основной капитал». Значительное внимание уделено проблеме совершенствования управления основными средствами. Приведен метод совершенствования управления основными средствами.

Ключевые слова: основные средства, основные фонды, основной капитал, управление основными средствами

В условиях рыночной экономики уделяется большое внимание таким вопросам как технический уровень, качество, надежность продукции, которые напрямую зависят от состояния основных средств предприятия и их эффективного использования. Поэтому в производственно-хозяйственной деятельности предприятия необъемлемым элементом являются основные средства [3].

Эффективное использование основных средств повышает производительность труда, фондоотдачу и прибыль, а также увеличивает выпуск продукции, снижает ее себестоимость. То есть на эффективность производства предприятия оказывает влияние состояние основных средств, их стоимость, технический уровень и структура.

Все указанное выше требует дальнейшего совершенствования механизма управления эффективностью использования основных средств.

Многие авторы отождествляют основной капитал со средствами труда. Основной капитал это не орудия труда, а деньги, авансированные на них, включая и ту часть, которая находится в обороте, т.е. еще не приняла денежную форму. А вот «основные средства» - это обобщающее наименование вещественного выражения орудий труда, а в стоимостном

i Надоели баннеры? Вы всегда можете отключить рекламу.