УДК 658.5
Тишина А. О. студент 3 курса Институт финансов, экономики и управления Тольяттинский государственный университет
Россия, Тольятти
ЗНАЧЕНИЕ ДАННЫХ В КАЧЕСТВЕ
Аннотация: В статье говорится о том, как влияют данные на качество продукции. Как правильно хранить большие объёмы данных и как с ними правильно работать. Так же рассказывается о видах данных и как они влияют на качество.
Ключевые слова: качество, данные, машинное обучение, энтропия данных, родословная данных.
Tishina A. O. 3rd year student
Institute of finance, economics and management
Togliatti State University Russia, Togliatti
THE IMPORTANCE OF DATA IN QUALITY
Annotation: The article talks about how data affects product quality. How to store large amounts of data and how to work with them properly. It also talks about the types of data and how they affect quality.
Keywords: quality, data, machine learning, data entropy, data pedigree.
По мере увеличения объема данных, создаваемых и хранимых организациями, расширенная аналитика, такая как машинное обучение, играет решающую роль в превращении этих данных в значимые бизнес-идеи и помощи в обеспечении качества. В то же время организации сталкиваются со значительными проблемами из-за быстрого расширения типов данных. Если они хотят успешно использовать возможности, фирмы должны преодолеть недостатки, присущие хранилищам данных, а также устранить плохую видимость перемещений данных и "беспорядок" энтропии данных.
Хранилища данных - объединение в эпоху аналитики данные являются основным активом для компаний, предоставляющих финансовые услуги, однако большая их часть сильно распределена по разрозненным и изолированным системам, отделам, функциям, географическим районам, базам данных, файлам и архивам. Даже самые простые запросы должны
обрабатываться по нескольким каналам и бизнес-областям, каждая из которых имеет доступ к различным источникам данных. Главное -обеспечить доступность данных в нужное время, в нужном месте и в нужном формате. Для достижения этой цели фирмы должны объединить свои хранилища данных с помощью аналитической платформы. Такие платформы являются основополагающими инструментами для согласования данных, позволяющими фирмам наиболее эффективным и действенным образом собирать, хранить, вычислять и анализировать данные из различных источников.
Родословная данных - четкая линия видимости. В мире больших данных современные методы оценки информационных рисков и контроля прискорбно недостаточны, поскольку они не обеспечивают адекватной видимости данных. Инструмент для отслеживания данных от точки происхождения до преобразования и, в конечном счете, потребления, передача данных может заполнить этот пробел. Однако его потенциал не используется из-за отсутствия отраслевых стандартов. Существует три важнейших руководящих принципа, позволяющих сделать передачу данных полезной и стандартизированной. Во-первых, сделайте это дружественным к бизнесу. Во-вторых, выделите контекст и принадлежность данных. И в-третьих, покажите, как данные преобразуются и используются. Фирмы, которые успешно используют передачу данных, получат дополнительную ценность за счет снижения затрат наряду со снижением рисков с помощью усиленного контроля.
Энтропия данных - устранение беспорядка. Нежелание организаций удалять данные приводит к переполнению хранилищ, заполненных устаревшей, невидимой и труднодоступной информацией. Другими словами, беспорядок в данных. Временные исправления только добавляют дополнительные уровни беспорядка и приводят к энтропии данных -тенденции к тому, что данные внутри предприятия становятся все более неупорядоченными. В то время как большие программы часто ориентированы на данные и создают беспорядок в данных, они также предоставляют возможность внедрять передовые на рынке методы управления данными. Организация, которая прививает культуру, в которой данные рассматриваются как актив, сможет обеспечить, чтобы каждая крупная программа служила укреплению ее экосистемы данных.
Машинное обучение - охватывающее автоматизацию. Машинное обучение может автономно идентифицировать шаблоны, анализировать данные и интерпретировать их с помощью отчетов и визуализации данных. МЬ может быть мощным дополнением к любому инструментарию анализа данных, но требуется тщательное планирование и понимание соответствующих методов на высоком уровне. Бизнес-вопрос, на который организация стремится ответить, определит тип МЬ, который будет развернут; и тип и качество доступных данных также должны быть
ключевыми соображениями. Если фирмы смогут успешно объединить данные в разных хранилищах, внедрить линейку данных для повышения видимости и использовать реализации крупных программ для снижения энтропии, то возможности, предоставляемые машинным обучением, будут значительными.
Использованные источники:
1. ГОСТ Р ИСО 9001-2008. Системы менеджмента качества. Требования.
2. Голдратт, Элия Цель. Процесс непрерывного улучшения / Элия Голдратт, Джефф Кокс. - М.: Попурри, 2012. - 512 с.
3. Адлер Ю.П., Щепетова С.Е. Система экономики качества. - М: РИА «Стандарты и качество», 2005
4. Все о качестве. Отечественные разработки. Выпуск №1(70), 2011. - М.: НТК "Трек", 2011. - 883 с.