Научная статья на тему 'Идентификация виноматериалов с защищенным наименованием места происхождения с применением кластерного анализа'

Идентификация виноматериалов с защищенным наименованием места происхождения с применением кластерного анализа Текст научной статьи по специальности «Прочие технологии»

CC BY
102
232
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Вопросы питания
Scopus
ВАК
PubMed
Область наук
Ключевые слова
пищевой продукт с указанием географического места происхождения / идентификация / цифровой идентификационный критерий / кластеризация / диаграмма Вороного / регрессионная модель / food product with geographical indication / identification / digital identification criterion / clustering / Voronoi diagram / regression model

Аннотация научной статьи по прочим технологиям, автор научной работы — Семипятный Владислав Константинович, Хуршудян Сергей Азатович, Галстян Арам Генрихович

Производство продуктов с защищенным наименованием места происхождения (ПЗП) предполагает использование определенного сырья (сорт, органолептические и физико-химические характеристики и т.д.), что может быть подтверждено соответствующими испытаниями. В связи с этим актуально обоснование принципов выбора идентификационных критериев, позволяющих определять и подтверждать происхождение отечественных вин с защищенным наименованием места происхождения. Цель работы – разработка робастного дифференцирующего критерия, позволяющего определять подлинность и происхождение виноматериалов относительно эталона. Материал и методы. Авторами представлена кластеризационная методика, позволяющая на основе результатов испытаний и разработанных цифровых критериев идентификации подтверждать происхождение виноматериалов Краснодара и Ростова-на-Дону. В качестве критерия использованы данные анализа микрои макроэлементного состава виноматериалов этих регионов. Результаты. В статье постулируется: основная задача кластеризации; пути решения с позиций пищевой промышленности с использованием регрессионной модели пищевого продукта; информация по основным кластеризационным метрикам; области применения в зависимости от подхода к идентификации ПЗП. По результатам анализа содержания 21 минерального вещества (10 в мкг/л и 11 в мг/л) была построена регрессионная модель виноматериала. На основе модели были определены кластерные центры. Результирующая модель позволяет разделить два указанных винодельческих региона и сформировать пространственный цифровой дискриминационный критерий, основанный на близости к одному из установленных кластерных центров. Заключение. Предлагаемая модель может быть адаптирована для идентификации продукции различных отраслей пищевой промышленности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по прочим технологиям , автор научной работы — Семипятный Владислав Константинович, Хуршудян Сергей Азатович, Галстян Арам Генрихович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The identification of the primal wine production with the protected designation of origin with the appliance of cluster metrics

The article considers the guidelines of the choice of identification criteria, allowing to verify and confirm the geographical name of the origin of domestic primal wine production, thereby confirming their legal status. A priori the production of wine with protected designation of origin includes the use of certain raw materials with predetermined organoleptic and physical-chemical characteristics, which can be confirmed by respective tests. The aim of the work was to develop a robust differentiating criterion that allows one to determine the authenticity and origin of wine materials relative to the standard. Material and methods. The authors presented a clustering technique, which allows on the basis of test results and developed digital identification criteria to verify the origin of wine materials from Krasnodar and Rostov-on-Don regions. As a criterion, the data from the analysis of mineral and trace element composition of primal wine production in these regions have been used. Results. The article postulates following: the main concern of clustering, methods of identification from the perspective of food production using food regression model, information on fundamental clustering metrics, fields of appliance according to the approach of the identification of the product with indication of geographic place of origin. Based on the results of the analysis of the content of 21 mineral substances (10 in μg/l and 11 in mg/l), a regressive model of the primal wine production was built. Based on this model, cluster centers were identified. The resultant model allows us to distinguish the two mentioned wine regions and form a spatial digital discrimination criterion based on the proximity to one of the established cluster centers. Conclusion. The proposed model can be adapted to identify the production of different branches of the food industry.

Текст научной работы на тему «Идентификация виноматериалов с защищенным наименованием места происхождения с применением кластерного анализа»

Для корреспонденции

Семипятный Владислав Константинович - кандидат технических наук, заведующий Межотраслевым научно-техническим центром мониторинга качества пищевых продуктов ВНИИПБиВП -филиал ФГБНУ «ФНЦ пищевых систем им. В.М. Горбатова» РАН Адрес: 119021, Российская Федерация, г. Москва, ул. Россолимо, д. 7 Телефон: (995) 901-10-51 E-mail: semipyatniy@gmail.com https://orcid.org/0000-0003-1241-0026

Семипятный В.К.1, Хуршудян С.А.1, Галстян А.Г.2

Идентификация виноматериалов с защищенным наименованием места происхождения с применением кластерного анализа

1 Всероссийский научно-исследовательский институт пивоваренной, безалкогольной и винодельческой промышленности - филиал Федерального государственного бюджетного научного учреждения «Федеральный научный центр пищевых систем им. В.М. Горбатова» РАН, 119021, г. Москва, Российская Федерация

2 Федеральное государственное автономное научное учреждение «Всероссийский научно-исследовательский институт молочной промышленности», 115093, г. Москва, Российская Федерация

1 All-Russian Scientific Research Institute of Brewing, Beverage and Wine Industry -Branch of the Gorbatov's Federal Research Center for Food Systems of RAS, 119021, Moscow, Russian Federation

2 All-Russian Dairy Research Institute, 115093, Moscow, Russian Federation

Производство продуктов с защищенным наименованием места происхождения (ПЗП) предполагает использование определенного сырья (сорт, органолептиче-ские и физико-химические характеристики и т.д.), что может быть подтверждено соответствующими испытаниями. В связи с этим актуально обоснование принципов выбора идентификационных критериев, позволяющих определять и подтверждать происхождение отечественных вин с защищенным наименованием места происхождения.

Цель работы - разработка робастного дифференцирующего критерия, позволяющего определять подлинность и происхождение виноматериалов относительно эталона.

Материал и методы. Авторами представлена кластеризационная методика, позволяющая на основе результатов испытаний и разработанных цифровых

Финансирование. Работа выполнена в рамках государственного задания ВНИИПБиВП - филиала «ФНЦ пищевых систем им. В.М. Горбатова» РАН.

Конфликт интересов. Авторы декларируют отсутствие конфликтов интересов.

Для цитирования: Семипятный В.К., Хуршудян С.А., Галстян А.Г. Идентификация виноматериалов с защищенным наименованием места происхождения с применением кластерного анализа // Вопросы питания. 2020. Т. 89, № 5. С. 119-126. DOI: 10.24411/0042-8833-2020-10072 Статья поступила в редакцию 23.01.2020. Принята в печать 20.09.2020.

Funding. The work was carried out within the framework of the state assignment of All-Russian Scientific Research Institute of Brewing, Non-Alcoholic and Wine Industry - Branch of the V.M. Gorbatov Federal Research Center for Food Systems of RAS. Conflict of interest. The authors declare that they have no conflicts of interest.

For citation: Semipyatniy V.K., Khurshudyan S.A., Galstyan AG. The identification of the primal wine production with the protected designation of origin with the appliance of cluster metrics. Voprosy pitaniia [Problems of Nutrition]. 2020; 89 (5): 119-26. DOI: 10.24411/0042-8833-2020-10072 (in Russian)

Received 23.01.2020. Accepted 20.09.2020.

The identification of the primal wine production with the protected designation of origin with the appliance of cluster metrics

Semipyatniy V.K.1, Khurshudyan S.A.1, Galstyan A.G.2

критериев идентификации подтверждать происхождение виноматериалов Краснодара и Ростова-на-Дону. В качестве критерия использованы данные анализа микро- и макроэлементного состава виноматериалов этих регионов. Результаты. В статье постулируется: основная задача кластеризации; пути решения с позиций пищевой промышленности с использованием регрессионной модели пищевого продукта; информация по основным кластеризационным метрикам; области применения в зависимости от подхода к идентификации ПЗП. По результатам анализа содержания 21 минерального вещества (10 в мкг/л и 11 в мг/л) была построена регрессионная модель виноматериала. На основе модели были определены кластерные центры. Результирующая модель позволяет разделить два указанных винодельческих региона и сформировать пространственный цифровой дискриминационный критерий, основанный на близости к одному из установленных кластерных центров. Заключение. Предлагаемая модель может быть адаптирована для идентификации продукции различных отраслей пищевой промышленности. Ключевые слова: пищевой продукт с указанием географического места происхождения, идентификация, цифровой идентификационный критерий, кластеризация, диаграмма Вороного, регрессионная модель

The article considers the guidelines of the choice of identification criteria, allowing to verify and confirm the geographical name of the origin of domestic primal wine production, thereby confirming their legal status. A priori the production of wine with protected designation of origin includes the use of certain raw materials with predetermined organoleptic and physical-chemical characteristics, which can be confirmed by respective tests.

The aim of the work was to develop a robust differentiating criterion that allows one to determine the authenticity and origin of wine materials relative to the standard. Material and methods. The authors presented a clustering technique, which allows on the basis of test results and developed digital identification criteria to verify the origin of wine materials from Krasnodar and Rostov-on-Don regions. As a criterion, the data from the analysis of mineral and trace element composition of primal wine production in these regions have been used.

Results. The article postulates following: the main concern of clustering, methods of identification from the perspective of food production using food regression model, information on fundamental clustering metrics, fields of appliance according to the approach of the identification of the product with indication of geographic place of origin. Based on the results of the analysis of the content of 21 mineral substances (10 in pg/l and 11 in mg/l), a regressive model of the primal wine production was built. Based on this model, cluster centers were identified. The resultant model allows us to distinguish the two mentioned wine regions and form a spatial digital discrimination criterion based on the proximity to one of the established cluster centers.

Conclusion. The proposed model can be adapted to identify the production of different branches of the food industry.

Keywords: food product with geographical indication, identification, digital identification criterion, clustering, Voronoi diagram, regression model

Вопросы демографии и качества жизни населения непосредственно связаны с питанием. Согласно Стратегии повышения качества пищевой продукции в Российской Федерации до 2030 г., в рационе современного человека все больше внимания уделяется качеству пищевых продуктов. По положению ЕС № 1151/2012 Европейского парламента от 21 ноября 2012 г. пищевые продукты должны не только удовлетворять потребительским запросам, но и соответствовать по своему составу и свойствам современным требованиям нутрициологии. Несколько обособленно располагается группа продуктов с защищенным наименованием места происхождения (ПЗП), исторически свойственных той или иной местности. Качество данной группы продуктов предполагает

наличие алгоритма аутентификации и контролируется ГОСТ Р 55242-2012 «Вина защищенных географических указаний и вина защищенных наименований места происхождения. Общие технические условия», а также соответствующими национальными центрами мониторинга [1]. История производства отдельных ПЗП насчитывает многие столетия, в ходе которых сформировались строгие требования к качеству продукта [2]. В ряде стран ПЗП отмечаются особыми знаками, например, вина и сыры отмечают знаками АОС (Франция), DOC (Испания, Италия), а в соответствии с новой классификацией европейских вин будут использовать знак АОР.

Подтверждение географического места происхождения является сложной задачей идентификации, тре-

бующей проведения длительных комплексных аналитических измерений. В связи с вступлением в России в силу (с 27 июля 2020 г.) Закона № 230-Ф3 «О внесении изменений в часть четвертую Гражданского кодекса Российской Федерации и статьи 1 и 23.1 Федерального закона «О государственном регулировании производства и оборота этилового спирта, алкогольной и спиртосодержащей продукции и об ограничении потребления (распития) алкогольной продукции», который закрепляет новый подход индивидуализации продуктов - географическое происхождение, следует ожидать резкого увеличения числа ПЗП и опосредованного применения новых методов и алгоритмом комплексной оценки.

Проблема определения принадлежности пищевого продукта к конкретным группам [3-5], в том числе ПЗП, приобретает особую актуальность, учитывая тенденцию расширения их ассортимента. В настоящее время идентификационные критерии продуктов ПЗП устанавливаются без соответствующего математического обоснования, часто на основе лишь экспертного мнения. Такие критерии, внедренные в правовое поле, не обеспечивают должного барьера для исключения фальсификации.

Пищевые продукты являются многокомпонентными, имеют сложную матрицу состава, подтверждение которой используется для идентификации продукта [6, 7]. Известные методы идентификации [8] в ряде случаев не позволяют однозначно подтверждать происхождение ПЗП, а органолептическая оценка продукта часто осложняется наличием сложных концентрационных связей компонентов продукта [9].

Решение возникшей задачи определения характеристик продуктов с указанием географического происхождения возможно с использованием кластерной метрики. Целью работы было продемонстрировать принципы реализации предложенного метода на примере двух соседних винодельческих регионов России.

Материал и методы

В основу предлагаемого метода положено построение дискриминантного критерия - определение функции, которая принимает в качестве аргументов экспериментальные данные по образцам продукта, а на выходе определяет принадлежность этих образцов некоторым определенным ранее кластерам.

Предположим, что имеется п исследуемых образцов продукции и к измеримых критериев, по которым возможно экспериментально получить данные по каждому образцу. По этим данным строятся т кластеров - групп образцов продукции, каждая из которых объединена некоторыми критериями. Критерии, характерные для конкретных ПЗП, служат основой кластеризации [10].

Формальная задача кластеризации. Основная оптимизационная задача [11], решаемая в рамках кластеризации, имеет вид:

п

Ет/п .

/=1...т°(хС отт, (1)

/=1

где:

• х/ (/=1...п) - векторы в Як (к - количество критериев), соответствующие конкретным образцам пищевых продуктов. В дальнейшем будем называть их характеристическими векторами;

• о^ (у'=1...т) - выбранные кластерные центры, также являющиеся векторами в Як;

• о (о1.....от) - обобщенный вектор кластерных центров.

В дальнейшем будем называть его конфигурацией;

• й (•,•) - функция расстояния между точками пространства Як.

Формула (1) означает, что осуществляется поиск такой конфигурации кластерных центров, которая минимизирует суммарное расстояние точек образцов до соответствующих им ближайших кластерных центров.

Функция расстояния (также называемая дискриминирующей функцией) й (•,•) может быть произвольной [12], отвечающей задачам дискриминации в отдельно взятых отраслях пищевой промышленности, если она будет соответствовать определенным условиям [13].

Кластеризационные метрики. Наиболее употребительными функциями дифференциации, имеющими прикладное значение для пищевой промышленности, являются классическое Евклидово расстояние, манхэт-тенское расстояние и расстояние по косинусу [14-16]. Наиболее предпочтительно из них Евклидово расстояние. Манхэттенское расстояние более предпочтительным, если стоит задача кластеризации по дискретным данным (например, экспертным балльным оценкам). Расстояние по косинусу используется, когда имеется асимметричность данных - в случаях, когда вклад одного значения компонента превалирует над другим. Например, в задачах мониторинга качества и управления рисками гораздо большим весом обладает информация о том, что компонент выбивается из нормативных значений, чем та, что компонент находится в пределах нормы.

Регрессионная модель пищевого продукта. Когда количество исследуемых критериев продукта к >3, невозможна визуальная оценка построенных кластеров и дискриминантных критериев продукции, что существенно усложняет объяснение их физического смысла. Для решения этой проблемы можно прибегнуть к построению регрессионной модели пищевого продукта. В этом случае следует использовать классическую задачу поиска линейной функции:

у = а0 + а1 х1 + а2 х2 + ... + ак хк, (2)

где (х1.....хк) - значения измеримых критериев для некоторого образца продукта, и модифицируем ее следующим образом:

Таблица. 1. Минеральный (условно макроэлементный) состав (мг/л) образцов виноматериалов

Table 1. The content of mineral elements (In mg/l) In wine material samples

Минеральный элемент Mineral element Краснодар Krasnodar Ростов-на-Дону Rostov-on-Don

х a х a

B 11,7 6,0 11,5 4,4

Na 15,1 14,3 112,2 73,3

Mg 69,5 14,2 119,1 41,6

Al 0,4 0,7 1,1 0,5

Si 30,8 10,4 36,6 15,5

P 63,7 71,2 120,9 38,2

Mn 0,7 0,4 1,1 0,4

Zn 0,2 0,1 1,1 0,8

Rb 1,1 0,5 1,7 0,6

Sr 0,6 0,2 1,2 0,5

П р и м е ч а н и е. Здесь и в табл. 2: х - среднее значение; а -стандартное отклонение.

N o t e. Here and in Table 2: x - average value; а - standard deviation.

> у (с,)=/. Образцы, соответствующие /-му кластеру будут иметь наблюдаемое значение, равное номеру этого кластера;

• для получения дискриминантного критерия на плоскости необходимо разделить регрессионное уравнение на две части:

у1 = a0 + a1 x1 + a2 x2 + ... + al x(, У2 = b0 + a/+1 x/+1 + al+2 xl+2 + ... + akxk.

(3)

Полученные коэффициенты (Ь0,а0,а1^,ак) будут разделять образцы по установленным кластерам. При построении финального дискриминантного критерия будет использоваться не к-мерный вектор (х1,х2.....хк), а функционально зависимый от него двумерный вектор (у-|,у2).

Таблица. 2. Микроэлементный состав (мкг/л) образцов виноматериалов Table 2. The content of trace elements (In mcg/l) In wine material samples

Минеральный Краснодар Ростов-на-Дону

элемент Krasnodar Rostov-on-Don

Trace element х a х a

Li 24,2 19,2 60,2 16,8

Ti 5,5 1,7 14,7 6,3

V 3,0 1,5 7,8 4,0

Cr 3,0 1,6 22,1 4,1

Co 1,2 0,9 4,5 0,9

Ni 14,6 7,7 28,0 6,8

Zr 0,4 0,5 13,5 14,1

Mo 0,9 1,0 5,2 9,3

Sn 0,9 0,3 0,9 1,0

Ba 65,9 27,1 36,4 30,1

Cs 2,9 2,4 43,0 46,2

Таким образом, снижается размерность пространства для получения более прикладных идентификационных критериев.

Приводимые в работе расчеты основаны на оперировании данными по минеральному составу [17] для виноматериалов из Краснодара и из Ростова-на-Дону, полученных методом масс-спектрометрии с индуктивно-связанной плазмой (средние значения и стандартное отклонение представлено в табл. 1 и 2). Полные таблицы с данными доступны по ссылке https://wolfr.am/MDuYglTl. Для элементов В, Ыа, Мд, А1, в1, Р, Мп, Zn, ЯЬ, вг (далее - макроэлементы) содержание дается в мг/л (см. табл. 1), для Ц Т1, V, Сг, Со, Ы1, Zr, Мо, вп, Ва, Cs (далее - микроэлементы) в мкг/л (см. табл. 2).

Результаты и обсуждение

Модель кластеризации была рассмотрена на примере идентификации виноматериалов. Для построения полноценных цифровых критериев идентификации требуется наличие соответствующих методов получения данных, связывающих почвенно-климатические факторы и особые характеристики местности произрастания сырья и произведенной из него продукции. Для винома-териала такими методиками являются, например, определение микро- и макроэлементного состава продукта, изотопный анализ, а также активно развивающееся направление ДНК-аутентификации [18].

Методики определения микро- и макроэлементного состава отлично себя зарекомендовали [19, 20] при проведении кластеризационного анализа с получением дискриминирующего критерия в случае определения географического происхождения виноматериала на основе фиксированного количества известных образцов.

Валидность подхода подтверждает тот факт, что виноград экстрагирует из почвы содержащиеся в ней элементы, которые затем переходят в виноматериал [21-23]. При этом установить точную функцию перехода элементов в продукт не представляется возможным, а использование статистической зависимости между почвенным и винным составами также представляется затруднительным, так как требует исследования минерального состава почв для всевозможных территорий произрастания винограда [24, 25].

Эти проблемы можно обойти, опираясь на предположение о том, что элементные составы виноматериалов различного географического происхождения должны различаться. Используя данные по макро- и микроэлементному составу достаточного количества образцов, представляющих определенные регионы виноделия (отсюда указанное выше ограничение на количество дискриминируемых территорий), можно построить классифицирующий критерий продукции среди данных регионов.

Применим данную модель для построения дискриминирующего критерия, позволяющего установить географическое наименование места происхождения ви-

B

Na Mg Al Si P Mn l

Zn i

Rb Sr

00

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- 0,26 ПШ

- 0,32 0,74 MRS

- 0,15 0,24 0,30 ПШ

- 0,02 0,27 0,16 0,01 ПШ

- 0,53 0,50 0,59 0,72 0,25 ПШ

- 0,33 0,60 0,77 0,23 0,36 0,53 ВДЛ

- 0,17 0,66 0,57 0,36 0,39 0,48 0,54

- 0,28 0,61 0,65 0,36 0,01 0,55 0,49 0,43 ЦЩ

- 0,48 0,74 0,93 0,31 0,15 0,62 074 0,60 0,71 ДЯД

B Na Mg Al Si P Mn Zn Rb Sr

1,0 0,8 0,6 0,4 0,2 0

Б

Li Ti V Cr Co Ni Zr Mo Sn Ba Cs

œ.

- 0,63 usa

- 0,40 0,47 щу

- 0,73 0,67 0,56

- 0,70 0,64 0,78 0,1

- 0,64 0,54 0,28 0,76 0,!

- 0,31 0,59 0,41 0,63 0,56 0,.

- 0,34 0,51 0,23 0,36 0,27 0,36 0,50

- 0,17 0,39 0,11 0,06 0,01 0,16 0,38 0,23Щ^

- 0,38 0,36 0,06 0,49 0,22 0,23 0,26 0,05 0,00 ПШ

- 0,59 0,53 0,03 0,65 0,39 0,62 0,29 0,03 0,14 0,73 ЯИЯ

0,8 0,6 0,4 0,2 0

Li Ti V Cr Co Ni Zr Mo Sn Ba Cs

Рис. 1. Коррелограммы, визуализирующие абсолютные значения коэффициента корреляции Пирсона для макроэлементов (А) и микроэлементов (Б)

Fig. 1. Correlograms depicting absolute values of Pearson correlation coefficient for mineral elements (A) and trace elements (B)

А

номатериала, ограничив возможные варианты двумя винодельческими регионами - Краснодарским краем (долина Кубани) и Ростовской областью (долина Дона).

Для определения значимых для дискриминационного анализа элементов воспользуемся корреляционным анализом. На рис. 1 представлены соответствующие коррелограммы для условно обозначенных макро-и микроэлементов. Статистически значимой линейной зависимостью обладают пары элементов: (вг, Мд) для макроэлементов и (Со, Сг), (Со, V) для микроэлементов. Полученные зависимости характерны именно для исследуемой пары регионов. Также возможно построить коррелограмму для отдельного региона, и она будет служить идентификационным профилем для виномате-риалов данной местности.

Основная задача - сократить размерность. Для этого можно воспользоваться регрессионной моделью пищевого продукта, которую в данном случае удобно разбить на две компоненты: по микро- и по макроэлементам. Результирующие дискриминирующие регрессионные уравнения имеют следующий вид:

^тюю)=0,01 Ba - 0,067 Со - 0,041 Сг + 0,0043 Cs + 0,0019 и - 0,0067 Mo - 0,00018 N + 0,27 Sn +

0,019 Т/ - 0,0069 V + 0,011 Хг; (4)

^таою)=-0,08 А1 + 0,056 В + 0,007 Мд + 0,086 Мп -0,0039 Na - 0,0018 Р + 0,24 ЯЬ + 0,0061 S/ -0,98 Sr - 0,13 гп.

В формуле (4) названиями элементов обозначены соответствующие им содержания в виноматериале. Применение формул к имеющимся образцам образует график, показанный на рис. 2, там же дана диаграмма Вороного для двух кластеров, которая представляет собой две полуплоскости, разделенные прямой, равноудаленной от кластерных центров.

В данном случае задача кластеризации существенно упрощается тем фактом, что кластеры заранее известны. Однако после нормализации данных и регрессионного анализа следует подтвердить, что кластеры хорошо выделяются алгоритмом и для подобранных регрессионных уравнений отсутствуют пограничные значения для образцов. В нашем случае кластеры и визуально, и алго-

Микро-

Макро-1 5 элементы

• Краснодар А Ростов-на-Дону Krasnodar Rostov-on-Don

Рис. 2. Результат построения регрессионных моделей продуктов и соответствующая диаграмма Вороного

По осям - приведенные безразмерные значения для макро-и микроэлементов, полученные после применения формул (4) для образцов виноматериалов.

Fig. 2. The result of building regression models of products and the corresponding Voronoi diagram

Along the axes - reduced dimensionless values for mineral and trace elements obtained after applying formulas (4) for samples of wine materials.

ритмически разделяются, что позволяет сделать вывод о приемлемом качестве использованных уравнений.

Кластерным центром для краснодарских виномате-риалов является точка ск=(0,8582,0,8541), для Ростова-на-Дону - сг=(0,0412,0,1540). Дискриминационным критерием является близость по расстоянию к одному из кластерных центров исследуемого образца.

Пример легко обобщается на случай т >2 географических наименований.

Для построения уточненного критерия, учитывающего характер разброса данных, вычислим для каждого кластера выборочную ковариационную матрицу З1^^}, где 1 обозначает соответствующий кластер (Краснодар или Ростов-на-Дону):

П1

d ^ d d d d

sij=nd-1 ^ (xki-x i )(xkj-xj), k=1

где xd - образцы в кластере; nd - их количество.

Теперь для идентификации нового образца хп мы можем рассчитать расстояние Махаланобиса (хп) до каждого из кластерных центров:

(5)

DM(xn) =V(xn-cd)T (Sd)-1 (xn-cd),

(5)

Минимальное значение (6) будет обозначать принадлежность образца тому или иному кластеру. На рис. 3 проиллюстрирована функция оМ(хп), обозначающая минимум из двух расстояний. Наличие эксцентриситета доверительного эллипсоида для Краснодарского кластера смещает дискриминирующую кривую в сторону Ростова-на-Дону в сравнении с диаграммой Вороного на рис. 2.

В случае если возникнет необходимость углубить анализ, например, дискриминировать аналогичным образом красные и белые вина внутри винодельческого региона, потребуется применение дополнительных методик

• Краснодар А Ростов-на-Дону Krasnodar Rostov-on-Don

8

6

4

2

Рис. 3. Визуализация кластерного разбиения двух регионов виноделия с помощью построения функции DM (xn)=min(DK (xn),DM (xn)), где K - Краснодарский кластер, R - кластер Ростова-на-Дону. Белые линии - дискриминирующие кривые, для которых выполнено

DKM (xn)=DRM (xn)

Fig. 3. Cluster partitioning visualization of two wine regions using function: DKK(xn)=min(DKK(xn),DK (xn)), where K - Krasnodar cluster, R - Rostov-on-Don cluster. White lines represent discriminating curves for which equality DM(xn)=DM (xn) holds

идентификации, например анализ данных об изотопных характеристиках образцов, в частности, отношения содержания дейтерия, углерода-13 и водорода-18.

Заключение

На примере определения географического происхождения виноматериала продемонстрирована методика применения математического аппарата кластеризаци-онного анализа для построения цифровых критериев разделения групп различных пищевых продуктов. Методика основана на обработке эмпирических данных образцов. Это позволяет использовать единый алгоритм, включающий сокращение факторной размерности при рассмотрении регрессионной модели продукта и построении разделяющей диаграммы Вороного для установленных кластеров продуктов, объединенных единым признаком, для решения имеющихся дискриминацион-

ных и идентификационных задач пищевой промышленности. Дополнительная информация в области применения различных функций расстояния и количественного выбора кластерной конфигурации позволяет настраивать представленный алгоритм в зависимости от типа данных о пищевом продукте, для которого строится дискриминационный критерий. Построенная для винодельческих регионов Краснодара и Ростова-на-Дону дискриминирующая модель показывает возможность получения идентификационных критериев, позволяющих определять географическое наименование происхождения виноматериала, при этом данная методика может быть адаптирована под идентификационные задачи различных отраслей пищевой промышленности при наработке эталонов продуктов с защищенным наименованием места происхождения, что существенно при обеспечении высокого качества пищевых продуктов в рационе населения.

Сведения об авторах

Семипятный Владислав Константинович (Vladislav K. Semipyatniy) - кандидат технических наук, заведующий Межотраслевым научно-техническим центром мониторинга качества пищевых продуктов ВНИИПБиВП - филиал ФГБНУ «ФНЦ пищевых систем им. В.М. Горбатова» РАН (Москва, Российская Федерация) E-mail: semipyatniy@gmail.com https://orcid.org/0000-0003-1241-0026

Хуршудян Сергей Азатович (Sergey A. Khurshudyan) - доктор технических наук, старший научный сотрудник Межотраслевого научно-технического центра мониторинга качества пищевых продуктов ВНИИПБиВП - филиал ФГБНУ «ФНЦ пищевых систем им. В.М. Горбатова» РАН (Москва, Российская Федерация) E-mail: xca020149@rambler.ru https://orcid.org/0000-0001-7735-7356

Галстян Арам Генрихович (Aram G. Galstyan) - академик РАН, врио директора ФГАНУ «ВНИМИ» (Москва, Российская Федерация)

E-mail: a_galstyan@vnimi.org https://orcid.org/0000-0002-0786-2055

Литература

Хуршудян С.А., Галстян А.Г. Качество пищевых продуктов. 8. Термины, определения и противоречия // Контроль качества продукции. 2018. № 1. С. 48-49.

Хуршудян С.А., Зайчик Ц.Р. История производства пищевых 9. продуктов и развития пищевой промышленности России. Москва : ДеЛи принт. 2009. 286 с.

Gupta R.K., Dudeja P., Minhas S. Food Safety in the 21st Century: Public Health Perspective. Academic Press, 2016. ISBN 978-0-12801773-9. DOI: https://doi.org/10.1016/C2014-0-01094-5 Тутельян В.А., Вялков А.И., Разумов А.Н., Михайлов В.И., 10. Москаленко К.А., Одинец А.Г. и др. Научные основы здорового питания. Москва : Панорама, 2010. 816 с. 11.

Хуршудян С.А., Рябова А.Е., Вафин Р.Р., Семипятный В.К., МихайловаИ.Ю. Мониторингкачествамолочныхпродуктов// 12. Молочная промышленность. 2018. № 11. С. 23-24. Семипятный В.К., Рябова А.Е., Егорова О.С., Вафин Р.Р. Оптимизация экспериментального моделирования новых рецептур напитков методами математической статистики // 13. Пиво и напитки. 2018. № 3. С. 48-51.

Petrov A.N., Galstyan A.G., Radaeva I.A., Turovskaya S.N., Illari-onova E.E., Semipyatniy V.K. et al. Indicators of canned milk quality: Russian and international priorities // Foods Raw Mater. 2017. 14. Vol. 5, N 2. P. 151-161.

Эрл М., Эрл. Р. Разработка пищевых продуктов. Санкт Петербург : Профессия, 2004. 384 с. ISBN 978-1-84569260-5.

Oganesyants L.A., Khurshudyan S.A., Galstyan A.G., Semipyat-ny V.K., Ryabova A.E., Vafln R.R. et al. Base matrices - invariant digital identifiers of food products // News of the National Academy of Sciences of the Republic of Kazakhstan. Series of Geology and Technical Sciences. 2018. Vol. 6, N 432. P. 6-15. DOI: https://doi. org/10.32014/2018.2518-170X.30

Hilbe J.M. Logistic Regression Models. Chapman and Hall/CRC Press, 2009. ISBN 9781138106710.

Hardle W., Simar L. Applied Multivariate Statistical Analysis. Berlin, Heidelberg : Springer, 2007. ISBN: 978-3642172281. Rimareva L.V., Sokolova E.N., Serba E.M., Borshcheva Y.A., Kurba-tova E.I., Krivova A.Y. Reduced allergenicity of foods of plant nature by method of enzymatic hydrolysis // Orient. J. Chem. 2017. Vol. 33, N 4. P. 2009-2015. DOI: https://doi.org/10.13005/ojc/330448 Pfitzner D., Leibbrandt R., Powers D. Characterization and evaluation of similarity measures for pairs of clusterings // Knowl. Inf. Syst. 2009. Vol. 19. P. 361-394. DOI: https://doi.org/10.1007/ s10115-008-0150-6

Perriere G., Thioulouse J. Use of correspondence discriminant analysis to predict the subcellular location of bacterial proteins //

1.

2

4

6.

7

Comput. Methods Programs Biomed. 2003. Vol. 70, N 2. P. 99-105. DOI: https://doi.org/10.1016/s0169-2607(02)00011-1

15. Ortea I., Gallardo J.M. Investigation of production method, geo- 20. graphical origin and species authentication in commercially relevant shrimps using stable isotope ratio and/or multi-element analyses combined with chemometrics: an exploratory analysis // 21. Food Chem. 2015. Vol. 170, N 1. P. 145-153.

16. Kawaguchi F., Kitamura Y., Nakajima R., Takahashi M., Goto H., Washida Y. et al. Application of DNA markers for discrimination 22. between Japanese and Australian Wagyu beef // Anim. Sci. J. 2018.

Vol. 89, N 1. P. 257-258. 23.

17. Точилина Р.П., Гончарова С.А., Хорошева Е.В., Семипят-ный В.К. Особенности минерального состава донских вин и виноматериалов как идентификационный показатель места происхождения // Виноделие и виноградарство. 2016. № 3. 24. С. 14-17.

18. Donnik I.M., Vafln R.R., Galstyan A.G. et al. Genetic identiflca-tion of bovine leukaemia virus // Foods Raw Mater. 2018. Vol. 6,

N 2. P. 314-324. DOI: DOI: http://doi.org/10.21603/2308-4057- 25. 2018-2-314-324

19. Brzezicha-Cirocka J., Grembecka M., Szefer P. Monitoring of essential and heavy metals in green tea from different geograph-

ical origins // Environ. Monit. Assess. 2016. Vol. 188, N 3. P. 1-11.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Oganesyants L.A., Panasyuk A.L., Kuzmina E.I. et al. Definition of authenticity of grape wines by means of isotropic mass spectrometry // Food Proccessing Ind. 2011. Vol. 9. P. 30-31. Conde J.E. Charactererization of bottled wines from the Tenerife island (Spain) by their metal ion concentration // Ital. G. Food Sci. 2002. Vol. 14, N 4. P. 375-387.

Perez Trujillo J. P. Content of mineral ions in wines from Canary Islands (Spain) // CyTA J. Food. 2011. Vol. 9, N 2. P. 135-140. Martin G.J., Mazure M., Jouitteau C. et al. Characterization of the geographic origin of Bourdeaux wines by a combined use of iso-topic and trace element measurements // Am. J. Enol. Vitic. 1999. Vol. 50. P. 409-417.

Marcos J.J., Alcazar A., Palacios-Morillo A., Pablos F. Classification of Spanish wines white DO according to their elemental composition using methods support vector machine // Food Chem. 2012. Vol. 135, N 3. P. 898-903.

Dutra S.V., Adami L., Marson A.R. A defini§ao da origem geográfica de vinhos brasileiros de análise de isotópica e mineral composi§ao // Anal. Bioanal. Chem. 2011. Vol. 401, N 5. P. 15751580.

References

1. Khurshudyan S.A., Galstyan A.G. Food quality. Terms, definitions and contradictions. Kontrol' kachestva produktsii [Product Quality Control]. 2018; (1): 48-9. (in Russian)

2. Khurshudyan S.A., Zaychik C.R. The History of Food Production and the Development of the Food Industry in Russia. Moscow: DeLi print, 2009: 286 p. (in Russian)

3. Gupta R.K., Dudeja P., Minhas S. Food Safety in the 21st Century: Public Health Perspective. Academic Press, 2016. ISBN 978-0-12801773-9. DOI: https://doi.org/10.1016/C2014-0-01094-5

4. Tutelyan V.A., Vyalkov A.I., Razumov A.N., Mihaylov V.I., Mos-kalenko K.A., Odinets A.G., et al. Scientific Foundations of a Healthy Diet. Moscow: Panorama, 2010: 816 p. (in Russian)

5. Khurshudyan S.A., Ryabova A.E., Vafin R.R., Semipyatniy V.K., Mihailova I.Yu. Dairy product quality monitoring. Molochnaya promyshlennost' [Dairy Industry]. 2018; (11): 23-4. (in Russian)

6. Semipyatniy V.K., Ryabova A.E., Egorova O.S., Vafin R.R. Optimization of experimental modeling of new beverage recipes using mathematical statistics methods. Pivo i napitki [Beer and Beverages]. 2018; (3): 48-51. (in Russian)

7. Petrov A.N., Galstyan A.G., Radaeva I.A., Turovskaya S.N., Illarionova E.E., Semipyatniy V.K., et al. Indicators of canned milk quality: Russian and international priorities. Foods Raw Mater. 2017; 5 (2): 151-61.

8. Erl M., Erl R. Examples of Food Development. Case Analysis. Saint Petersburg: Professia, 2010: 384 p. ISBN 978-1-84569-260-5. (in Russian)

9. Oganesyants L.A., Khurshudyan S.A., Galstyan A.G., Semipyatniy V.K., Ryabova A.E., Vafin R.R., et al. Base matrices - invariant digital identifiers of food products. News of the National Academy of Sciences of the Republic of Kazakhstan. Series of Geology and Technical Sciences. 2018; 6 (432): 6-15. DOI: https://doi. org/10.32014/2018.2518-170X.30

10. Hilbe J.M. Logistic Regression Models. Chapman and Hall/CRC Press, 2009. ISBN 9781138106710.

11. Hardle W., Simar L. Applied Multivariate Statistical Analysis. Berlin, Heidelberg: Springer, 2007. ISBN: 978-3642172281.

12. Rimareva L.V., Sokolova E.N., Serba E.M., Borshcheva Y.A., Kur-batova E.I., Krivova A.Y. Reduced allergenicity of foods of plant nature by method of enzymatic hydrolysis. Orient J Chem. 2017; 33 (4): 2009-15. DOI: https://doi.org/10.13005/ojc/330448

13. Pfitzner D., Leibbrandt R., Powers D. Characterization and evaluation of similarity measures for pairs of clusterings. Knowl Inf Syst. 2009; 19: 361-94. DOI: https://doi.org/10.1007/s10115-008-0150-6

14. Perriere G., Thioulouse J. Use of correspondence discriminant analysis to predict the subcellular location of bacterial proteins. Comput Methods Programs Biomed. 2003; 70 (2): 99-105. DOI: https://doi.org/10.1016/s0169-2607(02)00011-1

15. Ortea I., Gallardo J.M. Investigation of production method, geographical origin and species authentication in commercially relevant shrimps using stable isotope ratio and/or multi-element analyses combined with chemometrics: an exploratory analysis. Food Chem. 2015; 170 (1): 145-53.

16. Kawaguchi F., Kitamura Y., Nakajima R., Takahashi M., Goto H., Washida Y., et al. Application of DNA markers for discrimination between Japanese and Australian Wagyu beef. Anim Sci J. 2018; 89 (1): 257-8.

17. Tochilina R.P., Goncharova S.A., Khorosheva E.V., Semipyat-niy V.K. Features of the mineral composition of Don wines and wine materials as an identification indicator of the place of origin. Vinodelie i vinogradarstvo [Wine and Viticulture]. 2016; (3): 14-7. (in Russian)

18. Donnik I.M., Vafin R.R., Galstyan A.G., et al. Genetic identification of bovine leukaemia virus. Foods Raw Mater. 2018; 6 (2): 314— 24. DOI: DOI: http://doi.org/10.21603/2308-4057-2018-2-314-324

19. Brzezicha-Cirocka J., Grembecka M., Szefer P. Monitoring of essential and heavy metals in green tea from different geographical origins. Environ Monit Assess. 2016; 188 (3): 1-11.

20. Oganesyants L.A., Panasyuk A.L., Kuzmina E.I., et al. Definition of authenticity of grape wines by means of isotropic mass spectrom-etry. Food Proccessing Ind. 2011; 9: 30-1.

21. Conde J.E. Charactererization of bottled wines from the Tenerife island (Spain) by their metal ion concentration. Ital G Food Sci. 2002; 14 (4): 375-87.

22. Perez Trujillo J. P. Content of mineral ions in wines from Canary Islands (Spain). CyTA J Food. 2011; 9 (2): 135-40.

23. Martin G.J., Mazure M., Jouitteau C., et al. Characterization of the geographic origin of Bourdeaux wines by a combined use of isotopic and trace element measurements. Am J Enol Vitic. 1999; 50: 409-17.

24. Marcos J.J., Alcazar A., Palacios-Morillo A., Pablos F. Classification of Spanish wines white DO according to their elemental composition using methods support vector machine. Food Chem. 2012; 135 (3): 898-903.

25. Dutra S.V., Adami L., Marson A.R. A defini§ao da origem geográfica de vinhos brasileiros de análise de isotópica e mineral com-posi§ao. Anal Bioanal Chem. 2011; 401 (5): 1575-80.

i Надоели баннеры? Вы всегда можете отключить рекламу.