Научная статья на тему 'АЛГОРИТМ ОБРАБОТКИ И АНАЛИЗА РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЙ МИКРО- И МАКРО-НУТРИЕНТНОГО СОСТАВА МОЛОКА'

АЛГОРИТМ ОБРАБОТКИ И АНАЛИЗА РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЙ МИКРО- И МАКРО-НУТРИЕНТНОГО СОСТАВА МОЛОКА Текст научной статьи по специальности «Экономика и бизнес»

CC BY-ND
29
6
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КАЧЕСТВО ПИЩЕВЫХ ПРОДУКТОВ / БАЗА ДАННЫХ ХИМИЧЕСКОГО СОСТАВА ПИЩЕВЫХ ПРОДУКТОВ / ЦИФРОВАЯ НУТРИЦИОЛОГИЯ / СТАНДАРТИЗАЦИЯ ДАННЫХ / ОБРАБОТКА РЕЗУЛЬТАТОВ ЛАБОРАТОРНЫХ ИССЛЕДОВАНИЙ / КЛАССИФИКАЦИЯ ПИЩЕВЫХ ПРОДУКТОВ

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Щербаков Григорий Дмитриевич, Бессонов Владимир Владимирович

Введение. Оценка фактического питания населения как на индивидуальном, так и на популяционном уровне зависит от корректности данных химического состава пищевых продуктов. Молоко является важным составляющим любого рациона, и корректная оценка потребляемых с ним микро- и макронутриентов необходима для оценки здоровья населения. Цель: разработка алгоритма получения статистически корректных значений средних концентраций и вариабельности основных микро- и макронутриентов в молоке. Материалы и методы. Для разработки и апробации алгоритма использовались данные лабораторных исследований молока различной жирности, выполненные в рамках федерального проекта «Укрепление общественного здоровья» в 2020-2021 гг. лабораториями Роспотребнадзора. Результаты. Исследования молока характеризовались большим количеством пропущенных и выпадающих значений, в связи с чем потребовалась соответствующая корректировка алгоритма. Наилучшую разделяющую способность показал подход разделения молока на кластеры по содержанию жира и кальция. Были получены три кластера, характеризующие виды молока, а именно - молоко с жирностью 2,5 % и средним содержанием кальция на уровне 1144 мг/л, с жирностью 3,2 % и средним содержанием кальция на уровне 1180 мг/л, а также молоко с содержанием кальция на уровне 597 мг/л и обоими уровнями содержания жира. Корректность алгоритма обеспечена проверкой на полноту данных жирнокислотного состава и малой вариабельностью значений. Заключение. Разработанный алгоритм позволил получить актуальные сведения о химическом составе молока, представленного в торговых точках в Российской Федерации. При этом особое беспокойство вызывает наличие молока с малым содержанием кальция, недостаточным при среднем потреблении молока для удовлетворения физиологических потребностей населения. При этом содержание насыщенных жиров не превышало 2,2/100 г для группы с максимальным содержание жира, что не вызывает дополнительных опасений с точки зрения влияния на здоровье. Дальнейшие исследования должны быть направлены на определение допустимых и корректных этапов предобработки данных, которые позволят сохранить баланс между получаемой точностью значений и реальной их воспроизводимостью.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Щербаков Григорий Дмитриевич, Бессонов Владимир Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ALGORITHM FOR ANALYZING THE RESULTS OF LABORATORY TESTING OF MICROAND MACRONUTRIENT COMPOSITION OF MILK

Introduction: The assessment of actual nutrition of the population, both at the individual and population level, strongly depends on the accuracy of data on the chemical composition of food products. Milk is an important component of a diet, and a precise estimation of micro- and macronutrients consumed with it is essential for public health assessment. Objective: To develop an algorithm for obtaining statistically accurate values of average concentrations and variability of basic micro- and macronutrients in milk. Materials and methods: To elaborate and check the algorithm, we used milk fat test results collected within the Federal Project on Public Health Strengthening by the laboratories of the Federal Service for Consumer Rights Protection and Human Wellbeing (Rospotrebnadzor) in the years 2020-2021. Results: Due to numerous missing and outlying values of milk composition testing, an appropriate adjustment of the algorithm was necessary. The best separating ability was demonstrated by the approach of dividing types of milk into clusters based on their fat and calcium content. The three clusters obtained included milk with a 2.5 % fat content and the average calcium concentration of 1,144 mg/L, milk with a 3.2 % fat content and the average calcium concentration of 1,180 mg/L, and milk with both fat contents and the mean calcium level of 597 mg/L. The algorithm was validated by checking the completeness of data on the fatty acid composition and a low variability of values. Conclusion: The developed algorithm has enabled us to obtain up-to-date information on the chemical composition of milk sold by food retailers in the Russian Federation. Low-calcium milk on the market is of special concern as its average consumption fails to satisfy human physiological needs. At the same time, the content of saturated fat was below 2.2 g/100 g in the cluster of milk types with the maximum fat content, thus raising no additional health concerns. Further studies should be aimed at determining the acceptable and correct stages of data preprocessing that maintain a balance between the obtained accuracy of values and their actual reproducibility.

Текст научной работы на тему «АЛГОРИТМ ОБРАБОТКИ И АНАЛИЗА РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЙ МИКРО- И МАКРО-НУТРИЕНТНОГО СОСТАВА МОЛОКА»

Оригинальная исследовательская статья

Я Check for updates

© Щербаков Г.Д., Бессонов В.В., 2022 УДК 613.2, 637.051

Алгоритм обработки и анализа результатов исследований микро-и макронутриентного состава молока

Г.Д. Щербаков12, В.В. Бессонов1

1 ФГБУН «ФИЦ питания и биотехнологии», Устьинский пр-д, д. 2/14, г. Москва, 109240, Российская Федерация 2 ФБУЗ «Федеральный центр гигиены и эпидемиологии» Роспотребнадзора, Варшавское ш., д. 19а, г. Москва, 117105, Российская Федерация

Резюме

Введение. Оценка фактического питания населения как на индивидуальном, так и на популяционном уровне зависит от корректности данных химического состава пищевых продуктов. Молоко является важным составляющим любого рациона, и корректная оценка потребляемых с ним микро- и макронутриентов необходима для оценки здоровья населения.

Цель: разработка алгоритма получения статистически корректных значений средних концентраций и вариабельности основных микро- и макронутриентов в молоке.

Материалы и методы. Для разработки и апробации алгоритма использовались данные лабораторных исследований молока различной жирности, выполненные в рамках федерального проекта «Укрепление общественного здоровья» в 2020-2021 гг. лабораториями Роспотребнадзора.

Результаты. Исследования молока характеризовались большим количеством пропущенных и выпадающих значений, в связи с чем потребовалась соответствующая корректировка алгоритма. Наилучшую разделяющую способность показал подход разделения молока на кластеры по содержанию жира и кальция. Были получены три кластера, характеризующие виды молока, а именно - молоко с жирностью 2,5 % и средним содержанием кальция на уровне 1144 мг/л, с жирностью 3,2 % и средним содержанием кальция на уровне 1180 мг/л, а также молоко с содержанием кальция на уровне 597 мг/л и обоими уровнями содержания жира. Корректность алгоритма обеспечена проверкой на полноту данных жирнокислотного состава и малой вариабельностью значений.

Заключение. Разработанный алгоритм позволил получить актуальные сведения о химическом составе молока, представленного в торговых точках в Российской Федерации. При этом особое беспокойство вызывает наличие молока с малым содержанием кальция, недостаточным при среднем потреблении молока для удовлетворения физиологических потребностей населения. При этом содержание насыщенных жиров не превышало 2,2/100 г для группы с максимальным содержание жира, что не вызывает дополнительных опасений с точки зрения влияния на здоровье. Дальнейшие исследования должны быть направлены на определение допустимых и корректных этапов предобработки данных, которые позволят сохранить баланс между получаемой точностью значений и реальной их воспроизводимостью.

Ключевые слова: качество пищевых продуктов, база данных химического состава пищевых продуктов, цифровая нутрициология, стандартизация данных, обработка результатов лабораторных исследований, классификация пищевых продуктов.

Для цитирования: Щербаков Г.Д., Бессонов В.В. Алгоритм обработки и анализа результатов исследований микро- и макронутриентного состава молока // Здоровье населения и среда обитания. 2022. Т. 30. № 8. С. 64-72. doi: https://doi. org/10.35627/2219-5238/2022-30-8-64-72 Сведения об авторах:

И Щербаков Григорий Дмитриевич - начальник отдела социально-гигиенического мониторинга анализа и прогнозирования ФБУЗ «Федеральный центр гигиены и эпидемиологии» Роспотребнадзора, аспирант ФГБУН «ФИЦ питания и биотехнологии», e-mail: sherbakovgrigory@gmaiI.com; ORCID: https://orcid.org/0000-0002-9046-6837.

Бессонов Владимир Владимирович - д.б.н., заведующий лабораторией химии пищевых продуктов ФГБУН «ФИЦ питания и биотехнологии»; e-maiI: bessonov@ion.ru; ORCID: https://orcid.org/0000-0002-3587-5347.

Информация о вкладе авторов: концепция и дизайн исследования, анализ и интерпретация результатов получение данных для анализа, анализ полученных данных: Бессонов В.В., Щербаков Г.Д.; сбор данных: Щербаков Г.Д., литературный обзор: Щербаков Г.Д.; подготовка рукописи: Бессонов В.В., Щербаков Г.Д. Все авторы ознакомились с результатами работы и одобрили окончательный вариант рукописи.

Соблюдение этических стандартов: данное исследование не требует представления заключения комитета по биомедицинской этике или иных документов.

Финансирование: исследование проведено без спонсорской поддержки.

Конфликт интересов: авторы декларируют отсутствие явных и потенциальных конфликтов интересов в связи с публикацией данной статьи.

Статья получена: 01.06.22 / Принята к публикации: 08.08.22 / Опубликована: 31.08.22

Algorithm for Analyzing the Results of Laboratory Testing of Micro- and

Macronutrient Composition of Milk

Grigorii D. Shcherbakov,1,2 Vladimir V. Bessonov1

1 Federal Research Center for Nutrition, Biotechnology and Food Safety, 2/14 Ustinsky Drive, Moscow, 109240, Russian Federation

2 Federal Center for Hygiene and Epidemiology, 19A Varshavskoe Highway, Moscow, 117105, Russian Federation

Summary

Introduction: The assessment of actual nutrition of the population, both at the individual and population level, strongly depends on the accuracy of data on the chemical composition of food products. Milk is an important component of a diet, and a precise estimation of micro- and macronutrients consumed with it is essential for public health assessment. Objective: To develop an algorithm for obtaining statistically accurate values of average concentrations and variability of basic micro- and macronutrients in milk.

Materials and methods: To elaborate and check the algorithm, we used milk fat test results collected within the Federal Project on Public Health Strengthening by the laboratories of the Federal Service for Consumer Rights Protection and Human WeII-being (Rospotrebnadzor) in the years 2020-2021.

Results: Due to numerous missing and outlying values of milk composition testing, an appropriate adjustment of the algorithm was necessary. The best separating ability was demonstrated by the approach of dividing types of milk into clusters based on their fat and calcium content. The three clusters obtained included milk with a 2.5 % fat content and the average

Original Research Article

calcium concentration of 1,144 mg/L, milk with a 3.2 % fat content and the average calcium concentration of 1,180 mg/L, and milk with both fat contents and the mean calcium level of 597 mg/L. The algorithm was validated by checking the completeness of data on the fatty acid composition and a low variability of values.

Conclusion: The developed algorithm has enabled us to obtain up-to-date information on the chemical composition of milk sold by food retailers in the Russian Federation. Low-calcium milk on the market is of special concern as its average consumption fails to satisfy human physiological needs. At the same time, the content of saturated fat was below 2.2 g/100 g in the cluster of milk types with the maximum fat content, thus raising no additional health concerns. Further studies should be aimed at determining the acceptable and correct stages of data preprocessing that maintain a balance between the obtained accuracy of values and their actual reproducibility.

Keywords: food quality, databases of the chemical composition of food products, digital nutritiology, data standardization, laboratory test result processing, food classification. For citation: Shcherbakov GD, Bessonov VV. Algorithm for analyzing the results of laboratory testing of micro- and macronutrient composition of milk. Zdorov'e Naseleniya i Sreda Obitaniya. 2022;30(8):64-72. (In Russ.) doi: https://doi.org/10.35627/2219-5238/2022-30-8-64-72 Author information:

И Grigorii D. Shcherbakov, Head of the Department of Public Health Monitoring, Analysis and Forecasting, Federal Center for Hygiene and Epidemiology; postgraduate student, Federal Research Center for Nutrition, Biotechnology and Food Safety; e-mail: sherbakovgrigory@gmail.com; ORCID: https://orcid.org/0000-0002-9046-6837.

Vladimir V. Bessonov, Dr. Sci. (Biol.), Head of the Laboratory of Food Chemistry, Federal Research Centre for Nutrition, Biotechnology and Food Safety; e-mail: bessonov@ion.ru; ORCID: https://orcid.org/0000-0002-3587-5347.

Author contributions: study conception and design, analysis and interpretation of results: Bessonov V.V., Shcherbakov G.D.; data collection: Shcherbakov G.D.; literature review: Shcherbakov G.D.; draft manuscript preparation: Bessonov V.V., Shcherbakov G.D. Both authors reviewed the results and approved the final version of the manuscript.

Compliance with ethical standards: Ethics approval was not required for this study.

Funding: The authors received no financial support for the research, authorship, and/or publication of this article. Conflict of interest: The authors declare that there is no conflict of interest. Received: June 1, 2022 / Accepted: August 8, 2022 / Published: August 31, 2022

Введение. Вопросы обеспечения необходимого состояния питания населения являются актуальными для правительств всех стран и в особенности для Российской Федерации. Нездоровое питание вместе с низкой физической активностью выделены Всемирной организацией здравоохранения как одни из наибольших вкладчиков в риски для здоровья во всем мире [1, 2]. В связи с этим вопросы обеспечения здоровья населения и изучение состояния его питания являются неразрывно связанными.

Хотя многие человеческие пищевые привычки изменились, молоко по-прежнему остается одним из основных пищевых продуктов. По данным Росстата за 2020 г. потребление цельного молока на потребителя в год составило 47,5 кг, а в целом по группе молочных продуктов 271,6 кг в год на потребителя в пересчете на молоко1. По данным Продовольственной и сельскохозяйственной организации (ФАО), Европа относится к группе, в которой потребление молока на душу населения составляет 389,91 литра в год [3].

Молоко является ценным источником белков, жиров, углеводов, витаминов и микроэлементов, находящихся в биологически доступной форме, это универсальное функциональное питание благодаря своим основным компонентам. Молочный белок содержит все девять незаменимых аминокислот, необходимых человеку, это особо ценно для растущего организма в составе школьного и дошкольного питания для роста и развития [4].

В сыром молоке состав жира может зависеть от многих факторов, к основным можно отнести сезонные и климатические изменения корма, стадию лактации, породу животных, условия содержания. Известно, что состав молочного жира подвергается значительным сезонным изменениям, особенно если сравнивать летний и зимний период, что связано в основном с введением в кормовой рацион зеленой травы. Содержание стеариновой и олеиновой кислот повышается летом, а миристиновой и пальмитиновой — зимой. Количество биологически важных полиненасы-

щенных жирных кислот (линолевой, линоленовой и арахидоновой) весной и летом выше, чем осенью и зимой, но одновременно и возрастает уровень окисления этих кислот [5, 6]. Поэтому необходимо иметь информацию о природных антиоксидантах молока, таких как каротиноиды и токоферолы, чтобы контролировать биологическую ценность молока (А, О, Е) [7].

С точки зрения селекции молочного скота повышение качества показателей молочной продуктивности является крайне актуальной задачей, которая в свою очередь может входить в конфликт с задачей обеспечения качества самого продукта. В связи с этим особый интерес может представлять определение концентрации казеина и жирных кислот (ЖК) в молоке, а не только традиционный выбор животных по удою, содержанию жира и белка. Изучение жирнокислотного состава открывает возможности для отбора животных по содержанию моно- и полиненасыщенных ЖК, снижению количества насыщенных жирных кислот и их трансизомеров, которые могут негативно влиять на здоровье человека [8]. Как известно, генетические и средовые факторы в большей степени оказывают влияние на изменчивость содержания молочного жира, чем белка [9—11].

В связи со всем вышеизложенным исследование качества молока и молочной продукции — крайне важная задача и не является однократным действием с целью составления справочника или базы данных, а требует именно составления алгоритма обработки данных с целью получения корректных усредненных значений для последующей оценки состояния питания населения. Важным является такой подход, который позволит как использовать ретроспективные данные из всех источников для применения в оценке питания, так и применять новые для корректировки ретроспективных и оценки возникающих тенденций или сезонных колебаний.

Применение полученных в результате анализа данных будет существенно зависеть от выбранной методологии оценки состояния питания

1 Потребление продуктов питания в домашних хозяйствах в 2020 году по итогам Выборочного обследования бюджетов домашних хозяйств. М.: Федеральная служба государственной статистики, 2021.

voLume зо, issue о, 2022

населения. Так, наиболее близким, по мнению авторов, с точки зрения уровня усреднения и, следовательно, экстраполяции выборки на всю совокупность, является метод обследования бюджетов домашних хозяйств. Несмотря на то что результаты, которые получены таким образом Росстатом, имеют ряд существенных ограничений с точки зрения эпидемиологии питания, таких как отсутствие учета потребляемых вне дома и прочих готовых кулинарных изделий, необходимость пересчета из чистой закупленной массы товара на фактически потребляемую как с учетом перевода нетто в брутто, так и с учетом доли несъедобной части, они в целом характеризуют примерные объемы продуктов в структуре потребления [12]. С точки зрения рассматриваемой проблематики это считается первоочередным, так как традиционные паттерны пищевого поведения можно рассматривать и как паттерны основных источников микро- и макронутриентов. Так, например, основными источниками кальция являются рассматриваемое в данной статье молоко, а также творог и сыр [13].

В связи с этим важным вопросом представляется применение полученных результатов с точки зрения оценки состояния здоровья населения. В данном случае целесообразно рассмотреть два вида рисков, которые считаются последовательными с точки зрения анализа. Первый вид рисков — риск недополучения определенных микро-и макронутриентов с рационом. Он может быть оценен на основании сочетания рассматриваемых результатов и сведений о потребительских характеристиках продукции, таких как цена, сведения на упаковке и так далее. В настоящий момент существует множество различных моделей потребителей пищевой продукции, но их применение потребует сбор существенно больших массивов информации [14, 15]. Второй вид рисков характеризует непосредственно влияние на здоровье недостатка или избытка тех или иных веществ, то есть вероятность развития каких-либо заболеваний. Так, недостаток кальция в питании всегда рассматривался как потенциальный источник негативного воздействия на нервную, костно-мышечную и сердечно-сосудистую системы [16]. Однако в ряде работ, где имелись попытки связать недостаток потребления кальция с продуктами питания и развитием остеопороза, устойчивые корреляции получены не были, но были получены результаты о влиянии чрезмерного потребления кальция на вероятность развития сердечных заболеваний [17]. При этом существенную роль играет формат построения выборки и, как следствие, оценка уровня потребления. В зависимости от исходного дизайна средний уровень потребления того или иного вещества с пищей может быть абсолютно разным, и, следовательно, оценка «высокого» и «низкого» уровня производится относительно некоторой нестандартизованной величины. Подобные подходы не позволяют экстраполировать результаты на другие популяции. Например, средний уровень потребления натрия для некоторых стран Азии будет существенно выше, чем рекомендуемый верхний предел потребления в соответствии с утвержденными в РФ нормами [18]. Таким образом, рассматриваемые результаты должны

Оригинальная исследовательская статья

лечь в основу разработки принципиально новых моделей оценки риска для здоровья населения.

Актуальность данной темы также отражена в одном из направлений Стратегии повышения качества пищевой продукции, а именно в «Совершенствовании и развитии методологической базы для оценки соответствия показателей качества пищевой продукции», содержащем в себе задачу создания базы данных показателей качества пищевой продукции, учитывающих естественную вариабельность энергетической и пищевой ценности.

Необходимо в том числе разделять результаты, полученные в ходе специализированных и «рутинных» исследований. Это влияет как на качество исходных данных, так и на воспроизводимость эксперимента. Притом нельзя сказать, что возможно исключить какую-либо одну составляющую из результатов. Так, большинство данных представляют собой результаты лабораторных исследований, произведенных в одной лаборатории. Для качества пищевых продуктов, когда вариабельность показателей может носить как сезонный характер, так и отличаться от производителя к производителю, подобные экспериментальные рамки являются недопустимыми. Еще одним фактором, который не позволяет использовать данные специализированных исследований для справочников или подобных обобщающих таблиц, является условная гомогенность лабораторной ошибки. Длительное время проведения эксперимента, применение одного и того же оборудования, а также работа одного и того же персонала могут изменять характер возникающих ошибок со случайных на систематический.

В тех случаях, когда проводятся множественные исследования с привлечением большого числа лабораторий, возникает проблема статистической оценки полученных результатов с учетом вышеизложенных факторов, а также выбора лабораторий для проведения подобных исследований. Так, естественным является привлечение наиболее компетентных лабораторий с наиболее точным оборудованием. Поскольку нельзя разделить биологическую и внутрилабораторную вариабельность, воспроизведение данных в лабораториях, которые работают менее точными методами или на менее прецизионном оборудовании, будет невозможно и не может соотноситься с реальными данными о продуктах.

Цель исследования — получить статистически достоверные сведения о микро- и макронутриент-ном составе молока на основе данных неспециализированных исследований.

Материалы и методы. В качестве базы данных для оценки результативности и корректности разрабатываемых методов были выбраны базы результатов исследований качества и безопасности пищевых продуктов, выполненных в рамках федерального проекта «Укрепление общественного здоровья» национального проекта «Демография»2 в 2020—2021 гг. Для базы 2020 г. объем выборки для молока составил 342 пробы = 342), количество лабораторий, проводивших исследования, составило 23 учреждения, для 2021 г. объем выборки составил соответственно 206 проб (М2 = 206) и 45 лабораторий. Такое существенное сокращение

2 Паспорт национального проекта «Демография» (утв. президиумом Совета при Президенте Российской Федерации по стратегическому развитию и национальным проектам, протокол от 24.12.2018 № 16).

С/

Original Research Article

объема выборки при увеличении количества проводящих исследования лабораторий связано с тем, что на стадии предобработки был исключен ряд некорректных и недостоверных значений в соответствии с МР 2.3.7.0261—213.

В обеих выборках представлены виды молока как 2,5 %, так и 3,2 % жирности (в соответствии с наименованиями), доступные для приобретения в магазинах на территории Российской Федерации. Разделение на две группы по заявленному содержанию жира было нецелесообразным в связи с тем, что имелись отклонения фактического значения содержания жира от заявленного, а также предполагалось рассмотреть и различные варианты группировки данных не только по жирности.

В обобщенном виде алгоритм обработки данных химического состава для любой группы пищевых продуктов представляется следующим [19]:

— предварительная очистка данных от недостоверно введенных (например, сумма основных пищевых веществ более 105 или менее 95 %), а также подготовка массива к обработке;

— оценка характера распределения данных по каждому исследуемому показателю, проверка данных на нормальность, где это необходимо;

— обработка пропущенных и нулевых значений;

— определение и обработка выбросов по каждому показателю; определение допустимого перечня показателей для анализа в результате удаления выбросов;

— кластеризация данных;

— нормализация данных, полученных от разных лабораторий;

— оценка полученных результатов.

Рассмотрим каждый из представленных этапов

отдельно.

1-й этап. Общие рекомендации к алгоритму оценки достоверности и порядку анализа результатов представлены в МР.

В том числе стоит обратить внимание именно на подготовку самого файла для предобработки. Так как данные не анализируются напрямую в лабораторных информационных системах или системах сбора данных о их результатах, то наиболее часто экспорт данных происходит в формат .xls или .xlsx. При этом имеются типовые ошибки как исходных данных, которые невозможно отследить в большом массиве, так и дополнительные, возникающие при конвертации.

К ошибкам первого типа относятся такие как загрузка отдельных числовых значений и определение их формата данных как текстовые [20, 21]. Также типовыми для выбранного массива были ошибки, связанные с некорректным указанием знака разделения десятичной части или его двойное указание, ввод двойного результата в одну ячейку, а также ввод результатов, которые также являются типовыми [22].

К ошибкам второго типа относится, например, некорректное восприятие Excel форматов данных. Наиболее опасным с точки зрения преобразования является перевод части значений в формат даты. Данный пример особенно актуален для указания наименований геномов, но и при совершении ошибок первого типа он также может возникать

2-й этап. Для применения методов параметрической статистики необходимо, чтобы данные были распределены нормально. При достаточно большом количестве исследований характер распределения будет стремиться к нормальному, так как отсутствует какой-либо доминирующий фактор, влияющий на поведение случайной величины, то есть нельзя сказать, что вклад лабораторной погрешности более значителен, чем биологическая вариабельность показателя. В данной работе проверка на нормальность осуществлялась с применением теста Шапиро — Уилка, результаты для большинства показателей показали нормальность их распределения (р > 0,05). Также необходимо оценить показатели, по которым отсутствуют данные, пригодные для корректной интерпретации. Так, в связи с крайне малым количеством данных по стеринам, кроме холестерина, данные показатели были исключены из рассмотрения с целью корректности обработки на всех дальнейших этапах.

3-й этап. Данные могут характеризоваться большим количеством пропущенных значений или нулевыми результатами исследований, что является типовой ситуацией для рассматриваемой базы в связи с тем, что часть лабораторий не обладает возможностью проводить определенные исследования, например не определяют все жирные кислоты или отдельные стерины.

Для групп продуктов, где количество таких значений небольшое, допустимым является удаление строчек целиком. Для множества пропущенных значений целесообразно такие значения заменять средним, модой или медианой в зависимости от характера распределения исходных значений [25]. Подобный подход в том числе относится и к нулевым значениям, которые могут быть приравнены к пропускам. Более комплексные варианты, такие как логистическая регрессия [26] или методы нечеткой логики [27], могут улучшить получаемые результаты, однако стоит понимать, что искусственное сужение интервала, как было указано ранее, не всегда может быть воспроизведено в реальных условиях. В том числе имеет значение влияние дополнительных факторов, таких как сезонность или внутренние корреляции параметров. Хорошим примером является использование данных о содержании тяжелых металлов и минералов для расчета потенциального содержания растворимых волокон, цинка и свинца в кукурузе [28]. Дальнейшее увеличение объема обрабатываемых алгоритмом данных как в части показателей, так и в части номенклатуры продуктов, требует организацию вычислений на основании баланса сложности, автоматизации и времени вычислений [29, 30].

4-й этап. Анализ выпадающих значений должен производиться на основании анализа распределения, произведенного на первом этапе. Так, для данных, распределенных бимодально, но имеющих ярко выраженные выпадающие значения, которые могут быть определены визуальным методом на гистограммах, некоторые из классических методов анализа «выбросов» могут давать некорректные результаты.

Для рассматриваемого массива данных и для оптимизации алгоритма с точки зрения

3 МР 2.3.7.0261—21 «Состояние здоровья населения в связи с состоянием питания. Рекомендации по алгоритму оценки достоверности и порядку анализа результатов мониторинговых исследований показателей качества отечественной продукции, способствующей устранению дефицита макро- и микронутриентов» (утв. Главным государственным санитарным врачом РФ 12.10.2021).

[23, 24].

volume зо, issue о, 2022

щ

Таблица 1. Меры описательной статистики исходных данных 2020 года Table 1. Descriptive statistics of source data for the year 2020

Показатель / Variable Среднее / Mean Стандартное отклонение / Standard deviation Коэффициент вариации (CV) / Coefficient of variation (CV)

Содержание жира, г/100 г / Fat content, g/100 g 3,010 1,710 56,833

Содержание белка, г/100 г / Protein content, g/100 g 3,144 1,488 47,326

Содержание золы, % / Ash content, % 0,705 0,372 52,800

Углеводы (расчетные), г/100 г / Carbohydrates (estimated), g/100 g 5,467 8,277 151,410

Энергетическая ценность аналитическая, ккал в 100 г / Analytical energy value, kcal per 100 g 59,536 19,519 32,785

Витамин В2, мг/100 г / Vitamin B2, mg/100 g 0,452 5,988 1325,502

Ca, мг/кг / Ca, mg/kg 1010,032 447,484 44,304

Холестерин, мг/100 г / Cholesterol, mg/100 g 103,589 526,772 508,521

Таблица 2. Меры описательной статистики исходных данных 2021 года Table 2. Descriptive statistics of source data for the year 2021

Показатель / Variable Среднее / Mean Стандартное отклонение / Standard deviation Коэффициент вариации (CV) / Coefficient of variation (CV)

Содержание жира, г/100 г / Fat content, g/100 g 2,946 0,524 17,800

Содержание белка, г/100 г / Protein content, g/100 g 3,053 0,185 6,057

Содержание золы, % / Ash content, % 0,681 0,165 24,221

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Углеводы (расчетные), г/100 г / Carbohydrates (calculated), g/100 g 7,152 14,378 201,039

Энергетическая ценность аналитическая, ккал в 100 г / Analytical energy value, kcal per 100 g 72,493 71,789 99,029

Витамин В2, мг/100 г / Vitamin B2, mg/100 g 0,147 0,143 97,574

Ca, мг/кг / Ca, mg/kg 997,558 640,723 64,229

Холестерин, мг/100 г / Cholesterol, mg/100 g 7,386 4,084 55,295

68 ЗНиСО

быстродействия использовалось правило трех сигм. Этот выбор во многом обуславливает последовательность действий в алгоритме, так как процесс кластеризации будет чувствительным к экстремальным значениям, которые с большей вероятностью являются технической ошибкой ввода или выбором некорректного объекта, нежели реально характеризует группу.

Альтернативные методы удаления выбросов данных необходимо оценивать с точки зрения целесообразности как в скорости выполнения алгоритма, так и улучшения алгоритма в части принципиальных отличий в интерпретации данных [31, 32].

5-й этап. Этап кластеризации требуется для выделения подгрупп продуктов, то есть определения некоторых скрытых с точки зрения потребителей структур распределения показателей качества. Как было указано ранее, далеко не все показатели являются стабильными во времени, в связи с этим привязка к торговому наименованию или установленным в соответствующих стандартах категориям, таким как, например, сортность, является нецелесообразной. Построение лингвистических сетей [33, 34] для установления связи между полученными кластерами и некоторыми общими элементами наименований продукции является сложной задачей, которая требует фокуса на качестве представления всех сведений, указанных при маркировке. В качестве метода кластеризации использовался метод к-средних. Ограничения данного метода и некоторые известные проблемы [35], возникающие при его применении, не сказываются на общей результативности алгоритма и качестве решения поставленной задачи.

6-й этап. Нормализация данных необходима для уменьшения влияния на конечный результат внутри- и межлабораторной ошибки при сопоставлении данных. Для этого предлагается использовать методологию, ранее описанную авторами.

Алгоритм и соответствующие вычисления реализованы на языке К версии 4.1.2 в среде разработки ЯБШёю.

Результаты. Был проведен анализ исходных данных по исследуемой группе продуктов. В связи с тем, что большое количество данных как для результатов 2020-го, так и для результатов 2021 г. по большинству показателей представляло собой нули или имело место отсутствие данных, что свидетельствовало о некорректно введенных результатах либо пропущенных показателях в исследованиях, такие значения были заменены на медиану для данного показателя.

После замен были рассчитаны коэффициенты вариации для исходных данных 2020 г. (табл. 1). Чем ближе данная величина к 0 %, тем более воспроизводимой и точной считалась полученная величина. Данные по содержанию отдельных жирных кислот были опущены для удобства представления, но они также характеризовались достаточно высокими коэффициентами вариации, до 300 %.

Аналогично были получены меры описательной статистики для результатов исследования 2021 г. (табл. 2).

Попарное сравнение коэффициентов вариации не показало, что большее количество исследований или большее количество задействованных лабораторий однозначно повышает точность результатов. В связи с этим было решено рассматривать

Original Research Article

>3 D

° 'S

X о îX и

5 *э

И "П

is н

i &

I я

II й 1 s 1

й) (Л S

f

é

î

m

& &

и

* îfj 8 в < 1 1 И if J14 1 1 1 1 1 1 1 1 ■ о 4-j 1 1 О î 8 1—w— 1 1 1

о о с U) С и U 1 0000000 J и и 1 и 1 и 1 и 1 и 1 и 00с ¿6 о ^ т-1 (N Г О и t э о о H M if si fN ÎN J и и

Насыщенные жирные кислоты / Saturated fattj' acids

Рис. 1. Диаграмма «ящик с усами» для содержания насыщенных жирных кислот для исходных данных Fig. 1. The box and whisker plot for the content of saturated fatty acids (source data)

объединенную выборку результатов 2020—2021 гг., так как в дальнейшем алгоритм должен оценивать как новые, так и ретроспективные данные с учетом новых полученных.

С целью оценки результатов исполнения алгоритма были рассмотрены, как пример, распределения насыщенных жирных кислот. Пальмитиновая кислота была исключена с целью сохранения размерности и лучшего визуального представления результатов. Распределение представлено в виде «ящика с усами» для демонстрации размаха и выбросов. График по исходным данным 2020—2021 гг. представлен на рис. 1.

Внутри кластеров был произведен процесс нормализации в соответствии с алгоритмом. В качестве примера работы алгоритма представлена диаграмма разброса для содержания насыщенных жирных кислот для второго кластера (рис. 3).

Появление отдельных выбросов было связано с уменьшением величины среднего и, как следствие, уменьшения интервала для определения выпадающих значений.

После нормализации были определены три кластера со следующими характеристиками:

— первая группа (49 образцов) — молоко с содержанием жира как 3,2, так и 2,5 (среднее 2,86 ± 0,335, минимум = 2,5, максимум = 3,24), но с содержанием кальция от 337 до 687,9 мг/кг (среднее 597,95 ± 78,79);

— вторая группа (129 образцов) — молоко с содержанием жира 3,2 % (среднее 3,24 ± 0,088, минимум = 3,2, максимум = 4) и содержанием кальция 926—11 566 мг/кг (среднее 1144,3 ± 77,35);

— третья группа (112 образцов) — молоко с содержанием жира 2,5 % (среднее 2,5 ± 0,018, минимум — 2,45, максимум — 2,54)

Рис. 2. Результаты кластеризации Fig. 2. Clustering results

voLume 30, issue о, 2022

Оригинальная исследовательская статья

5 ?

« d

е

0

1

щ

в 1

в &

I

и

"1 I I I I I I I I I I I I г

оооооооооооо

'^ГЦЛСЯт-Нт-Н^Нт-Нт-Нт-Нт-Н^НСЧСЧСЧГ']

UtJUUUUtJ UOUt^UtJUU

Насыщенные жирные кислоты / Saturated fatty acids

Рис. 3. Диаграмма «ящик с усами» для содержания насыщенных жирных кислот для молока с жирностью 3,2 % Fig. 3. The box and whisker plot for the content of saturated fatty acids in milk with a 3.2 % fat content

и содержанием кальция 900—1271 мг/кг (среднее 1180,11 ± 66,106).

Обсуждение. В результате анализа данных исследований питьевого молока, доступного для приобретения в торговых точках, был получен достаточно точный химический состав, в том числе и по отдельным жирным кислотам. Полученные значения соотносятся с ранее известными данными о содержании микро- и ма-кронутриентов4. Особое беспокойство вызывает выделение отдельной, ранее не описанной группы, которая характеризуется малым, по сравнению с обычным молоком, содержанием кальция. При условии, что существует «стандартная» формула, что большая часть суточной потребности в кальции может быть получена из трех стаканов молока, можно провести примерной расчет для каждой группы. Для кластеров со стандартным содержанием кальция за счет трех стаканов (750 мл) может быть получено около 870 мг кальция при норме физиологической потребности в 1000 мг в сутки. Группа с малым содержанием кальция будет в свою очередь давать лишь 448 мг, что не является даже половиной суточной потребности.

Заключение. Получение корректных значений для включения в базы данных химического состава пищевых продуктов является перспективной задачей не только с точки зрения изучения состава конкретного продукта, но и с точки зрения эпидемиологии питания.

Так, полученные сведения о различных группах питьевого молока позволили выявить потенциально большую проблему, которая может существенно влиять на здоровье населения. Учитывая, что человек не способен органолептически определить различное содержание кальция в молоке, а требования к маркировке его уровня отсутствуют, то и выбрать подходящий продукт не является возможным. Это в свою очередь требует организации

работы с производителями молочной продукции или внесения изменения в обязательные требования, а именно создания системы маркировки, которая бы полностью отражала наличие тех или иных веществ в продукте и уровень от физиологической потребности. Добровольность подобных систем, как показывает практика, не приносит требуемых результатов [36].

Алгоритм имеет перспективы развития и совершенствования. Так, полученные сведения о группах пищевых продуктов с различным содержанием нутриентов могут быть использованы для проведения точечных исследований для определения их распространенности среди всей выпускаемой продукции. Еще одной перспективой развития является разработка моделей потребления пищевых продуктов с целью определения реальных рисков для населения с точки зрения недостижения физиологических потребностей.

Список литературы

1. Healthy Diet. WHO Fact Sheets. Accessed April 23, 2022. https://www.who.int/news-room/fact-sheets/ detail/ healthy-diet

2. Карамнова Н.С., Шальнова С.А., Деев А.Д. и др. Характер питания взрослого населения по данным эпидемиологического исследования ЭССЕ-РФ. Кардиоваскулярная терапия и профилактика. 2018. Т. 17. № 4. С. 61-66. doi: 10.15829/1728-8800-20184-61-66

3. Agriculture, Forestry and Fishery Statistics — 2020 Edition. Eurostat, Statistical books. Luxembourg: Publications Office of the European Union; 2020. doi: 10.2785/143455

4. Попов П.А. «Микробиологический состав молока и пути его контаминации» Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2021. № 168. С. 208-216. doi: 10.21515/1990-4665-168-015

5. Priyashantha H, Lundh A. Graduate Student Literature Review: Current understanding of the influence of on-farm factors on bovine raw milk and its suitability for

4 Химический состав российских пищевых продуктов: Справочник / под ред. член-корр. МАИ, проф. И.М. Скурихина и академика РАМН, проф. В.А. Тутельяна. М.: ДеЛи принт, 2002. 236 с.

Original Research Article

cheesemaking. J Dairy Sci. 2021;104(11):12173-12183. doi: 10.3168/jds.2021-20146

6. Heck JML, van Valenberg HJF, Dijkstra J, van Ho-oijdonk ACM. Seasonal variation in the Dutch bovine raw milk composition. J Dairy Sci. 2009;92(10):4745-4755. doi: 10.3168/jds.2009-2146

7. Самойлов А.В., Колпаков Е.Ю., Сураева Н.М., Петров А.Н., Володарская Т.К., Горева Т.А. Сезонные изменения жирнокислотного состава коровьего молока, Вестник Красноярского государственного аграрного университета. 2017. № 9 (132). С. 35—40.

8. Лашнева И.А., Сермягин А.А. Влияние наличия транс-изомеров жирных кислот в молоке на его состав и продуктивность коров. Достижения науки и техники АПК. 2020. Т. 34. № 3. С. 46-50. doi: 10.24411/0235-2451-2020-10309

9. Zaalberg RM, Shetty N, Janss L, Buitenhuis AJ. Genetic analysis of Fourier transform infrared milk spectra in Danish Holstein and Danish Jersey. J Dairy Sci. 2019;102(1):503-510. doi: 10.3168/jds.2018-14464

10. Poulsen NA, Hein L, Kargo M, Buitenhuis AJ. Realization of breeding values for milk fatty acids in relation to seasonal variation in organic milk. J Dairy Sci. 2020;103(3):2434-2441. doi: 10.3168/jds.2019-17065

11. Лашнева И.А., Сермягин А.А., Елизарова И.В. и др. Показатели продуктивности коров в связи с уровнем транс-изомеров жирных кислот в молоке. Повышение конкурентоспособности животноводства и задачи кадрового обеспечения: материалы XXV международной научно-практической конференции, Г.о. Подольск, пос. Быково, 24-25 июня 2019 года / Российская академия менеджмента в животноводстве. — Г.о. Подольск, пос. Быково: федеральное государственное бюджетное образовательное учреждение дополнительного профессионального образования «Российская академия менеджмента в животноводстве», 2019. С. 184—191.

12. Батурин А.К., Мартинчик А.Н., Камбаров А.О. Структура питания населения России на рубеже ХХ и XXI столетий. Вопросы питания. 2020. Т. 89. № 4. С. 60—70. doi: 10.24411/0042-8833-2020-10042

13. Wallace TC, Bailey RL, Lappe J, et al. Dairy intake and bone health across the lifespan: a systematic review and expert narrative. Crit Rev Food Sci Nutr. 2021;61(21):3661-3707. doi: 10.1080/10408398.2020.1810624

14. Katt F, Meixner O. Is it all about the price? An analysis of the purchase intention for organic food in a discount setting by means of structural equation modeling. Foods. 2020;9(4):458. doi: 10.3390/foods9040458

15. Schaufele I, Janssen M. How and why does the attitude — behavior gap differ between product categories of sustainable food? Analysis of organic food purchases based on household panel data. Front Psychol. 2021;12:595636. doi: 10.3389/fpsyg.2021.595636

16. Villa-Etchegoyen C, Lombarte M, Matamoros N, Belizan JM, Cormick G. Mechanisms involved in the relationship between low calcium intake and high blood pressure. Nutrients. 2019;11(5):1112. doi: 10.3390/ nu11051112

17. Li K, Wang XF, Li DY, et al. The good, the bad, and the ugly of calcium supplementation: A review of calcium intake on human health. Clin Interv Aging. 2018;13:2443-2452. doi: 10.2147/CIA.S157523

18. Ghimire K, Mishra SR, Satheesh G, et al. Salt intake and salt-reduction strategies in South Asia: From evidence to action. J Clin Hypertens (Greenwich). 2021;23(10):1815-1829. doi: 10.1111/jch.14365

19. Щербаков Г.Д., Бессонов В.В. Подходы к алгоритму анализа результатов исследований микро- и макронутриентного состава хлебобулочных изделий. Сообщение первое. Здоровье населения и среда обитания. 2022. Т. 30. № 4. С. 44—53. doi: 10.35627/2219-5238/2022-30-4-44-53

20. Broman KW, Woo КР. Data organization in spreadsheets. Am Stat. 2018;72(1):2-10. doi: 10.1080/00031305.2017.1375989

21. Sanchez R, Griffin BA, Pane J, McCaffrey DF. Best practices in statistical computing. Stat Med. 2021;40(27):6057-6068. doi: 10.1002/sim.9169

22. McDermott C, Greig PR, Inglis A, Warren R, Hi-gham H. Taming 'biggish' data. BMJ Simul Technol Enhanc Learn. 2019;5(4):194-195. doi: 10.1136/bmjs-tel-2019-000441

23. Ziemann M, Eren Y, El-Osta A. Gene name errors are widespread in the scientific literature. Genome Biol. 2016;17(1):177. doi: 10.1186/s13059-016-1044-7

24. Bruford EA, Braschi B, Denny P, Jones TEM, Seal RL, Tweedie S. Guidelines for human gene nomenclature. Nat Genet. 2020;52(8):754-758. doi: 10.1038/s41588-020-0669-3

25. Das D, Nayak М, Pani SK. Missing value imputation — A review. Int J Comput Sci Eng. 2019;7(4):548-558. doi: 10.26438/ijcse/v7i4.548558

26. Nadraga V, Smirnov V, Boiko O, Dereko V. Comparison of missing values handling techniques using MICE package tools of R software and logistic regression model. In: Babichev S, Lytvynenko V, Wojcik W, Vyshemyrskaya S, eds. Lecture Notes in Computational Intelligence and Decision Making. ISDMCI2020. Advances in Intelligent Systems and Computing Springer, Cham; 2021;1246:39-50. doi: 10.1007/978-3-030-54215-3_3

27. El-Bakry M, Ali F, El-Kilany A, Mazen S. Fuzzy based techniques for handling missing values. Int J Adv Comput Sci Appl. 2021;12(3):50-55. doi: 10.14569/ IJACSA.2021.0120306

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

28. Pekel AY, Qalik A, Alata§ MS, et al. Evaluation of correlations between nutrients, fatty acids, heavy metals, and deoxynivalenol in corn (Zea mays L.). J Appl Poult Res. 2019;28(1):94-107. doi: 10.3382/japr/pfy023

29. Pollard S, Namazi H, Khaksar R. Big data applications in food safety and quality. In: Encyclopedia of Food Chemistry. Academic Press; 2019:356-363. doi: 10.1016/B978-0-08-100596-5.21839-8

30. Rashid W, Gupta MK. A perspective of missing value imputation approaches. In: Gao XZ, Tiwari S, Tri-vedi M, Mishra K, eds. Advances in Computational Intelligence and Communication Technology. Springer, Singapore; 2021;1086:307-315. doi: 10.1007/978-981-15-1275-9_25

31. Xu X, Liu H, Li L, Yao M. A comparison of outlier detection techniques for high-dimensional data. Int J Comput Intell Syst. 2018;11(1):652. doi: 10.2991/ ijcis.11.1.50

32. Amano S, Aizawa K, Ogawa M. Food category representatives: Extracting categories from meal names in food recordings and recipe data. 2015 IEEE International Conference on Multimedia Big Data. 2015:48-55. doi: 10.1109/BigMM.2015.54

33. Anzawa M, Amano S, Yamakata Y, Yamasaki T, Aizawa K, Ogawa M. Generation of representative meal names for food recording data by using web search results. 2016 IEEE International Conference on Multimedia & Expo Workshops (ICMEW). 2016:1-6. doi: 10.1109/ICMEW.2016.7574745

34. Ahmed M, Seraj R, Islam SM. The k-means algorithm: A comprehensive survey and performance evaluation. Electronics. 2020;9(8):1295. doi: 10.3390/ electronics9081295

35. Ruvuna F, Flores D, Mikrut B, De La Gana K, Fong S. Generalized lab norms for standardizing data from multiple laboratories. Drug Inf J. 2003;37(1):61—79. doi: 10.1177/009286150303700109

36. Беркетова Л.В., Прошина К.Ю. Система «Светофор» в пищевой отрасли // Бюллетень науки и практики. 2019. Т. 5. № 5. С. 183—191. doi: 10.33619/24142948/42/25

References

1. Healthy Diet. WHO Fact Sheets. Accessed April 23, 2022. https://www.who.int/news-room/fact-sheets/ detail/ healthy-diet

2. Karamnova NS, Shalnova SA, Deev AD, et al. Nutrition characteristics of adult inhabitants by ESSE-RF study. Kardiovaskulyarnaya Terapiya i Profilaktika. 2018;17(4):61-66. (In Russ.) doi: 10.15829/1728-88002018-4-61-66

3. Agriculture, Forestry and Fishery Statistics — 2020 Edition. Eurostat, Statistical books. Luxembourg:

voLume 30, issue o, 2022

/2

Publications Office of the European Union; 2020. doi: 10.2785/143455

4. Popov PA. Microbiological composition of milk and ways of its contamination. Politematicheskiy Setevoy Elektronnyy Nauchnyy Zhurnal Kubanskogo Gosudar-stvennogo Agrarnogo Universiteta. 2021;(168):208-216. (In Russ.) doi: 10.21515/1990-4665-168-015

5. Priyashantha H, Lundh Â. Graduate Student Literature Review: Current understanding of the influence of on-farm factors on bovine raw milk and its suitability for cheesemaking. J Dairy Sci. 2021;104(11):12173-12183. doi: 10.3168/jds.2021-20146

6. Heck JML, van Valenberg HJF, Dijkstra J, van Ho-oijdonk ACM. Seasonal variation in the Dutch bovine raw milk composition. J Dairy Sci. 2009;92(10):4745-4755. doi: 10.3168/jds.2009-2146

7. Samoylov AV, Kolpakov EYu, Suraeva NM, Petrov AN, Volodarskaya TK, Goreva TA. Seasonal variations in fatty acids composition of cow's milk. Vestnik KrasGAU. 2017;(9(132)):35-40. (In Russ.)

8. Lashneva IA, Sermyagin AA. The effect of the presence of trans fatty acids in milk on its composition and cows' productivity. Dostizheniya Nauki i Tekhniki APK. 2020;34(3):46-50. (In Russ.) doi: 10.24411/02352451-2020-10309

9. Zaalberg RM, Shetty N, Janss L, Buitenhuis AJ. Genetic analysis of Fourier transform infrared milk spectra in Danish Holstein and Danish Jersey. J Dairy Sci. 2019;102(1):503-510. doi: 10.3168/jds.2018-14464

10. Poulsen NA, Hein L, Kargo M, Buitenhuis AJ. Realization of breeding values for milk fatty acids in relation to seasonal variation in organic milk. J Dairy Sci. 2020;103(3):2434-2441. doi: 10.3168/jds.2019-17065

11. Lashneva IA, Sermyagin AA, Elizarova IV, et al. Production traits in relation with trans fatty acids level in cow milk. In: Increasing the Competitiveness of Animal Husbandry and Tasks of Staffing: Proceedings of the 25th International Scientific and Practical Conference, Bykovo settlement, Podolsk Urban District, June 24—25, 2019. Podolsk: Russian Academy of Management in Animal Husbandry Publ.; 2019:184-191. (In Russ.)

12. Baturin AK, Martinchik AN, Kambarov AO. The transit of Russian nation nutrition at the turn of the population at the turn of the 20th and 21st centuries. Voprosy Pitaniya. 2020;89(4):60-70. (In Russ.) doi: 10.24411/0042-8833-2020-10042

13. Wallace TC, Bailey RL, Lappe J, et al. Dairy intake and bone health across the lifespan: a systematic review and expert narrative. Crit Rev Food Sci Nutr. 2021;61(21):3661-3707. doi: 10.1080/10408398.2020.1810624

14. Katt F, Meixner O. Is it all about the price? An analysis of the purchase intention for organic food in a discount setting by means of structural equation modeling. Foods. 2020;9(4):458. doi: 10.3390/foods9040458

15. Schaufele I, Janssen M. How and why does the attitude — behavior gap differ between product categories of sustainable food? Analysis of organic food purchases based on household panel data. Front Psychol. 2021;12:595636. doi: 10.3389/fpsyg.2021.595636

16. Villa-Etchegoyen C, Lombarte M, Matamoros N, Belizán JM, Cormick G. Mechanisms involved in the relationship between low calcium intake and high blood pressure. Nutrients. 2019;11(5):1112. doi: 10.3390/ nu11051112

17. Li K, Wang XF, Li DY, et al. The good, the bad, and the ugly of calcium supplementation: A review of calcium intake on human health. Clin Interv Aging. 2018;13:2443-2452. doi: 10.2147/CIA.S157523

18. Ghimire K, Mishra SR, Satheesh G, et al. Salt intake and salt-reduction strategies in South Asia: From evidence to action. J Clin Hypertens (Greenwich). 2021;23(10):1815-1829. doi: 10.1111/jch.14365

19. Shcherbakov GD, Bessonov VV. Approaches to the algorithm of analyzing the results of laboratory testing of micro- and macronutrient content of bakery products: Part 1. Zdorov'e Naseleniya i Sreda Obitaniya.

Оригинальная исследовательская статья

2022;30(4):44-53. (In Russ.) doi: 10.35627/22195238/2022-30-4-44-53

20. Broman KW, Woo KP. Data organization in spreadsheets. Am Stat. 2018;72(1):2-10. doi: 10.1080/00031305.2017.1375989

21. Sanchez R, Griffin BA, Pane J, McCaffrey DF. Best practices in statistical computing. Stat Med. 2021;40(27):6057-6068. doi: 10.1002/sim.9169

22. McDermott C, Greig PR, Inglis A, Warren R, Hi-gham H. Taming 'biggish' data. BMJ Simul Technol Enhanc Learn. 2019;5(4):194-195. doi: 10.1136/bmjs-tel-2019-000441

23. Ziemann M, Eren Y, El-Osta A. Gene name errors are widespread in the scientific literature. Genome Biol. 2016;17(1):177. doi: 10.1186/s13059-016-1044-7

24. Bruford EA, Braschi B, Denny P, Jones TEM, Seal RL, Tweedie S. Guidelines for human gene nomenclature. Nat Genet. 2020;52(8):754-758. doi: 10.1038/ s41588-020-0669-3

25. Das D, Nayak М, Pani SK. Missing value imputation - A review. Int J Comput Sci Eng. 2019;7(4):548-558. doi: 10.26438/ijcse/v7i4.548558

26. Nadraga V, Smirnov V, Boiko O, Dereko V. Comparison of missing values handling techniques using MICE package tools of R software and logistic regression model. In: Babichev S, Lytvynenko V, Wojcik W, Vyshemyrskaya S, eds. Lecture Notes in Computational Intelligence and Decision Making. ISDMCI2020. Advances in Intelligent Systems and Computing. Springer, Cham; 2021;1246:39-50. doi: 10.1007/978-3-030-54215-3_3

27. El-Bakry M, Ali F, El-Kilany A, Mazen S. Fuzzy based techniques for handling missing values. Int J Adv Comput Sci Appl. 2021;12(3):50-55. doi: 10.14569/ IJACSA.2021.0120306

28. Pekel AY, Çalik A, Alataç MS, et al. Evaluation of correlations between nutrients, fatty acids, heavy metals, and deoxynivalenol in corn (Zea mays L.). J Appl Poult Res. 2019;28(1):94-107. doi: 10.3382/japr/ pfy023

29. Pollard S, Namazi H, Khaksar R. Big data applications in food safety and quality. In: Encyclopedia of Food Chemistry. Academic Press; 2019:356-363. doi: 10.1016/B978-0-08-100596-5.21839-8

30. Rashid W, Gupta MK. A perspective of missing value imputation approaches. In: Gao XZ, Tiwari S, Tri-vedi M, Mishra K, eds. Advances in Computational Intelligence and Communication Technology. Springer, Singapore; 2021;1086:307-315. doi: 10.1007/978-981-15-1275-9_25

31. Xu X, Liu H, Li L, Yao M. A comparison of outlier detection techniques for high-dimensional data. Int J Comput Intell Syst. 2018;11(1):652. doi: 10.2991/ ijcis.11.1.50

32. Amano S, Aizawa K, Ogawa M. Food category representatives: Extracting categories from meal names in food recordings and recipe data. 2015 IEEE International Conference on Multimedia Big Data. 2015:48-55. doi: 10.1109/BigMM.2015.54

33. Anzawa M, Amano S, Yamakata Y, Yamasaki T, Aizawa K, Ogawa M. Generation of representative meal names for food recording data by using web search results. 2016 IEEE International Conference on Multimedia & Expo Workshops (ICMEW). 2016:1-6. doi: 10.1109/ICMEW.2016.7574745

34. Ahmed M, Seraj R, Islam SM. The k-means algorithm: A comprehensive survey and performance evaluation. Electronics. 2020;9(8):1295. doi: 10.3390/ electronics9081295

35. Ruvuna F, Flores D, Mikrut B, De La Gana K, Fong S. Generalized lab norms for standardizing data from multiple laboratories. Drug Inf J. 2003;37(1):61-79. doi: 10.1177/009286150303700109

36. Berketova LV, Proshina KYu. The "traffic light" system in the food industry. Byulleten ' Nauki i Praktiki. 2019;5(5):183-191. (In Russ.) doi: 10.33619/24142948/42/25

ö

i Надоели баннеры? Вы всегда можете отключить рекламу.