Научная статья на тему 'СЕЗОННАЯ СТРУКТУРА ПОТРЕБЛЕНИЯ КОНТЕНТА'

СЕЗОННАЯ СТРУКТУРА ПОТРЕБЛЕНИЯ КОНТЕНТА Текст научной статьи по специальности «Математика»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
контент / оценка качества / анализ данных / регрессия / scikit-learn / pandas / content / quality assessment / data science / regression / scikit-learn / pandas

Аннотация научной статьи по математике, автор научной работы — Мосин Владимир Геннадьевич, Козловский Владимир Николаевич, Благовещенский Дмитрий Иванович

В статье исследована структура потребления образовательного контента в зависимости от сезона. Показано, что структура потребления в сезон высокого потребления отличается от структуры потребления в сезон низкого потребления. Рассмотрены регрессионные модели прогноза потребления. Показано, что модели, обученные на сезонах низкого потребления, хорошо подходят для прогнозов в сезон высокого потребления, причем, обратное не верно.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Мосин Владимир Геннадьевич, Козловский Владимир Николаевич, Благовещенский Дмитрий Иванович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SEASONAL STRUCTURE OF CONTENT CONSUMPTION

The article examines the structure of educational content consumption depending on the season. It is shown that the structure of consumption in the season of high consumption differs from the structure of consumption in the season of low consumption. Regression models of consumption prediction are considered. It is shown that models trained on low consumption seasons are well suited for prediction in the high consumption season, and the opposite is not true.

Текст научной работы на тему «СЕЗОННАЯ СТРУКТУРА ПОТРЕБЛЕНИЯ КОНТЕНТА»

УДК 005.6

DOI: 10.24412/2071-6168-2024-3-490-491

СЕЗОННАЯ СТРУКТУРА ПОТРЕБЛЕНИЯ КОНТЕНТА

В.Г. Мосин, В.Н. Козловский, Д.И. Благовещенский

В статье исследована структура потребления образовательного контента в зависимости от сезона. Показано, что структура потребления в сезон высокого потребления отличается от структуры потребления в сезон низкого потребления. Рассмотрены регрессионные модели прогноза потребления. Показано, что модели, обученные на сезонах низкого потребления, хорошо подходят для прогнозов в сезон высокого потребления, причем, обратное не верно.

Ключевые слова: контент, оценка качества, анализ данных, регрессия, scikit-learn, pandas.

1. Введение. Факторы сезонности в потреблении контента могут быть разнообразными и варьируются в зависимости от типа контента и предпочтений аудитории. Например, времена года, в которые проходят праздники, такие как Рождество, Новый год, День Святого Валентина, Хэллоуин и т. д., часто связаны с увеличенным интересом к праздничному контенту. Специфические сезонные мероприятия и события, такие как спортивные чемпионаты, фестивали или конференции, так же могут вызывать повышенный интерес и активность аудитории. Учитывая факторы сезонности, можно более эффективно адаптировать свои стратегии, выпуская соответствующий контент в нужное время для максимизации его востребованности [5, 6].

В нашей работе мы будем изучать сезонную структуру потребления образовательного контента, в котором сезонные колебания интереса аудитории выражены особенно ярко [8]. Учебные заведения работают по семестровой системе, и это оказывает сильное влияние на пики и спады потребления образовательного контента, так как во время семестров и активных периодов учебы спрос на образовательный контент значительно выше, в то время как в периоды каникул спрос минимален.

1.1. Теоретическая часть. Итак, есть сезоны высокого потребления образовательного контента, и есть сезоны низкого потребления. Мы будем изучать различия и сходства в сезонной структуре его потребления, используя регрессионный анализ — один из хорошо известных инструментов прогнозирования [3, 4]. Он позволяет определить основные факторы и тенденции, влияющие на потребление, и прогнозировать его на будущее, основываясь на результатах предыдущих наблюдений.

Однако в нашей работе, помимо прогнозирующих возможностей наших моделей, нас будет интересовать еще и структура моделей, так как именно она позволяет говорить о различиях или сходствах процессов потребления в разные сезоны. В регрессионной модели каждый предиктор имеет свой коэффициент, который показывает, как изменяется зависимая переменная при изменении значения предиктора [3]. Если коэффициент значимый, то это означает, что предиктор оказывает статистически значимое влияние на зависимую переменную, если он близок к нулю, его влияние минимально.

Оценивая не каждый коэффициент по отдельности, а всю их совокупность, можно судить о подобии структур потребления.

1.2. Постановки задачи

1.2.1. Предмет исследования. Предметом исследования являются 10 наборов данных о потреблении контента информационного канала, относящегося к образовательной тематике. Данные образуют 2 группы по 5 наборов наблюдений в каждой группе. В одной группе представлены данные о потреблении контента в сезон высокого потребления (периоды зимней сессии, январи с 2019 по 2023), в другой — о потреблении в сезон низкого потребления (периоды летних каникул, августы с 2019 по 2023).

1.2.2. Методика исследования. Методика состоит в обучении 10 регрессионных моделей на каждом из 10 наборов данных с последующим перекрестным тестированием по схеме «все на всех».

1.2.3. Цель исследования. Наша цель состоит в описании структуры потребления контента, то есть, в указании значимых предикторов регрессионных моделей, и последующем сравнении структур высокого и низкого сезонов потребления. Кроме того, мы хотим выяснить, способны ли модели высокого и низкого сезонов прогнозировать друг друга на достаточном уровне точности прогнозов.

1.3. Технологии. Для выполнения вычислений и анализа данных мы пользуемся средой Jupyter Notebook, которая предоставляет удобные средства для работы с языком программирования Python и его главными библиотеками: NumPy, Pandas, sklearn и matplotlib. Благодаря этим инструментам, мы можем эффективно работать с данными, выполнять исследования и визуализировать результаты [1, 2].

Библиотека numpy является одной из ключевых библиотек для научных вычислений и обработки массивов данных в языке программирования Python. Она предлагает эффективные структуры данных, алгоритмы и функции для операций с многомерными числовыми массивами.

Библиотека pandas — одна из наиболее популярных и мощных библиотек для работы с данными в языке программирования Python [1]. Она тесно взаимодействует с другими инструментами для вычислений и анализа данных на платформе Python, такими как numpy, sklearn и matplotlib. Это обеспечивает эффективную работу с информацией и применение различных алгоритмов и функций для анализа и визуализации данных.

Библиотека scikit-learn, широко известная как sklearn, предоставляет обширный набор инструментов и функций для решения различных задач в языке программирования Python, таких как задачи классификации, регрессии, кластеризации и др. Мы используем эту библиотеку для решения регрессионных задач.

2. Описание данных. Данные представляют собой набор из 10 сезонных отчетов о взаимодействии пользователей с контентом информационного канала на одном из ведущих хостингов. Наблюдения проводились в течение 5 лет, с 2019 по 2023 г., сезонная дифференциация осуществлялась по принципу: январь — сезон высокого потребления контента, август — сезон низкого потребления. Каждый из 10 отчетов содержит около 500 записей, точные значения объемов данных приведены ниже, в разделе 3.2.

3. Алгоритм.

3.1. Чтение данных. Методом read_csv библиотеки pandas загружаем в среду исполнения 10 наборов данных (соответственно периодам наблюдений) и формируем 10 однотипных дата-фреймов. Таковы, например, данные за январь 2023.

Новые коммента- Отметки Отметки "Нра- CTR для знач-

рии Поделились "Не нравится" вится" ... Показы ков видео (%)

0 2.0 32.0 1.0 38.0 .. . 5994.0 16.12

1 2.0 1.0 1.0 7.0 .. . 2356.0 9.08

2 1.0 0.0 0.0 1.0 .. . 668.0 4.34

497 0.0 0.0 0.0 0.0 ... 622.0 1.77

498 0.0 0.0 0.0 0.0 ... 52.0 0.00

499 0.0 0.0 0.0 2.0 ... 325.0 4.00

Каждая строка описывает определенный видеоролик, каждый столбец указывает на один из признаков, при помощи которого этот ролик описывается.

3.2. Разведочный анализ. Применяем метод info библиотеки pandas и выводим сведения о признаках. Для января 2023 они таковы.

# Column

0 Новые комментарии

1 Поделились

2 Отметки "Не нравится"

3 Отметки "Нравится"

4 Средний процент просмотра (%)

5 Просмотры

6 Время просмотра (часы)

7 Показы

8 CTR для значков видео (%)

Non-Null Count Dtype

500 non-null float64

500 non-null float64

500 non-null float64

500 non-null float64

500 non-null float64

500 non-null float64

500 non-null float64

500 non-null float64

500 non-null float64

Пропущенных значений нет, все данные относятся к типу с плавающей запятой. Заметим, что все наборы данных имеют одинаковую структуру, признаки всегда следуют в одном и том же порядке. Незначительные различия есть только в объемах

Период наблюдений 2019 2020 2021 2022 2023

_01_08_01_05_01_05_01_05_01_08_

Объем данных 500 499 500 494 495 500 499 498 500 498

Это объясняется тем, что в данных, загруженных непосредственно с сервера хостинга, имелись пропуски, и на этапе предварительной обработки мы их удалили при помощи метода dropna библиотеки pandas. Различия в объемах несущественны и не влияют на результаты исследования.

3.3. Сравнение средних значений. Пользуясь методом describe библиотеки pandas, выводим средние значения признаков по периодам наблюдений.

Период наблюдений 01.19 08.19 01.20 08.20 01.21 08.21 01.22 08.22 01.23 08.23

Новые комментарии 0.68 0.45 0.01 0.12 0.08 0 65 0.01 0.05 0.09 0 64 0.02 0.05 0.06 0 47 0.03 0.12 0.04 0 52 0.01 0.04

Поделились Отметки "Не нравится" 0.16 1.34 0.02 0.24 0.23 1 49 0.02 0.22 0.14 37 0.02 0.36 0.15 1 35 0.02 0.53 0.06 114 0.01 0.21

Отметки "Нравится" Средний процент просмотра (%) 32.40 96.89 41.36 16.54 36.44 100 35 40.33 17.51 35.12 67 57 38.14 14.18 35.26 62 59 36.50 16.63 33.02 70 99 33.68 12.40

Просмотры Время просмотра (часы) Показы 4.43 778.74 0.81 200.81 4.50 903 22 0.82 217.04 2.82 780 09 0.67 172.80 2.81 486 05 0.62 411.36 2.74 555 14 0.47 127.77

CTR для значков видео (%) 3.88 2.93 3.56 2.87 3.14 4.11 4.23 3.01 4.52 4.62

Сравнивая средние значения по месяцам, делаем два наблюдения:

1. Январские значения почти всегда оказываются выше августовских, кроме двух показателей — 'Средний процент просмотра (%)' и ' CTR для значков видео (%)' — причем, оба эти показателя, в отличие от всех остальных, являются относительными, а не абсолютными.

2. Значения некоторых показателей, например, 'Показы' и 'Новые комментарии', отличаются на порядки.

Отличие средних значений в пользу январских вполне естественно: мы изучаем структуру потребления

образовательного контента, а август в образовании — это «мертвый сезон». Более того, основываясь именно на этом отличии, мы и проводим наше исследование.

Что же касается существенного разброса значений, то это может привести к некорректным моделям, когда некоторые признаки будут получать преимущество просто из-за того, что их абсолютная величина перекрывает все остальные предикторы модели. Поэтому, прежде чем переходить к построению и сравнению регрессионных моделей, мы проводим нормализацию данных к стандартному виду с нулевым средним и единичной дисперсией.

3.4. Нормализация данных. В силу того, что данные были получены по отдельности друг от друга, в виде десяти самостоятельных дата-фреймов, нормализация на каждом из них была бы некорректной, так как средние значения всех показателей были бы нулевыми [3].

Для получения корректной нормализации, мы, пользуясь методом concat библиотеки pandas, производим конкатенацию данных в один дата-фрейм и только после этого нормализуем данные. Затем, пользуясь методом loc для локализаций общего дата-фрейма, разбиваем его на фрагменты по периодам наблюдений, и, пользуясь методом describe, получаем нормализованные данные о средних значениях:

Период наблюдений 01.19 08.19 01.20 08.20 01.21 08.21 01.22 08.22 01.23 08.23

Новые комментарии 1.59 -0.27 -0.13 -0.05 -0.25 -0.17 -0.02 -0.23 -0.17 -0.12 -0.20 -0.12 -0.16 -0.25 -0.18

Отметки "Не нравится" 0.14 0.19 -0.11 -0.22 0.28 -0.11 -0.23 0.10 -0.11 -0.17 0.11 -0.12 -0.11 -0.03 -0.14 -0.23

Средний процент просмотра (%) -0.20 0.27 -0.23 0.01 0.22 -0.22 -0.05 0.10 -0.25 -0.05 0.01 -0.23 -0.17 -0.13 -0.26

Время просмотра (часы) 0.34 -0.18 -0.30 0.35 -0.18 -0.28 0.11 -0.20 -0.33 0.10 -0.21 -0.06 0.09 -0.23 -0.38

СТЯ для значков видео (%) 0.06 -0.25 -0.04 -0.27 -0.18 0.13 0.17 -0.22 0.27 0.30

Возвращаясь к сделанным выше наблюдениям (см. шаг 3.3), обнаруживаем:

1. Нормализованные средние значения январских показателей по-прежнему выше августовских (с теми же двумя исключениями).

2. Разрыв в порядках наблюдаемых средних значений устранен, все значения относятся примерно к одному порядку.

Теперь, имея нормализованные данные, можно переходить к построению и обучению регрессионных моделей.

3.5. Построение и обучение регрессионных моделей. Мы будем строить десять моделей на десяти имеющихся у нас периодах наблюдений. В качестве целевой функции всегда будет выступать признак 'Время просмотра (часы)'.

3.5.1. Модель на данных за январь, 2019. Для получения левой части регрессионной задачи мы, пользуясь методом drop библиотеки pandas, удаляем целевой признак 'Время просмотра (часы)' и переводим оставшийся дата-фрейм в массив numpy, пользуясь методом to_numpy. В результате получается числовой массив X, содержащий 500 строк и 8 столбцов. Для получения правой части выделяем целевой признак, переводим его в массив и получаем одномерный числовой массив y, содержащий 500 элементов.

Затем, методом LinearRegression из модуля linear_model библиотеки sklearn, мы формируем объект model и применяем к нему метод fit на массивах X, y.

3.5.2-10. Модели на данных за другие периоды. Действуя точно так же, получаем и обучаем еще девять

моделей.

3.6. Коэффициенты регрессионных моделей. Применяя метод coef_ библиотеки sklearn к обученным выше моделям, выводим списки регрессионных коэффициентов и агрегируем их для сравнения.

Период наблюдений 01.19 08.19 01.20 08.20 01.21 08.21 01.22 08.22 01.23 08.23

0 1 Новые комментарии -0.01 0.22 0.11 -0.03 -0.09 0 04 -0.02 0.01 0.00 0 10 0.07 0.00 -0.03 0 06 -0.02 0.00 -0.01 0 18 0.00 -0.01

2 3 Поделились Отметки "Не нравится" 0.01 0.15 -0.02 0.09 -0.04 0 22 0.06 0.01 -0.04 0 22 -0.02 0.05 -0.09 0 02 0.03 0.03 0.14 0 18 0.03 0.00

4 5 Отметки "Нравится" Средний процент просмотра (%) 0.06 0.91 0.01 0.97 0.06 0 72 0.01 0.88 0.03 0 67 0.01 0.88 0.02 1 01 0.01 0.82 0.04 0 38 0.01 0.75

6 Просмотры Время просмотра (часы) Показы -0.08 0.12 0 19 0.17 —0 04 0.09 0 05 -0.02 0 19 0.07

7 СТЯ для значков видео (%) -0.06 -0.01 -0.05 -0.01 -0.04 0.00 -0.05 -0.01 -0.02 0.00

В этой таблице мы сохранили строку 'Время просмотра (часы)', не придавая ей никаких значений, чтобы подчеркнуть, что этот признак является целевой функцией и не участвует в построении регрессионных моделей.

3.7. Структура потребления контента. Набор коэффициентов регрессионной модели является хорошей (хотя, и не единственной) иллюстрацией того, какова структура целевой функции: предикторы с более высокими коэффициентами вносят наибольших вклад в ее вычисление, предикторы с коэффициентами, близкими к нулю, несущественны.

В нашем случае изучается структура потребления контента, которое мы естественным образом ассоциируем с общим временем просмотра, так как потребление видео — это и есть его просмотр. На иллюстрации (см. рис. 1) по горизонтали откладывается номер предиктора, а по вертикали — значение его коэффициента в регрессионной модели, то есть, то, насколько существенный вклад этот предиктор вносит в значение целевой функции.

а Ь

Рис. 1. Сезонная структура потребления контента: (а) по годам с 2019 по 2023, (Ь) усредненная.

Наибольший коэффициент всегда относится к предиктору номер 5: это признак 'Просмотры', что совершенно не удивительно, так как количество просмотров сильно коррелирует с общим временем просмотра. Приоритет предиктора 'Просмотры' свойственен как январским, так и августовским моделям, и можно было бы сказать, что структура потребления контента сохраняется вне зависимости от сезона, но это не так.

492

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

После усреднения отчетливо видно, что январская модель обладает еще двумя приоритетами: это предиктор номер 1, 'Поделились', и предиктор номер 3, 'Отметки "Нравится"'. При этом усредненная августовская модель не считает их приоритетными. Следовательно, структура потребления на «низком» сезоне отличается от структуры «высокого» сезона, и это отличие еще проявит себя в процессе прогнозирования.

3.8. Прогноз потребления контента. Начиная с шага 3.5, у нас есть 10 обученных моделей: 5 январских и 5 августовских, и каждая из них дает свой прогноз потребления. С другой стороны, у нас есть 10 сезонов с реальными данными о потреблении контента: 5 январских и 5 августовских. Это дает нам возможность сопоставить прогнозируемые значения с реальными, то есть, оценить прогнозирующие способности моделей с разных точек зрения.

3.8.1. Прогнозы модели, обученной на январе 2019. Сначала берем модель, обученную на январе 2019. Пользуясь методом score библиотеки skleam, вычисляем коэффициент детерминации этой модели на данных за январь 2019 (в данном случае обучающая и тестовая выборки совпадают). Получаем:

R2 = 0.9633791851744916.

Затем применяем эту модель к данным за январь 2020, получаем другой коэффициент детерминации:

R2 = 0.8991026585426595.

Оценка получилась ниже предыдущей. Это естественно, потому что в качестве обучающей выборки мы использовали данные за январь 2019, а в качестве тестовой — другие данные, за январь 2020. Затем применим модель к данным за январь 2021 и так далее.

Таким образом, на этом шаге мы оцениваем прогнозирующую способность модели, обученной на январе 2019, для всех сезонов (включая сезон, на котором модель обучилась) и получаем 10 оценок.

3.8.2-10. Прогнозы моделей, обученных на остальных сезонах. Действуем так же, как на предыдущем шаге: последовательно перебираем модели, обученные на остальных сезонах (их 9 шт.), применяем их ко всем сезонам (их 10 шт., включая сезон, на котором модель обучалась) и получаем еще 90 оценок.

4. Результаты. Метрики прогнозирующей эффективности для всех возможных попарных сезонных прогнозов представлены в следующей матрице (в ней по вертикали указаны сезоны, на которых обучалась модель, а по горизонтали — сезоны, на которых делался прогноз).

01.19 01.20 01.21 01.22 01.23 08.19 08.20 08.21 08.22 08.23

01.19 0.963 0.899 0.816 0.917 0.822 0.815 0.822 0.676 0.451 0.158

01.20 0.916 0.961 0.907 0.943 0.937 0.725 0.706 0.244 -1.301 -1.061

01.21 0.910 0.929 0.959 0.939 0.956 0.804 0.779 0.760 0.645 0.484

01.22 0.947 0.946 0.926 0.960 0.900 0.876 0.885 0.784 0.493 0.460

01.23 0.896 0.918 0.882 0.933 0.969 0.770 0.812 0.701 -1.408 0.462

08.19 0.874 0.892 0.820 0.916 0.845 0.952 0.906 0.888 -1.035 0.619

08.20 0.936 0.916 0.869 0.942 0.910 0.914 0.935 0.899 -0.932 0.828

08.21 0.929 0.937 0.920 0.953 0.925 0.924 0.918 0.950 0.080 0.845

08.22 0.895 0.911 0.934 0.926 0.949 0.822 0.856 0.849 0.887 0.908

08.23 0.880 0.907 0.923 0.917 0.944 0.833 0.872 0.892 0.52 0.925

Матрица метрик обладает следующими свойствами:

1.На ее главной диагонали сосредоточены наибольшие значения. Это закономерно, так как в этих случаях модель тестируется на тех же данных, на которых она обучалась, при этом коэффициент детерминации обладает заведомо большим значением.

2.Она не симметрична. Например, модель, обученная на январе 2019 и примененная к январю 2020, и модель, обученная на январе 2020 и примененная к январю 2019 — это две разные модели, и их коэффициенты детерминации различны: ^01.19 , 01.20 = 0.899 Ф 0.916 = ^01.20 , 01.19Неравенства имеют место и для всех остальных симметричных позиций.

3. Самое удивительное свойство состоит в том, что модель, обученная на августовских данных, а протестированная на январских данных, всегда обладает большей прогнозирующей способностью, чем наоборот. Например, для августа 2019 мы можем сравнить первую половину строки 08.19 с первой половиной столбца 08.19:

Я208.19 , 01.19 = 0.847 > 0.815 = ^01.19 , 08.19 Я208.19 , 01.20 = 0.8 92 > 0.725 = ^01.20 , 08.19 Я208.19 , 01.21 = 0.820 > 0.804 = ^01.21 , 08.19 Я208.19 , 01.22 = 0.9 1 6 > 0.876 = Я201.22 , 08.19 Я208.19 , 01.23 = 0.84 5 > 0.770 = ^01.23 , 08.19

Соотношения остаются справедливыми для всех остальных августовских моделей, для этого достаточно рассмотреть другие пары полу-строк и полу-столбцов с номерами: 08.20, 08.21, 08.22, 08.23. Нет ни одного исключения.

4. Матрица метрик не является блочной в алгебраическом понимании, но семантически она содержит 4 блока 5x5. Действительно:

a. Левый верхний блок описывает ситуации, когда модель обучается на январских данных и тестируется тоже на январских;

b. Правый нижний блок — модель обучается на августовских данных и тестируется тоже на августовских;

c. Правый верхний блок — модель обучается на январских данных, а тестируется на августовских;

(1 Левый нижний блок — модель обучается на августовских данных, а тестируется на январских;

Усреднение коэффициентов детерминации по каждому из четырех блоков дает агрегированную по сезонам матрицу метрик:

Январь Август

Январь 0.922 0.422

Август 0.911 0.682

Ее содержательная интерпретация такова:

a. Наилучшие результаты получаются, когда модель, обученная на январских данных, применяется для прогнозирования к другим январским данным.

b.Модель, обученная на августе, в применении к другим августовским данным дает значительно худший

результат.

c. Самая плохая ситуация возникает, когда модель, обученная на январе применяется к августовским данным.

d. И напротив: модель, обученная на августе, очень хорошо прогнозирует январские данные, лишь ненамного уступая моделям, которые учились на январе.

5. Выводы. Эффект сезонности в потреблении образовательного контента означает, что объем потребления контента в образовании сильно меняется в зависимости от времени года, и это должно учитываться в анализе его потребления. Такой анализ помогает смоделировать и предсказать будущие сезонные колебания и адаптировать стратегии контент-провайдеров в соответствии с этими тенденциями [7].

5.1. Обобщения. Разумеется, сезоны высокого и низкого потребления имеют место не только в потреблении контента. Этот феномен широко распространен в различных сферах экономики и оказывает значительное влияние на бизнес-планы и стратегии компаний [9].

В сезоны высокого потребления входят периоды, когда спрос на товар или услугу возрастает до максимального уровня. Такие периоды могут быть связаны с различными факторами, включая сезонность (например, спрос на курорты и пляжные каникулы в летние месяцы), праздники (как Рождество или День святого Валентина), акционные мероприятия или повышенную активность в определенной отрасли. Сезоны низкого потребления, напротив, связаны с падением спроса до минимального уровня.

Для компаний, работающих в условиях сезонности или колебания спроса, важно разрабатывать стратегии управления сезонами высокого и низкого потребления. Это тесно связано с предсказанием поведения потребителей и разработкой маркетинговых акций, что, в свою очередь, требует моделирования и прогнозирования продаж.

5.2. Моделирование на сезонах. Результаты, изложенные нами в пункте 4 для потребления контента, естественным образом обобщаются на произвольное потребление, связанное с сезонным фактором. А именно:

1. модель, обученная на сезоне высокого потребления, неприменима к сезону низкого потребления,

2. и наоборот, модель, обученная на сезоне низкого потребления, показывает хорошие результаты как прогнозирующий инструмент для сезона высокого потребления.

Такой подход к прогнозированию потребления можно рекомендовать широкому кругу компаний, чья деятельность сопряжена с ярко выраженной сезонностью.

Список литературы

1.Хейдт М. Изучаем Pandas. Москва: ДМК Пресс, 2018. 438 с.

2.Бурков А. Машинное обучение без лишних слов. СПб: Питер, 2020. 192 с.

3.Вьюгин В.В. Математические основы теории машинного обучения и прогнозирования. М.: МЦИМО. 2013. 387 с.

4.Бринк Х., Ричардс Дж., Феверолф М. Машинное обучение. СПб.: Питер, 2017. 336 с.

5.Владимиров В.А., Федорова Ю.А. Моделирование сезонных колебаний в потреблении образовательного контента // Вестник Санкт-Петербургского университета. Серия 5. Экономика. 2019. № 1. С. 82-93.

6. Заяц А.Л. Изучение и прогнозирование сезонности в потреблении образовательного контента на основе анализа временных рядов // Вестник Нижегородского университета имени Н. И. Лобачевского. Серия: Социальные науки. 2020. Т. 25. № 2 (2). С. 273-284.

7. Кашуба А.Ю. Моделирование сезонной динамики в потреблении образовательного контента в условиях цифровизации // Молодой ученый. 2021. № 7 (335). С. 175-178.

8.Шустова О.В., Ходьберг Е.Н. Сезонность в потреблении образовательного контента: теория, моделирование, прогнозирование // Бизнес-информатика. 2021. Т. 15. № 3. С. 15-30.

9.Kozlovskiy V. Analytical models of mass media as a method of quality management in the automotive industry / V. Kozlovskiy, D. Aydarov // Quality - Access to Success. 2017. Т. 18. № 160. С. 83-87.

Мосин Владимир Геннадьевич, канд. физ.-мат. наук, доцент, yanbacha@yandex. ru, Россия, Самара, Самарский государственный технический университет,

Козловский Владимир Николаевич, д-р техн. наук, профессор, заведующий кафедрой, [email protected], Россия, Самара, Самарский государственный технический университет,

Благовещенский Дмитрий Иванович, д-р техн. наук, профессор, [email protected], Россия, Тула, Государственный региональный центр стандартизации, метрологии и испытаний в Тульской и Орловской областях

SEASONAL STRUCTURE OF CONTENT CONSUMPTION V.G. Mosin, V.N. Kozlovsky, D.I. Blagoveshchensky

The article examines the structure of educational content consumption depending on the season. It is shown that the structure of consumption in the season of high consumption differs from the structure of consumption in the season of low consumption. Regression models of consumption prediction are considered. It is shown that models trained on low consumption seasons are well suited for prediction in the high consumption season, and the opposite is not true.

Key words: content, quality assessment, data science, regression, scikit-learn, pandas.

Mosin Vladimir Gennadievich, candidate of physical and mathematical sciences, docent, yanbacha@yandex. ru, Russia, Samara, Samara State Technical University,

Kozlovsky Vladimir Nikolaevich, doctor of technical sciences, professor, head of the department, [email protected], Russia, Samara, Samara State Technical University,

Blagoveshchensky Dmitry Ivanovich, doctor of technical sciences, professor dblagov1@yandex. ru, Russia, Tula, State Regional Center for Standardization, Metrology and Testing in the Tula and Orel Regions

УДК 691.32:621

Б01: 10.24412/2071-6168-2024-3-495-496

УЛУЧШЕНИЕ КАЧЕСТВА МАТЕРИАЛА ПРОМЫШЛЕННЫХ ПОЛОВ ДЛЯ ПОВЫШЕНИЯ УДАРНОЙ

СТОЙКОСТИ ПРИ ВОЗДЕЙСТВИИ МАШИНОСТРОИТЕЛЬНОГО ОБОРУДОВАНИЯ

С.Д. Николенко, С.А. Сазонова, В.Ф. Асминин

Стальные фибры являются одним из широко используемых материалов для дисперсного армирования бетона с целью усиления прочностных свойств материалов и конструкций, работающих в условиях повышенных статических, динамических и ударных нагрузок, вызывающих повышенное трещенообразование. Машиностроительное оборудование и станки можно рассматривать в качестве источников таких повышенных внешних воздействий на исследуемые материалы и конструкции. Результаты испытаний на удар показали повышенную трещино-стойкость плит, имеющих дисперсное армирование. Проведено испытание фибр различных геометрических параметров на выдергивание из бетонной матрицы. Результаты испытания фибр на выдергивание из бетона показали влияние глубины заделки фибр на первоначальное усилия сдвига фибры при небольшой глубине заделки. В целом проведенное исследование показало положительное влияние дисперсного армирования на механические свойства бетона. Приведена геометрическая модель зависимости усилия выдергивания фибры из бетона от глубины заделки фибры.

Ключевые слова: геометрические модели, машиностроительное оборудование, сталефибробетон, экспериментальные исследования, ударная нагрузка, трещинообразование, трещиностойкость плит, усилие выдергивания фибры из бетона.

Машиностроительное оборудование и станки имеют существенную массу, при работе воздействуют в виде статических и динамических нагрузок на промышленные бетонные полы и покрытия. Возможны также механические воздействия в виде ударов по покрытиям при возникновении аварийных ситуаций. Для увеличения ударной прочности бетона в основном применяют стальную арматуру в виде отдельных стержней или металлической сетки.

Разнообразные виды воздействий на основание вызывают его износ и разрушение, негативно влияют на работу машиностроительного оборудования и станков, могут вызвать их поломки и аварийные остановки. По данной причине необходимо применять более стойкие к воздействиям материалы. В отличии от традиционного железобетонного основания, основание из фибробетона будет способствовать обеспечению более высоких прочностных и других показателей при интенсивном воздействии на него.

В последние годы в конструкции промышленных полов стал применяться дисперсно-армированный бетон (фибробетон) для улучшения свойств бетонов, в частности трещиностойкости [1].

Полы промышленных зданий наиболее часто подвергаются ударной нагрузке. Проводимые в мире исследования, показывают, что независимо от вида применяемых фибр, ударостойкость бетона в результате дисперсного армирования возрастает [2, 3].

Основной эффект дисперсного армирования достигается за счет фибр, пересекающих трещины в бетоне. При этом величина усилий, воспринимаемых фиброй, является определяющей. На величину усилий, воспринимаемых фибрами, влияют из ориентации и величина коррозии. Исследованиям усилий, воспринимаемых фибрами посвящено достаточное количество работ [4, 5].

Несмотря на такие обширные исследования свойств фибробетона и конструкций из него, многие особенности его характеристик изучены недостаточно. Основным видом исследований, свойств дисперсно-армированных бетонов являются экспериментальные исследования [6-11]. При этом, результаты исследований отличаться друг от друга. Многие исследователи отмечают, что на результаты экспериментальных исследований оказывают влияния вид и характеристики фибр, равномерность их распределения. Среди стальных фибр одними из широко применяемых являются анкерные фибры.

Задачами исследований являлись испытание плит на ударное воздействие с оценкой трещинообразования и испытание фибр на выдергивание из тела бетона.

Рассмотрим результаты экспериментальных исследований, доказывающих преимущества применения фибробетона, работающего под воздействием интенсивных внешних нагрузок.

Материалы и образцы. В проведённых исследованиях в качестве дисперсного армирования использовались фибра металлическая анкерная (типа Шиапф и для сравнения волнистая (рис. 1) в испытании на выдергивание фибр из бетона. Геометрические характеристики фибр представлены в табл. 1.

Были изготовлены специальные образцы:

- для испытания на ударное воздействие с оценкой образовавшихся трещин - плиты размером 40х40х3,5

см;

- для испытания на выдергивание фибры из тела бетона - кубы из бетона10х10х10 см с заделанными в них фибрами. Величины заделки фибры в бетон составляла 10 мм, 20 мм. А для фибр длиной 50 мм была величина заделки - 30 мм (не менее половины длины фибры). В каждой серии использовалось по 6 фибр заделанных в бетон.

i Надоели баннеры? Вы всегда можете отключить рекламу.