Научная статья на тему 'МОДЕЛИ ПРОГНОЗИРОВАНИЯ КАССОВЫХ СБОРОВ КИНОФИЛЬМОВ НА ОСНОВЕ ЭМОЦИОНАЛЬНЫХ ФАКТОРОВ СПРОСА'

МОДЕЛИ ПРОГНОЗИРОВАНИЯ КАССОВЫХ СБОРОВ КИНОФИЛЬМОВ НА ОСНОВЕ ЭМОЦИОНАЛЬНЫХ ФАКТОРОВ СПРОСА Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
57
5
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Татарников А.С., Неволин И.В.

В статье представлен оригинальный подход к построению моделей прогнозирования кассовых сборов кинопродукции на основе эмоциональных факторов восприятия зрителями рекламных трейлеров фильмов. Описаны методы сбора первичных данных, дан анализ полученных результатов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «МОДЕЛИ ПРОГНОЗИРОВАНИЯ КАССОВЫХ СБОРОВ КИНОФИЛЬМОВ НА ОСНОВЕ ЭМОЦИОНАЛЬНЫХ ФАКТОРОВ СПРОСА»

Татарников А. С. аспирант ГАУГН Неволин И.В., к. э. н. старший научный сотрудник

ЦЭМИ РАН Россия, г. Москва МОДЕЛИ ПРОГНОЗИРОВАНИЯ КАССОВЫХ СБОРОВ КИНОФИЛЬМОВ НА ОСНОВЕ ЭМОЦИОНАЛЬНЫХ ФАКТОРОВ

СПРОСА36

Аннотация

В статье представлен оригинальный подход к построению моделей прогнозирования кассовых сборов кинопродукции на основе эмоциональных факторов восприятия зрителями рекламных трейлеров фильмов. Описаны методы сбора первичных данных, дан анализ полученных результатов.

Введение. Представленная ниже работа основывается на проведенных ранее исследованиях, результаты которых были описаны в [1 -8]. Тем не менее, она отражает дальнейшие поиски авторов в направлении, указанном в названии. Результаты проведённого авторами исследования будут описаны и интерпретированы ниже. Одной из базовых предпосылок нового этапа стало значительное расширение как исследуемой выборки, так и набора фильмов и трейлеров к ним.

Был также проанализирован накопленный отечественными и зарубежными исследователями методический опыт по сбору и обработке данных по спросу на кинопродукцию. С развитием интернета и социальных сетей появилась возможность оперативно и в больших количествах получать отклики потребителей на определенный продукт. Эльдар Садыков, Адитья Парамесварян и Петрос Венетис из Стэмфордского университета в своей статье «Блоги как предикторы успеха фильма» [9], опубликованной в 2009 году, представляют анализ полного набора возможностей извлечения информации из блогов для прогнозирования продаж фильмов. Авторами используется соотношение, кластеризация и анализ временных рядов для изучения построенных ими функций, обладающих определенной объясняющей силой. В указанной выше работе авторы пытаются оценить, насколько полезны данные блогов для прогнозирования продаж фильмов и рейтингов пользователей / критиков.

За последние десять лет, онлайн сообщество социальных сетей растет взрывными темпами и становится местом, где люди общаются, «организовываются», развлекаются. Twitter является ведущей социальной средой, в которой пользователи могут отправлять короткие сообщения (не более 140 символов) или твиты любого характера. Этот сайт был основан в

36 Работа выполнена при финансовой поддержке РФФИ - проект 13-06-00394.

2006 году, и во время выхода данной статьи, он был тринадцатым в списке самых популярных сайтов в Интернете (Traffic stats for twitter.com, January, 2010). В течение последних лет Твиттер играет важную роль в самых разных контекстах, включая политические компании, судебные разбирательства, новости, отчетности; он отражает активность граждан и оперативно реагирует на чрезвычайные ситуации. По наблюдениям аналитиков, Твиттер резко усиливает воздействие устной рекламы на потребителей.

Группа ученых из Баркер-центра Гарвардского Университета во главе с Омаром Васовым исследовала интересную ситуацию, возникшую на кинорынке после выхода в прокат скандального фильма Бруно. Свои результаты они опубликовали в статье под названием «Может ли Твиттер убить фильм? Эмпирические оценки эффекта Бруно» [12].

Использование Твиттера для сбора данных и дальнейшего построения прогноза кассовых сборов нашло свое отражение в исследовании сотрудников HP Social Computing Laboratory (Пало-Альто, Калифорния). Речь идет о прогнозировании кассовых сборов кинофильмов до их выхода в прокат. Для сбора данных авторы использовали API Twitter Search. На протяжении трех месяцев были собраны все твиты с упоминанием 24 фильмов, отобранных исследователями. Результатом сбора данных стала база, содержащая 2,89 миллионов записей, включающих точное время публикации, имя автора и полный текст оставленного сообщения, сканирование осуществлялось один раз в час. Отбирались сообщения, в которых использовались все слова, содержащиеся в названии фильма.

Исследователями был введен специальный твит-коэффициент, который выражает количество твитов о фильме в час. Средний коэффициент корреляции между введенным коэффициентом и суммой кассовых сборов составил 0,9, что говорит о наличии достаточно существенной линейной зависимости между исследуемыми показателями. Далее авторами был проведен регрессионный анализ. Объясняющими переменными в модели выступили семь средних твит-коэффициентов, каждый коэффициент характеризовал отдельный день недели, предшествующей премьере фильма. Построенная модель продемонстрировала довольно высокий коэффициент детерминации 0,93. При использовании в модели дополнительной переменной, обозначающей количество предполагаемых прокатных копий фильма, коэффициент увеличивался до 0,973 [9].

Помимо различных социальных сетей, для сбора данных в сети Интернет исследователями используется также статистика поисковых запросов. Так, международной группой ученых из Англии, Финляндии и Венгрии для построения прогнозов кассовых сборов использовались данные из Википедии, а именно: посещаемость страницы фильма в этой распространенной интернет-энциклопедии. Исследователям удалось продемонстрировать наличие положительной корреляции величины кассовых сборов с количеством посещений страниц, посвященных

конкретному фильму перед выходом его на широкий экран [10].

В распоряжении исследователей была выборка, содержащая 321 фильм, вышедший в прокат в США в 2010 году. Анализировались данные о числе просмотров страниц в Википедии за месяц до выхода на экраны. Получившийся коэффициент корреляции составил 0,671, что говорит о его не абсолютном характере. Согласно проведенному статистическому анализу, количество посещений страницы фильма в сетевой энциклопедии за полгода до премьеры фильма является лучшим предиктором успеха в прокате, нежели количество кинотеатров (прокатных копий), в которых предполагается демонстрация картины. Также авторами была предпринята попытка использовать в расчетах такой показатель, как число правок статей и количество человек, участвующих в редактировании. Однако данная информация не несла в себе достаточной объясняющей силы.

Сотрудниками исследовательского подразделения Google была построена модель прогнозирования кассовых сборов, основанная на анализе поисковых запросов. Выборка включала в себя 99 фильмов, вышедших в широкий прокат в США в 2012 году [13]. Стоит отметить, что заявленная разработчиками точность прогноза составляет 94%, что является феноменальным показателем для данного вида прогнозов. Для построения прогноза авторы анализируют частоту поисковых запросов о фильме и просмотров трейлеров, учитывая также число прокатных копий и другие факторы. При рассмотрении фильмов-сиквелов в модели используются также данные о предыдущих частях картины. Специалисты Google предложили формулу расчета прогнозных значений сборов фильма на первой неделе после премьеры, точность такого прогноза ниже и составляет 90 процентов, что странно, ведь в модель добавляется еще одна объясняющая переменная.

Описание экспериментального исследования. Учитывая опыт коллег, а также результаты собственных исследований, для сбора интересующих нас данных, мы решили создать специальный сайт www.ratetrailers.ru. Таким образом, оценки фильмов, вышедших на экраны осенью 2013 года, собирались по новой методике, используя онлайн опросы в Интернете. Помимо изменения таблицы основных эмоций, вводился новый вопрос респондентам: «Возникло ли у Вас желание посмотреть фильм?». Предлагалось также указать свой пол и возраст.

Для исследуемых наборов фильмов использовалась новая таблица эмоций, включающая в себя: удовольствие, страх, интерес, тревога, влюбленность, злость, воодушевление, разочарование, радость, грусть, восхищение, недовольство, предвкушение, раздражение, волнение, наслаждение, досада, нежность, удивление, сожаление, безразличие

Переработка таблицы базовых эмоций производилась с учётом факторов, которые, как было выяснено в ходе проведённого исследования [4], ответственны за принятие решения о просмотре кинофильмов.

Сокращение количества используемых нами эмоциональных категорий одновременно облегчило задачи для наших респондентов.

После обработки анкет респондентов нами осуществлялся перевод оценок 21 эмоциональной категории к использовавшимся ранее следующим семи базовым: любовь, радость, удивление, безразличие, гнев, печаль, страх. Перевод для каждой из них осуществлялся путем выбора максимальной оценки всех эмоций из соответствующей группы базовой эмоции. С использованием метода факторного анализа определялись эмоциональные факторы для различных наборов исследуемых фильмов.

В общую выборку входили также картины, выходившие на экраны в конце 2012 и 2013 году и частично проанализированные в предыдущих исследованиях. Списки картин в построенных моделях прогнозирования представлены в Таблице №1. Все фильмы разнесены по трём столбцам, в каждом столбце - набор фильмов, чьи данные использовались для построения соответствующей регрессионной модели. В регрессионных моделях, помимо эмоциональных факторов, в качестве объясняющих переменных использовались также: фактор сезонности, количество прокатных копий на первой неделе после премьеры, а также рассчитанный коэффициент желания/нежелания посмотреть фильм после просмотра трейлера.

_Таблица №1. Наборы фильмов для регрессионных моделей_

Модель №1 (фильмы) «Ведьмы из Сугаррамурди», «Армегедец», «Вечеринка», «Гонка», «Горько!», «Лучшие дни впереди», «Пятая власть», «Индюки: назад в будущее», «Облачно, возможны осадки-2: Месть ГМО», «Игра Эндера», «Мачете», «Он гораздо популярнее тебя», «Очень голодные игры», «План побега», «Семейка вампиров», «Джастин и рыцари доблести», «Ромео и Джульетта», « Как поймать перо Жар-Птицы», «Снежная королева», «Агент под прикрытием», «Джек Ричер», «Жизнь Пи», «Три богатыря: на дальних берегах», «Анна Каренина», «Джентльмены, удачи!», «С новым годом, мамы!», «Джекпот», «Суперстар», «Дублёр», «Голодные игры», «Женщина в черном», «Тот ещё Карлсон», «Белоснежка: месть гномов», «Гнев титанов»

Модель №2 (фильмы) «Остров везения», «Тёмный мир: равновесие», «Ведьмы из Сугаррамурди», «Армегедец», «Вечеринка», «Гонка», «Горько!», «Лучшие дни впереди», «Пятая власть», «Индюки: назад в будущее», «Облачно, возможны осадки-2: Месть ГМО», «Игра Эндера», «Мачете», «Он гораздо популярнее тебя», «Очень голодные игры», «План побега», «Ромео и Джульетта», «Снежная королева», «Агент под прикрытием», «Джек Ричер», «Жизнь Пи», «Три богатыря: на дальних берегах», «Анна Каренина», «Джентльмены, удачи!», «С новым годом, мамы!», «Джекпот», «Суперстар», «Дублёр», «Голодные игры», «Женщина в черном», «Тот ещё Карлсон», «Белоснежка: месть гномов», «Гнев титанов»

Модель №3 (фильмы) «Остров везения», «Тёмный мир: равновесие», «Ведьмы из Сугаррамурди», «Армегедец», «Горько!», «Лучшие дни впереди», «Индюки: назад в будущее», «Облачно, возможны осадки-2: Месть ГМО», «Очень голодные игры», «Агент под прикрытием», «Три

богатыря: на дальних берегах», «Джентльмены, удачи!», «С новым годом, мамы!», «Дублёр», «Тот ещё Карлсон», «Белоснежка: месть гномов»,

На момент построения описываемых моделей нам были неизвестны кассовые сборы для двух фильмов, представленных в выборке: «Остров везения» и «Темный мир». Забегая вперед, отметим, что модель, показавшая наилучшие результаты, спрогнозировала кассовые сборы за первый уикенд

37

для фильма «Остров везения» с точностью 99,6% , однако, в случае с другим интересовавшим нас фильмом - «Темный мир. Равновесие» -точность прогноза была значительно ниже, лишь 3338%.

39

Прогноз кассовых сборов на первом уикенде фильма «Остров везения» для разного количества прокатных копий представлен в Таблице № 2. Модели прогнозирования в качестве одного из параметров, как указано выше, используют количество копий, но до выхода фильма в прокат точное количество публике не известно. Поскольку прогноз строился до премьеры, для прогноза выбраны типичные для киноиндустрии цифры - они указаны в первом столбце Таблицы № 2. Для каждого значения количества копий по модели вычисляется наработка на копию (второй столбец), и сборы, таким образом, составляют произведение количества копий на наработку (третий столбец).

Таблица № 2. Прогноз кассовых сборов первого уикенда для фильма «Остров везения».

Количество копий Наработка уикенда Сборы уикенда

900 72 800 р. 65 520 000 р.

950 75 430 р. 71 658 500 р.

1 000 78 155 р. 78 155 000 р.

1 050 80 979 р. 85 027 825 р.

1 100 83 904 р. 92 294 400 р.

1 200 90 076 р. 108 091 200 р.

1 300 96 702 р. 125 712 600 р.

1 400 103 816 р. 145 342 400 р.

1 500 111 452 р. 167 178 000 р.

Фактические результаты: количество копий - 1005. Наработка уикенда

37 При использовании в модели фактического количества прокатных копий на первом уикенде, а также фактического курса доллара в рассматриваемый промежуток времени (прогнозируемым значением в моделях является усредненный показатель наработки на копию в долларах).

38 При использовании в модели фактического количества прокатных копий на первом уикенде, а также фактического курса доллара в рассматриваемый промежуток времени (прогнозируемым значением в моделях является усредненный показатель наработки на копию в долларах).

39 В данном случае речь идет о периоде с четверга по воскресение, т.к. в нашей стране днем премьер традиционно считается четверг._

- 76 410 руб. Сборы уикенда - 76 791 706 руб.40. Прогноз кассовых сборов фильма «Темный мир. Равновесие» на первом уикенде для разного количества прокатных копий представлен в Таблице № 3.

Таблица № 3. Прогноз кассовых сборов первого уикенда для фильма «Темный мир. Равновесие».

Количество копий Наработка уикенда Сборы уикенда

900 52 132р. 47 818 800 р.

950 54 015р. 51 314 250 р.

1 000 55 966р. 55 966 000 р.

1 050 57 988р. 60 887 400 р.

1 100 60 083р. 66 091 300 р.

1 200 64 503р. 77 403 600 р.

1 300 69 248р. 90 022 400 р.

1 400 74 342р. 104 078 800 р.

1 500 79 810р. 119 715 000 р.

Фактические результаты: количество копий - 1123. Наработка уикенда - 35 633 руб. Сборы уикенда - 40 016 407 руб.41

Описание моделей. Все четыре построенные модели включают в себя информацию, полученную в ходе трех проведенных нами опросов (весной 2012, зимой 2013-2014, осенью 2013 через Интернет).

Первая и вторая модели построены с использованием эмоциональных факторов, рассчитанных на одинаковых наборах фильмов (модель №1 - Р1, модель №2 - Р1, Р4, Р5).

Модель №1: Ln(box) = a*P1+b*k+c*autumn+d*winter+e*spring

Модель №2: Ln(box) = a*P1+b*Р4+с*Р5+d*k+e*autumn+ f*winter+ +g*spring+ h*screen

Модель №3: Ln(box) = a*P1+b*Р4+с*k+d*autumn+e*winter+f*spring+ +g*screen,

где Ln(box) - логарифм наработки на копию (прогноз);

P1, Р2, Р3, Р4, Р5 - эмоциональные факторы;

k - коэффициент желания/нежелания смотреть фильм после просмотра трейлера;

autumn, winter, spring - факторы сезонности;

a, b, c, d, e, f, g, h - коэффициенты, получаемые в ходе расчетов.

Третья модель строилась на новом наборе данных, содержит в себе два эмоциональных фактора. Это модель с двумя новыми фильмами для прогноза: «Остров везения» и «Темный мир: Равновесие». Модель не

40 По данным «Бюллетеня кинопрокатчика»: http://www.kinometro.ru/

41 Там же

содержит картин: «Семейка вампиров», «Джастин и рыцари доблести» и «Как поймать перо Жар-птицы». Данные фильмы были исключены из выборки в виду малого количества ответов (1 и 0).

Четвертая модель на очередном наборе данных содержала один эмоциональный фактор (Р1). Для построения данной модели использовались данные о фильмах, жанр которых обозначен как «комедия»; также в выборку были включены данные о двух новых фильмах для прогноза: «Остров везения» и «Темный мир: Равновесие».

Факторы, используемые в моделях. Факторный анализ — многомерный метод, применяемый для изучения взаимосвязей между значениями переменных. Предполагается, что известные переменные зависят от меньшего количества неизвестных переменных и случайной ошибки. С помощью факторного анализа возможно выявление скрытых переменных факторов, отвечающих за наличие линейных статистических корреляций между наблюдаемыми переменными. Одной из главных предпосылок использования факторного анализа в нашем исследовании являлись корреляции между семью базовыми эмоциями (любовь, радость, удивление, безразличие, гнев, печаль, страх). Факторный анализ выполнен для следующего совокупности переменных - семь эмоций тех, у кого возникло желание пойти в кино, и семь эмоций тех, у кого такого желания не возникло. Из совокупности четырнадцати переменных для каждого набора фильмов выделено от четырех до шести эмоциональных факторов, причем, непосредственно в регрессионных моделях использованы лишь некоторые из них. Факторный анализ проводился в программном пакете Stata 9.0. После того как была получена матрица факторных нагрузок, средствами MS Excel 2010 вычислены значения факторов для каждого фильма.

Как отмечалось выше, модели № 1 и № 2 построены с использованием одной и той же группы фильмов и, соответственно, одинаковых наборов эмоциональных факторов спроса. Рассмотрим их чуть более подробно, набор и значение факторных нагрузок представлены в Таблице № 4. Столбец слева представляет собой перечисление базовых эмоций двух групп респондентов - тех, кто выразил желание посмотреть фильма (обозначено как «да») и тех, кто отказался от последующего просмотра (обозначено как «нет»). Строка против каждой из базовых эмоций показывает значения факторных нагрузок для каждой эмоции.

Таблица № 4. Матрица факторных нагрузок для первой и второй модели. Жирным выделены нагрузки, использованные для модели №1.

Эмоции Фактор1 Фактор2 ФакторЗ Фактор4 Фактор5

любовь_да -0,5985 0,1952 0,0864 -0,0965 -0,2211

радость_да -0,6535 0,2453 -0,3021 0,0978 -0,0253

удивление_да 0,3406 0,2146 0,2117 -0,7468 -0,0764

безразличие_да 0,0504 -0,3917 -0,5178 0,3669 0,4644

гнев_да 0,4843 -0,1554 0,4837 -0,3170 0,3168

печаль да 0,6031 -0,2461 -0,0500 0,3476 -0,1532

страх_да 0,4347 -0,1143 0,6546 0,3731 0,0909

любовь нет -0,2665 -0,3685 0,5987 0,3413 -0,2235

радость_нет -0,5345 0,4906 0,2949 0,2858 -0,1176

удивление нет -0,2515 0,3479 -0,0399 -0,0362 0,7141

безразличие нет -0,2974 -0,7778 -0,0475 -0,3153 -0,0935

гнев нет 0,4934 0,6800 -0,2634 -0,0547 -0,1569

печаль нет 0,6134 0,0995 -0,5764 0,2147 -0,2662

страх нет 0,2218 0,5440 0,4338 0,2695 0,1048

Для построения модели № 1 был использован только первый фактор -выделен жирным в Таблице № 4, наиболее высокая корреляция значений данного фактора имеется для эмоций печали и радости, причем, учтены как эмоции тех, кто изъявил желание посмотреть фильм после просмотра трейлера, так и тех, кто не изъявил такого желания. В случае с печалью имеют место положительные значения факторных нагрузок, тогда как факторные нагрузки для радости являются отрицательными. Довольно высокие значения получены для эмоции гнева. Для построения модели № 2 использовалось эмоциональные факторы, представленые в Таблице № 5.

Таблица № 5. Факторные нагрузки первого, четвертого и пятого факторов, используемые для расчетов модели №2._

Эмоции Фактор1 Фактор4 Фактор5

любовь да -0,5985 -0,0965 -0,2211

радость да -0,6535 0,0978 -0,0253

удивление да 0,3406 -0,7468 -0,0764

безразличие да 0,0504 0,3669 0,4644

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

гнев да 0,4843 -0,3170 0,3168

печаль да 0,6031 0,3476 -0,1532

страх да 0,4347 0,3731 0,0909

любовь нет -0,2665 0,3413 -0,2235

радость нет -0,5345 0,2858 -0,1176

удивление нет -0,2515 -0,0362 0,7141

безразличие нет -0,2974 -0,3153 -0,0935

гнев нет 0,4934 -0,0547 -0,1569

печаль нет 0,6134 0,2147 -0,2662

страх нет 0,2218 0,2695 0,1048

Здесь используется тот же первый фактор, а также четвертый и пятый факторы, которые характеризуются не столь высокими факторными нагрузками, в целом, за исключением одной эмоции - удивление. Причем, можно сказать, что два этих фактора уравновешивают друг друга, у четвертого фактора высокое отрицательное значение для эмоции удивления у зрителей, готовых посмотреть фильм, тогда как для пятого фактора выделяется положительное значение факторной нагрузки для эмоции удивление у зрителей, не выразивших желания посмотреть фильм после просмотра трейлера.

Третья рассматриваемая модель (см. Таблицу № 1) построена на новом

наборе фильмов. Значения факторов для модели № 3 отображены в Таблице № 6. Для построения прогнозов кассовых сборов при помощи модели № 3 использовались два эмоциональных фактора, Фактор 1 и Фактор 4 - они выделены жирным в Таблице №6.

Таблица № 6. Матрица факторных нагрузок для набора фильмов модели № 3

Эмоции Фактор1 Фактор2 ФакторЗ Фактор4 Фактор5 Факторб

любовь_да -0,6017 0,1760 0,1244 0,4521 0,1858 0,3965

радость_да -0,7719 0,1078 -0,2920 -0,2920 0,0960 -0,3310

удивление_да 0,3800 0,4501 0,0596 0,6084 -0,3752 -0,1314

безразличие_да -0,0007 -0,5506 -0,5027 -0,3766 -0,2110 0,2259

гнев_да 0,6174 -0,0702 0,4056 -0,1558 -0,4309 -0,2769

печаль_да 0,6174 -0,3514 -0,2021 0,1587 0,2975 0,2910

страх_да 0,6643 -0,0540 0,4806 -0,3185 0,2081 0,0652

любовь нет -0,1047 -0,4090 0,7137 0,1217 0,2524 0,0828

радость_нет -0,4898 0,4369 0,3642 -0,1626 0,2618 -0,1240

удивление нет -0,2843 0,2892 -0,0177 -0,1705 -0,5508 0,5942

безразличие_нет -0,2542 -0,7818 0,0901 0,2509 -0,0848 -0,0869

гнев нет 0,2995 0,6472 -0,4162 0,0324 0,0932 -0,1447

печаль_нет 0,4288 -0,0371 -0,7165 0,1275 0,3347 0,0276

страх нет 0,3384 0,5633 0,2495 -0,2692 0,2292 0,3173

Модель №4: Ln(box)

a*P1+b*k+c*autumn+d*wmter+e*spring+f* screen.

Таблица № 7. Факторные нагрузки, использованные для построения модели №4 (только комедии). Жирным выделены нагрузки Фактора 1, использованные для построения модели №4_

Эмоции Фактор1 Фактор2 ФакторЗ Фактор4 Фактор5 Факторб

любовь да -0,4864 0,3981 0,3041 -0,2957 -0,0245 0,5882

радость_да -0,7203 -0,0301 -0,4086 0,3937 -0,2187 -0,2484

удивление_да 0,4435 0,2916 -0,1642 -0,7165 0,1341 -0,0370

безразличие_да -0,2290 -0,6346 0,0597 0,3109 0,5033 -0,0020

гнев_да 0,6569 0,2289 0,2967 -0,2445 0,3581 -0,3553

печаль_да 0,6016 -0,4604 0,0280 0,1740 -0,3625 0,3650

страх_да 0,5858 0,1292 0,5247 0,3679 -0,1454 -0,3034

любовь нет 0,1028 0,4658 0,4799 0,2028 -0,4746 0,2404

радость_нет -0,3912 0,7006 -0,2831 0,0898 -0,2101 -0,2773

удивление нет 0,0064 0,4105 -0,2239 0,2925 0,7412 0,3377

безразличие нет -0,4797 -0,3004 0,7121 -0,2277 0,0766 -0,1947

гнев нет 0,4475 0,0252 -0,6688 -0,2365 -0,2320 -0,0189

печаль нет 0,0903 -0,8866 -0,1577 -0,2510 -0,1526 0,0805

страх нет 0,7910 0,1221 -0,1043 0,5068 0,0892 0,1102

Характеристики построенных моделей. Таблица №8 содержит сравнительные характеристики построенных моделей прогнозирования кассовых сборов для выбранных кинофильмов.

Таблица №8. Сравнительные характеристики моделей прогнозирования._

Параметр модели Модель №1 Модель №2 Модель №3

Выборка 33 33 33

Количество объясняющих переменных 5 8 7

Количество факторов 1 3 2

Сезонность Да Да Да

Число экранов Нет Да Да

Коэффициент k Да Да Да

Точность42 59% 77% 82%

Количество фильмов с точностью более 95% 3 (9%) 2 (6%) 2 (6%)

Количество фильмов с точностью более 90% 7 (21%) 6 (18%) 4 (12%)

Количество фильмов с точностью более 80% 9 (27%) 14 (42%) 10 (30%)

Количество фильмов с точностью более 70% 11 (33%) 20 (60%) 19 (58%)

Точность по «осенним» фильмам 16 шт. 53% 77% 54% (13 фильмов)

Точность по «зимним» фильмам 11 шт. 60% 77% 56%

Точность по «весенним» фильмам 5 шт. 63% 83% 67%

Точность по отечественным фильмам 8 шт. 72% 78% 60%

Ошибка min 1,08% 1,34% 3,58%

Ошибка max 208,03% 287,36% 178,86%

Точность (число экранов <100) 5 шт. Ср. ошибка 101% 57% 52% (4 фильма)

Точность (число экранов 100-500) 8 шт. 44% 83% 42%

Точность (число экранов 500-1000) 9 шт. 67% 82% 69% (7 фильмов)

Точность (число экранов 1000-1600) 11 шт. 60% 77% 58,41%

Ошибка в большую сторону 15 (45%) 15 (45%) 14 (43%)

Ошибка в меньшую сторону 18 (55%) 18 (55%) 19 (57%)

Точность («комедии») (48% из всех фильмов) 56% 76% 77%

Точность («фэнтази/фантастика») (30%) 60% 77% 85%

Точность(«боевик») (24%) 59% 79% 80%

Точность(«триллер») (24%) 71% 82% 88%

42 Здесь и далее медианное значение показателя точности для каждой конкретной модели.

Точность («приключения») (30%) 60% 78% 85%

Точность («мультфильмы/анимация») (18%) 62% 78% 90%

Точность («семейный жанр») (18%) 62% 64% 76%

Точность («драма/мелодрама») (24%) 44% 63% 69%

Точность («криминал») (9%) 83% 73% 95%

После сопоставления точности моделей для фильмов разных жанров была выдвинута гипотеза о том, что данная методика прогнозирования кассовых сборов фильмов (учитывающая эмоциональную нагрузку трейлеров) наиболее адекватна для оценки фильмов развлекательных жанров, таких как «комедия», «приключения», «фантастика», а также мультфильмов43. Стоит отметить, что прогнозировалось также значение показателя «наработка на копию» - среднее арифметическое значение сборов, приходящихся на одну прокатную копию.

Таблица № 9. Показатели моделей для жанра «комедии»

Фильм Наработк а на копию Модель 1 Модель 2 Модель 3

Прогноз Ошибка Прогноз Ошибк а Прогноз Ошибка

Ведьмы из Суггармурди $828 $1 596 92,76% $724 12,61% $979 18,25%

Армегедец $975 $2 029 108,14% $1 232 26,43% $1 093 12,11%

Горько! $4 541 $1 781 60,78% $4 152 8,55% $5 025 10,68%

Лучшие дни впереди $1 449 $2 487 71,64% $2 149 48,28% $1 546 6,67%

Индюки $2 321 $1 476 36,41% $2 467 6,31% $1 822 21,49%

Облачно 2. Месть ГМО $3 526 $2 290 35,05% $2 389 32,23% $2 622 25,62%

Очень голодные игры $904 $787 12,92% $867 4,06% $425 53,04%

Семейка вампиров $392 $357 8,85% $236 39,83% нет в модели

Агент под прикрытием $737 $1 402 90,14% $747 1,34% $3 99,55%

Три богатыря $3 793 $2 282 39,82% $2 998 20,96% $3 112 17,95%

Джентельмены , удачи $1 453 $1 204 17,09% $2 577 77,38% $2 170 49,38%

Джекпот $828 $1 666 101,28% $1 054 27,32% $695 16,03%

43 Высокие значения точности для жанров «триллер», «боевик» и «криминал» связаны с тем, что многие исследуемые картины представляют сразу несколько жанров (например, «Джек Ричер» - боевик, триллер, детектив, криминал; «Голодные игры» - фантастика, триллер, приключения; «Джекпот» - комедия, триллер, криминал), а также сравнительно небольшого количества фильмов данных жанров в общей выборке.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Суперстар $533 $1 522 185,83% $1 056 98,28% $1 159 117,61 %

Дублёр $3 420 $3 583 4,74% $2 844 16,84% $3 205 6,31%

Тот еще Карлсон $4 323 $9 766 125,88% $7 738 78,98% $9 009 108,37 %

Белоснежка. Месть гномов $3 686 $5 190 40,79% $4 310 16,92% $4 485 21,67%

ошибка 50,79% ошибка 23,70% ошибка 21,49%

точност ь 49,22% точност ь 76,31% точност ь 78,51%

Таким образом, было принято решение провести факторный анализ для получения эмоциональных факторов и построения модели, используя данные только о фильмах, в описании жанров которых присутствовала «комедия», а также добавив в выборку два новых фильма, для которых было необходимо получить прогноз: комедию «Остров везения» и фэнтези/приключения «Тёмный мир».

Построенная модель № 5, на выборке из 16 фильмов (в описании жанра которых фигурировала «комедия») показала наилучший результат, ее показатели отражены в Таблице №10.

Таблица №10. Результаты модели № 5 (только комедии).

Фильм Ln(box) Прогноз факт ошибка копии

Темный мир. Равновесие 7,407553 $1 648 $1 071 53,91% 1000

Остров везения 7,732151 $2 281 $2 297 0,72% 1000

Ведьмы из Суггармурди 6,857762 $951 $828 14,88% 280

Армагедец 7,368964 $1 586 $975 62,67% 321

Горько! 8,500625 $4 918 $4 541 8,30% 1550

Лучшие дни впереди 7,093827 $1 205 $1 449 16,87% 20

Индюки 7,591996 $1 982 $2 321 14,59% 972

Облачно 2. Месть ГМО 8,216501 $3 702 $3 526 4,98% 1100

Очень голодные игры 6,296991 $543 $904 39,94% 208

Агент под прикрытием 6,701588 $814 $737 10,41% 171

Три богатыря 8,045176 $3 119 $3 793 17,78% 1600

Джентельмены, удачи 7,599099 $1 996 $1 453 37,40% 1400

С новым годом, мамы! 7,787942 $2 411 $2 353 2,48% 1044

Дублер 7,950683 $2 838 $3 420 17,03% 928

Тот еще Карлсон 8,290873 $3 987 $4 323 7,77% 911

Белоснежка. Месть гномов 8,293418 $3 997 $3 686 8,45% 1220

ошибка 19,89%

точность 80,11%

Аналогичная процедура была проведена также для других жанров. Модели для жанров «боевик», «триллер» и «драма» показали неудовлетворительные результаты. Для жанра «приключения» была построена модель, точность которой превысила точность модели для «комедий» на 3%, но данная модель строилась на меньшей выборке и содержала 12 фильмов, 5 из которых входили также в модель для «комедий».

Следует отметить, что наличие собственного сайта значительно ускорило и облегчило процесс построения прогнозов, позволив автоматизировать сбор данных и быстрее наполнять базу исследованных кинофильмов, имеющуюся в нашем распоряжении.

Таким образом, аналогичная процедура была проведена для очередного набора фильмов. Стоит отметить, что нами был добавлен еще один вопрос в анкету, актуальный только при положительном ответе на вопрос о желании посмотреть фильм - «Какую сумму Вы готовы потратить на билет?». Однако, коэффициент, получаемый в результате обработки анкет с учетом данного вопроса, оказался незначимым. Ниже приведены таблицы, содержащие описательные характеристики для моделей с новыми наборами фильмов, вышедших в широкий прокат зимой-весной 2014 года. Стоит обратить внимание, что все фильмы, представленные в приведенных ниже моделях, являются отечественными. Характеристики моделей (№6-8) для набора только отечественных фильмов приведены в Таблицах № 11 -13.

Таблица №11. Характеристики модели №6 (только отечественные).

Фильм Ln(box) Прогноз Факт ошибка Копии

Лёгок на помине 7,421911 $1 672,23 $2 138,00 21,79% 970

С 8 марта, мужчины 7,655178 $2 111,55 $1 843,97 14,51% 809

Одноклассники. Накликай удачу 7,152499 $1 277,29 $1 826,00 30,05% 970

Остров везения 7,754243 $2 331,44 $2 297,00 1,50% 1005

Горько 8,410482 $4 493,93 $4 540,54 1,03% 1550

Джентельмены, удачи 7,220523 $1 367,20 $1 452,67 5,88% 1400

С новым годом, мамы 8,326138 $4 130,43 $2 352,83 75,55% 1044

Дублер 7,970511 $2 894,34 $3 420,41 15,38% 928

Тот еще Карлсон 7,888179 $2 665,59 $4 323,49 38,35% 911

Спираль 6,740002 $845,56 $1 511,00 44,04% 518

Дубровский 7,563103 $1 925,81 $965,00 99,57% 936

Вий 9,691092 $16 172,90 $17 015,00 4,95% 1025

Чемпионы 7,611541 $2 021,39 $2 546,00 20,61% 1016

Темный мир.Равновесие 7,371213 $1 589,56 $1 071,00 48,42% 1123

Снежная королева 7,805353 $2 453,70 $2 381,04 3,05% 1300

Три богатыря 8,008433 $3 006,20 $3 792,95 20,74% 1600

Жар-Птица 6,959409 $1 053,01 $1 042,20 1,04% 700

Ошибка 20,67% Точность 79,33%

Таблица №12. Характеристики модели №7 (только отечественные).

Фильм Ln(box) Прогноз Факт ошибка копии

Лёгок на помине 7,472874 $1 759,66 $2 138,00 17,70% 970

С 8 марта, мужчины 6,749208 $853,38 $1 843,97 53,72% 809

Одноклассники. Накликай 7,267146 $1 432,46 $1 826,00 21,55% 970

удачу

Остров везения 7,718832 $2 250,33 $2 297,00 2,03% 1005

Горько 8,305169 $4 044,73 $4 540,54 10,92% 1550

Джентельмены, удачи 7,459579 $1 736,42 $1 452,67 19,53% 1400

С новым годом, мамы 8,264362 $3 883,00 $2 352,83 65,03% 1044

Дублер 8,301513 $4 029,97 $3 420,41 17,82% 928

Тот еще Карлсон 8,397433 $4 435,67 $4 323,49 2,59% 911

Спираль 6,17845 $482,24 $1 511,00 68,08% 518

Дубровский 7,132076 $1 251,47 $965,00 29,69% 936

Вий 10,5747 $39 132,29 $17 015,00 129,99% 1025

Чемпионы 7,663461 $2 129,11 $2 546,00 16,37% 1016

Темный мир.Равновесие 7,383242 $1 608,80 $1 071,00 50,21% 1123

Снежная королева 7,562777 $1 925,18 $2 381,04 19,15% 1300

Три богатыря 8,104749 $3 310,15 $3 792,95 12,73% 1600

Жар-Птица 7,064722 $1 169,96 $1 042,20 12,26% 700

Ошибка 19,34% Точность 80,66%

Таблица №13. Характеристики модели №8 (только отечественные).

Фильм Ln(box) Прогноз Факт ошибка копии

Лёгок на помине 7,542272 $1 886,11 $2 138,00 11,78% 970

С 8 марта, мужчины 7,46369 $1 743,57 $1 843,97 5,44% 809

Одноклассники. Накликай удачу 7,289967 $1 465,52 $1 826,00 19,74% 970

Остров везения 7,790987 $2 418,70 $2 297,00 5,30% 1005

Горько 8,64825 $5 700,16 $4 540,54 25,54% 1550

Джентельмены, удачи 7,640586 $2 080,96 $1 452,67 43,25% 1400

С новым годом, мамы 8,591539 $5 385,90 $2 352,83 128,91% 1044

Дублер 8,086381 $3 249,90 $3 420,41 4,99% 928

Тот еще Карлсон 8,120403 $3 362,38 $4 323,49 22,23% 911

Спираль 6,094378 $443,36 $1 511,00 70,66% 518

Дубровский 7,144986 $1 267,73 $965,00 31,37% 936

Вий 10,27073 $28 874,95 $17 015,00 69,70% 1025

Чемпионы 7,706354 $2 222,42 $2 546,00 12,71% 1016

Темный мир.Равновесие 7,143661 $1 266,06 $1 071,00 18,21% 1123

Снежная королева 7,812393 $2 471,04 $2 381,04 3,78% 1300

Три богатыря 7,92987 $2 779,06 $3 792,95 26,73% 1600

Жар-Птица 6,721707 $830,23 $1 042,20 20,34% 700

Ошибка 20,99% Точность 79,01%

Заключение. Полученные результаты демонстрируют возможность использования эмоциональных факторов спроса на кинофильмы в качестве предикторов величины кассовых сборов полнометражных фильмов широкого и ограниченного проката, транслируемых в кинотеатрах. Точность

моделей можно повысить, привлекая дополнительную информацию об интересующих картинах - например, более детальную информацию о так называемой «росписи» фильма - точного количества прокатных копий, а также географии их распространения, времени сеансов показа фильма. Подход, основанный на сборе данных, после дальнейшей обработки являющихся объясняющими переменными в регрессионных моделях, позволяет решить одну из проблем для кинопроизводителей, а также фирм, занимающихся маркетингом кинофильмов.

Кинопроизводители практически всегда создают несколько трейлеров для каждого фильма, в этой связи возникает вопрос: какой из имеющихся трейлеров способен привлечь в кинотеатры максимальную аудиторию? Разработанная методика позволяет оценивать эффективность одного из ключевых элементов рекламной кампании фильма - трейлера, правильное использование которого в широкой рекламной кампании (на ТВ, в Интернете, в кинотеатрах) принесет наибольший экономический эффект -приведет большее количество зрителей в кинотеатры на первом уикенде.

Каждый показ рекламного ролика стоит денег, для рационального использования бюджета на ТВ рекламу следует уделить особое внимание материалам, предполагающихся к трансляции в СМИ. Два разных трейлера для одного фильма могут оказывать противоположное влияние на людей, пришедших в кинотеатры на первом уикенде. Наша методика позволяет определить, какой из трейлеров обладает большим потенциалом привлечения зрителей. Правильный выбор рекламного ролика позволит повысить его эффективность и сэкономить средства рекламного бюджета -более привлекательный для аудитории трейлер будет иметь большую конверсию, соответственно, ожидаемого эффекта можно добиться меньшим количеством показов, что способствует экономии средств и повышению эффективности рекламной кампании в целом.

Разработанная методика позволяет анализировать видеоконтент, что подразумевает возможности ее применения в сфере рекламы, такой как трейлеры к компьютерным играм, видеопрезентации коммерческих компаний. Методика может быть использована также при проведении предвыборных кампаний политиков - в данном случае, оценка будет привязана не к денежному выражению, а к количеству потенциальных избирателей.

Использованные источники:

1. Неволин И.В., Татарников А.С. Эмоциональные факторы принятия решений // Вестник Восточно-Сибирской государственной академии образования. - 2013 - Вып.19 - с.139-144.

2. Ноакк Н.В., Неволин И.В., Татарников А.С. Методика прогнозирования выручки от проката кинофильмов // Финансовая аналитика: проблемы и решения. - 2012. - № 48. - а 17-24.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Ноакк Н.В., Неволин И.В. Развитие осознанности эмоциональной сферы

молодёжи при потреблении медиаконтента // Вестник Восточно-Сибирской государственной академии образования. - 2013. - Вып. 18. - c. 36-39.

4. Овсянникова В. В. Категориальный и многомерный подход в классификации эмоций // Вестник Восточно-Сибирской академии образования. - 2013. - Вып. 19. - с. 65-69.

5. Татарников А.С. Методы прогнозирования кассовых сборов // Бюллетень кинопрокатчика - 2012 - №10-11 (75-76) - с. 50-56.

6. Татарников А.С., Неволин И.В. Прогноз на эмоциях // Бюллетень кинопрокатчика. - 2013. - №1-2 (78-79) - с. 46-50.

7. Татарников А.С., Неволин И.В., Ноакк Н.В. Выявление спроса на неосязаемые продукты (на примере кинофильмов) // Труды 55-й научной конференции МФТИ. Инновации и высокие технологии. - 2012. - с.65-67.

8. Тевелева О.В., Татарников А.С. Зарубежный и отечественный опыт финансирования кинопроизводства и диверсификации рисков при инвестировании в кино // Финансовая аналитика: проблемы и решения. -2013. - № 40. - с.32-41.

9. Asur S., Huberman B.A. Predicting the Future With Social Media // Proceedings IEEE/WIC/ACM international conference on web intelligence and intelligent agent technology. - 2010. - pp.492-499.

10. Mestyan M., Yasseri T., Kert J. Early Prediction of Movie Box Office Success Based on Wikipedia Activity Big Data. Marton Mestyan, Taha Yasseri, Janos Kertesz. // PLoS ONE 8(8): e71226 (2013)

11. Sadikov E., Parameswaran A., Venetis P. Blogs as Predictor of Movie Success // Proceedings of the Third International Conference on Weblogs and Social Media. - 2009. - pp. 304-307.

12. Wasow O., Baron, A. Can Tweets Kill a Movie? An Empirical Evaluation of the Bruno Effect. // Proc. CHI 2010 Workshop on Microblogging. - 2010. - URL: http://cs.unc.edu/~julia/accepted-papers/Bruno_Effect2_CHI.pdf

13. Panaligan, R., Chen, A. Quantifying movie magic with google search / R. Panaligan, A. Chen // Google Whitepaper «Industry Perspectives + User Insights». - 2013. - P.11

i Надоели баннеры? Вы всегда можете отключить рекламу.