Научная статья на тему 'Применение корреляционного анализа для исследования эстетических предпочтений киноаудитории'

Применение корреляционного анализа для исследования эстетических предпочтений киноаудитории Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
160
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ / CORRELATION ANALYSIS / ЭСТЕТИКА КИНО / AESTHETIC OF CINEMA

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Бояршинова Е.Б., Насельский С.П.

В статье показано, что в эстетическом восприятии современного кинематографа существует проблема статистического сравнения вкусов современных российских кинозрителей (массовых) и любителей кино (синифилов) со вкусами их западных коллег. Мы предлагаем несколько иной инструмент, который, позволяет выделять различия в оценке фильмов независимо от того, в какой части рейтингового списка они находятся.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Applied of correlation analysis for recherch aesthetic preferences movie audience's

One of the issues arising in the contemporary cinema aesthetic perception is a statistical comparison of current Russian moviegoer tastes (both gross audience and cinephiles) with the tastes of their western counterparts. The tool we designed is slightly different. It allows, as will be demonstrated, to highlight differences in movie evaluations despite its position in a rating list.

Текст научной работы на тему «Применение корреляционного анализа для исследования эстетических предпочтений киноаудитории»

УДК 791.43.01

ПРИМЕНЕНИЕ КОРРЕЛЯЦИОННОГО АНАЛИЗА ДЛЯ ИССЛЕДОВАНИЯ ЭСТЕТИЧЕСКИХ ПРЕДПОЧТЕНИЙ КИНОАУДИТОРИИ

Е.Б. Бояршинова,

МГУ им. М.В. Ломоносова

E-mail: boyarshinova_e@mail.ru

С.П. Насельский, канд. техн. наук,

Московский государственный гуманитарный университет им. М.А. Шолохова E-mail: snasel@mail.ru

Аннотация. В статье показано, что в эстетическом восприятии современного кинематографа существует проблема статистического сравнения вкусов современных российских кинозрителей (массовых) и любителей кино (синифилов) со вкусами их западных коллег. Мы предлагаем несколько иной инструмент, который, позволяет выделять различия в оценке фильмов независимо от того, в какой части рейтингового списка они находятся.

Ключевые слова: корреляционный анализ, эстетика кино.

Abstract. One of the issues arising in the contemporary cinema aesthetic perception is a statistical comparison of current Russian moviegoer tastes (both gross audience and cinephiles) with the tastes of their western counterparts. The tool we designed is slightly different. It allows, as will be demonstrated, to highlight differences in movie evaluations despite its position in a rating list.

Keywords: correlation analysis aesthetic of cinema.

В эстетическом восприятии современного кинематографа существует проблема статистического сравнения вкусов современных российских кинозрителей (массовых) и любителей кино (синефилов) со вкусами их западных коллег. Развитие электронных средств коммуникаций и сети Интернет привело к появлению сайтов любителей кино, на которых можно почерпнуть огромное количество информации про-

шедшей предварительную систематизацию. О внимании киноаудитории к фильмам свидетельствуют сборы. О внимании продвинутой части кинозрителей (синефилов) говорит количество посетителей сайтов, давших оценку фильмам. А сам уровень оценок непосредственно свидетельствует о восприятии художественного уровня произведений киноискусства. Ключевым в исследовании различий восприятия является необходимость разработки способа сравнения данных характеризующих киноаудиторию нашей страны и западных зрителей. Дело в том, что все имеющиеся показатели в силу различных объемов кинорынков (нашего и западного), разного количества любителей кино и различной степени их включения в интернет-сообщество, а также различия подходов к оценке фильмов, нуждаются в способе сопоставления.

В настоящей работе был использован достаточно очевидный способ. Приведем пример. Пусть есть результаты измерений каких-то величин в сантиметрах и в дюймах. Например, данные о росте некоторого количества людей. Тогда, сравнив эти данные, можно определить коэффициенты пересчета дюймов в сантиметры. Для некоторых людей, может оказаться, что пересчитанный в сантиметры результат дюймовых измерений не соответствует тому результату, который получен при измерении сантиметровой линейкой. Это свидетельствует о том, что при измерении роста этого человека дюймовой и сантиметровой линейками что-то по-разному повлияло на результат. Так и при сравнении мнений различных киноаудиторий. Можно установить средний коэффициент пересчета, но для некоторых фильмов окажется, что результат не подчиняется простым законам соответствия. Значит что-то в этом произведении киноискусства воспринимается по-разному нашими зрителями и западными. Да что там западными! Интерес наших синефилов и массового зрителя к различным фильмам не коррелирован, т.е. никак не связан.

Источники информации. Каждую неделю в российский кинопрокат выходит несколько фильмов. Например, в 2008 г., по данным популярного синефильского сайта, в прокат вышли 339 кинофильмов. Используя Интернет, можно узнать самые различные сведения об этих фильмах. Можно просмотреть так называемый трейлер (это то, что раньше принято было называть анонсом). Можно познакомиться с отрывками из этих фильмов, просмотреть галерею, составленную из отдельных кадров, прочитать аннотацию, рецензии профессиональных и непрофессиональных рецензентов и отклики зрителей. Если бы этим

и исчерпывалась информация об эстетических достоинствах кинопроизведений, то база для анализа была бы ограничена только мнениями аудитории, пишущей о кино профессионально или любительски. Но в настоящее время можно говорить о существовании массового интернет-сообщества, охватывающего широкие круги любителей кино (синефилов), которые участвуют в постоянно проводимых опросах на сайтах для киноманов. На этих сайтах автоматически обобщаются статистические характеристики выражения мнений. Кроме того, косвенно о восприятии фильмов говорит их коммерческий успех или неуспех. Итак, познакомимся с источниками информации, на базе которой проведены исследования. Непосредственно мнение синефилов по отношению к каждому фильму выражается в виде оценки по десятибалльной шкале в индексах Тор250 и IMDB. Индекс Тор250 используется русскоязычной публикой, а индекс IMDB является интернациональным. О фильмах, вышедших в мировой прокат, на сайте IMDB отзывается в десятки раз больше людей, чем на сайте Тор250. Средние оценки фильмов, публикуемые этими индексами, могут служить для сравнения вкусов активных кинозрителей, которых можно назвать синефилами. Кроме непосредственных оценок, выраженных баллами, имеется показатель, характеризующий интерес активных кинозрителей к тому или иному кинопроизведению, - это количество людей, поставивших свою оценку фильмам на сайтах Тор250 и IMDB. Статистическая сводка мнений профессиональных англоязычных кинокритиков также доступна на сайте www.kinopoisk.ru. Количество англоязычных рецензий и доля среди них положительных рецензий, а также средняя оценка фильмов рецензентами по десятибалльной шкале. Сборы фильмов в кинопрокате позволяют сравнивать интерес публики к различным фильмам. Сборы от проката в России и (отдельно) в США доступны на этом сайте. По 142-м из 339-ти фильмов вышедших в российский кинопрокат в 2008 г., информация о всех указанных оценках имеется.

Метод исследования и результаты. Но вот вопрос: как использовать эту богатую статистику? Неужели ограничиться, как это делают в популярных журналах по кино, составлением десятки самых лучших фильмов? Кстати, Тор250 именно так и задуман. С его помощью составлен и постоянно корректируется список 250-ти самых лучших фильмов. Мы предлагаем несколько иной инструмент, который, как это будет видно, позволяет выделять различия в оценке фильмов независимо от того, в какой части рейтингового списка они находятся. Рассмотрим вопрос

на языке математической статистики. О некотором количестве объектов (в нашем случае фильмов) известны две количественные характеристики. В нашем случае их можно выбрать из широкого списка: оценка синефилов Тор250; оценка синефилов IMDB; количество людей выразивших свое мнение в рейтинге Тор250; количество людей выразивших свое мнение в рейтинге IMDB; сборы фильма в российском прокате (характеристика интереса к фильму со стороны российской аудитории); сборы фильма в прокате США (характеристика интереса к фильму со стороны американской аудитории); оценка, данная фильму англоязычными рецензентами; процент англоязычных рецензентов, положительно оценивших фильм; общее количество англоязычных рецензий; любые другие количественные характеристики зрительского внимания или зрительского восприятия, которые можно найти в Интернете.

Итак, мы имеем дело с парой количественных характеристик выбранных из широкого списка, для некоторого количества объектов (фильмов). Обозначим эти характеристики {х;у}. Индекс г - это порядковый номер, он меняется от 1 до п. Существует математический критерий - коэффициент корреляции, который позволяет оценить степень обоснованности применения линейной зависимости для описания связи между величинами у и х. Этим критерием является коэффициент линейной корреляции. Для его вычисления разумно использовать следующую формулу: СОГу_ (Х^у)-X • у

г = -

Бх X2-|

( )

В этой формулу горизонтальные черточки над выражениями означают усреднение. В частности:

п п п п

Е(х• у) _ Ех _ Еу — Ех2

(х - у ) = -; х = ; у =

|=г

Следует иметь в виду, что х2 ф(х) . Величины СОУху = (х • у)- х • у и Б х = х2 -() называются в статистике, соответственно, ковариация и дисперсия. Коэффициент линейной корреляции изменяется в пределах от минус единицы до плюс единицы. Если коэффициент корреляции больше нуля, говорят о положительной корреляции. В этом случае большим значениям одной из переменных чаще соответствуют большие значения другой переменной. В случае отрицательной корреляции все

наоборот: большим значениям одной из исследуемых величин соответствуют меньшие значения другой величины. Считается, что абсолютное значение коэффициента корреляции является мерой тесноты связи двух величин. Чем ближе к единице, тем теснее связь. Если коэффициент корреляции отличается от нуля менее чем на 0,2 ... 0,3; то это указывает на отсутствие связи между величинами или ее крайне низкую степень.

Сама по себе величина коэффициента линейной корреляции о многом говорит. Например, по результатам проката 2008 г. коэффициент корреляции между оценкой синефилов Тор250 и сборами проката отсутствует: коэффициент корреляции равен 0,047. Это очень важный результат. Сборы никак не связаны с художественными и эстетическими качествами фильмов. Зато количество людей, давших свою оценку фильмам, зависит от сборов очень заметно. Коэффициент корреляции количества оценок на Тор250 и сборов в РФ составляет 0,635. Это достаточно ожидаемый результат, количество просмотревших фильм синефилов определяется интенсивностью ее проката. Еще теснее корреляция оценок Тор250 и IMDB - для этой пары величин коэффициент корреляции равен 0,794; а количества проголосовавших коррелируют с коэффициентом 0,743. Значит, в целом, оценка фильма и внимание к нему со стороны отечественных и зарубежных синефилов определяются эстетическими критериями. Но наибольший интерес представляют различия. Мы подходим к ним. Повторяем: мы имеем дело с парой количественных характеристик для некоторого количества фильмов. Мы обозначили эти характеристики {х;у}, где индекс г - это порядковый номер, он меняется от 1 до п. Если изобразить эти точки на координатной плоскости ХОУ, то они образуют в большей или меньшей степени вытянутое облачко. Сразу появляется желание изобразить зависимость между у и х с помощью прямой линии, то есть линейной функции:

у~=кх+Ь.

- 1 1

Оправданность такого приближения тем выше, чем больше коэффициент линейной корреляции. Метод построения таких зависимостей известен с эпохи Возрождения. Он носит название метода наименьших квадратов. Этот метод заключается в подборе таких значений параметров зависимости (в нашем случае это к и Ь), чтобы сумма квадратов отклонений теоретических значений от фактических была бы минимальной. Отклонение фактического значения (у.) от теоретического (у~.) -это:

£. = у- у~ = у - кх - Ь.

г ^ г ^ г ^ г г

Эта задача давно решена и имеет простое решение:

Го~ - -

к = г ■ —-; Ь = у - к ■ х.

Величина отклонения фактических значений от расчетных (е.) является мерой соответствия теоретической зависимости фактической для каждого конкретного случая. Среднее квадратичное отклонение фактических значений от теоретических (остаточная дисперсия) является мерой точности соответствия зависимости фактическому положению дел в целом. Производной от нее величиной является остаточное среднее квадратичное отклонение, обычно обозначаемое греческой буквой о. Эти величины легко вычислить по формулам:

п

^ г-

Б... = —; о... = .

¡по. ^ ' ¡по. Л/ ¡по .

п - 2

Значение этих величин трудно переоценить. Напомним так называемое правило «трех сигм»: «очень редко случайная величина отклоняется от своего среднего значения более чем на три средних квадратичных отклонения (три сигма)». Если такое отклонение происходит, то оно указывает на то, что применительно к объекту можно утверждать, что этот объект является особенным. Проиллюстрируем вышесказанное примером.

Если в качестве пары величин (у и х), между которыми исследуется степень зависимости использовать две величины: количество любителей кино (синефилов) давших свои оценки на Тор250 и сборы в РФ (коэффициент корреляции этих величин 0,635; количество фильмов для которых имеются эти данные 317), то выяснится интересный факт. Более чем на три сигма (или чуть меньше) превосходит ожидаемый со стороны синефилов интерес к следующим фильмам: «Сумерки» (8,5о), «Темный рыцарь» (7,0о), «ВАЛЛ-И» (5,8о), «Я-легенда» (3,7о), «Заложница» (3,3о), «Железный человек» (2,6о), «Суиннитод: демон парикмахер с Флит-стрит» (2,6о). Ажиотажное внимание фильму «Сумерки» обеспечила аудитория, состоящая из молодых зрительниц, влюбившихся в главного героя фильма - симпатичного вампира. Понятно преувеличенное внимание к фильму «Темный рыцарь». В этом фильме сыграл свою последнюю роль трагически ушедший из жизни актер Хит Лед-жер, смерть которого незадолго до премьеры фильма стала предметом обостренного внимания синефилов. Остальные три фильма привлекли

к себе повышенное внимание благодаря своим художественным качествам и сниженному интересу к ним со стороны массового зрителя.

Несопоставимо мало внимания синефилы уделили следующим фильмам: «Мадагаскар-2» (-3,4а), «Адмирал» (-2,6а), «Мумия: Гробница Императора Драконов» (-2,6а). Это отставание легко интерпретировать. Фильмы оказались востребованы аудиторией, состоящей из людей не принадлежащих к интернет-сообществу. Фильмы «Мадагаскар-2» и «Мумия: Гробница Императора Драконов» были кассово-успешны, но рассчитаны на детскую аудиторию. Фильм «Адмирал» не заслужил внимания у любителей кино, видимо, по эстетическим причинам.

Для исследования зависимости между количеством синефилов, давших свои оценки на Тор250, и сборами в РФ было использовано 317 фильмов. Примененный нами метод позволил выделить из этой массы 10 фильмов. Это около 3%. Обработана информация только за один год кинопроката (2008). Доступный для использования в исследовании объем информации на порядок больше того, что обработан, и мы надеемся продолжить это исследование.

i Надоели баннеры? Вы всегда можете отключить рекламу.