Научная статья на тему 'Статистический метод исследования эстетических предпочтений российской и западной киноаудиторий'

Статистический метод исследования эстетических предпочтений российской и западной киноаудиторий Текст научной статьи по специальности «Математика»

CC BY
538
83
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Власть
ВАК
Область наук
Ключевые слова
КИНЕМАТОГРАФ / СОЦИОЛОГИЧЕСКОЕ ИССЛЕДОВАНИЕ / ЭСТЕТИЧЕСКИЕ ПРЕДПОЧТЕНИЯ / ИНТЕРНЕТ / CINEMATOGRAPH / SOCIOLOGICAL RESEARCH / AESTHETIC PREFERENCES / INTERNET

Аннотация научной статьи по математике, автор научной работы — Бояршинова Елена Борисовна, Гаах Владимир Викторович

Для сравнительного анализа эстетических предпочтений различных киноаудиторий использован метод линейного регрессионного анализа. Он позволяет выявить произведения киноискусства, оценка которых различными сегментами мировой киноаудитории наиболее сильно различается.I

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

n the article the authors are using the method of linear regression analysis to make the comparative analysis of different cinema-audiences. This method allows to identify film arts, which receive very different attitudes from various segments of the cinema audience.

Текст научной работы на тему «Статистический метод исследования эстетических предпочтений российской и западной киноаудиторий»

84 ВЛАСТЬ 201 0 ’ 0 3

Елена БОЯРШИНОВА, Владимир ГААХ

СТАТИСТИЧЕСКИЙ МЕТОД ИССЛЕДОВАНИЯ ЭСТЕТИЧЕСКИХ ПРЕДПОЧТЕНИЙ РОССИЙСКОЙ И ЗАПАДНОЙ КИНОАУДИТОРИЙ

Цпя сравнительного анализа эстетических предпочтений различных киноаудиторий использован метод линейного регрессионного анализа. Он позволяет выявить произведения киноискусства, оценка которых различными сегментами мировой киноаудитории наиболее сильно различается.

In the article the authors are using the method of linear regression analysis to make the comparative analysis of different cinema-audiences. This method allows to identify film arts, which receive very different attitudes from various segments of the cinema audience.

Ключевые слова:

кинематограф, социологическое исследование, эстетические предпочтения, Интернет; cinematograph, sociological research, aesthetic preferences, Internet.

БОЯРШИНОВА

Елена

Борисовна —

преподаватель

Московского

экономического

института

ЪоуагъЫпоуаг®

mail.ru

ГААХ Владимир Викторович — к.пед.н., доцент; ректор Московского экономического института gaakh@mail.ru

Каждую неделю в российский кинопрокат выходит несколько фильмов. Например, в 2008 г. по данным сайта www.kinopoisk.ru в прокат вышли 339 кинофильмов. Используя Интернет, можно узнать самые различные сведения об этих фильмах: просмотреть трейлер, галерею, составленную из отдельных кадров, прочитать аннотацию, рецензии профессиональных и непрофессиональных рецензентов.

В настоящее время можно говорить о существовании массового интернет-сообщества, охватывающего широкие круги любителей кино (синефилов), которые участвуют в постоянно проводимых опросах на сайтах для киноманов. На этих сайтах автоматически обобщаются статистические характеристики выражения мнений.

Непосредственно мнение синефилов по отношению к каждому фильму выражается в виде оценки по десятибалльной шкале в индексах Тор250 и IMDB. Индекс Тор250 используется русскоязычной публикой, а индекс IMDB является интернациональным. Количество оценок фильмов, вышедших в мировой прокат, на сайте IMDB в десятки раз больше, чем на сайте Тор250. Средние оценки фильмов, публикуемые этими индексами, могут служить для сравнения вкусов активных кинозрителей. Кроме непосредственных оценок, выраженных баллами, имеется показатель, характеризующий интерес синефилов, — это количество людей, поставивших свою оценку фильмам на сайтах Тор250 и IMDB.

Статистическая сводка мнений профессиональных англоязычных кинокритиков (количество англоязычных рецензий и доля среди них положительных рецензий, а также средняя оценка фильмов рецензентами по десятибалльной шкале) доступна на сайте www.kinopoisk.ru. Кроме того, сборы фильмов в кинопрокате позволяют сравнивать интерес публики к различным фильмам. Сборы от проката в России и (отдельно) в США также доступны на этом сайте.

В данной статье используется информация обо всех указанных оценках по 142 из 339 фильмов, вышедших в российский кинопрокат в 2008 г.

Как правило, с помощью Тор250 составляется и постоянно корректируется список 250 самых лучших фильмов, в журналах со-

201 0'03

ВЛАСТЬ

85

ставляются десятки лучших фильмов. Мы предлагаем несколько иной инструмент, который позволяет выделять различия в оценке фильмов независимо от того, в какой части рейтингового списка они находятся.

Рассмотрим вопрос на языке математической статистики. О некотором количестве объектов (в нашем случае — фильмов) известны две количественные характеристики. В нашем случае их можно выбрать из широкого списка: оценка синефилов Тор250; оценка синефилов IMDB; количество людей, выразивших свое мнение в рейтинге Тор250; количество людей, выразивших свое мнение в рейтинге IMDB; сборы фильма в российском прокате; сборы фильма в прокате США; оценка, данная фильму англоязычными рецензентами; процент англоязычных рецензентов, положительно оценивших фильм; общее количество англоязычных рецензий; а также любые другие количественные характеристики зрительского внимания или зрительского восприятия, которые можно найти в Интернете.

Мы имеем дело с парой количественных характеристик для некоторого количества объектов (фильмов). Обозначим эти характеристики Ху}. Индекс і — это порядковый номер, он меняется от 1 до п. Существует математический критерий — коэффициент корреляции, который позволяет оценить степень обоснованности применения линейной зависимости для описания связи между величинами у и х. Этим критерием является коэффициент линейной корреляции. Для его вычисления разумно использовать следующую формулу:

СОУху = (х • у)-X • у

" X2-(X)

в„

В этой формуле горизонтальные черточки над выражениями означают усреднение. В частности:

Т (х ■ у)_ Тх Ту — Тх2<

(х • у )=

;=г . „2 _ ;=г

Следует иметь в виду, что х2 Ф () . Величины согху =(х ■ у)-х ■ у и

В х = х2 - (X) называются в статистике соответственно ковариацией и дисперсией. Коэффициент линейной корреляции

изменяется в пределах от —1 до +1. Если коэффициент корреляции больше нуля, говорят о положительной корреляции. В этом случае большим значениям одной из переменных чаще соответствуют большие значения другой переменной. В случае отрицательной корреляции все наоборот: большим значениям одной из исследуемых величин соответствуют меньшие значения другой величины. Считается, что абсолютное значение коэффициента корреляции является мерой тесноты связи двух величин. Чем ближе к единице, тем теснее связь. Если коэффициент корреляции отличается от нуля менее чем на 0,2 ... 0,3, то это указывает на отсутствие связи между величинами или ее крайне низкую степень.

Сама по себе величина коэффициента линейной корреляции говорит о многом. Например, по результатам проката 2008 г. коэффициент корреляции между оценкой синефилов Тор250 и сборами проката отсутствует: коэффициент корреляции равен 0,047. Это очень важный результат. Сборы никак не связаны с художественным и эстетическим качествами фильмов. Зато количество людей, давших свою оценку фильмам, зависит от сборов очень заметно. Коэффициент корреляции количества оценок на Тор250 и сборов в РФ составляет 0,635. Это достаточно ожидаемый результат — количество просмотревших фильм синефилов определяется интенсивностью его проката.

Еще теснее корреляция оценок Тор250 и IMDB — для этой пары величин коэффициент корреляции равен 0,794; а количества проголосовавших коррелируют с коэффициентом 0,743. Значит, в целом оценка фильма и внимание к нему со стороны отечественных и зарубежных синефилов определяются эстетическими критериями.

Но наибольший интерес представляют различия. Повторяем, мы имеем дело с парой количественных характеристик для некоторого количества фильмов. Мы обозначили эти характеристики {ху}, где индекс i — это порядковый номер, он меняется от 1 до п.

Если изобразить эти точки на координатной плоскости ХОУ, то они образуют в большей или меньшей степени вытянутое облачко. Сразу появляется желание изобразить зависимость между у и х с по-

86

ВЛАСТЬ

201 0’03

мощью прямой линии, то есть линеинои функции: у = кх- + Ь

Оправданность такого приближения тем выше, чем больше коэффициент линейной корреляции. Известен с эпохи Возрождения метод построения таких зависимостей. Он носит название метода наименьших квадратов. Этот метод заключается в подборе таких значений параметров зависимости (в нашем случае это к и Ь), чтобы сумма квадратов отклонений теоретических значений от фактических была бы минимальной. Отклонение фактического значения (у-) от теоретического (у-) выражается формулой

£ - = У-- у-= У-- кх--Ь.

Эта задача давно решена и имеет простое решение:

Величина отклонения фактических значений от расчетных (£ -) является мерой соответствия теоретической зависимости фактической для каждого конкретного случая. Среднее квадратичное отклонение фактических значений от теоретических (остаточная дисперсия) является мерой точности соответствия зависимости фактическому положению дел в целом. Производной от нее величиной является остаточное среднее квадратичное отклонение, обычно обозначаемое греческой буквой сигма (О). Эти величины легко вычислить по формулам:

I е

В = !=1

2’^ ост.

Значение этих величин трудно переоценить. Напомним так называемое правило «трех сигм». Очень редко случайная величина отклоняется от своего среднего значения более чем на три средних квадратичных отклонения (три сигма).

Если такое отклонение происходит, то применительно к объекту можно утверждать, что объект является особенным. Проиллюстрируем вышесказанное примером.

Если в качестве пары величин (у и х), между которыми исследуется степень зависимости, использовать две величины:

количество любителей кино, давших свои оценки на Тор250, и сборы в РФ (коэффициент корреляции этих величин 0,635; количество фильмов, для которых имеются эти данные — 317), то выяснится интересный факт. Более чем на три сигма (или чуть меньше) превосходит ожидаемый со стороны синефилов интерес к следующим фильмам: «Сумерки» (8,5а), «Темный рыцарь» (7,0а), «ВАЛЛ-И» (5,8о), «Я — легенда» (3,7а), «Заложница» (3,3а), «Железный человек» (2,6а), «Суиннитод: демон-парикмахер с Флит-стрит» (2,6а).

Ажиотажное внимание фильму «Сумерки» обеспечила аудитория, состоящая из молодых зрительниц. Понятно преувеличенное внимание к фильму «Темный рыцарь». В этом фильме сыграл свою последнюю роль трагически ушедший из жизни актер Хит Леджер. Остальные три фильма выделились благодаря своим художественным качествам и сниженному интересу к ним со стороны массового зрителя.

Несопоставимо мало внимания синефилы уделили следующим фильмам: «Мадагаскар-2» (—3,4а), «Адмирал» (—2,6а), «Мумия: Гробница Императора Драконов» (—2,6а). Это отставание легко интерпретировать. Фильмы оказались востребованы аудиторией, состоящей из людей, не принадлежащих к интернет-сообществу. Фильмы «Мадагаскар-2» и «Мумия: Гробница Императора Драконов» были кассово успешны, но рассчитаны на детскую аудиторию. Фильм «Адмирал» не заслужил внимания у любителей кино по эстетическим причинам. Казалось, новый подход к изложению событий революции и гражданской войны не мог не привлечь внимание синефилов старших возрастов, однако последние редко высказывают свои взгляды через Интернет.

Для исследования зависимости между количеством любителей кино, давших свои оценки на Тор250, и сборами в РФ было использовано 317 фильмов. Примененный нами метод позволил выделить из этой массы 10 фильмов. Это менее 3%. Таким образом, использованный нами метод позволяет сконцентрировать внимание исследователей на фильмах, чья оценка различными киноаудиториями отличается в наибольшей степени, хотя эти фильмы могут находиться в общей рейтинговой массе.

2

i Надоели баннеры? Вы всегда можете отключить рекламу.