Научная статья на тему 'Хэнд Д. Д. Статистика: очень краткое введение / Пер с англ. М. Л. Фреера; под науч. Ред. М. И. Левина. М. : издательский дом «Дело» РАНХиГС, 2017. — 192 с. '

Хэнд Д. Д. Статистика: очень краткое введение / Пер с англ. М. Л. Фреера; под науч. Ред. М. И. Левина. М. : издательский дом «Дело» РАНХиГС, 2017. — 192 с. Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
182
49
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
анализ данных / регрессионные модели / статистика / data analysis / regression models / statistics.

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Рогозин Дмитрий МихайЛович

Рецензия представляет перевод на русский язык книги британского математика и статистика, профессора Дэвида Хэнда, выпущенной в серии научно-популярных работ издательства Oxford University Press. Автор книги показывает, что статистические идеи и методы лежат в основе всех аспектов современной жизни и что статистика в ее современном виде — это динамическая дисциплина, которая использует глубокую теорию и передовые программные средства. В книге рассматривается развитие статистики в историческом контексте, обобщаются методы сбора и анализа данных, объясняется роль категорий случайности и вероятности в статистических методах, рассматриваются философские вопросы индукции. Однако главная цель книги, по мнению автора рецензии, — не научить статистике, а творчески продемонстрировать мир анализа данных, увлечь постановкой сложных и нетривиальных исследовательских задач, приобщить к «искусству открытий». И в этом плане книга Д. Хэнда может представлять интерес не только для тех, кто лишь обучается статистике, но и для профессионалов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

[REV.] HAND D. STATISTICS: A VERY SHORT INTRODUCTION / TRANSL. FROM ENG. BY M.L. PHREER; ED. BY V.I. LEVIN. MOSCOW: IZDATEL’SKIY DOM “DELO” RANEPA PUBL., 2017

This review presents the Russian translation for a certain book written by a British mathematician and statistician professor David Hand, which was released as part of a series of popular-scientific works by the Oxford University Press publishing house. The book’s author shows that statistical ideas and methods underlay all aspects of modern life, and that statistics in their contemporary form are a dynamical discipline which utilizes deep theory and cutting-edge software. The book examines the development of statistics within the historic context, while generalizing methods for collecting and analyzing data, explaining the role of categories of randomness and probability in statistical methods, while also examining the philosophical issues of induction. However, the book’s main objective, according to the author of this review, is not to teach statistics, but rather to creatively demonstrate the world of data analysis, captivate by posing complex and unconventional research tasks, and introduce to the “art of discovery”. And in this sense D. Hand’s book might be of some interest not only for those who are merely studying statistics, but also for professionals.

Текст научной работы на тему «Хэнд Д. Д. Статистика: очень краткое введение / Пер с англ. М. Л. Фреера; под науч. Ред. М. И. Левина. М. : издательский дом «Дело» РАНХиГС, 2017. — 192 с. »

Д.М. РОГОЗИН

Хэнд д.д. СТАТИСТИКА ОЧЕНЬ КРАТКОЕ ВВЕДЕНИЕ /

Пер с англ. М.Л. Фреера; Под науч. ред. М.И. Левина.

М.: Издательский дом «дело» рАИХиГС, 2017. — 192 с.1

Аннотация. Рецензия представляет перевод на русский язык книги британского математика и статистика, профессора Дэвида Хэнда, выпущенной в серии научно-популярных работ издательства Oxford University Press. Автор книги показывает, что статистические идеи и методы лежат в основе всех аспектов современной жизни и что статистика в ее современном виде — это динамическая дисциплина, которая использует глубокую теорию и передовые программные средства. В книге рассматривается развитие статистики в историческом контексте, обобщаются методы сбора и анализа данных, объясняется роль категорий случайности и вероятности в статистических методах, рассматриваются философские вопросы индукции. Однако главная цель книги, по мнению автора рецензии, — не научить статистике, а творчески продемонстрировать мир анализа данных, увлечь постановкой сложных и нетривиальных исследовательских задач, приобщить к «искусству открытий». И в этом плане книга Д. Хэнда может представлять интерес не только для тех, кто лишь обучается статистике, но и для профессионалов.

Ключевые слова: анализ данных; регрессионные модели; статистика.

Для цитирования: Рогозин Д.М. [Рец.] Хэнд Д.Д. Статистика: очень краткое введение / Пер с англ. М.Л. Фреера; Под науч. ред. М.И. Левина. М.: Издательский дом «Дело» РАНХиГС, 2017 // Социологический журнал. 2017. Том 23. № 2. С. 184-187. DOI: 10.19181/socjour.2017.23.2.5167

Показать статистику в ее нынешнем виде, как определяет свою задачу автор книги (с. 10), — нелегко. Без деталей, формул, доказательств, пространных объяснений — невозможно, невыполнимо, абсурдно. Дэвид Хэнд утверждает обратное. Мы привыкли воспринимать статистику как набор бесконечных методов, статистик, аналитических описаний. Нагромождение подходов приводит к растерянности и бесконечному повторению когда-то освоенного. Один автор останавли-

Рогозин Дмитрий Михайлович — кандидат социологических наук, заведующий лабораторией, Институт социального анализа и прогнозирования РАНХиГС при Президенте РФ; старший научный сотрудник, Институт социологии РАН.

Адрес: 119034, Москва, Пречистенская набережная, д. 11, корп. 1, ком. 404. Телефон: +7 (916) 482-30-35. Электронная почта: nizgor@gmail.com

1 Hand D. Statistics: A Very Short Introduction. Oxford: Oxford University Press, 2008. — 144 p.

Обзоры, рецензии, рефераты 185

вается на таблицах сопряженности и Хи-квадрате, другой — муссирует линейную регрессионную модель, третий — ко всем данным прикладывает деревья классификаций. Можно и так, а можно иначе.

Все статистические методы связаны между собой, утверждает Д. Хэнд (с. 40). Воспринять, осознать эту связь — и есть первый шаг в освоении искусства статистического анализа. Не важно, когда этот шаг сделан: в самом начале или после многих лет бесплодных попыток овладеть количественной методологией. Важно сделать его, увидеть гармонию мира, красоту в данных (с. 42). Поэтому задача книги — не научить пользоваться статистикой (с. 62), об этом написаны тысячи работ, а привить вкус, дать толчок развитию мышления. «Каждый из нас порождает целую лавину данных — но, чтобы извлечь из их наличия какую-либо пользу, необходимо обладать знанием статистики» (с. 169).

«Данные — это свидетельства природы, которые мы наблюдаем через линзы измерительных инструментов» (с. 43), — пишет Хэнд. Настройка оптики, уход за инструментом и профилактика его качества — основные задачи статистика. Применять метод может каждый, обслуживать — только понимающий базовые принципы, о которых идет речь в книге.

Во-первых, статистика начинается с комбинации элементов, выявления связей и отношений (с. 45). Распределения, меры средней тенденции (средняя, мода, медиана) и меры разброса (дисперсия, среднеквадратичное отклонение, коэффициенты асимметрии) помогают упорядочить данные, подготовить нас к целостному восприятию.

Во-вторых, статистика — это работа с данными, качество которых определяет результаты всех последующих операций. К сожалению, книги по статистике обычно игнорируют вопросы качества данных (с. 61). Их задача — познакомить с методами, как если бы этого было достаточно для статистического анализа. Но нам доступны лишь неполные (с. 62) и некорректные (с. 67) данные. Работа статистика — работа над ошибками и с ошибками (с. 71). Упускать это из вида, подводить свои рассуждения под прочие равные условия — глубочайшее заблуждение, результаты которого мы пожинаем при неумелом обращении со статистическим материалом.

В-третьих, наблюдения, эксперименты, выборочные исследования составляют почву для статистического творчества. Соблюдение определенных рамок, математическая чистота процедур, корректность и аккуратность статистических выводов — это лишь основа искусства интерпретации. Иными словами, следование процедуре не является достаточным условием для корректности вывода. Необходимо, как считает Хэнд, научиться эстетике числа, почувствовать тональность, уловить обертоны внешнего мира.

В-четвертых, работа с точными данными на деле оборачивается поиском компромиссных решений. Статистик постоянно сталкива-

186 Социологический журнал. 2017. Том 23. № 2. С. 184—187

ется с дилеммами, вводящими новобранца в состояние прострации и непонимания. Так, с одной стороны, «чем больше данных собрано исследователем для ответа на определенный вопрос, тем более точным будет полученный результат. Это следствие закона больших чисел» (с. 78). С другой стороны — «чем больше размер выборки, тем больше людей вовлечены в ее обработку и оцифровку, тем больше стадий предварительной обработки и записи она проходит — а в результате все это приводит к большему количеству ошибок» (с. 69). Статистик не только подбирает модели и методы, но и конструирует сами данные, оценивая и взвешивая процедуры, необходимые и достаточные для решения поставленных задач.

Наконец, в-пятых, современная статистика опирается на теорию вероятностей. Освоение последней — единственная возможность вскочить на подножку уходящего в будущее состава научного знания. Анализ вероятности — это игра с неопределенностью, выявление законов неосознанного поведения. Несмотря на давным-давно сформулированную А.Н. Колмогоровым аксиоматику теории вероятностей, необходимо раз за разом возвращаться к чтению трудов, внесших вклад в развитие этой теории, и к размышлению над особенностями случая. Блез Паскаль, Пьер де Ферма, Христиан Гюйгенс, Якоб Бернулли и позже Пьер Симон Лаплас, Абрахам де Муавр, Симеон-Дени Пуассон, Антуан Курио, Джон Венн и другие великие математики, логики, философы, кому мы обязаны созданием и развитием теории вероятностей (с. 91), заслуживают медленного прочтения с постоянными повторами и возвращениями. Научное толкование вероятности слишком далеко отстоит от здравого смысла, привыкшего маркировать случайности как непреднамеренность, неосознанность отношений. Используя оптику здравого смысла, невозможно увидеть закономерности в случайном.

Задача статистика — различить связанность мира. Для этого он пользуется инструментом, элементы которого взаимосвязаны и взаимообусловлены. Так, «хотя изначальная постановка задачи дисперсионного анализа значительно отличается от стандартной регрессионной модели, задачу дисперсионного анализа можно свести к определенному типу регрессии путем некоторых преобразований. К тому же обе эти модели являются частными случаями более общей концепции линейных моделей» (с. 155), в основе которых лежат операции со средними величинами и мерами разброса.

Всю современную методологию статистического анализа — перекрестные проверки, бутстрэп, методы Монте-Карло с цепями Маркова — нет шансов понять без взгляда на их связанность с первоначальными, базовыми понятиями средней, отклонений от средней и далее от математического ожидания, оценок достоверности отобранных статистик. «Современная статистика основывается на базовых

Обзоры, рецензии, рефераты 187

философских концепциях и представляет собой искусство открытий» (с. 170) — главная идея, которую заявляет и аргументирует автор книги.

Дата поступления: 13.04.2017.

Sotsiologicheskiy Zhurnal = Sociological Journal 2017. Vol. 23. No. 2. P. 184-187. DOI: 10.19181/socjour.2017.23.2.5167

D.M. Rogozin

Russian Presidential Academy for National Economy and Public Administration, Moscow, Russian Federation.

Dmitriy M. Rogozin — Candidate of Sociological Sciences, Head of The Laboratory for Social Research Methodology, Russian Presidential Academy for National Economy and Public Administration.

Address: 404 office, 11, bl. 1, Prechistenskaya nabereznaya, 119034, Moscow, Russian Federation. Phone: +7 (916) 482-30-35. Email: nizgor@gmail.com

[Rev.] Hand D. Statistics: A Very Short Introduction / transl. from eng. by M.L. Phreer; Ed. by V.I. Levin. Moscow: Izdatel'skiy dom "Delo" RANEPA Publ., 2017

Abstract. This review presents the Russian translation for a certain book written by a British mathematician and statistician professor David Hand, which was released as part of a series ofpopular-scientific works by the Oxford University Press publishing house. The book's author shows that statistical ideas and methods underlay all aspects of modern life, and that statistics in their contemporary form are a dynamical discipline which utilizes deep theory and cutting-edge software. The book examines the development of statistics within the historic context, while generalizing methods for collecting and analyzing data, explaining the role of categories of randomness and probability in statistical methods, while also examining the philosophical issues of induction. However, the book's main objective, according to the author of this review, is not to teach statistics, but rather to creatively demonstrate the world of data analysis, captivate by posing complex and unconventional research tasks, and introduce to the "art of discovery". And in this sense D. Hand's book might be of some interest not only for those who are merely studying statistics, but also for professionals.

Keywords: data analysis; regression models; statistics.

For citation: Rogozin D.M. [Rev.] Hand D. Statistics: A Very Short Introduction / Transl. from Eng. by M.L. Phreer; Ed. by V.I. Levin. Moscow: Izdatel'skiy dom "Delo" RANEPA Publ., 2017. Sotsiologicheskiy Zhurnal = Sociological Journal. 2017. Vol. 23. No. 2. P. 184-187. DOI: 10.19181/socjour.2017.23.2.5167

Received: 13.04.2017.

i Надоели баннеры? Вы всегда можете отключить рекламу.