РАЗДЕЛ 5. СТАТИСТИКА, БУХГАЛТЕРСКИЙ УЧЕТ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ ЭКОНОМИКИ
А.А. Трегубова
СТАТИСТИЧЕСКОЕ ИССЛЕДОВАНИЕ СПРОСА НА УСЛУГИ ДОБРОВОЛЬНОГО МЕДИЦИНСКОГО СТРАХОВАНИЯ
Аннотация
Мировой финансовый кризис стал причиной сокращения сборов по коллективному добровольному медицинскому страхованию. Для сохранения своих позиций на рынке ДМС страховщикам необходимо привлекать к страхованию большее число индивидов. В статье приведены основные результаты статистического моделирования потребительского поведения населения на рынке услуг добровольного медицинского страхования. Были оценены модели анализа панельных данных по РМЭЗ за 2001-2005 годы.
Annotation
The world financial crisis is one of the case decline insurance profit in collective voluntary health insurance. Nowadays the insurance companies have great shortage of clients in this field. The paper basic result is statistical modeling demand of voluntary health insurance. The panel models were estimated by RLMS-data for 2001-2005 years.
Ключевые слова
Страхование, добровольное медицинское страхование (ДМС), панельные данные, логит-модель, модели со случайными эффектами.
Key Words
Insurance, voluntary health insurance, panel data, logit model, random effects models.
За последние несколько лет можно было отметить рост рынка добровольного медицинского
страхования (ДМС). Увеличение сборов по этому виду страхования было обусловлено в основном за счет привлечения к страхованию большего числа корпоративных клиентов. Мировой финансовый кризис повлек за собой массовые сокращения
сотрудников во многих компаниях, что в свою очередь стало причиной снижения сборов по ДМС.
В такой ситуации страховщики могут попытаться сохранить свои позиции на рынке ДМС за счет привлечения к этому виду страхования большего числа индивидуальных
клиентов. С этой целью была проведена сегментация рынка добровольного медицинского страхования, заключающаяся в выделении основных характеристик потребителей услуг ДМС на основе оценивания моделей анализа панельных данных. Это позволит страховщикам переориентировать свои программы ДМС в соответствии в выделенными характеристиками,
провести корректировку тарифов ДМС.
Для целей исследования были использованы данные Российского мониторинга экономики и здоровья населения (РМЭЗ) за 2001-2005 годы. Рабочая база содержит наблюдения по индивидам в возрасте от 16 до 74 лет. Число наблюдений за период
наблюдения с 2001 по 2005 год составило 13570, что представляет собой произведение числа индивидов, попавших в выборку (2714 индивидов), на число периодов наблюдения (5 лет).
dms
male
age
income
loginc
work
oms
health_pr
hospital
oblcen
city
selo
marr
year
tX
Для дальнейшего анализа были выбраны основные переменные, которые могут оказывать влияние на приобретение индивидом полиса ДМС, их обозначения приведены ниже:
медицинского страхования у
Наличие полиса добровольного респондента
Пол респондента (мужской)
Возраст респондента
Доход за последний месяц (любые денежные поступления за последние 30 дней, включая зарплату, пенсии, премии, прибыли, пособия, материальную помощь, случайные заработки и другие денежные поступления в рублях)
Логарифм натуральный дохода респондента за месяц Наличие работы у респондента
Наличие полиса обязательного медицинского страхования у респондента
Проблемы со здоровьем за последний месяц Госпитализация за последние три месяца Проживание в областном центре Проживание в городе Проживание в селе
Брачный статус респондента (состоит браке)
Год обследования
Фиктивные переменные, принимающие
зарегистрированном
значение,
года Х и 0 для остальных периодов, где Х=2001,
равное 1 2GG5
для
В процентном соотношении в изучаемой совокупности 61,9% женщин, соответственно мужчин -38,1%. При этом доля работающих составила 69,54%, среди них работающих мужчин 74,7%, против 66,37% работающих женщин. Доля, имеющих полис ДМС, очень невелика и составила 3,45%. При этом доля лиц в возрасте 25-30 лет, имеющих такой полис, равна 4,89%. Средний возраст индивида составил 45 лет.
Для исследования влияния на вероятность наличия полиса ДМС прочих факторов первоначально была оценена сквозная регрессия по всем годам и всем индивидам, не учитывающая панельной структуры данных. Поскольку в качестве зависимой выступила бинарная переменная, была оценена логит-модель (таблица 1).
Таблица 1.Результаты оценивания сквозной логит-модели с зависимой переменной «наличие полиса ДМС»__________________________________
Независимые переменные Коэффициент Стандартная ошибка
Male G.3655 G.G98G9
Work 1.8G23 G.2G16
Oms G.3366 G.2543
Продолжение таблицы 1
Health pr 0.1456 0.1018
Hospital 0.4695 0.2099
Age -0.0043 0.0042
Oblcen 0.9068 0.2997
City 1.0430 0.3020
Selo 0.1208 0.3263
Marr 0.2227 0.1093
Const -6.1657 0.4770
Количество наблюдений 13570
pseudo R2 0.0632
Log likelihood -1907.0748
Величина статистики отношения правдоподобия (LR) позволяет утверждать, что построенная модель значима. Для оценки качества модели используется pseudo R2 - аналог R2 для линейной регрессии.
На уровне 5 % значимыми являются следующие переменные: пол респондента, госпитализация, наличие работы, брачный статус. Согласно полученным результатам вероятность наличия полиса ДМС для мужчин повышается, так как она повышается и в случае, если индивид работает. Это вполне объяснимо, так как работающие лица с большей вероятностью могут позволить себе дорогостоящий полис ДМС, кроме того, на сегодняшний день добровольное медицинское страхование в основном распространено среди работодателей, включающих его в социальный пакет для сотрудников, то есть, если индивид работает, то он с большей вероятностью будет иметь полис ДМС. Вероятность наличия полиса ДМС для лиц, состоящих в официально зарегистрированном браке, будет выше.
Недавняя госпитализация
повышает вероятность приобретения полиса. Наличие проблем со здоровьем оказалось незначимо. Было отмечено, что проживание индивида в областном центре и городе повышает вероятность наличия полиса ДМС по сравнению с
этой вероятностью для жителей поселка городского типа и сел.
Для выявления различий для
мужчин и женщин в вероятности приобретения ДМС была проведена оценка двух моделей в разрезе пола с одинаковыми объясняющими
переменными.
И для мужчин, и для женщин с увеличением возраста вероятность наличия полиса ДМС снижается. Кроме того, в модели для женщин проживание в городе и областном центре статистически значимо повышает исследуемую вероятность.
Логарифм натуральный дохода ведет к повышению вероятности
наличия полиса ДМС и у мужчин, и у женщин. Следует отметить, что
значимость брачного статуса для мужчин и женщин различна.
Вероятность наличия полиса ДМС повышается для женщин, состоящих в зарегистрированном браке на уровне значимости 5%, тогда как для мужчин эта переменная является незначимой. Можно предположить, что в случае, если женщина состоит в браке, общий доход семьи возрастает и делает покупку полиса ДМС более доступной.
Сквозная регрессия является упрощенной и, как было отмечено ранее, не учитывает особенностей, связанных с панельной структурой данных. Для анализа панельных данных применяются два основных типа
моделей: модели с фиксированными
эффектами и модели со случайными эффектами [1].
Модель с фиксированными эффектами является подходящей спецификацией в том случае, если рассматривается уникальный набор данных (стран, регионов), то есть все выводы ограничены поведением только представителей этого набора данных. В этом случае предполагается, что у каждого индивида есть какие-либо индивидуальные факторы, влияющие на вероятность наличия у него полиса ДМС. Эти индивидуальные факторы учитываются в модели в виде
константы, позволяющей определить, какой эффект оказывают эти
индивидуальные различия на зависимую переменную. При этом
результаты оценивания такой модели могут быть распространены только на объекты, попавшие в выборку.
Модель со случайными эффектами применима в том случае, если
рассматривается выборка из большой генеральной совокупности элементов, например, в случае исследований панелей домашних хозяйств, индивидов или мелких фирм. В таком случае индивидуальные эффекты можно считать случайными отклонениями, ими можно пренебречь. Применение модели анализа панельных данных со случайными эффектами обосновано, если результаты оценивания модели необходимо распространить на все объекты генеральной совокупности, а не только на наблюдения, попавшие в выборку.
В проведенном исследовании были использованы данные
Российского мониторинга экономики и здоровья населения, содержащие информацию лишь о некоторой части домохозяйств и индивидов России. На основании полученных результатов
можно определить наиболее
существенные характеристики
потенциальных потребителей услуг ДМС, распространив выводы на все население. Индивидуальными эффектами при этом можно пренебречь. С этой точки зрения наиболее целесообразной является использование модели со случайными эффектами.
Первоначальная спецификация содержит те переменные, которые должны оказывать наибольшее влияние на вероятность приобретения полиса ДМС. Это - пол индивида, занятость, наличие проблем со здоровьем, возраст, место проживания, брачный статус, логарифм дохода, а также фиктивные переменные года (таблица 2).
Большинство переменных
значимы на уровне значимости 5-10 %. При этом переменные «работа индивида» и «логарифм дохода» значимы даже на 0,1%-м уровне. Поскольку связь между этими переменными очень заметна, их одновременное введение в модель не целесообразно, но поскольку они оказывают столь заметное влияние на вероятность наличия полиса ДМС, нельзя просто исключить одну из них. Поэтому можно построить две модели, в одной оставив переменную «работа», а в другой - «логарифм дохода».
Таким образом, можно не просто учесть влияние этих переменных на зависимую переменную, но и
определить, что в большей степени оказывает влияние на приобретение полиса: наличие работы или доход
индивида (не всегда являющийся результатом только трудовой деятельности). Результаты оценивания моделей с совместным включением этих двух переменных, а также
отдельно с включенной переменной «логарифм дохода» и «работа»
представлены в таблице 2.
Таблица 2.Результаты оценивания логит-моделей со случайными
Независимы е переменные Спецификация, содержащая переменные «логарифм дохода» и «работа» Спецификация, содержащая переменную «логарифм дохода» Спецификация, содержащая переменную «работа»
Коэффи- циент Стандартна я ошибка Коэффи- циент Стандартна я ошибка Коэффи -циент Стандартна я ошибка
Male 0.2314 G.2G12 0.1490 G.2G66 G.5911* G.2G62
Work 1.5124* G.2981 - - 2.G256* G.2939
Health pr 0.1293 G.1445 0.0966 G.1443 G. 1331 G.1441
Age -0.0113 G.GG86 -0.0279* G.GG8G -G.G1G2 G.GG83
Oblcen 0.9551** * G.5211 1.0293** G.4942 1.2311* * G.54G1
City 1.0269** * G.5323 1.0701** G.5G44 1.159G* * G.5412
Selo 0.1496 G.5662 0.1259 G.5346 G.G124 G.5826
Marr 0.3878** * G.2G3G 0.4834** G.2G31 G.3GG5 G.2G29
Loginc 0.7138* G.11GG 0.8684* G.1G6G - -
t2002 0.3295** * G.193G 0.3582** * G.192G -G.G921 G.1891
t2003 0.3561** * G.1918 0.4068** G.1963 G.G8GG G. 1864
t2004 -0.6843* G.21G6 -0.7659* G.2G81 -G.1298 G.193G
t2005 0.4581** G.2161 -0.5842* G.2131 G.2882 G.1854
Const -13.1737 1.G168 -12.4801 1.G322 -8.14G4 G.1196
Число наблюдений Log likelihood 1351G -1542.3363 1351G -1556.91G9 1351G -1564.G819
*-1%-й уровень значимости, **-5%-й уровень значимости, ***-10%-й
уровень значимости
Спецификация модели,
содержащая переменную «логарифм
дохода», позволила сделать следующие выводы. На уровне значимости 1%
вероятность наличия полиса ДМС
возрастает с увеличением логарифма натурального дохода индивида, тогда как при увеличении возраста индивида вероятность наличия полиса снижается. При этом можно отметить, что
проживание в областном центре и
городе повышает вероятность наличия полиса ДМС по сравнению с проживанием в поселке городского типа. Также видно, что лица, состоящие в браке, с большей вероятностью будут иметь полис ДМС.
Фиктивные переменные времени, введенные в спецификацию, позволили сделать вывод, что на уровне значимости 10 % по сравнению с 2001 годом вероятность наличия полиса снижалась в каждом последующем году.
Проблемы со здоровьем, напротив, не оказывают существенного влияния на вероятность наличия полиса ДМС, что может косвенно подтвердить предположение о том, что в действительности лица, имеющие полис ДМС, получают его просто как уже заранее оплаченный работодателем курс лечения.
Так как покупка полиса ДМС -дорогостоящее «удовольствие», то не каждый может позволить себе его приобрести. Поэтому доходу индивида отводится первое место по степени влияния на вероятность наличия полиса ДМС. И хотя доход и работа тесно связаны между собой, не всегда наличие работы автоматически означает, что индивид получает необходимый для покупки полиса заработок. Точно так же отсутствие работы не означает, что лицо не имеет никаких других источников дохода.
Согласно результатам оценивания третьей модели, вероятность наличия полиса ДМС у мужчин выше, чем у женщин. Кроме того, для работающего индивида эта вероятность заметно возрастает. Третьей переменной, оказывающей влияние на наличие
Так, по сравнению с проживанием в поселке городского типа, лица, проживающие в городе или в областном центре, с большей вероятностью будут иметь полис ДМС.
По результатам оценивания двух последних моделей было отмечено, что при прочих равных условиях в большей степени на наличие полиса ДМС влияет доход индивида, а не просто наличие работы.
Однако в оцененных моделях отсутствовали важные для определения заинтересованности в приобретении полиса ДМС переменные, такие как самооценка здоровья индивидом, частота посещений врача. Их
включение в модели было невозможным по причине того, что РМЭЗ стал рассматривать эти вопросы лишь с 2004 года. Поскольку учесть влияние этих переменных на вероятность наличия полиса ДМС
являлось необходимым, были рассмотрены данные за 2004-2005 годы.
Число наблюдений за период наблюдения составило 10402, то есть за два года был рассмотрен 5201 индивид. К уже выделенным ранее переменным были добавлены следующие
переменные:
полиса ДМС, стало место проживания. child - Наличие детей (1-да, 0-иначе)
invalid - Присвоена ли группа инвалидности
visit - Часто ли посещение врача (часто - несколько или один раз в месяц)
t05 - Фиктивная переменная времени (2005 год)
Самооценка здоровья (эталон - оценка здоровья как совсем плохого) heal_val 1 - оценка здоровья как очень хорошего
heal_val2 - оценка здоровья как хорошего
heal_val3 - оценка здоровья как среднего
heal_val4 - оценка здоровья как плохого
Согласно предварительному
корреляционному анализу переменная «наличие полиса ДМС» связана с такими переменными, как: «логарифм дохода», «работа», менее заметна связь с самооценкой здоровья, местом проживания, полом индивида, брачным статусом и возрастом. Такой
предварительный анализ позволил подтвердить уже отмеченную ранее тенденцию, а именно: наличие полиса ДМС скорее связано с наличием работы или соответствующего дохода, чем с теми факторами, которые должны были бы оказывать влияние на
самостоятельный выбор в пользу приобретения полиса ДМС индивидом.
Результаты оценивания логит-модели со случайными эффектами с
зависимой переменной «вероятность наличия полиса ДМС» по данным за 2004-2005 годы представлены в таблице 3.
Таблица З.Результаты оценивания логит-моделей со случайными
Независимые переменные Спецификация, содержащая переменные «логарифм дохода» и «работа» Спецификация, содержащая переменную «логарифм дохода» Спецификация, содержащая переменную «работа»
Коэффи- циент Стандартная ошибка Коэффи- циент Стандартная ошибка Коэффи- циент Стандартная ошибка
Visit 0.7458** G.3G19 0.6314** G.2981 0.7771** G.31G1
Health pr 0.2016 G.1881 0.1650 G.1816 0.2427 G.196G
Lginc 1.2540* G.1356 1.4166* G.1325 - -
Male 0.0958 G.2G96 0.0529 G.2G83 0.6265* G.221G
Child -0.4738 G.2885 -0.3613 G.2818 -0.3954 G.311G
Work 1.5528* G.3591 - - 2.5630* G.3151
heal val1 -0.0906 1.3631 0.4654 1.3918 -0.1031 1.41G1
heal val2 0.1638 1.G512 0.8181 1.G9G4 0.1604 1.G643
heal val3 0.2317 1.G4G1 0.8923 1.G135 0.1242 1.G41G
heal val4 -0.0893 1.G811 0.3537 1.1158 -0.41048 1.G882
Marr 0.8220* G.2321 0.8728* G.23G9 0.8744* G.2464
Age 0.0013 G.GG92 -0.0121 G.GG86 0.0026 G.GG91
Oblcen 0.8693*** G.5211 0.9426*** G.5219 1.3231** G.5843
City 1.0254*** G.5394 1.0815** G.539G 1.1309*** G.5924
Selo 0.2438 G.5111 0.2284 G.5693 -0.0570 G.6212
5 tG -0.0314 G.1431 -0.0014 G.1421 -0.3247** G.1428
Const -19.4669 1.1958 -19.8038 1.8215 -10.4907 1.3131
Число 1G4G2 1G4G2 1G4G2
наблюдений Log likelihood -13G3.G411 -1314.1135 -1352.G166
*-1%-й уровень значимости, **-5%-й уровень значимости, ***-10%-й
уровень значимости
По результатам оценивания первой модели были сделаны
следующие выводы. Рост дохода повышает вероятность наличия полиса ДМС так же, как и наличие работы. Как и ожидалось, часто обращающиеся к врачу индивиды с большей вероятностью будут иметь такой полис. Кроме того, вероятность наличия полиса ДМС среди индивидов,
состоящих в браке, при прочих равных условиях будет выше. Также значима оказалась переменная «место проживания»: проживание в городе или селе по сравнению с проживанием в поселке городского типа влечет за
собой повышение вероятности наличия у индивида полиса добровольного медицинского страхования.
Две следующие модели, содержащие только одну из двух переменных «логарифм дохода» или «работа», дали сходные результаты. При этом в модели, содержащей переменную «работа», также значим оказался «пол»: для мужчин
вероятность наличия полиса будет выше. Кроме того, вероятность наличия полиса ДМС в 2005 году по сравнению с 2004 годом будет ниже.
Таким образом, как и следовало ожидать, на наличие полиса ДМС главным образом влияют доход индивида, наличие работы, частота посещений врача, брачный статус и
проживание индивида в крупных городах. Тогда как те характеристики, которые должны были бы влиять на наличие полиса ДМС, оказались не значимы, в первую очередь это касается переменной «самооценка здоровья». Ведь выбор индивидом в пользу приобретения полиса как способа защиты своего здоровья не может не зависеть от того, насколько он уверен или нет в собственном здоровье.
То есть, факторы,
характеризующие здоровье индивида, которые реально должны бы влиять на выбор в пользу приобретения полиса ДМС, согласно оцененным моделям не столь существенны. На первый план выходит работа и доход. Судя по таким результатам, ДМС на сегодня не является тем страховым продуктом, выбор которого обусловлен
характеристиками здоровья индивида.
В результате трудно говорить о том, что ДМС сегодня действительно работает как рисковый вид страхования, как добровольный выбор самим
индивидом способа защиты своего здоровья. А значит, страховщикам для продвижения ДМС среди индивидов нужно менять свою тарифную политику, предоставлять новые программы страхования, которые могут действительно заинтересовать индии-вида.
Библиографический список
1. Анализ панельных данных в пакете «Stata». Т.А. Ратникова. Высшая школа экономики. - Москва, 2004.
2.Прикладной эконометрический анализ в статистическом пакете Stata. С.О. Колеников. Российская Экономическая Школа, 2000.
Bibliographic list
1.Panel data analysis in Stata. T.A. Ratnikova. High School of Economics. Moscow, 2004.
2.Applied econometric analysis in Stata. S.O. Kolenikov. New Economic School, 2000.