Бакуменко Л.П.
д.э.н., профессор, зав. кафедрой прикладной статистики и информатики, Марийский государственный
университет
Минина Е.А.
студент Марийского государственного университета
КЛАССИФИКАЦИЯ СТРАН ЕВРОПЫ ПО УРОВНЮ ЦИФРОВИЗАЦИИ
Ключевые слова: цифровизация, ИКТ, кластеры, кластерный анализ, дискриминантный анализ.
Keywords: digitalization, ICT, clusters, e-commerce, cluster analysis, discriminant analysis.
В последнее время цифровая экономика становится все более актуальной, она все сильнее влияет на жизнь каждого человека, на домашние хозяйства и предприятия. Ежедневная деятельность человека не мыслима без компьютера. В рабочей среде он значительно упрощает деятельность сотрудников, выполняя сложные задачи и решая бизнес-процессы за короткий промежуток времени. Современные технологии связи помогают работать с коллегами по всему миру, а с помощью Интернета предприятия могут получать заказы, решать проблемы с потребителем и контрагентом, проводить маркетинговые кампании. Для повышения своей конкурентоспособности организации вынуждены обучать работников ИКТ, а некоторые из них для оперативной обработки заказов предоставляют сотрудникам устройства с выходом в Интернет. Что касается индивидуального использования Интернета, люди активно применяют его не только на ПК, но и на мобильных телефонах и планшетах. Участвуют в различных онлайн-мероприятиях - потребляют контент, общаются, продают, покупают, используют онлайн-банкинг и др.
Цифровизация происходит по всему миру довольно быстрыми темпами. Mastercard и Школа права и дипломатии им. Флетчера Университета Тафтса представили рейтинг Digital Evolution Index 2017, в первую десятку которого вошли страны с передовой цифровой экономикой, шесть из которых европейские: Норвегия, Швеция, Швейцария, Дания, Финляндия, Великобритания [1].
В данной статье проведен анализ развития цифровизации в странах Европы. Анализ проводился с использованием методов многомерного статистического анализа. Для характеристики состояния, развития и применение цифровой экономики были рассмотрены данные 29 стран Европы. Использованы статистические данные, взятые с сайта Ев-ростата [2].
Были рассмотрены следующие показатели: доля предприятий, получившие заказы через компьютерные сети, % -1; доля предприятий, которые используют специалистов в области ИКТ,% - L; доля предприятий, которые проводили обучение по разработке/повышению квалификации ИКТ для своего персонала, % - ^ Э; доля лиц, имеющих базовые или выше базовых общие навыки в сфере ИКТ, % - стоимость продаж электронной коммерции (общий
оборот компаний с электронной коммерцией), % оборота - ^ 5; использование мобильных подключений к Интернету сотрудниками (доля наемных работников, которым предоставлено портативное устройство, с мобильным подключением к Интернету для использования в бизнесе), % от общей занятости - 6; использование социальных сетей для разработки имиджа или рыночной продукции предприятия, %-■*■': использование социальных сетей для привлечения
клиентов к разработке или инновации товаров или услуг, %-хВ: использование социальных сетей для сотрудничества с деловыми партнерами (поставщиками) и др. компаниями или другими организациями (государственными органами, неправительственными организациями и т.д.),% - интеграция внутренних процессов (доля предприятий, имеющих программный пакет ERP для обмена информацией между различными функциональными областями), % -
11С;процент лиц, использующих Интернет на настольном компьютере, % - Ml; процент лиц, использующих Интернет на ноутбуке или нетбуке, % - х 1- ; процент лиц, использующих Интернет на мобильном телефоне или смартфоне, % - tiï; процент лиц, использующих Интернет на интеллектуальном телевизоре (напрямую подключенном к Интернету)^ - ^ 14; доля лиц, совершавших Интернет-покупки, % - r доля домашних хозяйств с доступом к Интернету дома, %- х№ ;доля лиц, с индивидуальным использование облачных сервисов, % - х 1 ' ; процент использования Интернета за последний год, % - ^ is; процент использования компьютеров за последний год, % - 15.
Так как показателей, характеризующих электронную торговлю западных стран, достаточно много и они характеризуют различные сферы использования Интернет и ИКТ, было решено провести кластерный анализ всех переменных, представленных в исследовании. Наличие множества исходных признаков, характеризующих процесс функционирования объектов, заставляет отбирать из них наиболее существенные и изучать меньший набор показателей.
В качестве методов кластерного анализа были использованы как иерархические процедуры, которые используются при небольших объемах наборов данных (в нашем исследовании задействованы 29 стран Европы), так и метод к-средних. При использовании иерархических процедур для объединения стран в кластеры применены различные методы объединения, но наилучшее разбиение показал метод Варда. В этом методе в качестве целевой функции применяют внутригрупповую сумму квадратов отклонений. С использованием данного метода классификации были получены четыре группы, на которые были разбиты все показатели (рис. 1).
Рисунок 1.
Вертикальная дендрограмма разделения признаков
После проведения классификации все участвующие в анализе признаки были разбиты на четыре группы. В первую группу вошли показатели:Л'Х^: Л'^: Во вторую группу вошли признаки: JL'^; Х^:
В третью группу вошли показатели: jrl5. Четвертую группы сформировали показатели: -г^; х.г8:
V14.
Классификация переменных методом k-средних также разбила все переменные на четыре группы. Результат качества кластеризации методом k-средних можно проверить (т.е. оценить, насколько кластеры отличаются друг от друга), рассчитав средние значения для каждого кластера. При хорошей кластеризации должны быть получены сильно отличающиеся средние для всех измерений или хотя бы большей их части. В табл. 1 представлены данные средних значений по кластерам, проведенным методом k-средних.
Таблица 1
Средние значения по кластерам
Страны Центры кластеров
Кластер 1 Кластер 2 Кластер 3 Кластер 4
Бельгия 46,2 65,3 87,3 22,8
Болгария 22,2 33,7 65,7 9,5
Чехия 31,8 53,0 84,0 18,4
Дания 51,8 76,0 96,3 24,6
Германия 45,4 68,0 91,7 18,9
Эстония 36,8 62,3 88,7 14,5
Ирландия 38,6 57,3 82,7 27,8
Греция 32,0 44,7 70,0 11,1
Испания 40,6 59,0 81,3 19,3
Франция 40,4 57,3 86,3 16,6
Хорватия 28,6 50,7 70,0 17,1
Италия 30,8 40,0 71,7 12,1
Кипр 35,2 56,3 78,0 15,8
Латвия 30,8 48,0 81,0 12,6
Литва 34,6 51,0 77,0 17,0
Люксембург 52,6 79,3 96,7 18,3
Венгрия 29,0 54,0 79,3 15,4
Мальта 41,4 57,7 81,7 18,6
Нидерланды 56,2 78,7 96,3 25,0
Австрия 42,6 64,7 88,0 19,0
Польша 27,0 48,0 79,0 12,0
Португалия 29,0 48,7 69,7 17,1
Румыния 23,8 31,0 71,3 9,0
Словения 33,4 54,0 80,3 17,0
Словакия 34,4 58,3 82,3 15,4
Финляндия 47,6 75,0 94,0 26,6
Швеция 49,0 73,7 95,7 25,0
Великобритания 47,4 72,7 94,0 24,0
Норвегия 44,6 82,0 97,3 26,9
При классификации переменных, проведенных методом k-средних, получилась практически такая же классификация. Однако показатель Хе при разбиении первым (иерархические процедуры, метод Варда) способом оказался в первой группе, а при классификации вторым методом (методом k-средних) в четвертой группе.
Для проверки качества классификации и уточнения попадания переменной ге в свою (правильную) группу были использованы некоторые меры проверки качества классификации, в частности функционалы или критерии качества. Наилучшим по выбранному функционалу считают такое разбиение, при котором достигается экстремальное (min или max) значение целевой функции - функционала качества. Были использованы три вида функционалов. В качестве первого рассматривался алгоритм, при котором сумма квадратов расстояний до центров классов была бы минимальной:
k 2 -
F = Z2 d2(xi,x),
l=HeS,
где l - номер кластера (l=1,2,...,k), xt - центр l-го класса, Xj - вектор значений переменных для i-го объекта,
входящего в l-й кластер, d(Xj, Xi) - расстояние между i-м объектом и центром l-го кластера.
По данному алгоритму были получены следующие значения функционалов. Для разбиения методом Варда значение функционала F = 33637,4, для разбиения методом k- средних - Fx = 31333,9.
В качестве второго алгоритма качества разбиения использовалась сумма внутриклассовых расстояний между k 2
объектами - F2 = 2 2 d jj . В этом случае наилучшим следует считать такое разбиение, при котором дости-l=1 i, jeSl
гается минимальное значение F2^min, т.е. получены кластеры большой «плотности». Для разбиения методом Варда значение функционала F2 = 18874, для разбиения методом k- средних - F2 = 184882.
k Р 2
В качестве третьего алгоритма использовалась суммарная внутриклассовая дисперсия - F3 = 2 2 У , где
l=1 j=1 j
2
Уlj - дисперсия j-й переменной в кластере Sl. В разбиениях, при которых сумма внутриклассовых (внутригруппо-
вых) дисперсий будет минимальной считают оптимальными. F3^min. Для разбиения методом Варда значение функционала F3 = 6025,0, для разбиения методом k- средних - F3 = 5865,4.
Таким образом, в трех из трех функционалах качества подтверждается разбиение методом k-средних, то есть элемент Х6 следует отнести к четвертому кластеру.
Проанализируем полученные кластеры по содержанию сформировавших их переменных.
В первый кластер вошли показатели, отражающие в основном электронную торговлю. Он содержит преимущественно показатели, отражающие продажи и покупки в Интернете, использование социальных сетей для разработки имиджа или рыночной продукции предприятия, программный пакет ERP для обмена информацией между различными функциональными областями. Также нельзя не отметить применение Интернета на настольном компьютере для совершения различных операций: хранения файлов в облачных сервисах, что значительно упрощает работу устройств, экономя память, общения с представителями различных стран, работы и, конечно, для совершения покупок. Электронная торговля в последнее время становится все более актуальной и популярной: все большее число людей совершают покупки онлайн, находясь далеко от стационарных магазинов, так как это удобно, быстро, доступно и легко. Сейчас стало еще проще покупать в Интернете, так как у большинства поставщиков есть не только свои сайты, но и приложения, поэтому покупки можно совершать даже с телефона.
По оценкам eMarketer, в 2015 г. объем технологичного рынка в мире составил 1,8 трлн. долл. При этом доля Интернет-торговли в совокупном объеме розничной торговли постепенно растет, она увеличилась практически в 1,5 раза с 6,5% в 2012 г. до 8,6% в 2015 г [3]. Что касается товарной структуры рынка Интернет-торговли, преимущественный вес имеют электроника, товары для дома, автозапчасти, одежда.
В качестве глобальных Интернет-площадок выступают китайский AliExpress, который за Черную пятницу в 2016 первый миллиард долларов заработал всего за несколько минут после её старта. Большую распространенность имеют Amazon, Ebay, Walmart, H-H-Shop, Asos, M&Co, Yoox и др., занимающиеся продажей электротехники, одежды, обуви, продуктов питания онлайн.
Второй кластер содержит показатели, описывающие людей, имеющих базовые знания в области ИКТ, позволяющие им без труда использовать планшет или телефон. Третий кластер образован по трем признакам, показываю-
щим индивидуальное использование компьютера и Интернета дома. В четвертый кластер вошли показатели, характеризующие деятельность предприятия в информационной сфере.
Рассмотрим, какие страны Европы используют элементы электронной торговли, в разрезе переменных, сформировавших отдельные кластеры, и попробуем определить уровень Интернет-покупок в них. Для этого была проведена дополнительная кластеризация методом к-средних по переменным, сформировавшим первый кластер, а именно, Д"7: г г 1Г. Страны были разделены на четыре группы по объединяющим признакам (табл. 2).
Таблица 2
Страны, составляющие кластеры
1 кластер 2 кластер 3 кластер 4 кластер
Ирландия Чехия Болгария Бельгия
Испания Эстония Греция Дания
Кипр Франция Хорватия Германия
Мальта Латвия Италия Люксембург
Венгрия Литва Нидерланды
Польша Португалия Австрия
Словения Румыния Финляндия
Словакия Швеция
Великобритания
Норвегия
В первый кластер вошли всего четыре страны, небольшие по территории, однако преуспевающие по использованию социальных сетей для разработки имиджа или рыночной продукции предприятия. Второй кластер представлен в основном «сердцем Европы» - странами, находящимися по соседству с Чехией. Они отстают по нескольким показателям, но имеют довольно неплохие результаты по количеству людей, использующих Интернет на настольном компьютере. Третья группа в среднем имеет самые низкие результаты по данной классификации, прежде всего, из-за низкой доли Интернет-покупок и использования облачных сервисов. Третий кластер в основном представлен странами, умеренно развивающимися и не претендующими на звание «двигатели экономики», в отличие от стран четвертого кластера, в котором средний уровень превышает другие кластеры по четырем из пяти признаков. Можно сделать вывод, что именно в этих странах, преимущественно Бенилюкса и Скандинавии, сильнее всего развита электронная торговля. Средние значения по кластерам представлены на рис. 2 и в табл. 3.
График средних для казед. кп.
Я) -------
70
М
10
ПЕрвмен.
Рисунок 2. Средние значения по кластерам
Средние значения показателей первой группы по странам Европы
КластЕр 1 КластЕр 2 КластЕр 3 КластЕр 4
Таблица 3
Средние значения по кластерам
Переменные Содержание переменных Кластер 1 Кластер 2 Кластер 3 Кластер 4
использование социальных сетей для разработки имиджа или рыночной продукции предприятия, % 58,2 30,2 35,5 49,2
«Я доля предприятий, имеющих программный пакет ERP для обмена информацией между различными функциональными областями, % 34,7 27,5 32,4 38,0
X« процент лиц, использующих Интернет на настольном компьютере, % 28,0 44,5 35,8 47,8
*1Б доля лиц, совершавших Интернет-покупки, % 37,7 38,3 19,8 63,9
доля лиц с индивидуальным использование облачных сервисов, % 36,0 24,1 19,8 42,8
По второй группе Д"13) показателей, характеризующих уровень подготовленности людей в области
ИКТ, позволяющий им без труда использовать планшет или телефон: наличие базовых или выше базовых навыков ИКТ, использование Интернета на ноутбуке, мобильном телефоне. То есть данный кластер в основном представляет общее использование Интернета, преимущественно для создания запросов в поисковых системах и нахождения информации, это моментные операции, не требующие больших затрат времени. Посмотрим, как данные показатели участвуют в цифровой коммерции в разных странах Европы, т.е. определим уровень подготовленности (образованности) европейских людей в сфере ИКТ. Для этого была проведена кластеризация анализируемых стран. Использован метод к-средних (рис. 3), отражающий средние значения кластеров по объединяющим признакам.
График средник для кавд. кп.
юо-.-.---.-------т-,-.-.-,-.-.-.-
эо
ВО
20
10
Х4
Х13
КластЕр 1
КластЕр 2
КластЕр 3
КластЕр 4
Х12 Переден.
Рисунок 3.
График средних для 2 кластера переменных
По уровню образованности населения в сфере ИКТ все страны Европы были разделены на 4 кластера. В первый и второй кластеры вошли страны, имеющие средний уровень распространенности ИКТ среди населения. 3 кластер представлен 4 странами с наименьшей информационной образованностью. Это схожие друг с другом страны по уровню экономического развития. 4 кластер имеет самые высокие результаты. В этих странах уделяется повышенное внимание образованию населения в области ИКТ (в среднем 75,5%), помимо школ и университетов, организовывается специальное обучение на предприятиях и на специальных курсах. А также 80% населения использует Интернет на мобильном телефоне или смартфоне, что говорит о хорошем материальном достатке в данных странах и распространенности 3в и 4в (табл. 4).
Таблица 4
Страны, составляющие кластеры по второй группе переменных
1 кластер 2 кластер 3 кластер 4 кластер
Ирландия Бельгия Болгария Дания
Испания Чехия Греция Германия
Хорватия Эстония Италия Люксембург
Кипр Франция Румыния Нидерланды
Венгрия Латвия Финляндия
Мальта Литва Швеция
Португалия Австрия Великобритания
Польша Норвегия
Словения
Словакия
Третья группа признаков состоит из показателей, характеризующих использование компьютера и Интернета дома. Все страны по данным переменным объединились также в четыре группы (рис. 4).
1№ 100 96 90 S5 80 75 ГО &5 6С 55
Х16 Х19 X1S
Перемет
Рисунок 4.
График средних для третьего кластера переменных
Данный кластер представляет собой признаки, характеризующие индивидуальное использование Интернета на работе и дома. Первая группа включает в себя 10 стран, это преимущественно страны Прибалтики и Восточной Европы. Имеет средние значения по признакам, тем самым показывая средний уровень распространения Интернета в этих странах. Второй кластер представлен 5 странами: жители Бельгии, Великобритании, Эстонии и Австрии активно используют Интернет-ресурсы. 3 группа состоит из 6 стран, наименее развитых в данной сфере, это те страны, которые еще только встают на инновационный путь. 4 кластер - 8 стран Европы с самым сильным развитием Интернета (табл. 5).
Таблица 5
Страны, составляющие кластеры по третьей группе переменных
-и- Кластер 1 -в- кластер £ --» кластер 3 -а- Кластер -
1 кластер 2 кластер 3 кластер 4 кластер
Ирландия Бельгия Болгария Дания
Испания Чехия Греция Германия
Кипр Эстония Хорватия Люксембург
Латвия Франция Италия Нидерланды
Литва Австрия Португалия Финляндия
Венгрия Румыния Швеция
Мальта Великобритания
Польша Норвегия
Словения
Словакия
Для жителей всех стран данной группы наиболее популярными Интернет-ресурсами (в процентах от Интернет-пользователей) являются: чтение новостей в Интернете (70%), просмотр видео, музыка (39%), социальные сети (63%), Интернет-магазины (66%), онлайн-банкинг (59%).
В четвертый кластер стран вошли показатели, характеризующие, так или иначе, деятельность предприятия в информационной сфере: Л ;; XХ-: Хя: Четвертый кластер показывает использование цифровых техно-
логий в странах Европы в бизнесе. Они также были разделены на четыре группы (рис. 5).
График средних для кажд. кл.
20 10
X2 X3
X5 X6 Перемен.
X9 X14
Кластер 1 Кластер 2 Кластер 3 Кластер 4
70
60
50
40
30
0
X1
X8
Рисунок 5.
График средних для четвертого кластера переменных
Средние значения показателей четвертой группы отражены в табл. 6.
Таблица 6
Средние значения показателей четвертой группы переменных по странам Европы
Средние значения по кластерам
Переменные Содержание переменных Кластер 1 Кластер 2 Кластер 3 Кластер 4
доля предприятий, получившие заказы через компьютерные сети, % 17,86 22,13 12,29 28,14
Xг доля предприятий, которые используют специалистов в области ИКТ,% 22,00 21,88 15,14 24,43
доля предприятий, которые проводили обучение по разработке/повышению квалификации ИКТ для своего персонала, % 22,86 24,63 10,43 30,43
стоимость продаж электронной коммерции (общий оборот компаний с электронной коммерцией), % оборота 12,57 21,75 9,57 21,43
использование социальных сетей для привлечения клиентов к разработке или инновации товаров или услуг, % 21,00 23,00 17,14 46,14
использование социальных сетей для сотрудничества с деловыми партнерами (поставщиками) и др. компаниями или другими организациями (государственными органами, неправительственными организациями и т.д.),% 15,86 9,13 10,71 15,57
процент лиц, использующих Интернет на интеллектуальном телевизоре (напрямую подключенном к Интернету),% 17,29 10,38 11,14 18,14
Четвертый кластер переменных показывает использование цифровых технологий в бизнесе. Так, все страны Европы были разделены на четыре группы (табл. 7).
Таблица 7
Страны, составляющие кластеры по четвертой группе переменных
1 кластер 2 кластер 3 кластер 4 кластер
Испания Бельгия Болгария Дания
Хорватия Чехия Эстония Ирландия
Кипр Германия Греция Нидерланды
Литва Франция Италия Финляндия
Люксембург Венгрия Латвия Швеция
Мальта Австрия Польша Великобритания
Португалия Словения Румыния Норвегия
Словакия
Первая и вторая группы стран характеризуются тем, что в среднем на 17% у них освоены технологии в предпринимательстве. Третий кластер стран имеет самые низкие показатели, то есть пока на современном этапе развития экономики и бизнеса в этих странах применяются стандартные технологии. Четвертая группа стран имеет самые высокие результаты. В данную группу входят страны: Дания, Нидерланды, Великобритания, Норвегия, Швеция. Большое значение в развитии цифровых технологий данных стран оказывает то, что в этих странах в бизнесе большая доля предприятии проводила обучение по повышению квалификации ИКТ для своего персонала.
Для определения комплексного развития цифровой экономики в странах Европы были использованы составляющие всех четырех кластеров и найдены их пересечения (табл. 8).
Таблица 8
Пересечение стран по кластерам
1 кластер
Первая группа переменных: использование Интернета Вторая группа переменных: уровень образованности людей в области ИКТ Третья группа переменных: индивидуальное использование Интернета на работе и дома Четвертая группа переменных: деятельность предприятия в информационной сфере
Ирландия Ирландия Ирландия Испания
Испания Испания Испания Хорватия
Кипр Хорватия Кипр Кипр
Мальта Кипр Латвия Литва
Венгрия Литва Люксембург
Мальта Венгрия Мальта
Португалия Мальта Португалия
Польша
Словения
Словакия
2 кластер
Чехия Бельгия Бельгия Бельгия
Эстония Чехия Чехия Чехия
Франция Эстония Эстония Германия
Латвия Франция Франция Франция
Венгрия Латвия Австрия Венгрия
Польша Литва Австрия
Словения Австрия Словения
Словакия Польша Словакия
Словения
Словакия
3 кластер
Болгария Болгария Болгария Болгария
Греция Греция Греция Эстония
Хорватия Италия Хорватия Греция
Италия Румыния Италия Италия
Литва Португалия Латвия
Португалия Румыния Польша
Румыния Румыния
4 кластер
Бельгия Дания Дания Дания
Дания Германия Германия, Ирландия
Германия Люксембург Люксембург Нидерланды
Люксембург Нидерланды Нидерланды Финляндия
Нидерланды Финляндия Финляндия Швеция
Австрия Швеция Швеция Великобритания
Финляндия Великобритания Великобритания Норвегия
Швеция Норвегия Норвегия
Великобритания
Норвегия
Таким образом, в первую группу стран, имеющих пересечение по всем группам переменных, вошли Испания, Кипр и Мальта. Во второй кластер - Чехия и Франция. Третий кластер образовали соседствующие друг с другом страны Болгария, Греция и Италия. Они имеют схожий уровень экономического развития. Экономика Болгарии пережила немало драматичных моментов в течение 1990-х годов. Экономика страны испытала серьёзный кризис после роспуска СЭВ и ослабления хозяйственных связей с бывшими социалистическими странами. Уровень жизни населения значительно упал. Все эти страны сильно зависели и до сих пор зависят от «титанов» Евросоюза, в связи с этим развитие в них идет постепенно и последовательно. Четвертый кластер включает страны с передовыми цифровыми технологиями. Сильное развитие цифровой экономики в данных странах обусловлено несколькими причинами. Прежде всего, это связано с государственной политикой: Норвегия и Финляндия зафиксировали доступ к Интернету в своих законах как одно из прав, которое страна должна гарантировать своим гражданам. Дополнительное обучение, курсы, специальности 1Т в этих странах имеют большое распространение. Самые громкие примеры успеха - разработчик 1Р-телефонии 8куре или музыкальный стриминг-сервис 8роШу, позволяющий легально и бесплатно прослушивать музыкальные композиции, скоро станет доступным и в России. Также Стокгольм - один из лучших городов Европы для запуска стартапов в области цифровых технологий, то есть там созданы все условия для благоприятного развития 1Т-бизнеса.
Таким образом была получена качественная классификация, позволившая четко определить отнесение пятнадцати стран Европы в группы со схожими характеристиками внедрения и использования ИТК и цифровой экономики. Данную классификацию можно считать обучающими выборками и использовать ее для уточнения классификации оставшихся четырнадцати стран, используемых в анализе. Из всех 19 показателей были выбраны 7 наиболее значимых для развития цифровой экономики с учетом развития инновационного климата: доля предприятий, получивших заказы через компьютерные сети, % - Л-^; доля предприятий, которые проводили обучение по разработке/повышению квалификации ИКТ для своего персонала, % - А'э: доля лиц, имеющих базовые или выше базовых общие навыки в сфере ИКТ, % - использование мобильных подключений к Интернету сотрудниками (доля наемных работников, которым предоставлено портативное устройство, с мобильным подключением к Интернету для использования в бизнесе), % от общей занятости -л^; процент лиц, использующих Интернет на ноутбуке или нетбуке, % - х^; процент лиц, использующих Интернет на мобильном телефоне или смартфоне, % - Я и; процент лиц, использующих Интернет на интеллектуальном телевизоре (напрямую подключенном к Интернету),% - Х-^:
Исследование проводилось с помощью дискриминантного анализа. На первом этапе была проверена правильность распределения стран на группы (кластеры) по объединяющим признакам. Для проверки качества классификации используются различные статистики, связанные с дискриминантным анализом. Мы использовали значение статистики Уилкса и Б-статистики. Значение «лямбда» Уилкса (^Шз'б) -это отношение внутригрупповой суммы квадратов к общей сумме квадратов. Его значение варьирует от 0 до 1.
Значения статистики Уилкса близкое к 0 свидетельствуют о хорошей дискриминации, указывает на то, что средние групп различаются, близкое к 1 - о плохой дискриминации, средние групп не различаются. Значения ^статистики вычисляют с помощью однофакторного дисперсионного анализа, используя разбивку на группы независимой переменной. Каждый предиктор, в свою очередь, служит в ЛМОУЛ метрической зависимой переменной. Данный показатель должен быть достаточно большим. Для проведенной классификации стран Европы значение «лямбда» Уилкса (^Шз'б) равно 0,0018998 , значение Б-критерия - 5,583479, можем предположить, что данная классификация корректная. В целях проверки корректности обучающих выборок рассмотрены результаты классификационной мат-
рицы. Классификационная матрица содержит ряд правильно классифицированных и ошибочно классифицированных случаев (табл. 9).
Таблица 9
Матрица классификации
Матрица классификации
Процент правильности О 1:1 - р=,20000 О 2:2 - р=,13333 О 3:3 - р=,26667 О 4:4 - р=,40000
О 1:1 100,0000 3 0 0 0
О 2:2 100,0000 0 2 0 0
О 3:3 100,0000 0 0 4 0
О 4:4 100,0000 0 0 0 6
Всего 100,0000 3 2 4 6
Из классификационной матрицы можно сделать вывод, что объекты были правильно отнесены к выделенным группам, т.е. все 15 стран были распределены правильно по 4 кластерам и данную выборку можно использовать для классификации других стран.
Оставшиеся 14 стран были распределены по кластерам с помощью апостериорных вероятностей таким образом: новые случаи (страны) были отнесены к тем группам (классам), вероятность попадания в которые была максимальной (табл. 10).
Таблица 10
Апостериорные вероятности
Классифицируемые страны Наблюд. - Класс. С 1:1 - р=,20000 С 2:2 - р=,13333 С 3:3 - р=,26667 С 4:4 - р=,40000
Испания О 1:1 0,999983 0,000017 0,000000 0,000000
Кипр О 1:1 1,000000 0,000000 0,000000 0,000000
Мальта О 1:1 0,999869 0,000130 0,000000 0,000000
Чехия О 2:2 0,000000 1,000000 0,000000 0,000000
Франция О 2:2 0,008750 0,991250 0,000000 0,000000
Болгария О 3:3 0,000000 0,000000 1,000000 0,000000
Греция О 3:3 0,000025 0,000029 0,999946 0,000000
Италия О 3:3 0,000004 0,000000 0,999996 0,000000
Румыния О 3:3 0,000000 0,000000 1,000000 0,000000
Дания О 4:4 0,000000 0,000000 0,000000 1,000000
Нидерланды О 4:4 0,000000 0,000000 0,000000 1,000000
Финляндия О 4:4 0,000000 0,000000 0,000000 1,000000
Швеция О 4:4 0,000000 0,000000 0,000000 1,000000
Великобритания О 4:4 0,000000 0,000000 0,000000 1,000000
Норвегия О 4:4 0,000000 0,000000 0,000000 1,000000
Бельгия О 2:2 0,040052 0,959948 0,000000 0,000000
Германия О 1:1 0,999021 0,000979 0,000000 0,000000
Эстония О 2:2 0,007541 0,992459 0,000000 0,000000
Ирландия О 2:2 0,000000 1,000000 0,000000 0,000000
Хорватия О 1:1 0,997619 0,002380 0,000001 0,000000
Латвия О 3:3 0,000768 0,001684 0,997548 0,000000
Литва О 2:2 0,000002 0,999968 0,000030 0,000000
Люксембург О 4:4 0,000000 0,000000 0,000000 1,000000
Венгрия О 1:1 0,963487 0,036484 0,000029 0,000000
Австрия О 1:1 0,998460 0,001539 0,000000 0,000001
Польша О 2:2 0,000185 0,998562 0,001253 0,000000
Португалия О 1:1 0,955281 0,043931 0,000788 0,000000
Словения О 2:2 0,191527 0,808439 0,000033 0,000000
Словакия О 2:2 0,005399 0,994601 0,000000 0,000000
Используя апостериорные вероятности, можно сделать вывод, что в 1 кластер добавится 5 стран, во 2 кластер -7 стран, в 3 и 4 кластер по одной стране.
После добавления всех наблюдений и распределения их на кластеры, была составлена повторно матрица классификации, по которой определим правильность распределения всех стран в свои группы (табл. 11).
Таблица 11
Матрица классификации всех стран
Процент правильности О 1:1 - р=,27586 О 2:2 - р=,31034 О 3:3 - р=,17241 О 4:4 - р=,24138
О 1:1 100,00 8 0 0 0
О 2:2 88,88 1 8 0 0
О 3:3 100,00 0 0 5 0
О 4:4 100,00 0 0 0 7
Всего 96,55 9 8 5 7
По данной таблице видно, что во второй группе процент правильности составляет 88,88%, т.е. присутствует некорректное наблюдение (страна). Для нахождения ошибки был использован метод определения расстояний до центров кластеров - расстояние Махаланобиса, который позволяет отнести каждое наблюдение к той группе, расстояние до которой максимально (табл. 12).
Таблица 12
Квадраты расстояний Махаланобиса до центров кластеров
Наблюд. - Класс. О 1:1 - р=,27586 О 2:2 - р=,31034 О 3:3 - р=,17241 О 4:4 - р=,24138
Испания О 1:1 4,50 21,21 17,52 36,93
Кипр О 1:1 5,64 19,99 20,26 60,65
Мальта О 1:1 1,12 11,93 13,38 36,69
Чехия О 2:2 33,97 9,74 35,99 77,08
Франция О 2:2 7,91 1,48 17,54 43,99
Болгария О 3:3 19,49 30,61 4,14 90,54
Греция О 3:3 10,76 8,41 3,94 59,40
Италия О 3:3 23,33 36,41 7,82 81,91
Румыния О 3:3 25,70 37,14 3,17 89,20
Дания О 4:4 34,44 35,88 66,11 5,06
Нидерланды О 4:4 34,41 38,79 64,73 3,87
Финляндия О 4:4 38,82 41,39 67,41 6,34
Швеция О 4:4 42,58 46,01 64,79 4,69
Великобритания О 4:4 62,05 72,18 84,75 7,02
Норвегия О 4:4 55,06 72,12 95,31 9,10
Бельгия О 2:2 11,30 6,90 36,77 44,87
Германия О 1:1 6,82 14,84 29,66 34,75
Эстония О 2:2 13,73 6,76 29,04 37,63
Ирландия О 2:2 25,66 12,85 43,56 58,33
Хорватия О 1:1 4,16 17,86 12,49 38,88
Латвия О 3:3 11,88 12,44 7,74 36,65
Литва О 2:2 21,93 6,41 20,41 60,01
Люксембург О 4:4 38,92 55,15 66,71 10,49
Венгрия О 1:1 2,40 6,43 10,15 42,02
Австрия О 1:1 6,78 14,80 23,41 19,16
Польша О 2:2 19,03 8,59 17,97 47,44
Португалия О 1:1 6,68 11,81 14,17 65,85
*Словения О 2:2 8,54 8,84 16,28 48,98
Словакия О 2:2 12,33 1,97 22,76 50,19
Ошибка находится в строке по стране Словения. Это говорит о том, что она была неправильно отнесена ко 2 кластеру. Причина ошибки в том, что расстояние до центра 1 и 2 кластера в данном наблюдении практически идентичны (спорные кластеры). Отнесем Словению к 1 кластеру, построим повторно матрицу классификации (табл. 13).
Таблица 13
Отредактированная матрица классификации всех стран
Процент правильности О 1:1 - р=,31034 О 2:2 - р=,27586 О 3:3 - р=,17241 О 4:4 - р=,24138
О 1:1 100,0000 9 0 0 0
О 2:2 100,0000 0 8 0 0
О 3:3 100,0000 0 0 5 0
О 4:4 100,0000 0 0 0 7
Всего 100,0000 9 8 5 7
Таким образом, все страны отнесены в группы правильно. Так, к первому кластеру можно отнести 9 стран Европы: Испанию, Кипр, Мальту, Германию, Хорватию, Венгрию, Австрию и Словению. Ко второму кластеру - восемь стран: Чехию, Францию, Бельгию, Эстонию, Ирландию, Литву, Польшу и Словакию. К третьему кластеру отнесены пять стран: Болгария, Греция, Италия, Румыния и Латвия. Четвертый кластер составили семь стран: Дания, Нидерланды, Финляндия, Швеция, Великобритания, Норвегия и Люксембург.
Объединение стран в группы говорит о различных уровнях развития цифровизации в Европе. Первый кластер преимущественно представлен небольшими странами, которые постепенно переходят на жизнь с инновациями и современными технологиями, однако развиты они еще не так сильно и не повсеместно. Во второй кластер входят страны, занимающие довольно высокие места среди всех экономик Европы (Франция, Чехия, Бельгия, Польша). Это страны крупные по территории и численности населения, с активной внутренней и внешней политикой, что касается цифровых технологий, оснащение происходит, но так как у этих стран много других первоочередных целей и задач, циф-ровизация развивается не такими быстрыми темпами. Третий кластер представлен странами, в которых на данный момент цифровые технологии развиваются очень медленно, население преимущественно использует традиционные методы ведения экономики. Четвертый кластер - страны с самыми высокими результатами развития технологий.
В основном это скандинавские страны, в которых особое внимание уделяется человеку как личности, охране его труда и жизни, продумывается политика обеспечения населения Интернетом и гаджетами.
Таким образом, цифровая экономика стремительно развивается в глобальных масштабах [4]. Она является важнейшим двигателем инноваций, конкурентоспособности и экономического роста в мире [5]. Европейские страны имеют хорошие результаты в сфере цифровизации экономики, занимая высокие места в международных рейтингах. Взятые в анализе показатели отражают информатизацию общества в 29 странах Европы, распределяя их по различным признакам в группы, показывающие уровень развития диджитализации, или цифровизации в этих странах.
Цифровая экономика развивается в различных сферах жизни общества: на предприятиях, в домашних условиях, повышается уровень образованности населения в сфере ИКТ. Больше всего распространено использование Интернета и компьютера в домашних условиях (83,4% от всего населения Европы) [6]. Более половины населения имеют базовые навыки ИКТ, которые позволяет им без труда пользоваться ноутбуком и мобильным телефоном. Однако пока слабо развиваются предприятия в информационной сфере.
Самых активных Интернет-пользователей имеют Дания, Швеция и Люксембург, за ними следуют Нидерланды, Финляндия и Эстония. Румыния, Италия и Болгария являются наименее активными. С 2010 года доля пользователей Интернета, заказывающих товары и услуги в Интернете, увеличилась на 10 процентных пунктов, до 66% в 2016 году. Интерес к электронной торговле выше среди молодых, высокообразованных и работающих людей. И это естественно, так как они уже с детства привыкли использовать гаджеты.
Перспектива в сфере цифровизации хорошая, в ближайшие несколько лет количество людей, использующих Интернет и современные устройства, позволяющие быстрее выполнять работу, увеличится. Также изменится роль информации на предприятии, еще больше внедрится новых технологий, усовершенствующих функции сотрудников. В качестве точек развития можно предложить создание возможностей, ускоряющих переход бизнеса на цифровиза-цию, стимулирование применения цифровых технологий, создание новых бизнес-моделей, включающих в себя новые рабочие места; функционал работников, который охватывает Интернет-навыки, а также неплохой уровень владения компьютером, позволяющий без особого труда совершать запросы и быстро обрабатывать их.
Список литературы
1. Пресс-релизы: Mastercard и Школа права и дипломатии им. Флетчера представили рейтинг Digital Evolution Index 2017 // Центр новостей Mastercard. - https://clck.ru/EmR2k
2. Евростат // База данных. Официальный сайт. - http://ec.europa.eu/eurostat/data/database
3. Интернет-торговля. Обзор. - https://clck.ru/EmREh
4. Use of Internet and ePrivacy / European Commission. Europe's Digital Progress Report. 2017. - 17 p.
5. Manyika J. Digital Economy: Trends, Opportunities and Challenges // Extracts from McKinsey Global Institute Research. 2016. - 18 p.
6. Индикаторы цифровой экономики. - https://www.hse.ru/primarydata/ice2017
7. Росстат // База данных. Официальный сайт. - http://www.gks.ru/
8. Теория статистики: учебник / Под ред. Громыко Г.Л. - М.: ИНФРА-М, 2010. - 414 с.