Научная статья на тему 'МОДЕЛИРОВАНИЕ ИНДИКАТОРОВ ИНТЕРЕСА К ТЕКСТУ В СОЦИАЛЬНОЙ СЕТИ "ВКОНТАКТЕ"'

МОДЕЛИРОВАНИЕ ИНДИКАТОРОВ ИНТЕРЕСА К ТЕКСТУ В СОЦИАЛЬНОЙ СЕТИ "ВКОНТАКТЕ" Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
15
3
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАРКЕТИНГ / СОЦИАЛЬНЫЕ СЕТИ / ИНДИКАТОР ИНТЕРЕСА К ТЕКСТУ / АЛГОРИТМ РАСЧЁТА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Минюров Е.С.

В статье предлагается два вида индикаторов интереса к тексту, размещённому в социальной сети «ВКонтакте», и излагается алгоритм их расчёта. Приводится расчёт этих индикаторов на примере текста, опубликованного в одной из групп социальной сети «ВКонтакте»The paper proposes two types of interest indicators of text, placed in the social network "VKontakte", and suggests a procedure for their calculation. The calculation of these indicators is given as an example of a text published in one of the groups of the social network "VKontakte".

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «МОДЕЛИРОВАНИЕ ИНДИКАТОРОВ ИНТЕРЕСА К ТЕКСТУ В СОЦИАЛЬНОЙ СЕТИ "ВКОНТАКТЕ"»

• Возможность применить TDD имеется не всегда. Существуют задачи, которые невозможно решить только при помощи тестов. Например, это задачи в области безопасности данных и взаимодействия между процессами. Иногда бывает, что сложно сразу представить, как будет выглядеть работа модуля. Кроме того, невозможно решить с помощью TDD разработку баз данных, компиляторов и интерпретаторов языков программирования, невозможно автоматизировать тестирование графического интерфейса и распределенных объектов.

• Начальные требования не всегда могут быть понятны и правильно интерпретированы. В итоге можно получить ошибку в тесте, в коде и в понимании. Опасность ситуации заключается в том, что с виду кажется, что все работает правильно, ведь тесты проходят зеленый этап. На всем этом можно потерять массу времени.

• Необходимость поддержки тестов. База кода при стопроцентном покрытии тестами увеличивается почти в два раза. И кроме того всю эту базу необходимо документировать, поддерживать и проводить рефакторинг.

Не смотря на существование большого количества мощных инструментов разработки, программирование по-прежнему остается сложной работой. Методология разработки через тестирование позволяет разделить работу на много маленьких частей и сконцентрировать внимание программиста на единственной задаче. Таким образом, методика TDD позволяет разделить процесс разработки на элементарные режимы, избавляя от монотонности, предлагая быстро переключаться между этими режимами, что повышает эффективность разработки.

Использованные источники:

1. Кент Бек «Экстремальное программирование: разработка через тестирование» - СПб.: Питер, 2003. - 224 с

2. Многофункциональный сайт Хабрахабр [Электронный ресурс] / URL: http: //habrahabr.ru/

Минюров Е.С. магистрант 2 курса кафедра «Бизнес-информатика» Уральский государственный экономический университет

Россия, г. Екатеринбург МОДЕЛИРОВАНИЕ ИНДИКАТОРОВ ИНТЕРЕСА К ТЕКСТУ В СОЦИАЛЬНОЙ СЕТИ «ВКОНТАКТЕ»

Аннотация

В статье предлагается два вида индикаторов интереса к тексту, размещённому в социальной сети «ВКонтакте», и излагается алгоритм их расчёта. Приводится расчёт этих индикаторов на примере текста, опубликованного в одной из групп социальной сети «ВКонтакте».

Ключевые слова

Маркетинг, социальные сети, «ВКонтакте», индикатор интереса к тексту, алгоритм расчёта.

Annotation

The paper proposes two types of interest indicators of text, placed in the social network "VKontakte", and suggests a procedure for their calculation. The calculation of these indicators is given as an example of a text published in one of the groups of the social network "VKontakte".

Keywords

Marketing, social networks "VKontakte", interest indicator of text, calculation algorithm.

В настоящее время актуальна проблема продвижения сообществ в социальных сетях, в том числе в сети «ВКонтакте». Компании создают и развивают группы, публичные страницы и страницы мероприятий для поиска клиентов. Эта деятельность получила название SMM (Social Media Marketing), что можно перевести на русский как «Маркетинг с помощью социальных платформ».

Главная цель SMM заключается в создании такого контента, который распространялся бы без организаторов сообщества среди целевой аудитории. Поэтому закономерно, что надо уметь оценивать реакцию подписчиков на контент. В этой работе выделяются индикаторы интереса к тексту.

В качестве индикаторов используются следующие величины:

• поверхностный отклик - количество подписчиков, которые отметили, что им нравится данная публикация;

• желание поделиться - количество подписчиков, которые поделились данной публикацией.

Была поставлена цель разработать алгоритм прогнозирования реакции подписчиков на текстовый контент. Полученный алгоритм рассчитан на поведение подписчиков групп социальной сети «ВКонтакте». Кроме того, в анализируемом сообществе должна уже быть дана реакция не менее чем на 10% публикаций.

Предполагается, что реакция на текст есть суперпозиция реакций на отдельные слова этого текста. Таким образом, одной из задач была задача нахождения реакции на отдельно стоящее слово без учёта знаков препинания. Кроме того, так как существует бесконечное множество чисел, записанных с помощью цифр, то было решено исключить и их, оставив в рассмотрении числа, записанные словами.

В качестве меры реакции было выбрано количество человек, которое отреагировало на данное слово. Первой мыслью было сопоставить слову число из частотного словаря. Но дело в том, что частоты, указанные там, не

отражают реального интереса к данному слову. Было выдвинуто предположение, что с помощью поисковых систем можно узнать реальный интерес к словам, так как люди вводят поисковый запрос, имея при этом внутреннюю мотивацию, то есть эти слова им были в той или иной степени интересны им самим.

Таким образом, источником для получения реакции на отдельное слово стал сервис «Подбор слов» компании «Яндекс», который находится в Интернете по адресу https://www.wordstat.yandex.ru.

Экспериментально установлено, что суперпозиция интереса к тексту лучше всего описывается средним гармоническим произведением десятичного и натурального логарифма реакции на каждое слово, на которое существует реакция пользователей. То есть, если с помощью вышеупомянутого сервиса было установлено, что эту самостоятельную или служебную часть речи никто не искал, то следует исключить из рассмотрения это слово.

Предполагается, что будет целесообразно учитывать опыт предыдущих публикаций в данном сообществе, поэтому вводим в рассмотрение такую величину, как коэффициент общей заинтересованности. Он показывает, какую часть аудитории в целом интересует публикуемый текстовый контент. К сожалению, мы затрудняемся вывести её строго, поэтому разобьём эту проблему на части и пойдём наиболее простым путём.

Пусть известны реакция на каждую публикацию в данном сообществе и количество подписчиков. Тогда возможно разделить значение одной из величин реакции, указанных в начале этой статьи, на количество подписчиков, рассчитав таким образом так называемый коэффициент частной заинтересованности (далее КЧЗ). Значит, можно вычислить их суперпозицию, которая и является коэффициентом общей заинтересованности.

Несмотря на затруднение в расчёте коэффициента общей заинтересованности, можно выбирать один из следующих вариантов его расчёта:

• вычислить среднее арифметическое КЧЗ;

• найти максимальный КЧЗ;

• найти минимальный КЧЗ;

• найти моду КЧЗ;

• найти медиану КЧЗ.

Для предсказания величины поверхностного отклика R были разработаны эмпирическая функция, которую можно представить формулой 1:

я =

где

n

I

р р•([1вшах{хг}])2 • Я?1

1х •1п х

г < 0,005

n

I

1

р ~

Р 1п--Я,

100 2

•1п

0,005 < г < 0,01

n

I

1

р 1п р • ([1§шах{хг }])2 • я

•1п

0,01 < г < 0,1

n

I

1

р 1п р • ([1§шах{хг }])2 • Я,

•1п

г > 0,1

(1)

Я - величина поверхностного отклика, человек; К- количество слов, на которые есть реакция; х1 - реакция на 1-е слово, человек; Р - количество подписчиков в группе, человек; г- коэффициент общей заинтересованности;

Я - коэффициент отклика 1-го уровня, Я1 = 0,°0000015;

Я

- коэффициент отклика 2-го уровня,

Я =0,00000906517711257657.

• Яз - коэффициент отклика 3-го уровня, Яз = 0,°00001;

• Я4 - коэффициент отклика 4-го уровня, я = 0,000002.

Для удобства представления результата можно сформировать диапазон от 0,66Я до 1,33Я. Иными словами, прогноз считается верным, если

Я

фактическое значение величины поверхностного отклика ф входит в диапазон Я ± 33%.

Для предсказания минимального значения величины «желание поделиться» W была разработана эмпирическая функция, которую можно

представить формулой 2:

min{log20 x.. • lnx.. }log140 (rl )■ RL ■ W J r < 0,005

W

где

min{log20 ■ ln}lg(rl )■ R -w~2 j

min{log20 X - lnx }l0g20 (rL )- RL - W3

min{log20 x. ■ lnx. }log20 (rl )■ Rl ■ W4

0,005 < r < 0,01 0,01 < r < 0,1 r > 0,1

xi - реакция на i-е слово;

г- коэффициент общей заинтересованности;

nl _ А fifij)

r - 0,uur - нижняя граница поверхностного отклика, человек; W - коэффициент желания поделиться 1-го уровня, Wi = 0,001;

W,

- коэффициент желания поделиться 2-го уровня,

W = 0,000032

W3 - коэффициент желания поделиться 3-го уровня, W3 0,0011 •

W

- коэффициент желания поделиться 4-го уровня, W4 0,007.

Формулы (1) и (2) дают прогноз о том, какими будут поверхностный отклик и желание поделиться в сообществе при заданном количестве подписчиков и при заданном коэффициенте общей заинтересованности. Важно понимать, что эти формулы описывают ситуацию, когда данную публикацию просмотрели не менее 40% подписчиков.

Итак, сделаем резюме вышесказанного.

Входные данные:

1. текст;

2. коэффициент общей заинтересованности;

3. количество подписчиков;

4. словарь;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. список слов, на которых нет реакции.

Опишем последовательность действий для получения индикатора интереса к тексту:

1. удалить все знаки препинания;

2. удалить все цифры десятеричной системы счисления;

3. удалить все слова, на которых нет реакции;

4. рассчитать поверхностный отклик по формуле (1);

5. рассчитать желание поделиться по формуле (2).

Выходные данные:

1. поверхностный отклик;

2. желание поделиться.

Следует понимать, что для реализации алгоритма требуется специально составленный словарь. Также необходимо будет обработать деление на ноль, в случае, если «знакомых» программе слов не будет. Кроме того, нужно вспомнить определение логарифма.

Приведём пример использования алгоритма.

Рассмотрим следующую публикацию в сообществе http://vk.com/pub.vorobushek: «То состояние, когда жареной картошечки хочется больше, чем найти свое место в этом мире». Количество подписчиков Р на момент расчёта равно 317484 человека. Коэффициент общей заинтересованности г равен 0,0038. Удалим из текста публикации все слова, на которые нет реакции. Сопоставим каждому слову число, выражающее реакцию (Таблица 1) людей на данное слово, сделав промежуточные расчёты.

Таблица 1 — Реакция людей на слова

№ п/п Слово Число, х1 1п(х, Мх,) 1п(х, )1°Б20 (х,) 1

1п(х, )

1 состояние 1865210 90,54231165 69,59279337 0,01104456

2 жареной 650555 77,81418483 59,80967779 0,012851127

3 картошечки 5644 32,40751528 24,9091223 0,03085704

4 хочется 731972 79,19118663 60,86807137 0,012627668

5 больше 15024124 118,5976446 91,15673354 0,008431871

6 найти 10099033 112,9646759 86,82711104 0,008852325

7 место 6286381 106,4214582 81,79785138 0,009396601

8 мире 19867652 122,6424585 94,26566561 0,008153783

Теперь вычислим величину поверхностного одобрения по формуле (1):

,=11 1

I , 1 , ч = 0,102214975

11п(х М*,) ,

[^ шах{х }] = 7

я =

n

1

N

И^Б ■ 1п х 8

р р•(1вшах{х, })2 • я

0,102214975

• 317484- 1Б(3 17484)• 72 • 0,00000015

= 1004

человека

Фактическое поверхностное одобрение Яф=1004 человек. Относительное отклонение прогноза составило примерно 20,32%. Теперь рассчитаем желание поделиться: Я = [0,66Я] = [0,66 • 1004] = 662человек

Ж = [шш{[о§20 * • 1п * }1°б140 (Я1 )• Яь • Щ ] = [24,90912231°б140 662 • 662• 0,001] = 21 человек

Фактическое желание поделиться Wф=39 человек. Относительное

отклонение прогноза составило примерно 46,15%. Причём расчётное значение W не превышает фактическое.

С программной реализацией данного алгоритма можно ознакомиться на авторском сайте, который расположен в сети Интернет по адресу forecastсайт100процентов.рф. За развитием алгоритма можно следить в социальной сети «ВКонтакте» в группе «Индикатор интереса к тексту», которая расположена по адресу http://vk.com/indicator_interest_text (http://vk.com/club107322063).

Использованные источники: 1. Халилов, Д. Маркетинг в социальных сетях / Дамир Халилов. - 2-е изд. -М.: Манн, Иванов и Фербер, 2014. - 240 с.

Мухутдинова Д.Т. студент 3 курса

факультет «Информационные системы и Технологии»

Штанько А.О. студент 3 курса

факультет «Телекоммуникаций и Радиотехники»

ФГБОУВО ПГУТИ Россия, г. Самара

ЗАЩИТА ДОКУМЕНТОВ С ИСПОЛЬЗОВАНИЕМ ЭЛЕКТРОННОЙ

ПОДПИСИ

Анотация: В данной статье рассматривается принцип создания и проверки электронной подписи. А также использование электронной подписи в реальной жизни.

Ключевые слова: электронная подпись, шифрование, хэш-функция.

Abstract: the principle of creating and verifying of digital signature and the use of it in real life is considered in this article.

Keywords: digital signature, encryption, hash function.

В обыденной жизни каждому человеку постоянно приходится иметь дело с различными документами, но не всегда информация, которая представлена в них, достоверна. Подделыванием письменных документов начали заниматься с давних времен. И хотя изобретение Иоганна Гутенберга повысило степень защиты документов - это все равно не остановило фальсификаторов, а даже повысило масштаб подделки в промышленных объемах.

Электронная подпись (ЭП) - параметр электронного документа, позволяющий установить отсутствие несанкционированных изменений информации в электронном документе с момента формирования электронной подписи, и подтвердить принадлежность электронной подписи владельцу.

Закрытый ключ - уникальная последовательность символов, с помощью которой генерируется каждая ЭП и подписывается электронный

i Надоели баннеры? Вы всегда можете отключить рекламу.