Научная статья на тему 'ФОРМИРОВАНИЕ КОНТЕКСТНОЙ РЕКЛАМЫ НА ОСНОВЕ АНАЛИЗА СЕТЕВОЙ АКТИВНОСТИ ПОЛЬЗОВАТЕЛЯ'

ФОРМИРОВАНИЕ КОНТЕКСТНОЙ РЕКЛАМЫ НА ОСНОВЕ АНАЛИЗА СЕТЕВОЙ АКТИВНОСТИ ПОЛЬЗОВАТЕЛЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
133
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОНТЕКСТНАЯ РЕКЛАМА / ВЕБ-СТРАНИЦА / СИНТАКСИЧЕСКИЙ АНАЛИЗ ТЕКСТА / СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТА / АВТОМАТИЗИРОВАННАЯ СИСТЕМА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шлыков В.А., Гордеева О.А.

Статья посвящена проектированию и реализации автоматизированной системы, предназначенной для формирования рекламного предложения из имеющегося набора. Рекламное предложение составляется в соответствии с алгоритмами формирования контекстной рекламы. Для этого система анализирует сетевую активность пользователя - список посещенных пользователем веб-страниц, их тематику, ключевые слова текста, размещенного на веб-странице, затем формирует релевантное рекламное предложение. При этом сетевые пользователи объединяются в группы в соответствии с определенными параметрами - интересы, сферы деятельности, возрастная группа и т.д. Представлены характеристики контекстной рекламы, а также методика синтаксического и семантического анализа текста, применяемого для анализа веб-страницы. В статье также описывается проект и экранные формы разрабатываемой системы. Данная разработка предназначена для использования сетевыми рекламными агентствами, для оценки эффективности контекстной рекламы, а также в целях статистического анализа посещаемости веб-страниц.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ФОРМИРОВАНИЕ КОНТЕКСТНОЙ РЕКЛАМЫ НА ОСНОВЕ АНАЛИЗА СЕТЕВОЙ АКТИВНОСТИ ПОЛЬЗОВАТЕЛЯ»

электрически параллельно собранных шайб позволяет иметь на наружных обкладках пакетного пье-зокерамического преобразователя одинаковый потенциал, что исключает возможность короткого замыкания источника питания через элементы устройства и упрощает задачу электроизоляции обкладок пакетного пьезокерамического преобразователя от концентратора и корпуса.

Контроль степени затяжки, основанный на достижении силы затяжки в точке предела упругих деформаций материала резьбовых деталей, практически не зависит от трения, позволяет использовать крепежные детали меньшего диаметра и более низкого класса точности и обеспечивает минимальный разброс силы затяжки.

ЛИТЕРАТУРА

1. Гусаков Б.В. Отечественные и зарубежные методы и средства тарированной затяжки резьбовых соединений//Сборка в машиностроении, приборостроении. № 9, 2003, С.12-24.

2. Повышение работоспособности резьбовых соединений путем применения ультразвука при обработке и сборке: монография / Б.Л. Штриков, В.В. Головкин, В.Г. Шуваев, И.В. Шуваев. - М.: Машиностроение, 2009. - 125 с.

3. Шуваев В.Г., Шуваев И.В. Контроль качества затяжки резьбовых соединений при ультразвуковой сборке по динамическим характеристикам// Международный симпозиум «Надежность и качество», Пенза,25-31 мая, 2013. 2 том. С.276-278.

4. Шуваев В.Г. Адаптивная система управления ультразвуковой запрессовкой с оценкой качества формируемых соединений// Международный симпозиум «Надежность и качество», Пенза,25-31 мая, 2013. 2 том. С.278-279.

5. Шуваев В. Г. Методология адаптивной ультразвуковой сборки резьбовых соединений гарантированного качества // Международный симпозиум «Надежность и качество», 2018. Пенза,21-31 мая, 2018. С.201-204.

6. Основы измерений. Датчики и электронные приборы: Учебное пособие/ К. Классен - 4-е изд. -Долгопрудный: Издательский Дом «Интеллект», 2012. - 352 с. С.103-107.

7. Патент РФ на изобретение № 2502591. Способ ультразвуковой сборки резьбовых соединений / В.Г. Шуваев, И.В. Шуваев // 27.12.2013. Бюл. № 36.

УДК 004.021, 659.11, 004.42 Шлыков В.А., Гордеева О.А.

ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева», Самара, Россия

ФОРМИРОВАНИЕ КОНТЕКСТНОЙ РЕКЛАМЫ НА ОСНОВЕ АНАЛИЗА СЕТЕВОЙ АКТИВНОСТИ ПОЛЬЗОВАТЕЛЯ

Статья посвящена проектированию и реализации автоматизированной системы, предназначенной для формирования рекламного предложения из имеющегося набора. Рекламное предложение составляется в соответствии с алгоритмами формирования контекстной рекламы.. Для этого система анализирует сетевую активность пользователя — список посещенных пользователем веб-страниц, их тематику, ключевые слова текста, размещенного на веб-странице, затем формирует релевантное рекламное предложение. При этом сетевые пользователи объединяются в группы в соответствии с определенными параметрами — интересы, сферы деятельности, возрастная группа и т.д. Представлены характеристики контекстной рекламы, а также методика синтаксического и семантического анализа текста, применяемого для анализа веб-страницы. В статье также описывается проект и экранные формы разрабатываемой системы. Данная разработка предназначена для использования сетевыми рекламными агентствами, для оценки эффективности контекстной рекламы, а также в целях статистического анализа посещаемости веб-страниц. Ключевые слова:

КОНТЕКСТНАЯ РЕКЛАМА, ВЕБ-СТРАНИЦА, СИНТАКСИЧЕСКИЙ АНАЛИЗ ТЕКСТА, СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТА, АВТОМАТИЗИРОВАННАЯ СИСТЕМА

Текстовая КР представляет собой текст с гиперссылкой на рекламируемый сайт. Выглядит невыгодно по сравнению с другими видами КР и отличается наименьшей эффективностью.

Баннерная КР - это форма с графическим контентом и возможной небольшой подписью, содержит в себе информацию, удовлетворяющую запросу пользователя.

Видео КР - видеоролик с рекламным обращением к пользователю, обычно размещается на сайтах с видеоконтентом.

Существует еще одна классификация КР - по типам. Одним из типов КР является реклама в поисковых системах, которые сразу после пользовательского запроса выдают в первых двух-трех результатах рекламные предложения, соответствующие запросу пользователя. Вторым типом КР является тематическая КР. Такая реклама размещается на сторонних сайтах, может содержать информацию схожую с содержанием сайта или отличающуюся от его тематики [2].

Две описанных классификации являются перекрестными. Разрабатываемая автоматизированная система содержит базу данных с рекламными предложениями различных типов и видов, при этом конкретное рекламное предложение формируется только на основе семантики предварительно посещенных страниц, без конкретизации типа КР.

Как и у любой рекламы, у КР есть показатели эффективности, такие, как отношение числа кликов по объявлению к числу его показов, средняя выручка в расчете на одного абонента, коэффициент возврата инвестиций, и др.

Анализ активности пользователя в сети. Рекламное предложение формируется системой из базы данных на основе анализа тех веб-страниц,

Введение. В современном мире среднестатистический человек проводит значительное время в сети Интернет, просматривая новости, персональные аккаунты, электронную почту, осуществляя иную так называемую сетевую активность, в том числе, выполняя поиск необходимой информации с помощью запросов в поисковых системах, посещая сайты, переходя по предложенным ссылкам или вводя адрес нужного сайта в адресную строку Интернет-браузера. Баннеры, встроенные в текст просматриваемой пользователем веб-страницы, отображаются при этом не случайным образом, а показываются пользователю на основе посещенных им до этого веб-страниц.

Контекстная реклама (КР) - тип Интернет-рекламы, в которой рекламное объявление показывается в соответствии с содержанием, контекстом интернет-страницы [1]. Каждый день люди ищут в интернете различные вещи - службы ремонта электроприборов, музыкальные инструменты, магазины одежды, технологию ремонта квартиры - КР предложит уместное решение в ответ.

Целевыми пользователями разрабатываемой автоматизированной системы формирования контекстной рекламы являются рекламные агентства, анализирующие активность пользователя сети и предлагающие соответствующую КР, оптимизирующие рекламную кампанию в соответствии с интересами потребителей Интернет-контента. Система реализует алгоритм формирования КР на основе синтаксического и семантического анализа текста вебстраниц, предварительно посещенных пользователями сети.

Классификация контекстной рекламы.

КР делится на три вида - текстовая, баннерная и видео.

которые предварительно были просмотрены пользователем сети. Система проводит последовательно синтаксический разбор текстового содержимого страницы, а потом его семантический анализ, результатом которого является набор ключевых слов, характеризующих содержание текста страницы. Затем система сопоставляет полученные ключевые слова с категорией рекламных предложений в базе данных, и формирует релевантное рекламное предложение пользователю сети.

Сначала система проводит парсинг текста вебстраницы, отбрасывая метасимволы, разметочные теги, специальные обозначения. В результате будет получен набор слов, составляющий суть контента страницы. Затем этот полученный набор слов приводится к единообразному виду.

Существует два наиболее распространенных способа выделения основы слова - стэмминг и лемма-тизация. В разрабатываемой системе применяется второй метод.

Лемматизация - это процесс приведения слова к так называемой, лемме. Лемма -первоначальная словарная форма слова. Для разных частей речи формат леммы различен, из-за особенности этой самой части речи:

существительное - именительный падеж, единственное число;

глагол - неопределенная форма (инфинитив); прилагательное - именительный падеж, мужской род, единственное число [3].

Общий алгоритм лемматизации выглядит следующим образом:

Поиск суффикса, переход к шагу 2. Поиск правила удаления или замены суффикса на нормализованный, переход к шагу 3 при нахождении правила, конец работы алгоритма при отсутствии правила, вывод слова.

Выполнение правила, вывод слова, конец работы алгоритма.

С помощью описанного процесса система получает набор ключевых слов для текстового контента страницы, посещенной пользователем. Затем пользователю подбирается рекламное предложение, соответствующее сформированному набору ключевых слов. Рекламные предложения каталогизированы и хранятся в базе данных, каждому каталогу соответствует свой набор ключевых слов, с которым и соотносятся ключевые слова посещенной страницы. Таким образом, для конкретного сетевого пользователя подбирается индивидуальное предложение КР.

Для оптимизации и таргетирования предложений КР с целью проведения рекламных компаний, а также подсчетов статистики посещений и анализа контингента, система предполагает объединение пользователей сети в целевые группы (аудитории) по общим сферам деятельности, интересам, возрастной группы и т.д. [4]. Для оценки работоспособности системы при группировании пользователей в тестовом режиме группу (аудиторию) пользователю задается принадлежность аудитории администратором системы. В дальнейшем система будет относить пользователя к определенной группе автоматически, с учетом результатов анализа его предварительной сетевой активности. Предполагается, что система будет собирать статистику посещений пользователя и сохранять её показатели для аудитории, к которой он относится, и на основе интегральных данных аудитории будет формировать рекламное предложение. При этом, для оценки эффективности работы системы, пользователь будет оценивать каждое, выданное ему системой, рекламное предложение по показателю релевантности его сетевой активности. На данном этапе пользователь просто указывает, релевантно ли рекламное предложение или нет.

Проектирование и реализация автоматизированной системы.

Разрабатываемая автоматизированная система имеет трехуровневую архитектуру, ее структурная схема представлена на рисунке 1.

Сервер БД состоит из подсистемы взаимодействия с сервером приложений, которая отвечает за

корректную интерпретацию и выполнение команд с сервера приложения к базе данных, также на сервере БД размещена сама база данных системы.

Сервер приложения состоит из следующих подсистем:

- подсистема взаимодействия с БД, которая отвечает за формирование и отправку запросов к базе данных;

- подсистема взаимодействия с клиентом, которая отвечает за получение запросов клиента и распределение их по соответствующим подсистемам, и за обратную связь с клиентом;

- подсистема авторизации, которая контролирует проверку данных учетных записей авторизующихся пользователей системы;

- подсистема сбора информации об активности пользователя, которая получает адреса веб-страниц из истории браузера, считывает весь текст с указанных веб-страниц и передает следующей подсистеме;

- подсистема анализа активности пользователя, которая преобразует текст, полученный от предыдущей подсистемы, в набор ключевых слов с помощью метода лемматизации. Полученный набор которые затем передается следующей подсистеме;

- подсистема подбора рекламного предложения, которая рассчитывает, какое рекламное предложение из какой категории наилучшим образом соответствует набору ключевых слов, полученному от предыдущей подсистемы;

- подсистема генерации интерфейса отвечает за отправку подсистеме взаимодействия с пользователем команды на формирование пользовательского интерфейса, соответствующего сформированному рекламному предложению;

- подсистема анализа результатов работы приложения служит для сбора статистики и анализа результатов предыдущих запусков системы.

Клиент состоит из следующих подсистем:

- подсистема взаимодействия с сервером, которая отвечает за отправку запросов на сервер, принятию и правильной интерпретации ответов с сервера;

- подсистема визуализации, которая отвечает за отрисовку графики в пользовательском интерфейсе;

- справочная подсистема, которая предназначена для работы со вспомогательной информацией для пользователя;

- подсистема ввода/вывода, которая отвечает за взаимодействие с пользователем.

Диаграмма вариантов использования разрабатываемой системы для пользователя представлена на рисунке 2. После загрузки приложения он может авторизоваться, посмотреть справочную информацию и получить рекламное предложение на основе своей активности в сети. В процессе авторизации предусмотрен процесс регистрации нового пользователя в системе. При получении рекламного предложения пользователь может изменить параметры анализа системы и должен оценить рекламное предложение после его выдачи.

На рисунке 3 представлена диаграмма вариантов использования для администратора, который кроме всех доступных пользователю действий может также работать с базой данных системы.

Стартовой экранной формой разрабатываемой системы является форма авторизации, которая представлена на рисунке 5а. Для каждого поля формы существуют необходимые соответствия, которые должны выполняться, например они не должны быть пустыми.

После успешного прохождения авторизации пользователь попадает в форму работы пользователя, которая представлена на рисунке 5б. Система считывает адреса веб-страниц из истории браузера, на текущем этапе анализируется 1 или 2 страницы. На рисунке 5в представлен результат работы системы и сформированное рекламное предложение после посещения пользователем веб-страницу «Красный гид Мишлен» (URL : https://ru.wikipedia.org/wiki/Красный_гид_«Ми-шлен»). На рисунке 5г представлена форма работы

администратора, на которой он дополнительно может работать с базой данных системы, в частности, добавлять и удалять рекламные предложения,

редактировать категории рекламных предложений и соответствующие им ключевые слова.

Рисунок 2 - Диаграмма вариантов использования системы для пользователя сети

Рисунок 3 - Диаграмма вариантов использования для администратора

На рисунке 4 представлена логическая модель данных системы.

■ Окно работы пользователя

а) Экранная форма авторизации, б) Форма работы пользователя

--^ кол-во анал!

Шо©

Кол-во анализируемых страниц

шш

ШАВАРМА СКРАСИТ" ★ ЧАС ДОСУГА ★ Д

СЕБЯ ПОРАДУЕШЬ И ДРУГА

©

в) Выдача рекламного предложения, г) Форма работы администратора Рисунок 5 - Экранные формы системы

Заключение. В работе описана разрабатываемая автоматизированная система, предназначенная для формирования рекламного предложения определенного типа контекстной рекламы, исходя из результатов анализа активности пользователя в сети. Были рассмотрены классификации контекстной рекламы, описаны этапы анализа сетевой активности пользователя, методы текстового анализа, используемые для получения набора ключевых слов, характеризующих текстовое содержимое веб-страницы, а также методика формирования рекламного предложения путем сопоставления ключевых слов для каталога рекламы и текстового контента посещенных пользователем веб-страниц. Сетевые пользователи группируются в так называемые «аудитории» в соответствии с некоторыми характеристиками - интересами, возрастом, сферой деятельности и т.д. Релевантность сформированного рекламного предложения на данном этапе оценивается самим пользователем. Разработанная автоматизированная система имеет трехслойную клиент-серверную архитектуру, реализована на языке программирования Java с использованием библиотек jsoup для парсинга текста страницы и russianmorphology для реализации алгоритма лемматизации, а также СУБД PostgreSQL. В данный момент автоматизированная система проходит тестовую эксплуатацию, в дальнейшем планируется автоматическое отнесение пользователя к аудитории на основе анализа статистики его активности, а также оценка релевантности сформированного рекламного предложения..

ЛИТЕРАТУРА

1. Контекстная реклама [Электронный ресурс] // Википедия: электронная энциклопедия. [20012018]. URL: https://ru.wikipedia.org/wiki/Контекстная_реклама (21.03.2020).

2. Виды контекстной рекламы и особенности их использования [Электронный ресурс] // Энциклопедия результативного маркетинга. [2020]. URL: https://blog.zolle.ru/2 018/0 9/25/vidy-kontekstnoj-reklamy/ (21.03.2020).

3. Лемматизация [Электронный ресурс] // Википедия: электронная энциклопедия. [2001-2018]. URL: https://ru.wikipedia.org/wiki/Лемматизация (21.03.2020).

4. Аудиторный таргетинг Яндекс и Google [Электронный ресурс] // Синапс. URL: https://www.syn-apse-studio.ru/blog/auditornyy-targeting-yandeks-i-google (21.03.2020).

5. Лемматизация [Электронный ресурс] // Инструменты для NLP разработчика: лексика, морфология, синтаксис русского языка [2019] URL: http://www.solarix.ru/for_developers/api/lemmatization.shtml (21.03.2020)

УДК 544.01

Доросинский А.Ю. , Недорезов В.Г.

ООО научно-производственное предприятие «Сонар», Пенза, Россия ФГБОУ ВО «Пензенский государственный университет», Пенза, Россия

МЕТОД КОНТРОЛЯ СОСТАВА ГАЗОВОЙ СРЕДЫ В ПОДКОРПУСНОМ ПРОСТРАНСТВЕ РЕЗИСТИВНЫХ МИКРОСХЕМ

Обозначены актуальность, и проблемы оценки газовой среды в подкорпусном пространстве микросхем изготовленных по гибридной технологии. Предложена схема установки на базе масс-спектрометра.

Показана эффективность использования метода масс-спектроскопии для контроля газового состава подкорпусного пространства резисторов и наборов резисторов при анализе отказов, отработке вопросов использования новых материалов и оценке влагопроницае-мости корпусов.

Ключевые слова:

ГАЗОВАЯ СРЕДА, ВЛАГОСОДЕРЖАНИЕ, ПОДКОРПУСНОЕ ПРОСТРАНСТВО, ГИБРИДНАЯ МИКРОСХЕМА, МАСС-СПЕРКТРО-МЕТРИЯ, ОБРАЗЕЦ, КОНТРОЛЬ КАЧЕСТВА

Проблема управления качеством промышленной продукции весьма сложна и многогранна. В электронной промышленности, характеризуемой сложностью технологических процессов, массовостью и сложностью выпускаемых изделий при высокой автоматизации, проблема повышения качества стоит особенно остро так ее решение позволяет увеличить процент выхода годных изделий, улучшить технологические характеристики изделий, в том числе и их надежность.

Работы по повышению качества и надежности резисторов и резистивных микросхем не могут иметь успеха без широкого внедрения в производство эффективных методов контроля качества и физико-технического анализа причин технологических потерь и отказов при отбракованных и других испытаниях, а также при эксплуатации.

Одной из технически сложных проблем при реализации гибридной технологии производства является контроль состава газовой среды в подкорпус-ном пространстве микросхем.

Анализа литературных данных [1-3] показал, что наиболее перспективным направлением для решения этой проблемы является метод масс-спектро-метрии. Была разработана специальная установка, основными частями которой является масс-спектрометр магнитного, монопольного или квадрупольного типа, обогреваемая камера для вскрытия микросхем, блоки управления и обработки информации. Методика проведения масс-спектрометрического контроля влаги включает калибровку масс-спектрометра по эталонным газовым смесям, монтаж испытываемой микросхемы в термошкафу, вакуумирование и сушку системы с термокамерой в течение 12-24 ч. при температуре (115-125) °С, стабилизацию с термокамерой на уровне температуры разогрева 100 °С корпуса микросхемы.

При исследовании физики отказов микросхем установлено, что влага, присутствующая внутри корпуса, является одним из основных факторов, снижающих надежность микросхем. Влияние влаги, проявляющееся в коррозии алюминиевой металлизации, накопление заряда на изолирующем диэлектрике, миграции ионов основных материалов и примесей отмечено в [1], где подчеркивается необходимость установления верхней границы содержания влаги в корпусе, исключающей развитие этих процессов.

Вместе с тем количественные закономерности, связывающие содержание влаги в корпусе со сроком службы и хранения микросхем, изучены сравнительно мало, что вызвано разнообразием условий хранения, применения и эксплуатации изделий, широкой номенклатуры материалов, используемых для изготовления корпусов, различной интенсивностью

процессов натекания из окружающей среды и другие.

Например, из-за проницаемости пластмассового корпуса накопление влаги может достигать 30-100 мкг в неделю [1], а вследствие термодесорбции керамического корпуса в течение 4000 часов увеличение количества влаги может составлять при температуре 150 °С 0,002 мкг/см3, при 200°С более чем 0,012 мкг/см3.

Накопление влаги внутри корпуса вследствие недостаточной герметичности уплотнений может быть еще более неопределенным, так как в условиях массового производства микросхем отбраковываются лишь изделия с мощностью течи, превышающей 5-10-5 мм.рт.ст/с.

Для оценки содержания влаги в подкорпусном пространстве было проведено исследование НР1-27-6. Исследование проводилось на установке, разработанной на базе масс-спектрометра МИ-1201. Принципиальная схема установки представлена на рисунке 1.

Образец (5) размещается в вакуумной камере (3). Стальная игла (4) служит для прокалывания образца, а масс-спектрометр (1) - для количественного измерения высвобождающихся при этом паров воды.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Точные измерения могут быть сделаны только после предварительного удаления всей влаги из системы, что осуществимо лишь при длительной откачке (24 часа) всей системы при температуре 450 °С и практически невозможно при проведении анализа партии образцов. Приемлемое значение чувствительности (100-150 ррт) обеспечивается подготовкой масс-спектрометра (давление паров воды до соответствующего уровня), уменьшением внутреннего объема всей системы до минимума и перегревом системы при температуре 100 °С в течение 1 ч после установки каждого образца.

Для измерения содержания паров воды в образце последний прокалывают стальной иглой, и пары воды попадают в масс-спектрометр, индикатор массовых чисел которого настроен на 18 а.е.м. Такая настройка необходима ввиду малого времени измерения.

Расчет количества влаги производится путем измерения площади, ограниченной кривой измерения ионного тока, соответствующего массовому числу 18 а.е.м., и осью координат (рисунок 2) . Для калибровки масс-спектрометра используются образцы известного объема, герметизируемые в среде с контролируемым содержанием влаги. (Применялись образцы, герметизированные в среде с относительной влажностью f = 51% и f = 0,5 % при 20 °С).

i Надоели баннеры? Вы всегда можете отключить рекламу.