Научная статья на тему 'Особливості формування та аналізу контенту інтернет-газети музичних новин'

Особливості формування та аналізу контенту інтернет-газети музичних новин Текст научной статьи по специальности «Экономика и бизнес»

CC BY
369
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
аналіз / контент-аналіз змісту інформаційних ресурсів / контент-аналіз / рейтингова оцінка / система управління контентом / анализ / контент-анализ содержания информационных ресурсов / контент-анализ / рейтинговая оценка / система управления контентом

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Коробчинський М. В., Чирун Л. Б., Висоцька В. А., Кондратьєв Є. О.

Актуальність. Негативні чинники у формуванні контенту ускладнюють процес пошуку необхідних даних при скануванні різних джерел інформації. Збільшення фізичного обсягу та зміна актуальності/динаміки контентних потоків (систематичне та нерегулярне оновлення) призводить до виникнення дублювання, інформаційного шуму та надмірності результатів пошуку контенту. Охоплення та узагальнення великих динамічних потоків контенту, які безперервно генерують в Інтернет-джерелах, вимагає якісно нових методів/підходів пошуку як контент-моніторинг. Мета. Метою виконання роботи є розроблення методу формування та анлізу контенту Інтернет-газети музичних новин для активного залучення постійних користувачів інформаційного ресурсу новин та збільшення цільової аудиторїі. Завданням є розроблення системи для розповсюдження музичних новин з використанням методу контент-моніторингу для формування та анлізу текстового контенту інформаційного ресурсу Інтернет-газети. Метод. Вхідною інформацією для контент-моніторингу є текст на природній мові як послідовність символів, вихідна інформація – це таблиці розділів, речень і лексем аналізованого тексту. Контент-моніторинг є програмним засобом автоматизації знаходження важливих складових в потоках контенту. Це змістовний аналіз потоків контенту з метою постійного отримання необхідних якісних/ кількісних зрізів на протязі не визначеного наперед проміжку часу. Складовою контент-моніторингу є контентний пошук та контентаналіз тексту. Контент-аналіз призначений для пошуку контенту в масиві даних за змістовими лінгвістичними одиницями. Одиниця рахунку є кількісною мірою одиниці аналізу, що дозволяє реєструвати частоту (регулярність) появи ознаки категорії аналізу в тексті (кількість певних слів або їх поєднань, рядків, друкованих знаків, сторінок, абзаців, авторських аркушів, площа тексту тощо). Результати. Розв’язано актуальну задачу дослідження і розроблення методів та засобів опрацювання інформаційних ресурсів інтелектуальної інформаційної систем формування контенту із використання розробленої класифікації, математичного та програмного забезпечення та узагальненої архітектури системи. Обґрунтовано необхідність розроблення методів і засобів опрацювання інформаційних ресурсів в інтелектуальних інформаційних систем формування контенту шляхом удосконалення архітектури системи з метою автоматизації процесів формування, управління та реалізації контенту. Висновки. Використання контент-аналізу в моніторингу джерел даних в Інтернет автоматизує процес пошуку найбільш важливих компонент в потоці змісту, у виборі даних з цих джерел. Це усуває дублікати контенту, інформаційний шум, паразитні результати резервування контенту та багато іншого. Цей метод використовується на наступних етапах аналізу змісту для більш точних результатів для створення унікального контенту, який користується попитом.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ОСОБЕННОСТИ ФОРМИРОВАНИЯ И АНАЛИЗА КОНТЕНТА ИНТЕРНЕТ-ГАЗЕТЫ МУЗЫКАЛЬНЫХ НОВОСТЕЙ

Актуальность. Негативные факторы в формировании контента усложняют процесс поиска необходимых данных при сканировании различных источников информации. Увеличение физического объема и изменение актуальности / динамики контентных потоков (систематическое и нерегулярное обновление) приводит к возникновению дублирования, информационного шума и избыточности результатов поиска контента. Охват и обобщение больших динамических потоков контента, непрерывно генерируют в Интернетисточниках, требует качественно новых методов / подходов поиска как контент-мониторинг. Цель. Целью выполнения работы является разработка метода формирования и анлиз контента Интернет-газеты музыкальных новостей для активного привлечения постоянных пользователей информационного ресурса новостей и увеличение целевой аудитории. Задачей является разработка системы для распространения музыкальных новостей с использованием метода контент-мониторинга для формирования и анлиз текстового контента информационного ресурса Интернет-газеты. Метод. Входной информацией для контент-мониторинга является текст на естественном языке как последовательность символов, исходная информация – это таблицы разделов, предложений и лексем анализируемого текста. Контент-мониторинг является программным средством автоматизации нахождения важных составляющих в потоках контента. Это содержательный анализ потоков контента с целью постоянного получения необходимых качественных / количественных срезов на протяжении не определенного заранее периода времени. Составной контент-мониторинга является контентный поиск и контент-анализ текста. Контент-анализ предназначен для поиска контента в массиве данных по смысловыми лингвистическими единицами. Единица счета является количественной мерой единицы анализа, позволяющая регистрировать частоту (регулярность) появления признака категории анализа в тексте (количество определенных слов или их сочетаний, строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста и т. д.). Результаты. Решено актуальную задачу исследования и разработки методов и средств обработки информационных ресурсов интеллектуальной информационной системы формирования контента по использованию разработанной классификации, математического и программного обеспечения обобщенной архитектуры системы. Обоснована необходимость разработки методов и средств обработки информационных ресурсов в информационных системах формирования контента путем усовершенствования архитектуры системы с целью автоматизации процессов формирования, управления и реализации контента. Выводы. Использование контент-анализа в мониторинге источников данных в Интернет автоматизирует процесс поиска наиболее важных компонент в потоке содержания, в выборе данных из этих источников. Это устраняет дубликаты контента, информационный шум, паразитные результаты бронирования контента и другое. Этот метод используется на следующих этапах анализа содержания для более точных результатов создания уникального контента, который пользуется спросом.

Текст научной работы на тему «Особливості формування та аналізу контенту інтернет-газети музичних новин»

УДК 004.9

Коробчинський М. В.1, Чирун Л. Б.2, Висоцька В. А.3, Кондратьев е. О.4

1Д-р. техн. наук, доцент, професор Вйськово-дипломатичноТ академТ ¡мет Свгена Березняка, КиТв, УкраТна 2Пров1дний спецалст ¡нституту комп'ютерних наук та ¡нформацйних технологй Национального унверситету

«Льв1вська полтехнта», Льв1в, УкраТна

3Канд. техн. наук, доцент, доцент кафедри «1нформац1йн1 системи та мереж» Национального ун1верситету «Льввська

полтехнка», Льв1в, УкраТна

4Магстр кафедри «1нформац1йн1 системи та мереж» Нацонального университету «Льв1вська полтехнка», Льв1в,

УкраТна

ОСОБЛИВОСТ1 ФОРМУВАННЯ ТА АНАЛ1ЗУ КОНТЕНТУ 1НТЕРНЕТ-ГАЗЕТИ МУЗИЧНИХ НОВИН

Актуальшсть. Негативш чинники у формуванш контенту ускладнюють процес пошуку необхщних даних при скануванш рiзних джерел шформаци. Збшьшення фiзичного обсягу та змша актуальнос™/динамжи контентних потоюв (систематичне та нерегулярне оновлення) призводить до виникнення дублювання, шформацшного шуму та надмiрностi результата пошуку контенту. Охоплення та узагальнення великих динамiчних потогав контенту, як безперервно генерують в 1нтернет-джерелах, вимагае якiсно нових методiв/пiдходiв пошуку як контент-мошторинг.

Мета. Метою виконання роботи е розроблення методу формування та анлiзу контенту 1нтернет-газети музичних новин для активного залучення постiйних користувачiв iнформацiйного ресурсу новин та збшьшення цшьово! аудитори. Завданням е розроблення системи для розповсюдження музичних новин з використанням методу контент-мошторингу для формування та анлiзу текстового контенту шформацшного ресурсу 1нтернет-газети.

Метод. Видною шформащею для контент-монiторингу е текст на природнш мовi як послщовшсть символiв, вихiдна iнформацiя - це таблиц роздiлiв, речень i лексем аналiзованого тексту. Контент-монiторинг е програмним засобом автоматизаци знаходження важливих складових в потоках контенту. Це змютовний аналiз потокiв контенту з метою постшного отримання необхщних якiсних/ кшьюсних зрiзiв на протязi не визначеного наперед промiжку часу. Складовою контент-мошторингу е контентний пошук та контент-аналiз тексту. Контент-аналiз призначений для пошуку контенту в масивi даних за змютовими лiнгвiстичними одиницями. Одиниця рахунку е кiлькiсною мiрою одинищ аналiзу, що дозволяе рееструвати частоту (регуляршсть) появи ознаки категори аналiзу в текстi (кiлькiсть певних ств або !х поеднань, рядкiв, друкованих знаюв, сторiнок, абзацiв, авторських аркушiв, площа тексту тощо).

Результати. Розв'язано актуальну задачу дослщження i розроблення методiв та засобiв опрацювання шформацшних ресурсiв штелектуально! шформацшно! систем формування контенту iз використання розроблено! класифжаци, математичного та програмного забезпечення та узагальнено! архiтектури системи. ОбГрунтовано необхщшсть розроблення методiв i засобiв опрацювання шформацшних ресурав в iнтелектуальних шформацшних систем формування контенту шляхом удосконалення арх1тектури системи

з метою автоматизаци процеав формування, управлшня та реалiзацil контенту.

Висновки. Використання контент-аналiзу в мошторингу джерел даних в 1нтернет автоматизуе процес пошуку найбiльш важливих компонент в потощ змiсту, у виборi даних з цих джерел. Це усувае дублжати контенту, шформацшний шум, паразитнi результати резервування контенту та багато шшого. Цей метод використовуеться на наступних етапах аналiзу змюту для бiльш точних результата для створення унiкального контенту, який користуеться попитом.

Ключовi слова: аналiз, контент-аналiз змiсту iнформацiйних ресурсiв, контент-аналiз, рейтингова оцiнка, система управлiння контентом.

НОМЕНКЛАТУРА

IC - iнфopмaцiйнa №CTeHa;

OIP - oпpaцювaння iнфopмaцiйниx pecypciß;

СЕКК - ^OTeina eлeктpoннoï кoнтeнт-кoмepцiï;

X - итожит вxiднoï iнфopмaцiï з Web-camiß a6o вщ мoдepaтopiв;

Formation - функщя фopмyвaння гонген-гу;

C - м^жит mOTeroy;

Management - функщя y^aRn^m кoнтeнтoм;

Realization - функщя peaлiзaцiï romeroy;

Y - мжжит виxiднoï iнфopмaцiï;

Gathering - функщя збиpaння iнфopмaцiï з джepeл;

Formatting - фopмaтyвaння iнфopмaцiï, пepeтвopeн-ня в мнoжинy ^m'emy;

KeyWords - функщя функцш виявлeння ключoвиx ст1в, ж>нять;

Categorization - функщя aвтoмaтичнoï pyбpикaцiï;

Backup - функщя виявлeння дyблювaння змicтy гон-тeнтy;

Dissemination - функщя вибipкoвoгo пoшиpeння гон-тeнтy;

Q - мнoжинa зaпитiв;

R - функщя фopмyвaння тa пoдaння cropimH;

Edit - функщя peдaгyвaння тa мoдифiкaцiï кoнтeнтa;

Caching - функщя фopмyвaння тешу;

BuInfPortr - мнoжинa функцш фopмyвaння iнфop-мaцiйниx пopтpeтiв;

BuDigest - м^жим функцш фopмyвaння дaйд-жecтiв;

IdThemTop - мнoжинa функцш виявлeння тeмaтич-ниx cюжeтiв;

ConCorrTablConc - м^жит функцш пoбyдoви тaб-лиць взaeмoзв'язкy пoнять;

CalRankConc - м^жит функцш poзpaxyнкy pe^ тинпв ж>нять;

CP - cкiнчeннa мнoжинa шт^ту iнфopмaцiйниx пopтpeтiв;

© Kopoбчинcький M. В., Чиpyн Л. Б., Ви^ць^ В. А., Koндpaтьeв G. О., 2017 DOI 10.15588/1607-3274-2017-4-16

CD - CKÍH4eHHa множина контенту дайджестав;

Ct - скшченна множина контенту тематичних сю-жетав;

Ce - скiнченна множина контенту таблиць взаемоз-в'язку понять;

CR - скiнченна множина контенту рейтинпв понять.

ВСТУП

Бурхливий розвиток електронноï комерцiï сприяв у виникненш потреби створення шаблону шформацшно-го ресурсу в^пов^но до потреб користувача для його задоволення у повнш мiрi [1]. Наприклад, бiльшiсть шфор-мацiйних ресурсiв з музичних новин свпу чи краïни е не адаптивними та не зрозумiлими для використання кшце-вим користувачем, часто нагромаджеш надлишковим контентом та рекламою. Бшьшють з них не володтоть адаптивною версткою для рiзних електронних носiïв. 1сну-ючi та розповсюдженш моделi систем або ïх шаблони для реалiзацiï СЕКК не вирiшують низку проблем О1Р згiдно потреб кшцевого коистувача або не враховуе специфжи дiяльностi пiдприемства чи людини, специфiки галузi науки чи промисловоста тощо [2]. Тому з'являеться попит на вдосконалення процесу О1Р та розроблення за-гальноï архiтектури СЕКК з використанням математичноï лiнгвiстики та контент-аналiзу текстових масивiв даних [3]. Проблема полягае у вщсутноста загального стандартизо-ваного тдходу до проектування i розроблення архгтекту-ри СЕКК та процесу О1Р в данш системi [4]. Вiдсутнiсть загальноï класифжаци приводить до проблем визначення та формування унiфiкованих методiв О1Р та реатзаци вдао-вiдних програмних засобiв [5]. Це обгрунтовуе мету, акту-альнiсть, доцiльнiсть та напрям дослвдження. 1 ПОСТАНОВКА ЗАДАЧ1

Метою роботи е розроблення шаблону шформацш-ного ресурсу з автоматичним наповненням контенту ввдповвдно до вимог користувача для виршення таких зав-дань: автоматичне формування комерцшного контенту; автоматичне збирання та створення контенту; автоматичне форматування контенту; виявлення ключових слiв та понять; рубрикащя контенту; виявлення дублювання контенту; формування дайджесту контенту; вибiркове поши-рення контенту [5]. Формальна модель СЕКК - це шютка

S = ( X, Formation, C, Management, Realization, 7).

Формальна модель формування шформацшних ре-сурсiв це

Formation = ( X, C, Gathering, Formatting, KeyWords,

, Categorization, Backup, Dissemination) .

Моделi управлiння шформащйними ресурсами.

1. Генеращя сторiнок за запитом вiдбуваеться на ос-новi зв'язки «Модуль редагування ^ База даних ^ Модуль представлення». Формальна модель генерацiï сторшок за запитом -

Managements = ( X, C, Q, R, Edit, 7).

2. Генеращя стс^нок при редагуваннi. При внесенш змiн до змiсту сайту створюють набiр статичних сторiнок.

При такому cnoco6i не враховуеться штерактившсть ]шж вiдвiдувачем i BMiCTOM сайту. Формальна модель систе-ми генерацп сторшок при редагуванш -

ManagementE = (C, Edit, . Процес формування сторшок описуеться функщею Edit вигляду:

y (t) = Edit (c, Weight, t).

3. Змшаний тип поеднуе в собi переваги перших двох тишв. Може бути реалiзований шляхом кешування -модуль представлення генеруе сторiнку один раз, надалi вона в декiлька разiв швидше пiдвантажуеться з кешу. Кеш може оновлюватися як автоматично, по закшчен-ню деякого термiну часу або при внесенш змш до пев-них роздiлiв сайту, так i уручну по командi адмшстрато-ра. 1нший пiдхiд - збереження певних шформацшних блоюв на етат редагування сайту i збiрка сторшки з цих блокiв при запил в^пов^но! сторiнки користувачем. Формальна модель системи зм^аного типу -

ManagementM = (X, C, Q, R, Edit, Caching, 7).

Формальна модель реалiзащl шформацшних ресурав -

це

Realization = ( X, C, BuInfPortr, BuDigest, IdThemTop,

ConCorrTablConc, CalRankConc, 7).

Скшченна множина контенту

C = (Cp, Cd , Ct , Cc , Cr } е адекватною та повною. 2 ОГЛЯД Л1ТЕРАТУРИ

Однiею з головних особливостей нашого часу е пост-iйне зростання темпiв виробництва шформацп [3]. Цей процес об'ективний i в цiлому, безумовно, позитивний. Однак на сьогодшшнш день людство зустршося з парадоксальною, на перший погляд, ситуащею: прогрес в областа виробництва шформацп веде до зниження загального рiвня iнформованостi [3-5]. О^м збiльшення об-сягiв шформацп до масштабiв, якi унеможливлюють ll безпосередне опрацювання, виник цiлий ряд специфiч-них проблем, пов'язаних з швидким розвитком шформа-цiйних технологш [6]. Ситуацiя рiзкого зростання темтв виробництва шформацп породила ряд проблем: непро-порцiйне зростання iнформацiйного шуму через слаб-ку структурованiсть шформацп; поява паразитно! шформацп (одержувано! в якост додаткiв); невiдповiднiсть формально релевантно! шформацп (тематично вщповь дно!) дшсним потребам ll споживачiв; багаторазове дублювання шформацп (типовий приклад - публжащя одного повщомлення в рiзних виданнях) [7]. Внаслщок пе-релiчених обставин, традицiйнi iнформацiйно-пошуковi системи поступово стали втрачати свою актуальшсть. Причина цього криеться не стшьки в фiзичних обсягах шформацшних потоюв, скiльки в !х динамщ, тобто в по-стiйному систематичному в^новленш шформацп, яка далеко не завжди мае очевидну регулярнiсть. Охоплення та узагальнення великих динамiчних шформацшних потоюв, яю безперервно генеруються в засобах масово! шформацп, вимагае яюсно нових пiдходiв [8]. Вихщ може бути знайдений тшьки в засобах автоматизацп виявлення

найбшьш важливих складових в шформацшних потоках [9]. Саме тому в останш роки все частше стали викорис-товувати системи мониторингу ресурсiв [10], якi тюно по-в'язанi з контент-аналiзом [11]. Цей перспективний напря-мок отримав назву контент-монiторинг [12]. Його поява була викликана, насамперед, завданнями систематичного вщстеження тенденцiй i процешв в iнформацiйному середовищi, яке поспйно оновлюеться. Пiд контент-мот-торингом найчастше розумiють змiстовний аналiз шформацшних потоков з метою отримання необхвдних яюсних i кiлькiсних зрiзiв, який ведеться постiйно протягом невиз-наченого заздалепдь промiжку часу [12]. Найважлившою методолопчною складовою контент-монiторингу е кон-тент-аналiз та життевий цикл контенту [13-16]. 3 МАГЕРЬАЛИ I МЕТОДИ

Складовою контент-монiторингу е контентний пошук та контент-аналiз тексту [17]. Контент-аналiз призначений для пошуку контенту в масивi даних за змiстовими лшгвютичними одиницями [18-20]. Одиниця рахунку е кшьюсною мiрою одиницi аналiзу, що дозволяе реестру-вати частоту (регуляршсть) появи ознаки категорп анал-iзу в текстi (кiлькiсть певних ^в або 1х поеднань, рядкiв, друкованих знакiв, сторiнок, абзацiв, авторських арк^в, площа тексту тощо).

Алгоритм 1. Контент-аналiз текстового комерцiйного контенту.

Етап. 1. Визначення набору критерпв для текстового комерцшного контенту.

Крок 1. Формування набору критерпв як тип джерела (форум, електронна пошта, 1нтернет-газета, чат, 1нтер-нет-журнал); тип контенту (стаття, електронний лист, банер, коментар^; учасники комушкацп (вiдправник, одер-жувач, рецишент).

Крок 2. Визначення розмiру (мiнiмальний обсяг або довжина), частоти появи, способу/шсця розповсюджен-ня та час появи контенту.

Крок 3. Фшьтрування згiдно сформованого набору критерпв контентного потоку та зберiгання щентифжо-ваного релевантного контенту.

Етап. 2. Контент-аналiтичний вiдбiр. Формування ви-бiрковоl сукупностi контенту за критерiями обмежено1 вибiрки з бшьшого масиву.

Етап. 3. Виявлення змютовних одиниць аналiзу текстового комерцшного контенту (словосполучення, ре-чення, тема, щея, автор, персонаж, соцiальна ситуащя, частина тексту, кластеризована за змютом категорп ана-лiзу). Вимоги до вибору лшгвютично! одиницi аналiзу: велика для штерпретацп значення; достатньо мала, щоб не iнтерпретувати багато значень; легко щентиф^еть-ся; кiлькiсть одиниць достатньо велика для проведення вибiрки.

Етап. 4. Видiлення одиниць рахунку аналiзу текстового контенту.

Крок 1. Якщо одиницi рахунку збiгаються з одиницями аналiзу, то знаходять частоту появи видшено! змютов-но1 одинищ, iнакше перейти до кроку 2.

Крок 2. Модератор на осжда аналiзованого контенту висувае одиницi рахунку, наприклад, протяжшсть текстiв;

площа тексту, заповнена зм1стовними одиницями; кшьюсть рядюв (абзащв, знаюв тощо); розм1р/вид файлу; кшьюсть рисунюв з певним змютом тощо.

Етап. 5. Пор1вняння змютовних одиниць анал1зу з оди-ницями рахунку.

Крок 1. Класифжащя за угрупованнями i3 оцшкою ваги змiстовних категорш в загальному обсязi тексту. Класифжатором е загальна таблиця, в яку зведеш всi ка-тегорiï аналiзу i одиницi аналiзу. Фiксують одинищ вира-зу категорiй.

Крок 2. Статистичш розрахунки зрозумiлостi та ат-рактивностi контенту.

Етап. 6. Розроблення шструменту контент-аналiзу

Крок 1. Створення закодованого протоколу контенту для компактностi подання даних та швидкого порiвняння результата аналiзу рiзного контенту.

Крок 2. Заповнення протоколу контенту властивостя-ми (автор, час, обсяг тощо).

Крок 3. Заповнення протоколу контенту тдсумками його аналiзу (кшьюсть вживання в ньому певних одиниць аналiзу i висновки щодо категорiй аналiзу). Протокол кожного контенту заповнюеться на основi тдрахун-ку даних вих його реестрацiйних карток.

Етап. 7. Розроблення таблиц контент-аналiзу Тип таб-лицi визначають у виглядi системи скоординованих i су-бординованих категорiй аналiзу: кожна категорiя (питан-ня) передбачае ряд ознак (вщповщей), за якими квантиф-iкуеться змют тексту.

Етап. 8. Розроблення кодувальноï матрицi контент -аналiзу

Крок 1. Якщо обсяг вибiрки > 100 одиниць, то аналь зуеться набiр матричних листiв, iнакше виконати крок 2.

Крок 2. Якщо вибiрка < 100 одиниць, то проводиться двовишрний аналiз. В цьому випадку для кожного контенту формуеться кодувальна матриця.

Етап. 9. Проведення аналiзу тексту згiдно створених кодувальних матриць.

Етап. 10. 1нтерпретащя результатiв. Виявляють i ощ-нюють характеристики контенту з врахуванням тдрахо-ваних коефiцiентiв за певний перюд часу на визначену категорiю.

Застосування контент-аналiзу для мониторингу 1нтер-нет-джерел даних дозволяе автоматизувати процес зна-ходження найбiльш важливих складових в потоках контенту при вiдборi даних з цих джерел шляхом викорис-тання частотно-лiнгвiстичних та евристичних методiв, технологiï Text Mining, а також щеологп Web-серв^в, базуючись при цьому на шформацшних ресурсах, нако-пичених в WWW першого поколiння [10-20]. Це усувае дублювання контенту, iнформацiйний шум, паразитич-ний контент, надмiрнiсть [21-23].

4ЕКСПЕРИМЕНТИ

Модуль формування контенту забезпечуе збирання шформацп з рiзноманiтних Web-сайтiв та ïï форматуван-ня; виявлення ключових слiв i понять контенту; автома-тичну рубрикацiю контенту; виявлення дублювання змюту контенту; вибiркове поширення контенту. Голов -не завдання модуля управлшня контентом: формування,

ротацiя баз даних i забезпечення доступу до нец формування оперативних i ретроспективних баз даних; персо-налiзацiя роботи користувачiв, збереження персональ-них запилв користувачiв i джерел, ведення статистики роботи; забезпечення пошуку в базы даних; генеращя вихщних форм; шформацшна взаемодiя з iншими базами даними. 1снуе три моделi управлшня контентом: ге-нерацiя сторiнок за запитом, генеращя стс^нок при реда-гуваннi; змiшаний тип. Генерацiя сторшок за запитом вщбуваеться на осжда зв'язки: Модуль редагування ^ База даних ^ Модуль подання. Генеращя стс^нок при редагуваннi полягае у створенш набору статичних сто-рiнок при внесеннi змiн до сайту (враховуеться штерак-тивнiсть мiж вщв^вачем i вмiстом сайту). Модель реа-лiзацiï контенту забезпечуе формування шформацшних портрепв; формування дайджестiв; побудова таблиць взаемозв'язку понять та розрахунок ïх рейтингiв, вияв-лення нових подш та тематичних сюжетiв, ïхне вщстеження кластерiзацiя. Процес проектування та створення 1С формування контенту за допомогою 1нтернет-маркетингу е iнтерактивним i протжае вiд аналiзу, проектування, роз-роблення плану до створення прототипу i експеримен-тальних випробувань, починаючи з формування специф-жацш, верстки, створення шаблону контенту, формування контенту та його подальше розмщення згiдно струк-тури сайту (рис. 1).

Завдяки мониторингу продуктивностi та успiху кори-стувачiв визначають одну iз вимог - доступ до даних про конференцп або щльову аудиторiю. За зворотною реак-цiею користувачiв формують шформацшну архiтектуру сайту. Основнi класи користувачiв сайту визначають дизайн сайту i процес ухвалення рiшень. Визначивши важ-ливу iнформацiю та ïï зв'язок iз основними класами ко-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ристувачiв, створюють архiтектуру контенту сайту, його iерархiю, способи подання i взаемодп кожного класу ко-ристувачiв з контентом. На рис. 2 подана типова схема взаемодп модушв, а на рис. 3 - схема модуля управлшня контентом.

Модуль формування контенту реалiзуеться у виглядi комплекшв контент-мошторингу зi збирання контенту з джерел за наперед визначеними методами (рис. 4), i за-безпечують створення баз даних в^пов^но до потреб споживачiв. Основнi етапи формування контенту: зби-рання/створення контенту, систематизащя контенту та поширення контенту. Аналiз та управлiння контентом сайту, ïхне моделювання е одним з найбшьш шформа-тивних методiв кшьюсного вивчення динамiки окремих тематичних напрямiв та проведення технiчного аналiзу сайту. За змшою величин управлiння контентом визна-чать швидкiсть розвитку окремих тематичних напрямiв або всього контентного простору.

При генераци сторiнок модуль подання генеруе сторiнку iз змстом при запитi на нього на осжга шформацп з бази даних (рис. 5а). У режим дiалогового доступу до бази даних забезпечуеться перегляд, пошук i вiдображення контенту, надаеться можливють звертання до ориriналiв контенту в 1нтернет (рис. 5b). 1нформащя в базi даних змшюеться за допомогою модуля редагування (рис. 5c). Сторшки наново створюються сервером при кожному запил, збiльшуе на-вантаження на ресурси системи (рис. 5d). Шавантаження знижуеться при використанш засобiв кешування в сучас-них Web-серверах. Задача повнотекстового пошуку у великих масивах контенту е неефективною. Проблему точностi вирiшуе пошук в анотованому контентi. Замiсть пошуку у повному контентi доцiльно вести пошук за анотащями -пошукових образах контенту.

Управлшня контентом

Реалiзацiя _ контенту

1нтернет -маркетинг

Проектування та роз роблення плану

Формування контенту

Просування та

пропагування

Реалiзацiя контенту»

Оцнювання результатiв

Визначення бiзнес-цiлей та цiльових ринкiв

Проектування та розроблення шаблону контенту

-Реалiзацiя контенту-

Визначення/ уточнення стратеги'

Уп равлшня контентом

Забезпечення iнструментами

Формування контенту

Оплата за клiк

М онгторинг продуктивностi та усп iху

Email шструменти

1нструменти ЗМ1

Партнерськi програми

... . 1нструменти

Web-хостинг "

PR

b

a

d

c

Рисунок 1 - Схема: а - 1нтернет-маркетингу, b - проектування плану, c - реал1защя контенту, d - мониторингу продуктивност та усшху

Рисунок 2 - Схема взаемоди модул1в

Покупець) ^еЬ -витрина

Вибф

контенту

Кошик сформо ваний

Оформлення вибору

Реестрацш клиента

Виб^р прийнятий

Коректний запит

Перевфка запиту

Некорект ний запит

Уточнення

Повщомле ння клиенту

Ви бф отримано

Рисунок 3 - Загальна схема модуля управлшня контентом

Корпоративна мережу ^р) Корпоративна мережа

Рисунок 4 - Етап збирання та створення контенту

Модуль реалiзацп контенту - це комплекснi процеси аналiзу контенту. Актуальнiсть розроблення загально1 ар-хiтектури модуля реалiзацп контенту полягае у необхщ-ностi отримувати оперативш i об'ективнi оцiнювання рiвня конкуренцп на сегментi фiнансового ринку контенту; оц-iнювати рiвень конкурентiв та мiри 1х конкурентоспромож -ност на ринку. Огриманi данi враховуються при створеннi або оновленнi ^'еЬ-порталу. Модуль реалiзацп контенту

виконуе процес пiдвищення рейтингу 1С формування контенту iз iнтерактивним iнтерфейсом та виршуе наступнi задачi: збирання маркетингово! шформацп з поширення контенту; тдтримка дiалогу з кiнцевим споживачем контенту; формування каталогу контенту; шформацшна тдтримка юнцевого споживача контенту; реестращя юнце-вого споживача контенту (рис. 6). Модуль реалiзацil контенту поданий на рис. 7-8 та в табл. 1-3.

Початок

Визначення методу розроблення прототипу

Визначення набору вимог до майбутнього пр ототипу

B^ip методу розроблення зпдно вимог

Розроблення прототипу

Експлуатацш прототипу

Аналiз pезультатiв роботи

прототипу ♦

Виправлення помилок та модеpнiзацiя прототипу У —

Кшець

Початок

Ж

Введення контенту

Початок

Редагування контенту

Г

Введення умов

Формування набору статичних стоpiнок Ï стр Bивiд статично' стоянки

Кшець

Формування сторшки

I ~~

Заповнення контентом статичних сторшок

Г

Вивщ статичноï

сторонки /

Кiнець

abc d

Рисунок 5 - Процес: а - створення прототипу, b - генераци сторшок за запитом, c - генеpацiï' та d - заповнення сторшок

при редагуванш

Рисунок 6 - Схема модераци контенту

Cu stomer

Рейтинг/ вщгуки

П итання/ вщпов^

lсторiя

-Читання iндексу

I

Читання контенту I I I I I

4-----

Е

-Q

Подання контенту

J_

OpenMQ

-черга-

-черга-

CMS

-репл1кащя репл кащя----

1нд^к^ац1я_дан

Читання шдексу

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ш

p с

u t

k o

c га СО p e □с

Workbench

Читання ( -

запис

Рисунок 7 - Схема потстав даних в модул реалiзацii контенту

читання

Якщо модератор вважае вхдний контент не вал1дним, то цей тип контенту додаеться до

БЗ з фтьтрами та правилами

а б

Рисунок 8 - Узагальнення контенту: а - алгоритм та б - процес

Таблиця 1 - Основш компоненти модуля peaлiзaцiï контенту

Назва Характеристика

Customer ПотенцшниМснуючий клiент iз власним сайтом, де вмонтовуеться апл^щя CMS з метою пщняття рейтингу контенту та кращого розумiння потреб кшцевого користувача через аналiз контенту типу питання/вщповда, рейтинги, вщгуки, статп тощо.

OpenMQ CMS Черга типу FIFO. Модуль аплжацл фшьтрування контенту за наперед визначеними правилами шдивщуально для кожного кшента.

Workbench 1ндивщуальний кабiнет ^ента з можливiстю перегляду контенту та аналiзу статистики.

Solar Модуль iндексування для швидкого пошуку контенту.

Таблиця 2 - Бази даних модуля реал1заци контенту

Назва Характеристика

Master Головна БД, яка е основною ланкою системи i для розподалу навантаження реплiкуе данi на дочiрнi бази.

Display Дочiрня БД вщ Master, з якою працюе сайт кшента на зчитування дозволеного на публжащю контенту.

Submit Попереджуе дублювання шформацп' на першому етапi.

Reporting На основi цiеi' БД формуються статистичш звiти для клiентiв

Backup Portal Додаткове СД. БД призначена для роботи з аплжащею Workbench.

Таблиця 3 - Правила модерацп контенту ¡з самонавчанням

Фшьтр Характеристика Режим роботи

Нецензурно!' лексики Перевiрка за словником та заборона при TRUE Нашвавтоматичний, при FALSE перевiряе модератор, словник перюдично поповнюеться модератором.

За кшьюстю символiв П^вняння кшькосп символiв i3 лiмiтом та заборона при FALSE Автоматичний, лiмiт визначае адмшютратор або власник сайту.

За URL-посиланнями Визначення наявносп URL, перевiрка за списком та заборона при TRUE Нашвавтоматичний, у разi FALSE остаточно перевiряе модератор, список перiодично поповнюеться модератором.

За «blacklist» списком Перевiрка за списком та заборона при TRUE Нашвавтоматичний, у разi FALSE остаточно перевiряе модератор, список перiодично поповнюеться автоматично у разi перевищення лiмiту.

За посиланням на конкурентiв Перевiрка за списком та заборона при TRUE Напiвавтоматичний, у разi FALSE остаточно перевiряе модератор, список перiодично поповнюеться модератором.

За IP адресами Перевiрка за списком та заборона у разi TRUE Автоматичний, список перюдично поповнюеться автоматично при перевищенш лiмiту, лiмiт визначае адмiнiстратор/власник сайту.

За ID користувачiв Перевiрка за списком та заборона у разi TRUE Автоматичний, список перюдично поповнюеться автоматично при перевищенш лiмiту, лiмiт визначае адмiнiстратор/власник сайту.

5 РЕЗУЛЬТАТИ

Для повного функцiонування штелектуально! 1С фор-мування контенту iHTepHeT-ra3eT характерна складна система взаемозв'язаних операцiй (рис. 9-10), методiв, прийомiв, якi формують технолопчний процес форму-вання контенту, який складаеться i3 п'яти фаз: ознайом-лення з 1С; пошук контенту; отримання шформацп про послугу/товар; вибiр категорп; доставка контенту е-по-штою або в режимi on-line.

Система поширення контенту подiляеться на двi пщси-стеми: з вiльним доступом; адмшстративна пiдсистема. Для користувачiв 1снуе частина з вiльним доступом. В нш реалiзованi такi серв1си як вибiр контенту за визначе-ний перiод часу з початку контентного наповнення за допомогою календаря. Зручний рубрикатор дозволяе вибирати контент за певною категорiею. За допомогою пошуку здiйснюють пошук в базы даних за ключовими словами. Можна в зручному виглядi переглянути анон-си на поди, якi мають вiдбутись. Адмiнiстрування систе-ми здшснюеться в адмiнiстративному модул штелекту-ально! 1С формування контенту iнтернет-газет, доступ до якого обмежений i реалiзований за допомогою логiна i пароля. Тут вносяться коригування в структуру, додаеть-ся, редагуеться або видаляеться контент, встановлюеться

Початок

S

Пiдключення ко ристувачiв

Аналiз предметно!' облас^

Створення прототипу i -

Пробнi випробування

i -

Модершзащя прототипу

Kiнеuь

Початок

I

Пдключення шнцевих користувач1в до проекту

..................................................г...............................................

Завоювання дов1ри сплки

_користувач iB_

i

Формування вимог до тформащйноТ структури

Аналiз зворотноТ реакцй' користувач iв

Визначення класу майбутнiх

користувач íb +

Визначення дизайну та проиесу прийняття рiшень

Створення арх'тектури сайту

Kiнеuь

Рисунок 9 - Процес: а - проектування СЕКК; b - шдключення користувач1в

а

Початок

Початок

Фоpмyвання

фyнкцiональноï

специфтацп

*

Bepстка iнфоpмацiйноï

аpхlтeктypи пpоeктy

i

Фоpмyвання контенту

*

Розмщення контенту

зпдно стpyктypи сайту

*

АдмЫстрування сайту

*

Кшець J

Оновлення контенту

1

Додавання нових

джepeл контенту

*

Розшиpeння контенту

1

Редагування вкладення

коpистyвачiв та

пpовайдeplв

1

Пiдтpимка звоpотного

зв'язку

*

Початок

Ствоpeння аpхiтeктypи вмисту

i — Фоpмyвання iepаpхiï вм1сту сайту

Початок

I

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

I ~

Способи

пpeдставлeння вм1сту *

Aналiз додаткових можливостей i

Aналiз фyнкцiональних можливостей

Юнець

Способи взаемодп' кожного класу коpистyвачiв з вмистом

Кшець

Визначення вимог до майбутньоТ системи

I

b

Визначення спосо61в peалiзацiï системи

I -

Кшець d

Рисунок 10 - Процес: а - оргашзаци контенту; b - адмiнiстрування сайту; c - створення; d - аналiзу архггектури сайту

контент дня. З]шнюеться 3MiCT статичних стс^нок, вщбу-ваеться розсилка листiв з контентом. Реалiзуеться зруч-на система для додавання нових ктенпв з вибором на певш категорп та встановлення часових мае ди доступу, який блокуеться автоматично пiсля закiнчення перiоду дл [3]. Структура бази даних з описом полiв подана в табл. 4 та наведена на рис. 11.

Структурна схема 1нтернет-газети розподшена на три частини: mods, libraries та templates. Опис призначення

Таблиця 4 - Структура бази даних

Назва Пpизнaчeння

clients зб^^^к^ся вiдомоcтi пpо клieнтa;

deliver мicтить коди оcтaннix вiдпpaвлeниx новин xa номepa pозcилок;

news в цш xaблицi pозxaшовaнi вci новини;

option pозмiщeнi опцiï;

pages statistics iнфоpмaцiя зi cxaxичниx crapi^R; збepiгaeIъcя cxaxичнa iнфоpмaцiя пpо вiдвiдyвaнicIъ;

tree мicxиIЪ cIpyкxypy у виглядi iepapxiчного дepeвa;

users iнфоpмaцiя пpо коpиcxyвaчiв aдмiнicxpaxивноï чacxини;

news

id

type_1 type_2 type_3 type_4 user

clients

regions products

delivery

product

tree

id

id

statistics

news_id

Pиcyнок 11 - Cтpyктypa бaзи дaниx

скришгв з даних груп подано в табл. 5. Група скриплв libraries ^блютеки) - це класи призначеш для роботи з певними об'ектами. Вони подiляються на три категорп: створенi автором, створенi iншими розробниками та скрипти на мовi JavaScript. Звернення до цих скриптiв вщбуваеться з групи скриптiв mods.

6 ОГОВОРЕННЯ

В табл. 6 наведет приклади найпопулярнiших штер-нет-газет. Кожна з яких вiдрiзняеться технологiями та тдхо-дом побудови 1С. Вони наповнюються контентом через модератора, що збшьшуе витрати та час на формування нового контенту. В них вщсутня iдентифiкацiя постiйного користувача, що дозволило б виконувати пiдбiр контенту за вподобанням користувача. Кожен з вище зазначених сайлв не е вузько спецiалiзованим, що зменшуе мож-ливiсть пошуку потрiбноi iнформацii. На сайтах № 1-4, 79 реалiзовано систему пошуку iнформацii по сайту, що значно зменшуе витрати часу, на сайтах № 5-6 така система вщсутня, що зменшуе зручшсть його використання. На сайтах № 2, 8 реалiзовано адаптивну верстку, що е дуже важливим тдходом побудови таких сайтiв. Сайти № 1-9 наповнюються контентом за допомогою модератора, тоб-то iнформацiя вщображаеться не вчасно, а значить може бути не актуальною на перюд перегляду. Автоматичне наповнення контентом сайту значно покращить його шформацшну наповненiсть. Сайти № 1-6 перенасичеш рекламою, що не стосуеться музичног теми. ВИСНОВКИ

Розроблена формальна модель 1С формування контенту, що дало змогу розробити життевий цикл контенту, узагальнену типову архiтектуру системи та ушфжоваш методи О1Р. Вдосконалено загальну архiтектуру 1С формування контенту, вщмшну вiд iснуючих наявтстю мо-дулiв О1Р Розроблено комплексний метод формування контенту, оперативний метод управлшня контентом та комплексний метод реалiзацii контенту для досягнення ефекту вщ роботи на рiвнi розробника системи. Розроблено загальш рекомендацп з проектування архiтектури системи, вiдмiннi вiд iснуючих бiльшою деталiзацiею етатв та наявнiстю модулiв О1Р, що дають змогу ефек-

a

с

1

ОО

оо

оо

оо

1

оо

оо

1

оо

Таблиця 5 - Опис призначення з групи

скриптов Ha3Ba Призначення

mods mod index взаемодiя користувача з загальнодоступною шформащею;

mod admin адмшютрування;

mod admin news edit забезпечуе маншуляци з контентом;

mod admin news search забезпечуе пошук контенту в архiвi за крш^ем вщбору;

mod admin news day дозволяе вибрати контент за перюд часу;

mod admin delivery забезпечуе розсилку контенту;

mod admin users забезпечуе маншуляци з даними про адмшютрування;

mod admin_pages забезпечуе редагування статичних даних;

mod admin test в цьому модуш вщбуваеться вщлагодження нових скриппв.

libraries class lib набiр рiзноманiтних допомiжних функцш;

class news клас для маншуляци над об'ектом «контент»;

class clients клас для маншуляци над об'ектом «кшент»;

class users клас для маншуляци над об'ектом «адмшютратор»;

class_pages клас для маншуляци над об'ектом «статичш сторшки»;

class tree клас для маншуляци над об'ектом «дерево»;

class mail клас для маншуляци над об'ектом «пошта»;

class message клас для маншуляци над об'ектом «повщомлення»;

class mysql клас для маншуляци над об'ектом «БД»;

class debug клас для маншуляци над об'ектом «вщлагодження»;

class error клас для маншуляци над об'ектом «помилки»;

jscalendar календар.

templates mod index шаблон для роботи з загальною частиною;

mod admin шаблон для роботи з адмшютративною частиною;

html ргзномаштш шаблони сшльш складовг

Таблиця 6 - 1нтернет газети музичних новин

№ Назва nocmaHHA

1. Mojo http ://www.moj o4music .com

2. QMAGAZINE http ://www.qthemusic .com

3. Pitchfork http ://pitchfork.com

4. SPIN http ://www.spin.com

5. FACT 6. Navsi100. com http ://www.factmag.com http ://b eta.navsi 100. com

7. РОК-ОКО http://www.rock-oko.com

8. MUZNEWS http ://muzsweet.com

9. 13 НОТ http ://13notes.info

тивно просто реалiзувати О1Р на рiвнi розробника систе-ми. Розроблено архггектури модулiв системи для реаль зацiï життевого циклу контенту. Розроблено та впровад-жено прикладне програмне забезпечення формування, управлiння та реалiзацiï контенту для досягнення ефекту вiд роботи на рiвнi власника та користувача штелекту-альноï iнформацiйноï систем формування контенту. ПОДЯКИ

У статп розв'язана науково-практична формування та аналiзу текстового контенту 1нтернет-шазети музичних нових для збiльшення цiльовоï аудиторп. Роботу виконано в рамках стльних наукових дослiджень кафедри шформа-цшних систем та мереж Нацiонального ушверситету «Львiвська полггехшка» на тему «Дослщження, розроб-лення i впровадження телектуальних розподiлених шфор-мацiйних технологiй та систем на осжга ресурсiв баз да-них, сховищ даних, простс^в даних та знань з метою при-скорення процесiв формування сучасного шформацшного сустльства», а також Вшськово-дипло-матичноï академiï iменi Свгена Березняка. Науктта дослвд-ження провадилися також в рамках шщативжй тематики досл^жень кафедри 1СМ Нацiонального унiверситету «Львiвська полггехшка» на тему «Розроблення штелекту-альних розподiлених систем на осжга онтологiчного тдхо-ду з метою штеграци шформацшних ресурив».

СПИСОК ЛГГЕРАТУРИ

1. Джерк Н. Разработка приложений для электронной коммерции / Н. Джерк, Санкт-Петербург : Питер. - 2001 р.

2. Пелещишин А.М. Методи побудови Ефективних Web-систем / А. М. Пелещишин // ¡нформацшш системи та мережг Вюник НУЛП. - 2012. - № 464. -C. 240-254.

3. Берко А. Системи електронно!' контент-комерцп : монограф1я / А. Берко, В. Висоцька, В. Паачник. - Льв1в : Видавництво НУ «Льв1вська полгтехшка», 2009. - 612 с.

4. Methods based on ontologies for information resources processing / [V. Lytvyn, V. Vysotska, L. Chyrun, D. Dosyn] // LAP Lambert Academic Publishing, Germany. - 324 p.

5. Висоцька В. А. Методи i засоби опрацювання шформацшних ресурав в системах електронно!' контент-комерцп : автореферат дисертацп на здобуття наукового ступеня к.т.н. : 05.13.06 / В. А. Висоцька; НУ «Львiвська полп^хшка». - Львiв, 2014. -27 с.

6. Ландэ Д. Основы моделирования и оценки електронных информационных потоков / Д. Ландэ, В. Фурашев, С. Брайчевс-кий, О. Григориев. - К. : Инжиниринг, 2006. - 348 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7. Ландэ Д. В. Некоторие методы анализа новостных информационных потоков / Д.В. Ландэ // ИКВТ-2005. - Вып. 93. -Донецк : ДонНТУ, 2005. - C. 277-287.

8. Ландэ Д. В. Сканер системы контент-мониторинга / Д. В. Ландэ // Открытые информационные и компьютерны интегрированные технологии. - Харьков : НАКУ «ХАИ», 2005. - Вып. 28. - C. 53-58.

9. Большакова Е. И. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика : учеб. пособие / [Е. И. Большакова, Э. С. Клышинский, Д. В. Ландэ и др.] - М. : МИЭМ, 2011. - 272 с.

10. Григорьев А. Н. Адаптивный интерфейс уточнения запросов к системе контент-мониторинга / А. Н. Григориев, Д. В. Лан-дэ // XI международная научно-практическая конференция. -К. : УкрИНТЭИ, 2005. - C. 17-20.

11. 1ванов В. Ф. Контент-аналiз / В. Ф. 1ванов. - К., 1994. - 112 с.

12. Математична лшГвютика / [В. Висоцька, В. Паачник, Ю. Щербина, Т. Шестакевич]. - Львiв : Новий СвпЧ2000, 2012. - 359 с.

13. McGovern G. Content Criticsl / G. McGovern, R. Norton. - NJ : FT Press, 2001. - 256 p.

14. McKeever S. Understanding Web content management systems: evolution, life cycle and market. / S. McKeever // Industrial Managemant & Data Systems, 2003. - 103 (9) - P. 686-692.

15. Rockley A. Managing Enterprise Content: A Unified Content Strategy. / A. Rockley. - Reading, Mass : New Riders Press, 2002. -592 p.

16. Висоцька В. А. Моделювання еташв життевого циклу комер -цшного web-контенту / В. А. Висоцька, Л. Б. Чирун, Л. В. Чирун // Вюник НУЛП. - 2011. - № 715. - С. 69-87.

17. Берко А. Ю. Алгоритми опрацювання шформацшних ресурав в системах електронно!' комерцп / А. Ю. Берко, В. А. Висоцька, Л. В. Чирун // Комп 'ютерш науки та шформацшш технологи. Вюник НУ ЛП. - 2008. - № 616. - С. 128-136.

18. Бюжало О. В. Застосування методу синтаксичного аналiзу речень для визначення ключових ^в украшомовного тексту / О. В. Бюжало, В. А. Висоцька // Радюелектрошка, шформа-тика, управлшня. - 2016. - № 3(38). - С. 54-65.

19. Бгакало О. В. Виявлення ключових ^в на основi методу кон-тент-мошторингу украшомовних текстсв / О. В. Бюжало,

В. А. Висоцька // Радюелектрошка, шформатика, управлшня. -2016. - № 1(36). - С. 74-83.

20. Литвин В. Застосування системи алгорштшчних алгебр для граматичного аналiзу символьних обчислень виразiв лопки висловлювань / В. Литвин, I. Бобик, В. Висоцька // Радюелектрошка, шформатика, управлшня. - 2016. - № 39. - С. 54-67.

21. Висоцька В. А. Особливосп проектування та впровадження систем електронно!' комерцп / В. А. Висоцька // Вюник НУЛП. -2008. - № 626. - C. 116-125.

22. Berko A. Features of information resources processing in electronic content commerce / Andriy Berko, Victoria Vysotska, Lyubomyr Chyrun // Applied Computer Science. ACS journal. -Poland, 2014. - Volume 10, Number 2. -P. 5-19.

23. Vysotska Victoria. Web Content Processing Method for Electronic Business Systems / Victoria Vysotska, Lyubomyr Chyrun // International Journal of Computers & Technology. - December 2013. - Vol 12, No. 2. - P. 3211-3220.

Стаття надшшла до редакци 05.04.2017.

Шсля доробки 15.05.2017.

Коробчинский М. В.1, Чирун Л. Б.2, Высоцкая В. А.3, Кондратьев Е. А.4

'Д-р. техн. наук, старший научный сотрудник Военно-дипломатической академии имени Евгения Березняка, Киев, Украина

2Ведущий специалист института компьютерных наук и информационных технологий Национального университета «Львовская политехника», Украина

3Канд. техн. наук, доцент, доцент кафедры «Информационные системы и сети» Национального университета «Львовская политехника», Украина

4Магистр кафедры «Информационные системы и сети» Национального университета «Львовская политехника», Украина

ОСОБЕННОСТИ ФОРМИРОВАНИЯ И АНАЛИЗА КОНТЕНТА ИНТЕРНЕТ-ГАЗЕТЫ МУЗЫКАЛЬНЫХ НОВОСТЕЙ

Актуальность. Негативные факторы в формировании контента усложняют процесс поиска необходимых данных при сканировании различных источников информации. Увеличение физического объема и изменение актуальности / динамики контентных потоков (систематическое и нерегулярное обновление) приводит к возникновению дублирования, информационного шума и избыточности результатов поиска контента. Охват и обобщение больших динамических потоков контента, непрерывно генерируют в Интернет-источниках, требует качественно новых методов / подходов поиска как контент-мониторинг.

Цель. Целью выполнения работы является разработка метода формирования и анлиз контента Интернет-газеты музыкальных новостей для активного привлечения постоянных пользователей информационного ресурса новостей и увеличение целевой аудитории. Задачей является разработка системы для распространения музыкальных новостей с использованием метода контент-мониторинга для формирования и анлиз текстового контента информационного ресурса Интернет-газеты.

Метод. Входной информацией для контент-мониторинга является текст на естественном языке как последовательность символов, исходная информация - это таблицы разделов, предложений и лексем анализируемого текста. Контент-мониторинг является программным средством автоматизации нахождения важных составляющих в потоках контента. Это содержательный анализ потоков контента с целью постоянного получения необходимых качественных / количественных срезов на протяжении не определенного заранее периода времени. Составной контент-мониторинга является контентный поиск и контент-анализ текста. Контент-анализ предназначен для поиска контента в массиве данных по смысловыми лингвистическими единицами. Единица счета является количественной мерой единицы анализа, позволяющая регистрировать частоту (регулярность) появления признака категории анализа в тексте (количество определенных слов или их сочетаний, строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста и т. д.).

Результаты. Решено актуальную задачу исследования и разработки методов и средств обработки информационных ресурсов интеллектуальной информационной системы формирования контента по использованию разработанной классификации, математического и программного обеспечения обобщенной архитектуры системы. Обоснована необходимость разработки методов и средств обработки информационных ресурсов в информационных системах формирования контента путем усовершенствования архитектуры системы с целью автоматизации процессов формирования, управления и реализации контента.

Выводы. Использование контент-анализа в мониторинге источников данных в Интернет автоматизирует процесс поиска наиболее важных компонент в потоке содержания, в выборе данных из этих источников. Это устраняет дубликаты контента, информационный шум, паразитные результаты бронирования контента и другое. Этот метод используется на следующих этапах анализа содержания для более точных результатов создания уникального контента, который пользуется спросом.

Ключевые слова: анализ, контент-анализ содержания информационных ресурсов, контент-анализ, рейтинговая оценка, система управления контентом.

Korobchynskyi M. V.1, Chyrun L. B.2, Vysotska V. A.3, Kondratiev E. O.4

'F.d., Senior Research Fellow of Military-Diplomatic Academy named Eugene Bereznyak, Kyiv, Ukraine

2Leading Specialist of Information Systems and Networks Department of Lviv Polytechnic National University, Lviv, Ukraine

3PhD, Associate Professor, Associate Professor of Information Systems and Networks Department of Lviv Polytechnic National University, Lviv, Ukraine

4Master of Information Systems and Networks Department of Lviv Polytechnic National University, Lviv, Ukraine

OF CONTENT FORMATION AND ANALYSIS FEATURES IN ONLINE NEWSPAPER OF MUSIC NEWS

Context. Negative factors in shaping the content complicate necessary data finding process when scanning various sources. Increased volume and variable Relevance / content flow dynamics (regular and non regular updates) leads to duplication and excessive information noise content in search results. Coverage and synthesis of large dynamic flow of content are continuously generating Internet media requires

qualitatively new methods / approaches of search as a content monitoring.

Objective. The work purpose is to develop content forming and anlizing method in online newspaper for the active involvement of regular users of news and information resource increase audytoryii target. The objective is to develop a system to distribute music news using content monitoring method for creation and content anlizing in information resource of online newspaper.

Method. Input information for content-monitoring is a natural language into a sequence of symbols, background information - a partition table, sentences and tokens analyzed text. Content monitoring is a software tool for automation of the important components in the flow of content. This is meaningful analysis of streams of content for the purpose of obtaining the necessary permanent qualitative / quantitative sections within pre-defined period of time not. Content monitoring component is content search and content analysis of the text. Content analysis designed to search for content in an array of data for linguistic semantic units. The unit of account is a quantitative measure of the unit of analysis that allows you to record the frequency (regularity) symbol appears in the text analysis category (number of certain words or combinations of lines, characters, pages, paragraphs, copyright sheets of text area, etc.).

Results. The problem of current research and development of methods and means of processing information resources information systems intellectual formation content with the use of the classification, mathematical and software and the generalized system architecture are solved. The necessity of methods and means development of information resources processing in intelligent information systems forming content by improving the system architecture to automate processes of formation, management and implementation of content.

Conclusions. The content analysis use in monitoring Internet data sources automates the finding process of the most important components in content flow in data selection from these sources. This eliminates duplicate content information noise, parasitic content redundancy results and more. This method is used in subsequent stages of content for more accurate relevant results - create a unique content that is in demand.

Keywords: analysis, content analysis content, information resource, content-analysis, rating evaluation, content management system.

REFERENCES

1. Dzherk N. Razrabotka prilozheniy dlya elektronnoy kommertsii. Sankt-Peterburg, Piter, 2001 r.

2. Peleshchyshyn A. M. Metody pobudovy Efektyvnykh Websystem, Informatsiyni systemy ta merezhi. LPNU Visnyk, 2012, No. 464, pp. 240-254.

3. Berko A. Y., Vysotska V. A., Pasichnyk V. V. Systemy elektronnoyi kontent-komertsiyi: monohrafiya. Lviv, LPNU Publishing, 2009, 612 p.

4. Lytvyn V., Vysotska V., Chyrun L., Dosyn D. Methods based on ontologies for information resources processing, LAP Lambert Academic Publishing, Germany, 324 p.

5. Vysotska V. A. Metody i zasoby opratsyuvannya informatsiynykh resursiv v systemakh elektronnoyi kontent-komertsiyi : avtoreferat dysertatsiyi na zdobuttya naukovoho stupenya k.t.n. : 05.13.06. NU «Lvivska politekhnika». Lviv, 2014, 27 p.

6. Lande D., Furashev V., Braychevskiy S., Grigoriyev O. Osnovy modelirovaniya i otsenki yelektronnykh informatsionnykh potokov. Kiev, Inzhiniring, 2006, 348 p.

7. Lande D. V. Nekotoriye metody analiza novostnykh informatsionnykh potokov, IKVT-2005, Vol. 93. Donetsk, DonNTU, 2005, pp. 277-287.

8. Lande D. V. Skaner sistemy kontent-monitoringa, Otkrytyye informatsionnyye i komp 'yuterny integrirovannyye tekhnologii. Khar'kov, NAKU «KHAI», 2005, Vyp. 28, pp. 53-58.

9. Bolshakova Y. I., Klyshinskiy E. S., Lande D. V., Noskov A. A., Peskova O. V., Yagunova Ye. V. Avtomaticheskaya obrabotka tekstov na yestestvennom yazyke i komp'yuternaya lingvistika: ucheb. Posobiye. Moscow, MIEM, 2011, 272 p.

10. Grigoryev A. N., Lande D. V. Adaptivnyy interfeys utochneniya zaprosov k sisteme kontent-monitoringa, KHH mezhdunarodnaya nauchno-prakticheskaya konferentsiya. Kiev, UkrINTEI, 2005, pp. 17-20.

11. Ivanov V. F. Kontent-analiz. Kiev, 1994, 112 p.

12. Pasichnyk V., Shcherbyna Y., Vysotska V., Shestakevych T. Matematychna linhvistyka. Lviv, Novyy svit-2000, 2012, 359 p.

13. McGovern G., Norton R. Content Criticsl. NJ, FT Press, 2001, 256 p.

14. McKeever S. Understanding Web content management systems: evolution, life cycle and market, Industrial Managemant & Data Systems, 2003, 103 (9), pp. 686-692.

15. Rockley A. Managing Enterprise Content: A Unified Content Strategy. Reading, Mass, New Riders Press, 2002, 592 p.

16.Vysotska V. Chyrun L., Chyrun L. Modelyuvannya etapiv zhyttyevoho tsyklu komertsiynoho web-kontentu, LPNU Visnyk, 2011, No. 715, pp. 69-87.

17.Berko A. Y., Vysotska V. A., Chyrun L. V. Alhorytmy opratsyuvannya informatsiynykh resursiv v systemakh elektronnoyi komertsiyi, Kompyuterni nauky ta informatsiyni tekhnolohiyi. LPNU Visnyk, 2008, No. 616, pp. 128-136.

18. Bisikalo O. V., Vysotska V.A. Sentence syntactic analysis application to keywords identification Ukrainian texts, Radio Electronics, Computer Science, Control, 2016, No. 3(38), pp. 54-65.

19. Bisikalo O. V., Vysots'ka V. A. Identifying keywords on the basis of content monitoring method in Ukrainian texts, Radio Electronics, Computer Science, Control, 2016, No. 1(36), pp. 74-83.

20. Lytvyn V. V., Bobyk I. O., Vysotska V. A. Application of algorithmic algebra system for grammatical analysis of symbolic computation expressions of propositional logic, Radio Electronics, Computer Science, Control, 2016, No. 4(39), pp. 54-67.

21. Vysotska V. A. Osoblyvosti proektuvannya ta vprovadzhennya system elektronnoyi komertsiyi, LPNU Visnyk, 2008, No. 626, pp. 116-125.

22. Berko A., Vysotska Victoria, Chyrun Lyubomyr Features of information resources processing in electronic content commerce, Applied Computer Science. ACS journal, Poland, 2014, Volume 10, Number 2, pp. 5-19.

23. Vysotska Victoria, Chyrun Lyubomyr Web Content Processing Method for Electronic Business Systems, International Journal of Computers & Technology, December 2013, Poland, 2014, Volume 10, Number 2, pp. 5-19.

i Надоели баннеры? Вы всегда можете отключить рекламу.