Научная статья на тему 'РЕПРЕЗЕНТАЦИЯ ЛИЧНОСТИ И ТВОРЧЕСТВА Г. П. КАМЕНЕВА С ИСПОЛЬЗОВАНИЕМ ТЕХНОЛОГИЙ АНАЛИЗА ИНТЕРНЕТ-РЕСУРСОВ И КОНТЕНТА'

РЕПРЕЗЕНТАЦИЯ ЛИЧНОСТИ И ТВОРЧЕСТВА Г. П. КАМЕНЕВА С ИСПОЛЬЗОВАНИЕМ ТЕХНОЛОГИЙ АНАЛИЗА ИНТЕРНЕТ-РЕСУРСОВ И КОНТЕНТА Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
61
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КАМЕНЕВ / РЕПРЕЗЕНТАЦИЯ / ИНТЕРНЕТ / АНАЛИЗ / ИСТОЧНИКИ / ПОИСКОВЫЕ СИСТЕМЫ

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Бакиров Ринат Альбертович, Нурутдинова Алсу Рафаиловна

Статья посвящена особенностям репрезентации писателя в публичном пространстве на примере казанского поэта рубежа XVIII-XIX веков Гавриила Петровича Каменева. В первой части работы приведен анализ места писателя в историко-культурном и научном контексте с XVIII по XX век, до повсеместного использования интернета как основного источника информации в обществе. Оказалось, что Каменев так и не получил полноправного места в историко-литературном процессе как в трудах филологов, так и в массовом сознании. Исключением явились лишь такие источники, как краеведческие работы и труды ученых, имевших отношение к Казани, в частности Е. А. Боброва. Во второй части статьи приведена методика и описаны инструменты сбора данных поисковых сайтов о присутствии личности писателя в интернете. Среди прочего в статье постулируется, что основными средствами анализа восприятия современной публикой аспектов творческой личности выступают запросы в поисковых системах. Собранные статистические данные по результатам анализа выдачи поисковых систем и контента дают возможность получить информацию о количестве открытых ресурсов, структуре и их содержании. Использованная методика может применена и в отношении других публичных личностей, прежде всего писателей.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

REPRESENTATION OF G. KAMENEV’S PERSONALITY AND WORKS USING TECHNOLOGIES FOR ANALYZING INTERNET RESOURCES AND CONTENT

The article is devoted to the peculiarities of the writer’s representation in a public space, exemplified by the Kazan poet, Gavriil Petrovich Kamenev, who worked at the turn of the18th-19th centuries. The first part of the article analyzes the writer’s place in the historical, cultural and scientific context from the 18th to the 20th centuries, before the widespread use of the Internet as the main source of information in society. We have found that Kamenev did not get his rightful place in the historical and literary process, either in the works of philologists or in the mass consciousness. The only exceptions were such sources as the works on local history and the works of researchers connected to Kazan, in particular, E. Bobrov. The second part of the article presents the methodology and describes the tools for collecting data from search sites about the presence of the writer’s identity on the Internet. Among other things, the article postulates that the main means of analyzing the modern public perception of creative personality aspects are queries in search engines. The statistical data, collected from the analysis of the search engine output and content, provide information about the number of open resources, structure and content. The used methodology can be applied to other public personalities, primarily writers.

Текст научной работы на тему «РЕПРЕЗЕНТАЦИЯ ЛИЧНОСТИ И ТВОРЧЕСТВА Г. П. КАМЕНЕВА С ИСПОЛЬЗОВАНИЕМ ТЕХНОЛОГИЙ АНАЛИЗА ИНТЕРНЕТ-РЕСУРСОВ И КОНТЕНТА»

ФИЛОЛОГИЯ И КУЛЬТУРА. PHILOLOGY AND CULTURE. 2022. №3(69)

ФИЛОЛОГИЧЕСКИЕ НАУКИ. ЛИТЕРАТУРОВЕДЕНИЕ

УДК 821.161.1

DOI: 10.26907/2074-0239-2022-69-3-44-51

РЕПРЕЗЕНТАЦИЯ ЛИЧНОСТИ И ТВОРЧЕСТВА Г. П. КАМЕНЕВА С ИСПОЛЬЗОВАНИЕМ ТЕХНОЛОГИЙ АНАЛИЗА ИНТЕРНЕТ-

РЕСУРСОВ И КОНТЕНТА

© Ринат Бакиров, Алсу Нурутдинова

REPRESENTATION OF G. KAMENEV'S PERSONALITY AND WORKS USING TECHNOLOGIES FOR ANALYZING INTERNET RESOURCES

AND CONTENT

Rinat Bakirov, Alsu Nurutdinova

The article is devoted to the peculiarities of the writer's representation in a public space, exemplified by the Kazan poet, Gavriil Petrovich Kamenev, who worked at the turn of the18th-19th centuries. The first part of the article analyzes the writer's place in the historical, cultural and scientific context from the 18th to the 20th centuries, before the widespread use of the Internet as the main source of information in society. We have found that Kamenev did not get his rightful place in the historical and literary process, either in the works of philologists or in the mass consciousness. The only exceptions were such sources as the works on local history and the works of researchers connected to Kazan, in particular, E. Bobrov. The second part of the article presents the methodology and describes the tools for collecting data from search sites about the presence of the writer's identity on the Internet. Among other things, the article postulates that the main means of analyzing the modern public perception of creative personality aspects are queries in search engines. The statistical data, collected from the analysis of the search engine output and content, provide information about the number of open resources, structure and content. The used methodology can be applied to other public personalities, primarily writers.

Keywords: Kamenev, representation, Internet, analysis, sources, search engines

Статья посвящена особенностям репрезентации писателя в публичном пространстве на примере казанского поэта рубежа XVIII-XIX веков Гавриила Петровича Каменева. В первой части работы приведен анализ места писателя в историко-культурном и научном контексте с XVIII по XX век, до повсеместного использования интернета как основного источника информации в обществе. Оказалось, что Каменев так и не получил полноправного места в историко-литературном процессе как в трудах филологов, так и в массовом сознании. Исключением явились лишь такие источники, как краеведческие работы и труды ученых, имевших отношение к Казани, в частности Е. А. Боброва. Во второй части статьи приведена методика и описаны инструменты сбора данных поисковых сайтов о присутствии личности писателя в интернете. Среди прочего в статье постулируется, что основными средствами анализа восприятия современной публикой аспектов творческой личности выступают запросы в поисковых системах. Собранные статистические данные по результатам анализа выдачи поисковых систем и контента дают возможность получить информацию о количестве открытых ресурсов, структуре и их содержании. Использованная методика может применена и в отношении других публичных личностей, прежде всего писателей.

Ключевые слова: Каменев, репрезентация, интернет, анализ, источники, поисковые системы

Гавриил Петрович Каменев (1772-1803) привлек пристальное внимание публикаторов и исследователей уже после своей смерти. Впрочем, и это внимание нельзя назвать по-настоящему

серьезным. Такое положение дел сохранилось в целом и до наших дней.

Для начала обозначим место казанского купца и писателя в культурной жизни России доин-тернетной эпохи. Кем он был для публики того

времени? Прижизненные публикации казанского писателя не дают достаточного ответа на этот вопрос. Да, он публиковался в довольно популярных литературных журналах своего времени. Но произведения его выходили в «Музе», «Ип-покрене» или «Новостях русской литературы» в основном под псевдонимами или цифронимами, что существенно сокращало для современников возможность идентификации автора реального.

Известные слова Пушкина о Каменеве относятся к его «Громвалу», опубликованному только через год после смерти поэта: «Он первый в России осмелился отступить от классицизма. Мы, русские романтики, должны принести должную дань его памяти...» [1, с. 21]. Поэтому, например, и слова В. Г. Белинского о том, что «громкую известность добыл он себе балладою „Громвал", для того времени удивительною», нужно понимать именно в том смысле, что известность эта оказалась посмертной. Одновременно локальный образ Каменева не соответствовал по крайней мере в диахронической перспективе тому образу, который он реконструировал с литературной точки зрения. Для казанских современников Каменев - это прежде всего представитель влиятельного рода, купец и видный общественный деятель.

Однако были две темы, которые достаточно тесно связывали купца-писателя с общероссийским контекстом. Первая - это уже упомянутая литература. Вторая - то, что Каменев, помимо всего, при участии своего ближайшего друга Саввы Андреевича Москотильникова (17681852), был членом казанской масонской ложи. Работала она по шведской системе (по ней же работала и основная часть московских масонов) под руководством Национальной Ложи и называлась Ложи Восходящего Солнца (Светила). За все время существования с 1776 года в ее составе в качестве действительных членов были зафиксированы несколько известных для своего времени личностей: Н. С. Арцыбашев, К. Б. Бер-биль, А. М. Вындомский, С. И. Гамалея, Г. П. Каменев, А. Л. Лихачев (основатель и мастер стула ложи), С. А. Москотильников, И. И. Панаев (мастер стула с конца 1783 года), В. М. Попов, И. И. Чернявский [2, с. 948]. Весной 1800 года в Казань приезжают московские масоны Матвей Григорьевич Спиридов и Иван Владимирович Лопухин, с которыми Каменева знакомит Мос-котильников [3, с. 121-122]. В сентябре-ноябре того же года Каменев отправляется в Москву, где его «рекомендателем» в столичном обществе становится Лопухин. Так, например, в одном из своих писем Москотильникову Гавриил Петрович с заметной долей самоиронии пишет:

«В пятницу Иван Володимирович рекомендовал меня господину Тургеневу под именем казанского не-госиямпа и литератора. Я принят был очень благосклонно; и господин директор университета сказал мне: что он за удовольствие себе поставляет знать меня лично, хотя уже я как ему так и детям его давно по переводам известен...» [4, с. 120];

и также:

«Третьего дни обедал я у Ивана Володимировича, где были г. Тургенев, и Поздеев... Последнему рекомендован я под именем любителя литературы, и зван им к себе» [Там же].

Все упомянутые Каменевым личности, и Лопухин, и Тургенев, и Поздеев были весьма активными участниками масонских собраний. Особенно ярым в этом отношении был взявший казанского писателя под свое крыло И. В. Лопухин, автор нескольких книг масонского содержания и известный благотворитель. Можно сказать, что масонские знакомства Каменева были довольно обширны и стали одной из основных составляющих формирования его публичного образа.

Между тем довольно остро встает вопрос о том, как реконструировать место Каменева в современном ему мире. Ввиду отсутствия сохранившихся о нем воспоминаний мемуарного характера, единственно возможным способом здесь становится опора на эпистолярий писателя - разумеется, с учетом всех присущих жанру субъективных факторов и особенностей.

Всего сохранилось 14 писем - все из Москвы от Каменева в Казань Москотильникову, в которых, «несмотря на наивность их в некоторых местах, вы увидите <... > человека с умом наблюдательным, душою нежною, любящею» [5, с. 39]. Впервые они были опубликованы еще в 1845 году Н. И. Второвым, однако с большими авторскими и цензурными купюрами, что не замедлил отметить другой исследователь личности и творчества казанского писателя, Е. А. Бобров, переиздавший с довольно обширными комментариями в 1902 году все известные на тот момент письма Каменева Москотильникову с их подлинников, полученных «благодаря просвещенному содействию наследницы бумаг С. А. Мос-котильникова и его воспитанницы П. Проскуряковой» [6, с. 109].

Важно отметить, что в письмах писатель формирует вполне определенный свой образ -меланхолика, постоянно размышляющего о собственной жизни и возможной смерти. Первая их «серия» написана в 1799 году: с 9 февраля по

март Каменев находился в Москве по торговым делам и написал в общей сложности 3 письма Москотильникову, к которому он обращается «Милостивый Государь мой и любезной друг Савва Андреевич». Ответных же писем Саввы Андреевича Каменеву не сохранилось (как, впрочем, не сохранилось их и из других поездок).

Следующее «путешествие» казанского провинциала в Москву состоялось в сентябре-ноябре 1800 года и оказалось для Каменева гораздо более плодотворным на знакомства и впечатления и гораздо больше позволяет реконструировать его образ среди современников. Каменев описывает свои новые знакомства в среде московской интеллигенции (в том числе и визиты И. В. Лопухину, И. П. Тургеневу, Н. М. Карамзину), довольно подробно останавливаясь на литературных пристрастиях столичного общества. Эти сообщения Гавриила Петровича довольно живы, даже с некоторой долей самоиронии. В других письмах чаще всего упоминаются отрывки бесед с Карамзиным, жалобы на погоду и местами иронические, местами лирические пассажи на самые разные темы.

Последняя - третья - поездка Каменева состоялась в июне-августе 1802 года. Сохранилось лишь одно письмо, также из Москвы в Казань Москотильникову, хотя большую часть времени (около двух месяцев) Гавриил Петрович провел в Петербурге, где, кстати, был избран 30 августа «членом Вольного общества любителей словесности, наук и художеств в нарушение устава, разрешавшего избрание иногородних писателей лишь корреспондентами» [3, с. 122]. Письмо это датировано 11 июня и содержатся в нем в основном размышления, связанные с посещаемыми Каменевым местами в окрестностях города и вызванными ими культурно-историческими ассоциациями-домыслами, предположениями о мыслях исторических персонажей века минувшего и т. д.

Особенно важным для определения места казанского литератора в истории представляется седьмое письмо Каменева, от 10 октября, в котором тот описывает первый свой визит к Н. М. Карамзину и в котором с истовостью молодого провинциального литератора, оказавшегося перед уже признанными корифеями русской литературы, детально описывает весь разговор с Карамзиным и Дмитриевым, не опуская ничего:

«Увидевши нас Карамзин встал из волтеровских кресел, обитых алым сафьяном, подошел ко мне, взял за руку, и говорил: что Иван Володимирович давно ему обо мне сказывал; что он любит познакомиться с молодыми людьми, любящими литературу. И не дав-

ши мне ни слова вымолвить, спросил не я ли присылал ему перевод из Казани, и напечатан ли он, я отвечал и на то, и на другое как можно короче. После сего начался разговор о книгах, и оба сочинителя спрашивали меня на перерыв: какие языки мне известны? где я учился? сколько времени? что переводил? что читал? и не писал ли чего стихами?..» [4, с. 129].

«Рекомендателями» казанского писателя выступают ведущие фигуры русского масонства конца ХУШ века, И. В. Лопухин и И. П. Тургенев (последний даже дал Каменеву своего сына как проводника). Вскоре состоялось и второе посещение Каменевым Карамзина. Видимо, робость первой встречи уже прошла, и Гавриил Петрович описывает эту встречу с заметной долей критицизма и некоторым разочарованием в своем кумире:

«Севши в вольтеровские свои креслы; просил он меня чтоб я сел на диван, возвышенной не более шести вершков от полу - где как карла перед гигантом в уничижительнейшем положении, имел удовольствие с час говорить с ним. Г. Карамзин был в совершенном дезабилье: белой банковой сюртук нараспашку, медвежьи большие сапоги, расстегнутая рубаха, и растрепанные волосы, перевязанные на голове косынкою, составляли его одежду — » [Там же, с. 133-134].

Таким образом, несмотря на все недовольство отношением к себе, мы можем понять, что в московском обществе Каменев отнюдь не пользовался хоть какой-либо известностью и воспринимался прежде всего как провинциальный писатель, пока что не равный столичным коллегам. Впрочем, оно и понятно: славу Каменеву принесла только уже посмертная публикация «Громвала». На протяжении последующего века о нем практически не вспоминали (исключение -лишь одно и на локальном уровне переданные обществу посредством А. А. Фукс слова Пушкина).

Упоминавшуюся нами активность Е. А. Боброва по публикации писем Каменева и исследованию его жизни и творчества (что интересно -посредством философии и психологии) можно назвать последним крупным всплеском интереса к писателю как в научной мысли, так и в общественном сознании вплоть до рубежа XX-XXI веков. На протяжении почти века купец и поэт лишь изредка появлялся в исследовательском поле, и то в основном в краеведческих работах, за исключением интереса к его поэзии и прозе со стороны Р. М. Лазарчук [7] и В. Э. Вацуро [8]. Кроме того, «каменевские письма к Москотиль-никову о встречах с Карамзиным, описание его внешности, поведения, обстановки квартиры и многое другое, - послужили источником для био-

графов Карамзина, нашедших в них объективные данные для характеристики известного историографа» [3, с. 122].

Новый серьезный всплеск интереса к произведениям Каменева относится уже к современности и, в частности, связано с именами А. Н. Пашкурова [9], [10], Е. И. Карташевой, Э. Н. Ва-леева. Между тем в последнее время из различных архивов извлекаются новонайденные, ранее не изданные художественные произведения и письма, списки писем Гавриила Петровича. Так, например, на Каменевских чтениях 2003 года Е. И. Карташевой были представлены списки двенадцати ранее считавшихся утерянными писем казанского литератора в Казань, хранившихся в личном архиве П. А. Пономарева. Таким образом, можно констатировать определенный рост интереса к личности и творчеству писателя в последние 20 лет и напрашивается издание выверенного собрания сочинений Каменева.

Однако кем же является Каменев-писатель в современном мире, в котором основным средством распространения информации стал интернет? Здесь сразу нужно сказать, что творчество поэтов, писателей и художественный текст в пространстве компьютерных сетей переживает второе рождение, так как они больше не ограничены физическими процессами, временем, могут воспроизводиться бесконечное количество раз, интерпретироваться в рамках обратной связи, осуществляемой между автором либо другими заинтересованными пользователями сети, у них есть возможность популяризации за счет продвижения, они часто становятся множеством для аккумулирования новой информации, агрегации в различные корпуса.

Переходя к современному состоянию восприятия «электронного» образа субъектов исследования, необходимо определить наиболее эффективные инструменты для оценки репрезентативности и представимости творчества писателей в глобальной сети. Есть несколько вариантов для решения такой задачи. Наиболее простым инструментом, позволяющим оценить интерес пользователей сети к тому или иному писателю, являются такие площадки, как wordstat.yandex.ru и trends.google.ru. Данные инструменты выдают статистику запросов пользователей по заданному запросу и могут рассматриваться преимущественно как инструменты анализа популярности (или непопулярности) писателей и произведений в интернете.

Однако эти инструменты не позволяют получить картину репрезентативности, а лишь демонстрируют определенные интересы пользователей сети. Для получения полной информации необ-

ходимо сгенерировать это множество запросов, получить результаты возможных поисковых систем с учетом пересечений по ресурсам, а для более глубокого анализа контента необходимо собрать данные из найденных ресурсов. Рассмотрим основные этапы поставленной задачи.

1. Формирование словаря U релевантных возможных комбинаций для запросов U= [«Каменев поэт», «Каменев стихи», ..., «Каменев Громвал»).

2. Сбор ссылок для каждого элемента словаря U.

3. Анализ полученного массива данных, очистка и преобразование.

4. Идентификация типа контента с использование методов машинного обучения.

Формирование семантического ядра для словаря включает использование сервиса подбора ключевых слов (Яндекс.Wordstat, Планировщик Google).

Парсинг выдачи поисковых запросов представляет собой набор функций, генерирующих запросы из заданного словаря и аккумулирующих полученные результаты в виде таблицы URL-адресов. Был разработан пакет таких функций для каждой из поисковых систем - Yandex, Google, Sputnik. Каждая функция использует для парсинга две библиотеки: BeautifulSoup и request. Данный пакет позволяет получить список URL-адресов каждого из источников в случае хотя бы одного вхождения запроса в контент ресурса. По запросу из словаря U было получено 1089 объектов.

На этапе обработки собранных данных исключены неработающие ссылки и пересечения с использованием библиотеки pandas.

В рамках работы разработан промежуточный web-ресурс, который позволяет визуально оценить статистику полученных результатов по регионам в виде графиков и карт. Такая статистика дает возможность проанализировать охваты запросов по регионам и отследить активность на временном интервале.

Есть два основных класса литературы, которые представлены в Интернете: художественная и документальная. Большая часть художественной литературы - это авторские тексты. В «документальную» литературу можно включить эссе, биографию, автобиографию, статьи и т. п. Можно выделить еще класс, имеющий отношение к литературному контенту: это информационный массив в виде отзывов и комментариев. Такая информация часто не подвергается серьезной цензуре, однако может иметь достаточный вес для анализа популярности текста или на-

строений читателей. Далее будем определять данный класс как тип ресурса.

С целью идентификации типа полученного ресурса для задачи анализа репрезентативности поэта предложены алгоритмы сбора контента и кластеризации контента массива ресурсов по содержанию. Пусть данные представляют собой три типа контента: биография, стихи и другие. К классу S0 отнесем биографию, к классу S1 - стихотворения, к классу S2 - другие сайты, в том числе ошибочные (шумовые, выбросы).

Для того чтобы распределить весь контент на три типа, используются методы извлечения, обработки html-кода страниц-ресурсов и обработки текстовой информации на предмет извлечения тем и структур. То есть парсер для получения контента каждого из ресурсов из списка URL-адресов пробегает по каждой ссылке, собирая код каждой страницы.

Полученный Html-код каждой страницы ресурса имеет различную структуру, включает в себя множество различных конструкций, в которых необходимо найти нужный текст или структуру. Для списка таких тегов объявим словарь Tags, по которому будем итерироваться при сборе часто встречающихся слов. Например, тег plaintext отображает содержимое контейнера «как есть»; тег abbr указывает, что последовательность символов является аббревиатурой; тег acronym сообщает, что текст является акронимом; тег address предназначен для хранения информации об авторе, тег em предназначен для акцентирования текста. Функция извлечения содержимого тегов реализует метод получения наиболее частых слов в тексте и включает в себя скрипты удаления незначащих слов для кластеризации (например, предлоги и знаки препинания). Далее происходит лемматизация слов, то есть все слова преобразовываются в свои корневые слова с использованием библиотеки Pymorphy2.

Полученная выборка ключевых слов используется для кластеризации. Здесь существует несколько методов, основанных на векторизации массива слов и использовании алгоритмов кластеризации, таких как иерархические методы, k-means, DBScan.

Если методы, основанные на минимизации внутрикластерных, межкластерных расстояний и поиске ближайшего соседа на данном этапе не дали хороших результатов, то иерархический метод позволил выделить три заявленных кластера.

Для решения задачи кластеризации было предложено использование методов тематического моделирования Latent Dirichlet Allocation (пакет Gensim Python), задача которых заключа-

ется в том, чтобы полученные данные были хорошего качества, понятными, значимыми и разделенными. Отметим, что достижение этих целей во многом зависит от предварительной обработки массива данных.

Решение задачи тематического моделирования включает следующие этапы:

1. Токенизация слов и очистка текста.

2. Создание биграмм и триграмм.

3. Удаление стоп-слов, создание биграмм, лемматизация.

4. Создание словаря и корпуса.

Биграммы в данной задаче - это два слова,

часто встречающиеся в документе вместе.

Здесь используется модель фраз Gensim, которая может создавать и реализовывать биграм-мы и триграммы. Двумя важными аргументами фраз являются min_count и threshold. Чем выше значения этих параметров, тем сложнее объединить слова в биграммы.

Двумя основными входными данными для тематической модели LDA являются словарь (id2word) и корпус. Gensim создает уникальный идентификатор для каждого слова в документе. Например, в словаре S: [[(0, 1), (1, 1), (2, 1), (3, 1), (4, 1), (5, 1), (6, 1), (7, 1), (8, 1)]] значение (0, 1) подразумевает, что слово c id 0 встречается один раз в первом документе. В дополнение к корпусу и словарю необходимо также указать количество тем. В нашем случае их три.

Кроме того, важной на этапе являются настройка гиперпараметров, которые влияют на разреженность тем. Согласно документации Gensim, оба значения по умолчанию равны 1.0. Входными параметрами модели являются количество документов, которые будут использоваться в каждом обучающем пакете, число, определяющее частоту обновления параметров модели и общее количество проходов обучения.

Пример получившихся тем:

[(0,

'0.145*"_" + 0.144*"d" + 0.010*"каменев" + 0.006* "каменева" + 0.005*"гавриил" + 0.005*"пётр" + 0.004*"поэт" + 0.003*"казань" + 0.003*"громвал" + 0.003*"кн"'),

(1,

'0.007*"каменева" + 0.005*"каменев" + 0.005*>ф" + 0.005*"года" + 0.004*"ре" + 0.004*"это" + 0.003*"рГ + 0.003*"году" + 0.003*"сгс" + 0.003*"жизни"'),

(2,

'0.023*"каменев" + 0.017*"казани" + 0.013*"каменева" + 0.010*"года" + 0.010*"году" + 0.009*"поэта" + 0.008*"поэт" + 0.007*"казань" + 0.006*"это" + 0.005*"mw_parser"')

Каждая тема представляет собой комбинацию ключевых слов, и каждое ключевое слово вносит определенный вес в тему.

Вычислены оценки сложности модели и согласованности темы, которые предоставляют удобную меру для оценки того, насколько хорошо выполнено тематическое моделирование. Здесь действует правило: чем меньше сложность, тем лучше. Для биграмм и триграмм-моделей оценка получилась примерно равной. Для кластеризация полученных тем использованы методы пакета Sklearn Python.

Таким образом, рассмотрена и изучена задача извлечения данных о писателях и произведениях и получения статистики запросов с использованием поисковых систем. Проведен сбор и анализ выдачи поисковых систем и контента по личности и творчеству Г. П. Каменева. Проведено исследование применения технологий Data mining и методов многопараметрического анализа текстовых массивов к задаче классификации типа полученного информационного массива. Разработан инструмент сбора и анализа ссылок по данным писателя в поисковых системах с возможностью идентификации характера информационного ресурса.

В итоге оказывается, что Гавриил Петрович Каменев в интернете интересен прежде всего жителям Казани и Поволжья, притом определенные всплески внимания в поисковых системах наблюдаются в те дни, когда проводятся мероприятия, тематически связанные с личностью писателя, прежде всего конференции, литературные фестивали и т.п. В этом плане Каменев четко отличается от того места, которое в интернете занимает, к примеру, его земляк и современник, а также тезка Гавриил Романович Державин. Интерес к последнему наблюдается в первую очередь в те периоды, когда в школьной программе изучается его творчество (октябрь-ноябрь каждого года). Региональный интерес к Державину также шире, чем к Каменеву, но также тесно связан с биографической составляющей. В случае с «певцом Фелицы» к Татарстану, например, присоединяются Карелия и Новогородская область -те регионы, в которых Державин жил и работал [11, с. 60]. В целом же из интернет-анализа видно, что Г. П. Каменев и поныне не входит в число популярных писателей, в десятки раз уступая по запросам даже многим своим современникам, не говоря уже о столпах русской литературы.

Хотелось бы отметить, что тенденции развития информационных технологий приводят к массовому накоплению информации и рассеиванию идей и мыслей по всему цифровому ландшафту. Мы должны осознавать важность и сроч-

ность, с которой им необходимо управлять своим цифровым наследием, и должны взять под контроль свои цифровые литературные активы -электронные тексты и их производные в виде смежной информации (отзывы, биографии, история, статьи и др.).

Проводя аналогию с информационными технологиями в других областях, мы можем принимать современные корпуса текстов как некоторые базы данных с возможностью фильтрации, обработки запросов, и это достаточно трудоемкая работа. Постоянное увеличение количества публикаций затрудняет ведение содержательных обзоров, на основе которых можно выявлять статистики и тенденции. Инструменты сбора и интеллектуальной обработки информации в интерактивном режиме дают большие возможности в части обработки постоянно пополняемых информационных литературных массивов в результате оцифровки текстов и откликов на тексты, а также позволяют отслеживать динамику интереса пользователей к литературным объектам. Здесь авторами предлагается автоматизированный гибкий инструмент-конвейер, который выявляет структуру и особенности интернет-ресурса, что соответствуют конкретным интересам исследователя.

Список источников

1. Фукс А. А. Александр Сергеевич Пушкин в Казани // Казанские губернские ведомости. 1844. № 2. Прибавл. С. 17-24.

2. Серков А. И. Русское масонство. 1731-2000 гг. Энциклопедический словарь. М.: РОССПЭН, 2001. 1224 с.

3. Валеев Э. Н. Г. П. Каменев в историко-литературном процессе конца ХУШ-начала XIX века: дис. ... канд. филол. наук. Елабуга, 2001. 194 с.

4. Письма Г. П. Каменева к С. А. Москотильни-кову // Е. А. Бобров Литература и просвещение в России XIX века. Материалы, исследования и заметки: Т. 3. Казань, 1902. С. 109-170, 190-199.

5. Второв Н. И. Гаврила Петрович Каменев: Посвящается другу его С. А. Москотильникову // Вчера и сегодня: Лит. сб. Кн. 1. СПб., 1845. С. 29-64.

6. Бобров Е. А. Литература и просвещение в России XIX в. Материалы, исследования и заметки. Т. 3. Казань: типо-лит. Имп. ун-та, 1902. 199 с.

7. Лазарчук Р. М. Письма Каменева и их историко-литературное значение // Проблемы изучения русской литературы XVIII века: от классицизма к романтизму. Вып. 2. Л., 1976. С. 74-84.

8. Вацуро В. Э. Готический роман в России. М.: «Новое литературное обозрение», 2002. 544 с.

9. Пашкуров А. Н. Анакреонтические мотивы в поэзии Г. П. Каменева // Филологические науки. 2009. № 3. С. 86-93.

10. Пашкуров А. Н. Забытая элегия русского предромантизма: «Осень» Г. П. Каменева (1792) // Забытые и малоизвестные писатели как феномен русской культуры: межвуз. сб. науч. трудов. Вып.1. Ела-буга: ЕГПУ, 2009. С. 28-34.

11. Бакиров Р. А. Трансформация популярности писателя в интернете: Google, Яндекс и Державин // М. Н. Муравьев и его время: Сборник статей и материалов. Казань: РИЦ, 2019. С. 55-61.

References

1. Fuks, A. A. (1844). Aleksandr Sergeevich Pushkin v Kazani [Alexander Sergeevich Pushkin in Kazan]. Kazanskie gubernskie vedomosti. No. 2, pp. 17-24. Pribavl. (In Russian)

2. Serkov, A. I. (2001). Russkoe masonstvo. 17312000 gg. Entsiklopedicheskii slovar' [Russian Freemasonry. 1731-2000. Encyclopedic Dictionary]. 1224 p. Moscow, ROSSPEN. (In Russian)

3. Valeev, E. N. (2001). G. P. Kamenev v istoriko-literaturnom protsesse kontsa XVIII-nachala XIX veka: Dis. kand. filol. nauk [G. P. Kamenev in the Historical and Literary Process of the Late 18th-Early 19th Centuries: Ph.D. Thesis]. Elabuga. 194 p. (In Russian)

4. Pis'ma G. P. Kameneva k S. A. Moskotil'nikovu (1844) [Letters from G. P. Kamenev to S. A. Moskotilnikov]. Bobrov E. A. Literatura i prosveshchenie v Rossii XIX veka. Materialy, issledovaniya i zametki: T. 3. Pp. 109-170, 190-199. Kazan'. (In Russian)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Vtorov, N. I. (1844). Gavrila Petrovich Kamenev: Posviashchaetsia drugu ego S. A. Moskotil'nikovu [Gavrila Petrovich Kamenev: Dedicated to His Friend S.

Бакиров Ринат Альбертович,

кандидат филологических наук, научный сотрудник, Лаборатория цифровых исследований литературы и фольклора ИРЛИ (Пушкинский Дом) РАН,

Лаборатория многофакторного гуманитарного анализа и когнитивной филологии Федерального исследовательского центра «Казанский научный центр Российской академии наук», Казанский федеральный университет, 199034, Россия, Санкт-Петербург, наб. Макарова, 4. r1nt@ya.ru

A. Moskotilnikov]. Vchera i segodnya: Lit. sb. Kn. 1, pp. 29-64. St. Petersburg. (In Russian)

6. Bobrov, E. A. (1902). Literatura i prosveshchenie v Rossii XIX v. Materialy, issledovaniya i zametki [Literature and Education in Russia in the 19th Century. Materials, Studies and Notes]. T. 3. 199 p. Kazan', tipo-lit. Imp. un-ta. (In Russian)

7. Lazarchuk, R.M. (1976). Pis'ma Kameneva i ikh istoriko-literaturnoe znachenie [Kamenev's Letters and Their Historical and Literary Significance]. Problemy izucheniya russkoi literatury XVIII veka: ot klassitsizma k romantizmu: Vyp. 2, pp. 74-84. Leningrad. (In Russian)

8. Vatsuro, V. E. (2002). Goticheskii roman v Rossii [Gothic Novel in Russia]. 544 p. Moscow, Novoe literaturnoe obozrenie. (In Russian)

9. Pashkurov, A. N. (2009). Anakreonticheskie motivy v poezii G. P. Kameneva [Anacreontic Motifs in the Poetry of G. P. Kamenev]. Filologicheskie nauki. No. 3, pp. 86-93. (In Russian)

10. Pashkurov, A. N. (2009). Zabytaya elegiya russkogo predromantizma: "Osen'" G. Kameneva (1792) [Forgotten Elegy of Russian Pre-Romanticism: "Autumn" by G. P. Kamenev (1792)]. Zabytye i maloizvestnye pisateli kak fenomen russkoi kul'tury: mezhvuz.sb.nauch.trudov. Vyp.1, pp. 28-34. Elabuga, EGPU. (In Russian)

11. Bakirov, R. A. (2019). Transformatsiya populiarnosti pisatelya v internete: Google, Yandex i Derzhavin [The Transformation of the Writer's Popularity on the Internet: Google, Yandex and Derzhavin]. M. N. Murav'ev i ego vremia: Sbornik statei i materialov. Pp. 55-61. Kazan', RITs. (In Russian)

The article was submitted on 30.06.2022 Поступила в редакцию 30.06.2022

Bakirov Rinat Albertovich, Ph.D. in Philology, research associate,

Laboratory of Digital Studies of Literature and Folklore at the Institute of Russian Literature of the Russian Academy of Sciences, Research Laboratory of Multiple Humanitarian Analysis and Cognitive Philology of the Federal Research Center "Kazan Scientific Center of the Russian Academy of Sciences",

Kazan Federal University,

4 Makarov Embankment,

St. Petersburg, 199034, Russian Federation.

r1nt@ya.ru

Нурутдинова Алсу Рафаиловна,

кандидат физико-математических наук, старший научный сотрудник, Лаборатория многофакторного гуманитарного анализа и когнитивной филологии Федерального исследовательского центра «Казанский научный центр Российской академии наук», Казанский федеральный университет, 420111, Россия, Казань, Лобачевского, 2/31. nurutdonovaar@mail.ru

Nurutdinova Alsu Rafailovna,

Ph.D. in Physics and Mathematics, senior researcher,

Research Laboratory of Multiple Humanitarian Analysis and Cognitive Philology of the Federal Research Center "Kazan Scientific Center of the Russian Academy of Sciences",

Kazan Federal University, 2/31 Lobachevsky Str., Kazan, 420111, Russian Federation. nurutdonovaar@mail. ru

i Надоели баннеры? Вы всегда можете отключить рекламу.