Научная статья на тему 'ПРИМЕНЕНИЕ ТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ ДЛЯ ОПТИМИЗАЦИИ ПРОЦЕССА ПОИСКА РЕЛЕВАНТНЫХ ИСТОРИЧЕСКИХ ДОКУМЕНТОВ (НА ПРИМЕРЕ БИРЖЕВОЙ ПРЕССЫ НАЧАЛА XX В.)'

ПРИМЕНЕНИЕ ТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ ДЛЯ ОПТИМИЗАЦИИ ПРОЦЕССА ПОИСКА РЕЛЕВАНТНЫХ ИСТОРИЧЕСКИХ ДОКУМЕНТОВ (НА ПРИМЕРЕ БИРЖЕВОЙ ПРЕССЫ НАЧАЛА XX В.) Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY-NC
52
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ / ЛАТЕНТНОЕ РАЗМЕЩЕНИЕ ДИРИХЛЕ / БИРЖЕВЫЕ ВЕДОМОСТИ / ПОВЕДЕНЧЕСКИЕ ФИНАНСЫ / ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА / РАСПОЗНАВАНИЕ ИСТОРИЧЕСКИХ ДОКУМЕНТОВ / ИСТОРИЧЕСКИЕ ГАЗЕТЫ / ПОИСК ИСТОРИЧЕСКИХ ДОКУМЕНТОВ / МАШИННОЕ ОБУЧЕНИЕ / ФОНДОВЫЙ РЫНОК

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Галушко Илья Николаевич

Ключевой задачей представленной статьи является апробация методики анализа информационного потенциала коллекции исторических источников с помощью тематического моделирования. Некоторые современные коллекции оцифрованных исторических материалов насчитывают десятки тысяч документов, и на уровне отдельного исследователя охват всего доступного наследия представляется затруднительным. Вслед за рядом исследователей мы предполагаем, что тематическое моделирование может стать удобным инструментом предварительной оценки содержания коллекции исторических документов; инструментом отбора только тех документов, в которых присутствует информация, релевантная поставленным исследовательским задачам. В нашем случае в качестве основной коллекции исторических документов была выбрана подборка газеты «Биржевые ведомости». На данном этапе мы можем подтвердить, что в рамках нашего исследования применение тематического моделирования оказалось продуктивным решением для оптимизации процесса поиска исторических документов в объемной коллекции оцифрованных исторических материалов. В то же время необходимо подчеркнуть, что в нашей работе тематическое моделирование применялось исключительно как прикладной инструмент ускорения поиска и первичной оценки информационного потенциала коллекции документов через анализ выделенных топиков. Наш опыт показал, что по крайней мере для «Биржевых ведомостей» тематическое моделирование с использованием LDA не позволяет делать выводы с позиции применяемой нами методологии содержательного анализа. Данные наших моделей слишком фрагментарны, их можно использовать только для первичной оценки тематик информации, содержащейся в источнике.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по СМИ (медиа) и массовым коммуникациям , автор научной работы — Галушко Илья Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE USE OF TOPIC MODELING TO OPTIMIZE THE PROCESS OF SEARCHING FOR RELEVANT HISTORICAL DOCUMENTS (ON THE EXAMPLE OF THE STOCK EXCHANGE PRESS OF THE EARLY 20TH CENTURY)

The key task of the presented article is to test how we can analyze the information potential of a historical sources collection by using thematic modeling. Some modern collections of digitized historical materials number tens of thousands of documents, and at the level of an individual researcher, it is difficult to cover available funds. Following a number of researchers, we suggest that thematic modeling can become a convenient tool for preliminary assessment of the content of a collection of historical documents; can become a tool for selecting only those documents that contain information relevant to the research tasks. In our case, the Birzhevye Vedomosti newspaper was chosen as one of the main collection of historical documents. At this stage, we can confirm that in our study, the use of topic modeling proved to be a productive solution for optimizing the process of searching for historical documents in a large collection of digitized historical materials. At the same time, it should be emphasized that in our work topic modeling was used exclusively as an applied tool for primary assessment of the information potential of a documents collection through the analysis of selected topics. Our experience has shown that, at least for Birzhevye Vedomosti, topic modeling with LDA does not allow us to draw conclusions from the standpoint of our content analysis methodology. The data of our models are too fragmentary, it can only be used for the initial assessment of the topics describing the information contained in the source.

Текст научной работы на тему «ПРИМЕНЕНИЕ ТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ ДЛЯ ОПТИМИЗАЦИИ ПРОЦЕССА ПОИСКА РЕЛЕВАНТНЫХ ИСТОРИЧЕСКИХ ДОКУМЕНТОВ (НА ПРИМЕРЕ БИРЖЕВОЙ ПРЕССЫ НАЧАЛА XX В.)»

Историческая информатика

Правильная ссылка на статью:

Галушко И.Н. — Применение тематического моделирования для оптимизации процесса поиска релевантных исторических документов (на примере биржевой прессы начала XX в.) // Историческая информатика. - 2023. -№ 2. DOI: 10.7256/2585-7797.2023.2.43466 EDN: SKBPNS URL: https;//nbpublish.com1lbrary_read_article.ptp? id=43466

Применение тематического моделирования для оптимизации процесса поиска релевантных исторических документов (на примере биржевой прессы начала XX в.)

Галуико Илья Николаевич

магистр, кафедра исторической информатики, исторический факультет, Московский государственный

университет имени М.В. Ломоносова (МГУ)

119234, Россия, г. Москва, ул. Ломоносовский Проспект, 27, корп.4

i.galushko15@gmail.com

Статья из рубрики "Новые методы и технологии обработки исторических источников"

DOI:

10.7256/2585-7797.2023.2.43466

EDN:

SKBPNS

Дата направления статьи в редакцию:

30-06-2023

Аннотация: Ключевой задачей представленной статьи является апробация методики анализа информационного потенциала коллекции исторических источников с помощью тематического моделирования. Некоторые современные коллекции оцифрованных исторических материалов насчитывают десятки тысяч документов, и на уровне отдельного исследователя охват всего доступного наследия представляется затруднительным. Вслед за рядом исследователей мы предполагаем, что тематическое моделирование может стать удобным инструментом предварительной оценки содержания коллекции исторических документов; инструментом отбора только тех документов, в которых присутствует информация, релевантная поставленным исследовательским задачам. В нашем случае в качестве основной коллекции исторических документов была выбрана подборка газеты «Биржевые ведомости». На данном этапе мы можем подтвердить, что в рамках нашего исследования применение тематического моделирования оказалось продуктивным решением для оптимизации процесса поиска исторических документов в объемной коллекции оцифрованных исторических материалов. В то же время необходимо подчеркнуть, что в нашей работе тематическое

моделирование применялось исключительно как прикладной инструмент ускорения поиска и первичной оценки информационного потенциала коллекции документов через анализ выделенных топиков. Наш опыт показал, что по крайней мере для «Биржевых ведомостей» тематическое моделирование с использованием LDA не позволяет делать выводы с позиции применяемой нами методологии содержательного анализа. Данные наших моделей слишком фрагментарны, их можно использовать только для первичной оценки тематик информации, содержащейся в источнике.

Ключевые слова:

тематическое моделирование, латентное размещение Дирихле, Биржевые ведомости, поведенческие финансы, обработка естественного языка, распознавание исторических документов, исторические газеты, поиск исторических документов, машинное обучение, фондовый рынок

Ключевой задачей представленной статьи является апробация методики анализа информационного потенциала коллекции исторических источников с помощью тематического моделирования. Некоторые современные коллекции оцифрованных исторических материалов насчитывают десятки тысяч документов (как, например, «Электронная библиотека исторических документов», созданная Российским историческим обществом (РИО), содержит 294 тысячи распознанных исторических

документов -Ш - и на уровне отдельного исследователя охват всего доступного наследия

представляется затруднительным. Вслед за рядом исследователей ^ мы предполагаем, что тематическое моделирование может стать удобным инструментом предварительной оценки содержания коллекции исторических документов; инструментом отбора только тех документов, в которых присутствует информация, релевантная поставленным исследовательским задачам.

Наше исследование, для которого и была разработана описываемая в статье методика, посвящено изучению доходности ценных бумаг на Санкт-Петербургской фондовой бирже в начале XX в. с позиции поведенческих финансов. Нас интересовали принципы инвестиционной оценки публичных компаний - как определялись приемлемые или недостаточные уровни капитализации; как определялись ценные бумаги, представляющие хороший выбор для помещения капиталов, насколько широко данные методики (если они существовали) применялись в практике биржевой торговли. В качестве одного из основных источников была выбрана газета «Биржевые ведомости», в ежедневных выпусках которой велась биржевая колонка, где печатался комментарий хроникера, в котором описывался настрой участников торгов и нередко приводился подробный анализ текущей ситуации в экономике Российской империи. В колонках «Биржевых ведомостей» часто встречаются аналитические заметки о доходности ценных бумаг: под какой процент размещается очередная эмиссия государственных долговых бумаг; на каком уровне относительно номинала торгуются эти бумаги; соответствует ли предлагаемый процент актуальной статистике денежного рынка и как объяснить курсовую динамику последних дней. Для исследования было решено собрать коллекцию таких заметок, чтобы на ее основе выделить устойчивые аналитические паттерны, характерные для биржевой прессы в вопросах, касающихся доходности ценных бумаг. Мы воспользовались материалами оцифрованного комплекта «Биржевых ведомостей» с сайта Российской национальной библиотеки (447 номеров за 1905 и 1913 года, утренние и вечерние выпуски). В рамках общего исследования доходности ценных бумаг на

фондовом рынке Российской империи нас интересовал ограниченный набор проблем, связанных с поведенческими и институциональными аспектами функционирования фондового рынка Российской империи. Содержание «Биржевых ведомостей», напротив, разнообразно. И, если не считать колонку биржевого хроникера, то встречаются номера, полностью лишенные нужной нам информации. Содержание таких номеров заполнено военными новостями, театральными и литературными обзорами, экономическими рассуждениями небиржевого характера и другими подобными статьями широкого профиля (см. рис. 1 и 2). И в этом контексте логично обратиться к возможностям тематического моделирования в качестве прикладного инструмента для автоматического поиска тех номеров (страниц) из нашей коллекции оцифрованных газетных материалов, которые содержат информацию, касающуюся особенностей функционирования рынка ценных бумаг.

Рисунок 1. Пример организации страницы номера «Биржевых ведомостей».

———

-П1 п! Тг-п-п ]

МСЫДОКЛ»

-—————

Пги* Ишп'МЦы Bi4ijji.ni«- кы | ш п цц, №Юикя1Е дач-

П нЛиднвмп гарцш» пСфНКйЙ»' «»»V Гчы щкш йш 4ыЬ г» м С, Д, П(Л1ЙИ1!!и»!ц I гоепред*. 1*4 Г* и* втт*«»"*»

9 и спптцк!17 тчсип, кШж щрл*- к», срогттви п шптгг! три свд* ■ пи грмпггашк- дмблим штпи «1| Гк лв*.

«ОТ* Пцйм^Чр я| радгпта яг М№ Оя*я* В4№«М1 м*к№и тол

Пэдплл 5ЧЯНж Я' 1 №1 Мх 4«1?г.*т|. иглтту. -п» М1

жгдинт. лршкп нед И№ЯЧ Нй4шт гНют м^п г ы.

гЬпк, ига и деятр» »ИТ г А додать НК1. юнс^рыгг ввдпитл явшгкг 1ГП11ПГ. В'.п- МШ) ПГСЧйв Я^О'С™ ЦЩ1Ц АО-{ ДЦ» СНЯЛ

"^»ШЦ И. «ОИП ■ № р ирмщцщц»

птт1 яш, вдл м к», дот я ггр-ш ______ ивпетин.

■ фбшлЬЛ {щж- 1гш ЧОПНЯШИ иютий тми*

иыхя г-шчичш пгяяггянн. ЧИГИт, им тап*и, ЩПЩ рм-

Т?<ЛЛЕК1 '"иязяяШ* И»*«!, Ш Цг>1-Ыжт м мог?нр, спйтШ гпфгап ■ ортдакльштк

Гщпглютя прзсЬрыв ятяг! 11 РЦЯПЩ ч'"чупшв*■ «мдефшшЦ« «ытяв выивш: ртчте- «*>сяж. Гвцръ щ|ш! «Щвт.

Дл и:ц1л,я яхЬ ЛЛВЦ*Я1 Й виияфяииЙЙ.

мммгЬяои. — (да, —т<?гл п циг<

Ниь&н-яММ* «НЬМПвШЪ П[«!»шг- ^ НмиАтн,—шт !»

ци дарчит *ле*Т- алл*тл ш ^ прга едошщяяйх. ■ г^тагш, яма » иди» шжм, мргафпа. вт, глттаьш г* гшпФтаЛ', ВЫИвШИ ^ ПТт «ВД нщфгя П№- ЦМ|№«№П| ищ и МЯ ЩИ и пяти» «чтепп-е» ДЖТТШ 3!> пЙКГйОТЛ

«п ПЧТ ямадт. даяит дашп «л» тртЛ*.

до». нпнотшш Дшн* №ш *п. ц и к „ т м

Н,а» лгш-яыв »№1(11 ю- »цириадярап ездадта ПНЮ «В-^ Й™-1 гЛ^НУ. Л-П- № пмт» ¿. Ч _____йпт<Тр.> пзгги II Ьгйжичя. Вгмп

— ж» 1ГМ1. тфйфл т льпт" |ПЛжИ гммип гпищднт

^И 1ЛЛ Й1ЧЧ «л эггуи-и, ХК-1 (^щ а в**,

аВМЬп

V (ШТ1ФЦ1, Т1рг«ип (р1УП, ВЙШПгатг ГТШГГЬ и Игпти ПС»Ч"П в

- ■ ■ г -

ГО гршчяфпппия плвгтгаы гу г-чгыте-

|1ля4ыи рлЪггю

а или ттп | не» и

1а—ПГШ|ЛЦЛ Ж]ЯГ> П I»..

тп

ил ■ гиг; »XV

СчЕстлявпца.

ть тр|ГГ0№.

ШП П г--1

Вгтчйтрг»-ЦЦТЦВИ' т. с>>!■:■ г г» IV-цп [гречи. ТЬ V прги|1 [ч -

иШяуц игт-

аакЛ ЩЯ11, п! Ииптпчтпп ■—П М и». ими! и-

«1ГТ1-?Л.ЗГ '1 . №¥ ВП- 9Я» »¡_. Ш— кфХШП, <№ 111 П-»РПЛ!' > !. 1' ' ' ■ "Тт> чип. т ий-1X4 гь Г»}»]' >1*

лгт» вяк 4 ЫКЛгД 1-

■гк| п. цчилгц иргарш я в|| пппшгт. 11ив ппы ЩГШШ штэъ I «пл шт »-»«1 р иЩами»: 0Я1 выпх Ы 9Р*- ( уяГщ т „ал^н.

(■ ¡но эъ Я1впи.

I «ицщ'П* ыттх^ им.'.*

1янЛ Ещг—шппЛ к|У »1*1 #р»1МН1» юг тэт*«, ви,-тллимлм-ь' 1А-1Ч г,-11пЛ(ш 1!>12 г.) млдя п 11|л!-п

зяаъ, г» 1Гпгвсат п^гп, оц «шл г-сл.

тчо., п. рлтйрйп шит иш

т^пж-иижьйш^^Й ми. таил гишт 3111ыг. П?

Иъ тт. н !г|ъ Кй^рт типд т «♦¡ву п тцшт шамй тшк пй «лзикк тг» ШтолирйяялЛ л

ИНТ» С41ШХЪ ити! Ц!ГШШНК1 ГКфЛ^МЙ *Л!ИГ» Шги-ягм ЦПУЛ. ггЫц| Еарягоп.

мтярод йрТГЛк 14 пошрвд, мтзд ОН я!Л, и-

иигп и й$6£и*штдиил| щдя-

ГУргяпияг пбкии^», т Е^ягощ. п* № дат гу Цвв*. * Кадрш ньвг* от Ек» №

>.тр|( П( И^ЕГИЫ?, и им виогяй». тт» Кш 17ЕЛ Б-г-о - яьгят. «тгц п? Сил

шмНям

Зл *Т1||||,М11!Ь тярш я^та ерпта М^йи артС№В!№, I МЩх и*яю яихггЬ лртт-ц ттринадлмлятя. Закянм жчл|п КинрпЙ ввяучятг п ^¡пшм пгниерыип тг» и«;««!', В йЧВ #вдтчгптап| ш-1Ш №1 № И, №

«1 »"Я тт«я 1ТЧ*11|Я1! 1Й5 ЧЕ1Ь Я

■гсъ »мг* г} (кн. ум «Лмянт гртгаги

1111 гь г^тёж! 11 -Ж^. Ппдам

П^яряяпЯ ишязплрп. ИПС. ом, 0. С-

Г1п п. ЪьящМъ ФиНте» пгМШ! Шарлям 1 ив СИЛ р*

¿яриягь апДтик». 1 иг« мклги бншт» ПЕчетямяя т трлгягап» ОП ПЫя! Л иуГЦПЧНЛГк (ГЮ-ЫТЦ |П<Г!П||»< 1ияг д С">ГР.''1 1ГК\ти* II» ПбПАМЛи П*-^шипи. игр юиящ епиУ (I Лгргс^м I Як ЕТ1Л1М я-длгштв

РЧПФ« Н НШТбСШ РИСПОШГЬ Г> ТО*-пфИлгяя па рмюнояия тти ■ >шги МТ(- Е«Щ», ■!*!№ тцптгглг'вти, риоП^ ч IV м>^1[4 (Вд, * Т1Ш

вр^.кчыт ттвв)» яъ юдатм г№ ■шаля екп^шд^иу «йдтюа'Ч

Ммдшъ.

ЕтТшгтптя" ига1!», ярй'ИЩЦ' П МГ ьигчгта^ил пцв авмюж"1»*1. Шад! ю ячллгчт сйршнтИи. «Утм Гасг1дг-Г 1Ы ргтв!|1 1

ГН' КМп «Гвявии»,

га*гь р*-

М'ошивпШ ЯЙЯТГр.

_____________________впЬп

юлт ял овш к^Яи ы

Ч*Г№* «П|Щ|Ь< п. р»Ьв!

«ЯЖВТТЛЛ! ИГП+ЛИ «■[» И ШЛхгит!

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

здагнь. |Ь гл1аз1 гтгд«п пплфвт ш-В' "43 И Жп'ишгл иптетра »-дакя+р ПРОШ п>

ШШЛ Й^ ИРП» 1 Й1

ига.» »'«л я^йсЪшПлпяг С1,1лА. ч;»

би д. ет» ии* вотттп. вт?»11тги|вг1гя яят» птртоттт Кг ивиЪ-явитяна-. п-г^сва ПШЯЛВДн I (ИТРИТЦ! 1Г1

Рисунок 2. Пример искомого текста. Колонка «Счастливица». Рассказ о том, как некая женщина нашла в магазине сверток с акциями, которые потерял банкир Борисов (Выпуск № 13621 от 28 июня (11 июля)).

* ж ж

Тематическое моделирование — это метод машинного обучения без учителя, применяемый для определения основных тем коллекции документов (или тем предложений одного документа, который рассматривается в таком случае как совокупность предложений) на основе выделения топиков (про разницу понятий «тема» и «топик» см. Приложение 1). Как правило, топик представляет собой взвешенный по вероятности список слов, которые вместе выражают общее содержание предполагаемой

темы Чем выше коэффициент слова, тем большее значение модель придает этому слову при формировании топика. Так, в Таблице 2 представлен пример двух топиков, определенных нашей моделью для третьей страницы выпуска «Биржевых ведомостей» от 29 апреля 1913 г. (№13521):

Таблица 1. Примеры двух определенных моделью топиков, представленных набором ключевых слов и их вероятностями (см. Приложение 2.1)

Топики

(1, '0.023*"склад" + 0.021*"акция" + 0.01б*"предприятие" +

0.012*"общество" + 0.012*"пароходных ' + 0.012*"товарищество" +

0.012*"транспорт" + 0.012*"страх" + 0.012*"железный" +

0.007*"баланс"')

(2, '0.015*"городской" + 0.013*"бумага " + 0.012*"заем" +

0.011*"дорога" + 0.007*"капитал" + 0.007*"облигация" +

0.007*"общество" + 0.007*"акция" + 0.00б*"специальный" +

0.00б*"иметь"')

Одним из наиболее популярных методов тематического моделирования, используемых в настоящее время, является латентное распределение Дирихле (LDA), которое представляет собой «генеративную вероятностную модель для коллекций дискретных

данных, таких как текстовые корпуса» Этот метод используется в рамках Digital Humanities для извлечения тем из набора текстов t41. В этой модели документ (в нашем случае - отдельная страница газетного номера «Биржевых ведомостей») представляет собой смесь топиков, а топик — распределение вероятностей по словарю. Под словарем понимается список всех слов изучаемой коллекции документов - именно словарь задает модели пространство слов, в котором нужно распределить документы таким образом, чтобы сформировать заданное исследователем количество топиков. Важной особенностью LDA является заранее определенное количество топиков, которое устанавливается до начала обучения. Удобной функцией моделей LDA является установление весов, равных 0.001 для слов, определяющих избыточные топики. То есть, если исследователь изначально установил для модели поиск 5 топиков, а по результатам тематического моделирования для трех тем модель установила разные веса слов, изменяющиеся в границах, например, от 0.005 до 0.0021, а для двух других тем - вес 0.001 для всех слов - значит, LDA при заданных настройках не может распределить текст более чем на 3 топика. В ходе наших экспериментов мы установили, что для решения наших исследовательских задач достаточным является порог в 5 топиков.

Создание словаря может дополняться применением различных методов предобработки текстов. В нашей работе использовался классический для компьютерной лингвистики метод лемматизации - приведения всех слов к основной форме. Другой широко применяемый метод предобработки подразумевает поиск и добавление в словарь модели биграмм - слов с двойной основой, выделяемых в тексте по частоте совместной встречаемости (например, «акционерный_капитал», «государственный_рента»). Данный подход мы тестировали изначально, когда планировали создавать LDA модель всей

имеющейся коллекции. При таком подходе в качестве одного документа рассматривается целый номер биржевой газеты. Однако результаты оказались крайне непрактичными -ввиду слишком широкого разброса тем на один выпуск газеты мы не смогли создать интерпретируемые модели. Добавление фильтров (TF-IDF (см. Приложение 1), изменение параметров обучения (например, размера батча - порции данных для итерации обучения), увеличение количества тем (разные варианты в диапазоне от 5 до 30 топиков) - не смогли улучшить ситуацию. Тогда мы решили создавать LDA модели для отдельных номеров газеты, рассматривая их в качестве коллекции предложений. Результаты улучшились, но все еще остались недостаточными для использования тематического моделирования в качестве стабильного поискового алгоритма. Последним и наиболее продуктивным вариантом оказалось построение LDA для каждой отдельной страницы в нашей коллекции «Биржевых ведомостей». Подобный подход позволил нам создать алгоритм отбора релевантных для исследования материалов на основе тематического моделирования, но ввиду ограниченного словаря нам пришлось отказаться от создания биграмм и фильтрации по TF-IDF, что в конечном итоге никак не повлияло на качество итогового моделирования, поскольку мы не ставили задачу исчерпывающего семантического анализа; выявление тем на основе одинарных слов оказалось достаточным для отбора всех номеров газеты, обладающих информацией, релевантной нашим исследовательским задачам. В качестве основной библиотеки для реализации программного кода был выбран Ру^оп-модуль Gensim, являющийся одним из наиболее востребованных пакетов NLP-инструментов в мире современной науки о

данных-5!.

Рисунок 3. Визуализация LDA модели, созданной для 3-ей страницы выпуска №13521 «Биржевых ведомостей» от 29 апреля 1913 г.

В рамках тематического моделирования эксперт должен сам определить название для топика таким образом, чтобы оно отражало семантику отдельных слов, формирующих тему. Для примера по рисунку 8 мы можем однозначно утверждать, что слова из топика №1 явно тяготеют к теме городских займов, на что указывают такие слова, как «городской», «заем», «облигация», «капитал». Архитектура существующих LDA моделей позволяет быстро анализировать содержание выделенных тем на основе поиска по ключевым словам с учетом их «веса». В качестве алгоритма поиска номеров газеты, содержащих нужную нам информацию, мы решили использовать поиск по словам, формирующим топики, с пороговым значением весов слова > 0.01. В качестве смысловых единиц, маркирующих присутствие биржевых сведений в моделируемом документе, мы использовали слова, перечисленные в Таблице 1. Перечень паттернов Fuzzy-match и соответствующих им форм слов ^^

Для всей отобранной коллекции текстов «Биржевых ведомостей» было создано 2411 LDA моделей. Из них наш алгоритм поиска определил в группу «содержащих биржевую информацию» - 457. Разумеется, в значительной степени к таковым относятся страницы с колонкой биржевого хроникера. В качестве определенного доказательства применимости LDA-моделей в подобных источниковедческих задачах отметим, что анализ случайной выборки из 100 номеров «Биржевых ведомостей» показал, что ни одна колонка хроникера не была пропущена поисковым алгоритмом - каждая из них была помещена в сводную таблицу. В качестве иллюстрации мы приведем малую выборку из полей итоговой таблицы, включающую только те страницы и номера, в которых удалось обнаружить биржевые сведения вне колонки биржевого хроникера. Всего таких — 29 моделей. В Таблице 2 представлены примеры определенных моделью наборов топиков. Таблица 3 содержит краткое описание материалов, найденных на страницах, перечисленных в Таблице 2. В приложении мы поместили фотографии страниц, представленных в обеих таблицах.

Таблица 2. Примеры топиков и ключевых слов LDA моделей для выборки номеров из коллекции «Биржевых ведомостей» за 1913 год.

Топик 1 Топик 2 Топик 3

Биржевые '0.021*"место" + '0.023*"склад" + '0.015*"городской"

ведомости. 1913, 0.012*"завод" + 0.021*"акция" + 0.013*"бумага"

№13521 (29 апр. 0.012*"съезд" + 0.016*"предприятие" + 0.012*"заем"

(12 мая))3. 0.012*"общество" + 0.011*"дорога"

0.009*"час" + 0.012*"пароходных" + 0.007*"капитал"

0.009*"станция" + 0.012*"товарищество" + 0.007*"облигация"

0.009*"октябрист" + 0.012*"транспорт" + 0.007*"общество"

0.009*"академик" + 0.012*"страх" + 0.007*"акция"

0.009*"совещание" + 0.012*"железный" + 0.006*"специальный"

0.009*"вновь" + 0.007*"баланс"' 0.006*"иметь"'

0.009*"вода"'

Биржевые '0.020*"акция" + '0.015*"остров" + '0.010*"время"

в едомости. 1913, 0.014*"заем" + 0.013*"венгерский" + 0.007*"май"

№13529 (3 (16) 0.011*"рабочий" + 0.008*"новый" + 0.007*"ленский"

мая) 2. 0.009*"май" + 0.008*"представитель" + 0.007*"товарищество"

0.007*"русский" + 0.008*"округ" + 0.007*"рабочий"

0.007*"банк" + 0.006*"акция" + 0.007*"договор"

0.007*"русско" + 0.006*"май" + 0.007*"держава"

0.007*"рынок" + 0.006*"арестовать" + 0.006*"последний"

0.007*"предприятие" + 0.006*"вопрос" + 0.006*"подписать"

0.007*"новый"' 0.005*"запрос"' 0.006*"принять"'

Биржевые '0.027*"коп" + '0.022*"год" + '0.022*"театр"

в едомости. 1913, 0.017*"вклад" + 0.015*"касса"

№13543 (11 (24) 0.019*"опер" + 0.017*"вопрос" + 0.015*"невский"

мая) 1. 0.019*"лето" + 0.017*"прирост" + 0.015*"май" +

0.012*"министр" +

0.010*"мир" + 0.012*"проект" + 0.015*"вход" +

0.010*"новый" + 0.012*"бумага" + 0.015*"сад"

0.010*"торговый" + 0.012*"правительство" + 0.013*"проспект"

0.010*"николаевский" 0.012*"сотрудничать" + 0.008*"выпуск"

+ 0.010*"эстрада" + 0.012*"ответить"' 0.008*"день"

0.010*"шт" +

0.008*"адрес"'

0.010*"дебюты"'

Биржевые '0.011*"день" + '0.026*"акция" + '0.024*"коп"

в едомости. 1913, 0.011*"новый" + 0.016*"собор" + 0.019*"сегодня"

№13553 (17 (30) 0.011*"друг" + 0.014*"час" + 0.016*"май"

мая) 1. 0.011*"специально" + 0.010*"день" + 0.013*"акция"

0.011*"представление " 0.010*"новый" + 0.013*"маг"

+ 0.011*"выпуск" + 0.010*"город" + 0.013*"невский"

0.011*"театр" + 0.008*"императорский + 0.013*"проспект"

0.011*"славянский" + 0.008*"августейший" + 0.013*"театр"

0.011*"вход" + 0.008*"местный" + 0.013*"начать"

0.011*"сербский"' 0.008*"лицо"' 0.013*"сад"'

Биржевые '0.014*"личный" + '0.013*"год" + '0.023*"книга"

в едомости. 1913, 0.014*"мыло" + 0.012*"акция" + 0.016*"корова"

№13565 (25 мая 0.014*"поэтому" + 0.012*"часть" + 0.012*"местность"

(7 июня)) 7. 0.008*"иметь" + 0.009*"иметь" + 0.012*"иметь"

0.008*"убийство" + 0.009*"собрание" + 0.012*"продажа"

0.008*"время" + 0.009*"общий" + 0.012*"право"

0.008*"преступление" 0.009*"акционер" + 0.008*"лес"

+ 0.008*"деньга" + 0.009*"склад" + 0.008*"невский"

0.007*"станция" + 0.008*"мочь"

0.007*"хороший"' 0.009*"час" + 0.008*"назначить"'

0.009*"правление"'

Биржевые '0.020*"пират" + '0.011*"комитет" + '0.013*"торговля"

в едомости. 1913, 0.014*"заем" + 0.011*"неделя" + 0.011*"министерство"

№13587 (8 (21) 0.012*"акция" + 0.011*"коп" + 0.011*"капитал"

июня) 2. 0.010*"дорога" + 0.006*"иметь" + 0.007*"предприятие"

0.010*"лодка" + 0.006*"боль" + 0.007*"промышленнос

0.008*"нефтяной" + 0.006*"принять" + 0.007*"правительство"

0.008*"казна" + 0.006*"заседание" + 0.004*"страна"

0.008*"железный" + 0.006*"денежный" + 0.001*"пират"

0.006*"синдикат" + 0.006*"поклон" + 0.001*"акционерный"

0.006*"особенно"' 0.006*"разрешать"' 0.001*"политика"'

Биржевые '0.016*"президент" + '0.022*"акция" + '0.018*"депутат"

в едомости. 1913, 0.013*"присутствовать " 0.016*"русский" + 0.014*"дорога"

№13597 (14 (27) 0.013*"предприятие" + 0.007*"июнь"

июня) 2. 0.011*"июнь" + 0.013*"правление" + 0.007*"кредитор"

0.011*"духовенство" + 0.013*"банк" + 0.007*"роспись"

0.011*"право" + 0.010*"общество" + 0.006*"дело"

0.008*"согласие" +

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0.010*"дивиденд" + 0.006*"принять"

0.008*"запрос" + 0.010*"доклад" + 0.006*"также"

0.008*"мир" + 0.010*"зав" + 0.006*"член"

0.008*"выбор" + 0.010*"русско"') 0.006*"вчера"')

0.006*"дело"'

Биржевые '0.010*"пристав" + '0.016*"акция" + '0.012*"июнь"

в едомости. 1913, 0.009*"дело" + 0.011*"рубль" + 0.008*"год"

№13621 (28 0.009*"московский" + 0.007*"день" + 0.008*"общественный"

июня (11 июля)) 0.008*"справка" + 0.007*"дело" + 0.005*"городской"

3. 0.007*"кислота" + 0.007*"чиновник" + 0.005*"закон" +

0.006*"фальсификаци я" 0.007*"артели" +

0.005*"пристав" + 0.005*"выпуск"

0.006*"проц" + + 0.005*"пройти"

0.005*"оказаться"

0.006*"салициловый" + 0.005*"помощник" + 0.005*"управление"

0.005*"пластинка" + 0.005*"служба"' 0.005*"жизнь"

0.005*"чиновник"' 0.005*"издать"'

Биржевые ('0.012*"акционер" + 0.009*"дипломатический" '0.002*"дипломатическ

ведомости. 1913, 0.012*"день" + 0.002*"переговоры"

№13696 (12 (25) 0.012*"помещение" + 0.008*"август" + 0.002*"близкий"

авг.) 1. 0.012*"акция" + 0.008*"театр" + 0.002*"вопрос"

0.012*"кризис" + 0.008*"дело" + 0.002*"посол"

0.012*"класс" + 0.008*"великий" + 0.002*"союз"

0.007*"сведение" + 0.008*"июль" + 0.002*"круг"

0.007*"третий" + 0.008*"иметь" + 0.002*"великий"

0.007*"выпуск" + 0.008*"переговоры" + 0.002*"балканский"

0.007*"подлинный"') 0.008*"вопрос" 0.008*"близкий"') + 0.002*"сад"'

Таблица 3. Содержание отобранных примеров с указателем на приложение 2 (соответствующие сканы страниц «Биржевых ведомостей»).

Биржевые ведомости. 1913,

№ 13521 (29 апр. (12 мая)). 3 страница

Приложение 2.1

Колонка «Может ли город обойтись без ссуды у банков» в разделе «Государственная Дума». На странице мы находим подробный доклад гласного петербургской городской думы по вопросу об организации очередного займа для покрытия муниципальных расходов Санкт-Петербурга. Автор высказывает сомнение в необходимости нового выпуска и считает, что продажа ценных бумаг, имеющихся на балансе городской думы, сможет обеспечить финансовые потребности столицы. К докладу прилагаются подробные статистические выкладки со ссылкой на «отчет с.-петербургского городского общественного управления за 1911 г.»

Биржевые ведомости. 1913,

№ 13529 (3 (16) мая). 2 страница Приложение 2.2

Колонка «Разоблачение Керенского», посвященная оправданию забастовки Ленских рабочих. В тексте члены правления ленского товарищества (а также неназванные акционеры) обвиняются в использовании административных связей для сокрытия тяжелых условий труда рабочих.

Биржевые ведомости. 1913,

№ 13543 (11 (24) мая).

1 страница Приложение 2.3

Колонка «Бюджетные прения» в разделе «Государственная Дума». Приводятся основные тезисы речи А.И. Шингарева о медлительности железнодорожного строительства. Далее следует оценка недавних слов министра финансов В.Н. Коковцова о текущем состоянии фондового рынка, удержавшегося на своих уровнях в контексте общего падения цен на мировых рынках.

Биржевые ведомости. 1913,

№ 13553 (17 (30) мая).

1 страница

Объявление правления Волжского акционерного общества

маслобойных и химических заводов «Салолин» об открытии

подписки на акции дополнительного выпуска с приведением условий участия.

Приложение 2.4

Биржевые ведомости. 1913,

№ 13565 (25 мая (7 июня)). 7 страница

Приложение 2.5

Объявление правления Акционерного общества С.-Петербургских товарных складов о проведении чрезвычайного общего собрания акционеров с повесткой мероприятия.

Биржевые ведомости. 1913,

№ 13587 (8 (21) июня).

2 страница

Приложение 2.6

Колонка «Речь Коновалова» в разделе «Государственная Дума». А.И. Коновалов поднял проблему несовершенства акционерного законодательства. Депутат говорил о длительности процедуры разрешения акционерных предприятий и высказывался против ограничений, устанавливаемых при разрешении акционерных обществ для поляков и евреев.

Биржевые ведомости. 1913,

№ 13597 (14 (27) июня).

2 страница

Приложение 2.7

Обращение к владельцам облигаций Сестрорецкой железной дороги председателя конкурсного управления,

юрисконсультанта министерства финансов К.К. Дыновского: сообщение о ликвидации текущего предприятия и организации продажи дороги в собственность другому обществу, готовому взять на себя обязательства по реорганизации дороги. Приводится сообщение представителя группы кредиторов дороги Л.Л. Балинского о том, что купоны не оплачивались дорогой с конца 1906 г.

Биржевые ведомости. 1913,

№ 13621 (28 июня (11 июля)).

3 страница

Приложение 2.8

Колонка «Счастливица». Рассказ о том, как некая женщина нашла в магазине сверток с акциями, которые потерял банкир Борисов. Этот банкир находился в доме предварительного заключения по подозрению в растрате этих акций. Редакция высказывает подозрение, поскольку «утерянные» в июне акции были внезапно найдены в магазине в сентябре.

Биржевые ведомости. 1913,

№ 13696 (12 (25) авг.)

1 страница Приложение 2.9

Объявление от правления акционерного общества «Северный ломбард» об обмене временных свидетельств на подлинные акции.

Анализ материалов, найденных с помощью LDA моделей, был включен в основное содержание нашего исследования, посвященного изучению поведенческих практик, связанных с анализом доходности ценных бумаг. Таким образом, был реализован подход, при котором содержательные задачи исследования решались традиционными историческими методами, предполагающими детальное изучение текста источника и встраивание отдельного документа в единую систему с другим имеющимся материалом -архивными источниками и сочинениями биржевых практиков

На данном этапе мы можем подтвердить, что в рамках нашего исследования применение тематического моделирования оказалось продуктивным решением для оптимизации процесса поиска исторических документов в объемной коллекции оцифрованных исторических материалов. В то же время необходимо подчеркнуть, что в нашей работе тематическое моделирование применялось исключительно как прикладной инструмент ускорения поиска и первичной оценки информационного потенциала коллекции документов через анализ выделенных топиков. Наш опыт показал, что по крайней мере для «Биржевых ведомостей» тематическое моделирование с использованием LDA из библиотеки Gensim не позволяет делать выводы с позиции применяемой нами методологии содержательного анализа, предполагающей работу с внутренним содержанием источника на уровне аналитических практик. Данные наших моделей слишком фрагментарны, их можно использовать только для первичной оценки тематик информации, содержащейся в источнике. Безусловно, мы должны учитывать возможность дальнейшего усложнения моделей через применение аддитивной

регуляризации и совершенствование OCR-распознавания в сторону разбиения страницы на документы по каждой отдельной колонке, - что может существенно повысить способность модели улавливать более глубокую семантику газетного текста. Подводя итоги, мы бы хотели отметить прикладную значимость продолжения исследований практической применимости тематического моделирования в решении задач источниковедения.

Для интересующихся читателей мы оставляем ссылку на доступ к предложенному автором программному коду и набору исходных данных ^^

Приложение 1: Словарь определений

Тематическое моделирование - это технология статистического анализа текстов для автоматического выявления тематики в больших коллекциях документов. Тематическая модель определяет, к каким темам относится каждый документ, и какими словами описывается каждая тема. Для этого не требуется ручная разметка текстов, обучение модели происходит без учителя. Этот процесс можно сравнить с кластеризацией, но тематическая кластеризация является «мягкой» и допускает, чтобы документ относился к нескольким кластерам-темам. Тематическое моделирование не претендует на понимание смысла текста, однако оно способно отвечать на вопросы «о чём этот текст» или «какие общие темы есть у этих текстов» I10!.

Применяя тематическое моделирование, важно проводить разграничение между топиками и, собственно, темами. Топики являются результатом статистической обработки коллекции документов и состоят из слов, которым в зависимости от выбранной статистической модели (LDA, LSA, BertTopic и т.д.) была присвоена определенная значимость, на основе которой моделью было сделано предположение, что эти топики (кластер значимых слов) формируют тему документа на семантическом уровне. Однако важно подчеркнуть, что процедура признания, что определенный топик действительно отражает присутствующую в тексте документа тему, является сугубо экспертной. Исследователь определяет, насколько семантически релевантным текстовой коллекции оказался сформированный моделью набор топиков.

TF-IDF (от англ. TF — term frequency, IDF — inverse document frequency) — статистическая мера, используемая для оценки важности слова в контексте документа, являющегося частью коллекции документов или корпуса. Вес некоторого слова пропорционален частоте употребления этого слова в документе и обратно

пропорционален частоте употребления слова во всех документах коллекции.

ПРИЛОЖЕНИЕ 2

Страницы газеты «Биржевые ведомости», выявленные методом автоматизированного поиска по содержанию комплекта LDA моделей

М 13521. ЙЭ-го аттр^дя 1013 г.

ВИРЖЕВЫЯ ВЕДОМОСТИ.

Можетмшрод'ьоМть

Еь исьллш гузи и!'

РДОШ улда* •» |о-

ггч п.,- ккМа бы храпт шя сие- р*рсг*|е гармл: ¿ткягн, прпсидраипЬ |

бодан - уяян п емш жл т-дотго" 11 ШЛЧШЙЪ оттмслшгь 1 ; чси ^ *«игй-■ип, Зуыгиг, рврятом кдедмпгг: кпи ■ сктшимЬг ншъ Пи мгь спишь-1 гщпъ ■блвгмйяп.. ккяиш! лил вроешь Т**(чи наши: к *вип Л

¿1, I ОЯЕГЬ .¿им;

в т, ч.

Iкчгкми гнет .3. И.

.и гр^п^, !1Ц]тм1, м5тяшц гРпри, <11 >]^рцтг> Лйлыпп. цат, 11л

1 11Г И] ПГнм'ЧЕ!-[!.. ПС-р^ПП ИЗЛт.

ИРИР^И , ________ _____„._.мни. тг> а тк-1 вплиспииВ. тагизыизй в пр. Ерам и к

»ча ,1:жвы м«м тчИ» ^ еичли!^! ибпяуу. х- вргииппгп. ишп пи- млшпю иян, Аяап, в гш,-) ии,

11М!1И1 ЛВ)1 * ГдЮТМШ I щД Н^винрт. ш ^ р|Пг тг. гпв]"11 шип ИЧШГЪ 'М 11114 йгвдрп,

П "(Ж«. В V ШШ. ЦГ| тц„ Щ) |фИИЧ1 РТЧ иргз- 41 ПК[1" ЯП» ИШ ШЗГУХЗОВЗ. ужи ЛШ1|

цшап и*» м (1ш Л 1!1 щнаютп. Нв№п -и- шь. тшпю

lft.iT. и1м—цлртк- ы «п. Иргтжязе Штат. кипдШьпл

ЛЧСИИ тгтчжичи! мггеь— Ш-' (щ, ||и||л щ, вщ . -щ I -г.—И т. нашли ипц].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

щи^! гчя-йв™ рьикши [ш- КГ1Т11 нгаццншм, т1е1| г,.г.Т| г^зи^ж!*! иЛ^ид!, идо-шгилзлк, ззропн! т.-,. ТЛвйетыги ГЧ"ЧТ ЛЯГОДЬвЩИЩ. 11ЛШ ГЬ т 11г-.^. р.=.ГТЧ"*4М "1ГД| ЛирУ**» ПН- ин| Л0ЛФ13-, в 1Л1 П^Щ ^лршвтпн, 'ь.

ггшт 66>Ъ 141, В^. li.rir.rTL ■ СВГТЮТ ГЯ-1*1.1П1.;|.|Щ1| 1<- нам! ИЩЧи» ПДОНШ I И'!!!'.ЧТ,!.

Г"1Р1»[| а!«», ИП1 ишям ВД'^Д,,, ртмтц га гчуж илц^гт, лш. г «Л (блгмН 1врн1|:-1> ни», шь ГйЛ:|Г. 111.1 М КШ *№ЛН|1' : гг(|1|.ТА ■ ВДОЛГ1Я, ПЛЧ НА ПЪтИ.ТЬКиТЪ Ь -

*>д ш при» ■ ррдштй вдвуа Шта- Цптз, ^у шгимпЩ гш!"""1 |иит

&Г5Г1 Гк М ■ ||'Ц; 11. у :■] 411 ]..и':1-П|СП|Л *

МшЖ., Ш ЯО «¡ПСЛУЛ 1|Ы»т1 шпионы! »№Ь » В ИШ. № (пивзщйи ^лгаадош™ м^и Г-, кид^м иаилмшя

в «ЛрйгТ№. иияыигм: ТгТи 11.1 ii.jp..

О залреще!ни славяне наго банкета.

¿гэ :■ ■ имгггг: ■ Р гп. шгпт.:

дялн^е № Д1ГЛ * ^гп^м^. 1! . .|1м!1пгап ГТ Ич'гИ ] Охтг^щ ДДР^ГЭМШИН" щ

ми! Г::

яЦ Й4Н1

"!В П*-:

' (1 а ну». п^ищрв лт^жп 1г"-;' V»™ (.-.гагтш! тщитнл, ''И«.!0])(гЬи аиипЕгги■ щаш ии> ШАЩИИХС! № М'-"(Ч1»еиГП Р'Г'-'Л. 1 ИГПТ1. ЧНЧИИ гккпи. I

сри;, пндпшс! 11 пи 1г]Ь. Я ¿¡еяггь (.и.П'Ь влн ли Опн в а '

тм сщчттгт вши ищмвдстМ ни па ■., ¡ш *цщп тн^;' '

г-чч'ч: г1II ¡11 иукл'^.1 п К^и, 9&нГ1а|| ш и Ер-'Чг

|циц «Сщспг ил ннгиииш шш

Цтизл.т|1пш|гъ п^^^мли. п г г jH.it и-

ГфШ , 1!и ИI',1 уЧ.1""Ч I. ПТ11(ц: I _

грсшттв! п. тор)! 1ИЕ1 2-5-Гч (ГСу

Г>' МИШ,

пргл. «ЦП ЛИЧЪ Пуваг^ Ни-1

цип! по.н^лиги:' с^ис*. л"

ТИйЛЪ II

ЙТШЬ Ц.чм1ЧЛ*|'СТЙ ЙЪ (*я-

ии цашк|>п»4[11 I», тш. вм>

Ч ВЧГЪ, ИЛ тт ХС ф^^яТЛГШЬ

¡■[и :фГ4№>М1ЭГ0 311x4 'V-"^чт

*ГД1 омятыг.тьил тп\ |

:ь Т^.И-Чир-Е^иит угл'■ I

и!, ш дгиущт. ГЛ^ТЧИ 1С' Г!.-1 1

йлвтшшчплгк г^!' ■"' ^¡ гпчт"-'-1

Т] .1 ПГ^У П 0МЧП ИЦ^ЩЦ; Й 11Г-1 1""? ¡И чллцъ ГС.;г, К !

Н|П| рггВ Тн...!|| л'

чллят И1 »»я«™» ВЧЛ.Ш плглгаыи Лгш «йичжИу цихци. [ 5ртв|л»1Т1.. Ьшт. гь гк» щч^тЬ «V тмгт-1

три ВиЛ1 ■ (ВЦлЧИУШЦ т ЦЩ1 ымьцо гктщл, (1Щ ВООРИИЦ

Атмгъ. итчтЬ даБмшт. дди1 ш

; _

_!_

а,™ 1

Ругвд 1 »

1 И1 усти

Е.1 I I

шг

Л с и- .'Ч-ТР^ГМ^ с; Ц]| Гг «ДЛЯ ТЧ^'ХУв^эЦГЦ^Ж

|:и»1. :го|Г |1п., .V ьи г.^ч ..и г^ ттт^ц у щ.т; . ""ИТ. | [71 г^«" Пмпг ПИ П Т;ГГТ7'1 "Л^'Ти. [к Т.1И- | -I п у

Пуи1н11з41гп М rf.iL.KiK 1

|..Ч.т1. 1П иЧтИ itirtt.1V 9 Н*Л'1Г1^|1№1|11т >

ТП^ГУТИиИ п —тпщ- 1ъ. [-:-

и^щ^типври^ РТШМЕЛ>. К) *. | т^ггттцй м п I, II, -1

Рисунок 2. 1. Биржевые ведомости. 1913, № 13521 (29 апр. (12 мая)). Третья страница

--------------------------------------------—........—

О !И'ВС(*1«ЛА||1 « Нннции (и-Г.

Т1]11>:1 же с«71В.1" ш, л|4!шп. ТМ'Г-пкш 4Д1ГЛ14, 'ТП^'и.ГЯ шдпвип. ■Кйил, I шпал. ОДншыШа тмп

||[НТЯГ1. г* 1441- 44КТ.У .«еттпу^л Оя^.иь-Б ПГ.Т, 1 Ти |\-'1

1-с¥йвгтт"и ПАМ^ки ¡¡¡" 1ЧГТ.

Е--ЧГ1 ^ Iа Ю^ Т7

Л1ТИ|'У ил Ч1гт|мл: и 1:иГ:^ь I1 ал

ДУ1:ЯИ ярстр^пцЩ рМЁ|1> -Г-0'

■гиин.

-•*•-

Русско-фраииуаЕькя нэ.чьзноав-роиныж к5нцосс1а зъ Тури!я.

Ь^РЛИНЪ. Э-го ИС-м) ли. № к». ■Вир». ВЦ.г),

•ВП^ИЕС ТЙ#*М|И» 131

Ккпсгипкппыз ' пт. тчишис

|'ч(СС|| I Фра|гц[4 шойпыв-

л <м '.таыпг^га I- ЩлЕГчягЧтои^ »■-■

п«|1 СУ1МТ1ТП(ТИ П

} чг»-—^

Шп!ономатя въ ШвецЫ.

МПРЩЕШЕ ВЬ!С1Ш ГШЕНИиЫ

НЗЪ СЕРЫН, ЕЕРЛЯЧЬ, З-св (15-го) шв, (Е>тъ к «С. •бар*. ЙЬп.

И.1Г. ШлГЬА!^ тинщ^цтшп СЯЬ.ИИ ■п. . г1; шапралл-

зш кцнсстфд лиутршлмкъ кип., внвна!

(■„ I1. |..,ц::ПП1.дТи 7М. Т>. Я ]|1МП С*-и, ■ гтлЛт^псы

ИгЬ '1,^1 ' ['¡V --г'тт.

ОТЪЪЗЛЪ С[Р6!«КХ': ЛЕЛЕГЛТОВЬ

вь ганда-гь.

Е.к.тгргц'п 2-1: 13 5-ГОО «4Л (СЛА). Е1 Л'.вит. ыщял №ктуг чнз^А Ппы-.111«! II исШ'РП. И'!аи1. ПшЛИиП- Вь м-

Г риа^Т ! ^ВЛИГТТ101П,Г При

Р[1вгу11т»зт. ггкгр.иг Пщап.

огмарки 60ПГЛ" III ОТНОСИТЕЛЬНО 1И)А-ЛИСАШП ПРЦЭЛРИ (ЕЛЫМГ0 мим. ЩРНЖЪ, 3-то Пв-л>1 НЕТ. № кос. -Ьлрж. ВЦ..),

Ш) еплы^оъ 'МАЙИ> ви ^^риим кетлилт:!.. 1|^1е1Втпннп 11^1'Д

ЙАРИ11.Л.П]Л1. 7 И1| Пг ьгтуИпть ЛИ

^ > «411т □.'[шгплиуы п.

! 'тикаиню Смипапнл '«чшии тч испкыъ 9 гнпг'.гЬл'чш инхылиичт-тп'-гз-вт.-Г'^. Гиавинь ойфшч^. Еллгирш вор^и ПМПВ''ЛД;1 кирпзго мтокр* М Гц-гл«. п^пиип ■ к и;»» пцилои! ||||Г. Ш1 7 1!иГ[ ЖОВфрРсЮ^В.

ПОЧШУ ШгиЧЙ ЛОТПЫИИЛ* СЬ НЯТТЕНЪ ПРЕПЭДРКШ;ЬНЫКЬ У новы МИРА?

АОНЦИНЬ, Зчт МИ-Г») Яал. АгсЛГ-

ПН 5■ -.■;111"^■ I 14" I 1-1^1150^ П С-Т1.!ТТ01ЦеЫТ.

■¿исисик лЦЬггаЫ гчл-

Шгсяиа нка пвиыл^г л^и да

|.1ЯГЦ 341.1(1 ртГСЕРП СИ1||Щ>.

№ ЛЦ1Щ ЕЗ)ииА щи. II ки-

ли! ДГРЬ ^ПтАЛиШ пз НЛО 71 Т1Ш|.

;тл1гиьмсьгд мтш л[в1пм-^вп 1>лп пошл» ииихъ ид КУ.ИОГЛЫ-»¡а т-И шкитшлп. В1 в.учШ: ас-;ив ллш.иму ал. Сузишш Пили .1Г"-

7711^.7710 Й '<477.rl.LI, Г 7 .■ti.fi.

У лиг'п вшив. Аг.ттч бы, С.:лЗ|Шт-7 ткд'З В11Т ып^ к Смкапи т, янптам Сел-ЯТтИ*^ (1Ж>!1 п|щзч1иЛ СИЛ.

нм"!. А *ЧВТРИ;|1 ижя^з^чшг л

ттли. У ]гг[Т1 не <я.тиик» шшп11п-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

| аип. ишяАиртл л чкш очгеСикп«*. а Г. Яш», н> ымпншмь пи тип мж-|71Л взпрвсу, мрачить

КЪ ил яунми^уу ПГЬПУ Г4вЬ;Т71Н,

МЗЛЁЛкЧЕНШ К£РЕНСНАГ0

1Чгчядат-■■л »асШ мрроо., пн а1г . T4T.lPnlJi.ft ГТССМИЛ ЗШХПВишк!. -+!'.'—■

щ .11.7!" 7И.' 3-11'. Думи. а КК-

j ^КНСКШ тгф сто г^л тау

■ '14.131 ь. шшллрг пуглив Тиивкаг щш-7в>11117 Мал Г. Г4П£ЦПЬ ГЙ И! ; .1173Т1. ['."РЛ7771 Г'.чрц.:.^! У Пу 1Л Гл а ОПТ. Пищ 1ШЕ9 1>Г0ГЧ." В Г- С1|]Ш.

I ирог^.-ь 'шСапт м» слшз лип] ЦД1. 77715717 7. II"] т77[:-117и, Т1' 177

IX« пси .[.7Л.> гл .1ЛЧИ1.; 7-, Л11,.11И'а1л1Гт.. ищатгиг шеап [ибсчвлг, лмгагсши I Я1н

17ГС1, Фитъ Л-..1.1 ЧчЯТЧШ П'Лчпр*!««!: —■ ЧТ.> дип.ИЧ'[ II* IV ЯИП

Г7,,71-1, Рь,7(17,1, !:г"С71*1 V"

Т1Т4р11Л ЦП : Ю!171Т7—7:Г7 д цга|. : упыил iHP.ru, Ли» Ч.1с|!и Нэп:г. лив-'

ЛГШ'1, П1. 311ани И^ЧКГК, < кД7 ,

NN. РлА^Ч!? лиитг) тт, 1

^иЫап, ч кштг елу'чч. чу* »яквдвд»

Шлму НЯОШ у НПП ЖИПСРУИЛН № СЧН1 1 н нъ изгплкып.

В1. |Из1: Ь щл ЛЭ-ггщутгиА ro.4cipi3~.iir

Г..I н||Г 341(ГС"3311 11. Ч-Зф.в!]ТЛ1, кйИ--1.1.171 □ Пи 111 !Т4П|ГП1 II" г.| Ч' 31фП1В УШП, ЧЛ^и В>}г-П »1Я1ХЧИУ1. пш .чпяч^тптц. ^СГЛЬ.

И.и'н!-иии. нъ пи и 7 щзив I 1)1-

ЦВГ'Н, 1Ш ТЛйШ 4.17 711 111IIII ни, ЦС4-;>Н11 II 14ш1п, Чз 147'п.,

Туи.'лии |.|Д Т-. з^паъ £ |Л1 (принял иг уппйа }пул]. ,1Ич. п. шч

тктп^л В С1 З^ПОЕВУЪ ЗРВЗРВЧГГТКМЪ, КГ|7С1и± А,уъ И| Е4В131 ИЙ^рВП |11 14-

4ВУТ,СЙ Ю.тзуу |чГ|ЩГВЪ ГЦ

Рисунок 2. 2. Биржевые ведомости. 1913, № 13529 (3 (16) мая). Вторая страница

* иимуйт;»!»!^ И!»ч. пп|г.

Амш П 1ММ I- Н (I Т-

говдешяи дщ

Перр эаЛдакИ

Суббота, мя.

Бюджетный првкая,

П^амхл.ивт. м 1мжл1Ы Цвк,

ядаЗДМЕШ Г.ь гадцтмй югаичп

Я" К ын*-П'Л йтмодегь

Б. II. Кл-Ф»»), ьигт^елл. ШИШ'ШШЪ,

кончив: лпнь уагЬп киип,

РЬЧЬ ШИНГ4РЕВД.

ПГИИГЛШ11> «рдакмпъ гоици» о

Л-кИШй МИД «ПвТтТИ-ИТМЗе

З'яадлия-ц т пуьтур'

«ыл *1игогГ£инт1№ гтрвййцягся. V клс> а па-гаи.« ниугв, и цмеюяъ и щ.

и» рждопт» шика ■ВДтьеш мш-тст рщ, и*.

Ц Ьцмше прйявтдачтв, теп мцвпылг фц'аш, иптсрын «и») пи №п у&с-

"»МЛ ЙОВТПГО ж Йтшвкп

теки* ЪИК4. <фвторь Еиртюджгь п ц*-

ШгЯ в*1апв1 терг^вг!;

— гсмфйта й«,—ипгкткя-

; на,* стрм.1, п мгорйЯ пдоышв-

вть п>рп*А сйщм*. ЧЕЙ мт и сейм ивпцммрчЬнлюнветъ шшаго (щдатр м ■г» маномн-чЕОч^ АинЁг-АянЦкшм Гейтом тшг пл »шв>'

ГгрЧШЗ! |14Д0Ти& СИПИ Мгиит. 1г|.' Швед к «тц» р*яц ¡Вмьгкв иь $ рал,! л тпшк г>г&ш\* дот, 33 ГЖПЬднМ д«*™-№1Т1* дачтбланк, 1Ш1Ц1 строит. добро-! ОКЪйШОВ Г«рМ31йИ дорогу щи ГКО.

вимть нЬ-иВцл1э твры ш екмрнуи Пвр-

сЭю.

■Чи каш {¡М шшг хьпгшгиП

тсдощД влладг». «в Ск яфгли, г<-

Е-Т.и.п шпш?* плчпп-дигг.

9СЯ ГШ, 4 11« Н]Ч1М=1Т1 грнгацн

Не 04Ч4ЛГ ни ВО ИНЯЭЗД12В1. Сд- ТТ-

ЧуПг-ЛЩ ,й|г П V {ВДЪ йадЦог\ г-'Г".

ИГШ1Ш МфЛ- Л ТО ЖА, мы. «б-

рабгшшп шть ленг? Ня Бью Мы ста »вишь въ сырьЬ,

Ми ДОВВДГ> 4ММ4, 1МЮ ИЛЧ-и, т-грппг. кил, |*п II вдтакъ ДО&К"

ГиВУ

ШВВШ'ЁВЪ мцит.» «лдтавкТй *»-

пи-) ж&гЬлоДОаХВДо ятрлвтсЛсЛк, и гфтПШйй И Ап^ЛаДВТЧ Ы

Уий чвга ; чинЕй^к!, СЛирИ НГШ(1 V*1ШШГ и 1Щгшл («уМдгЬ .МЛ .ВфмШг [ИЯ-игЪ>

— Мшарг л гй^жпв м-

лвялк отч н*шм 'бунята иг лчши. >лиг.

«и йЛСк'МЗШЬ, И« 10 те, ЧГЗ-ЙЫМ р Кмнси. ПНИ ИВ

Ивлл^ (-.иял^ рьаиппь

V КйОГгиаЯТ. №» к и оиьИ".

44* ичщ-'и, Г1 г-- Ьь аигл!бсянхк бйНнВяъ ив (фашмта мамм&иь. яы«ъг а въ рус.

РНКЬ—¡ШШНЪ Гда4М1<ЭГь. У -

итоою ишкгя» »„игвтт. дпигк шщ. ЙСТЬ {«4ШЫ1Л. Еь чртх ш у

н^еъ нстзлчк'Пч младйяь п мкшыжк мм-Ь4«М|£|и1Хк {*1И>1Ь ВЬфКЧв* и ПКП'Ьги.Ч Э года ив 800 1нпп. руб., въ Л мерки ъ при-Р«ТЬ (Ишлаян. Ёк шъ рйЁММКй 560 нн^л.

Ммлн-Цгу КЧЩГТИ! ьекцмп.,'

И П » ьъ ЛшомнЬ щмрость

вкящмъ -зхедлть. до ЭЭ6 ими. гадк, у И1А -1» 65 Мплл.

Квкпетръ м&езшъ и Д^ кы

вгаиздетме, аор«вгт(м1|1ш» ПРйЯТ'. гъ огтали^иляп, г^ ф^й^Ш'ИШМ^ (гр«в«:г^1гк. 'И ян Абйй^!» 1ЛгИ нг^г^д ' Ч^-ЯТ. М пи1ШГ4 П-Ы-Ь судкГи, чр* плгг г гг. иг1|Цла мъ ^осГжл яТк

; тмл^гми, сг |и.гмия, п^социли (г*аг-

¿тшымТ

I СИи1т1. —мвуг ал1шякЙ. и впгь

I лраВвКДЦ; Щш 1Ш-, Ш будто,

с яшьч-яг. В1Г1^. А вири янугрснмн!- ч-

|фо«» » Х'^ВКтИ, Н ШПЙ, и ЦПУ-

Гргиигмл «ВТ»*, 1 I.' 1!*ГП, ПГМ

—ЧТО Са1Л1№ ИМ ГщВ-

0МВМШП В I

I маВДизиш, ■ и--

Рисунок 2. 3. Биржевые ведомости. 1913, № 13543 (11 (24) мая). Первая страница

Рисунок 2. 4. Биржевые ведомости. 1913, № 13553 (17 (30) мая). Вторая страница

Г0ША31Я я РЁлЛЬШ УЧИЛИЩ?!"

д-ра Н. П, ШЕПОВАЛЬНННОВА. ¡Ф

НяввинооЬтрййСнЫ Пр., М (ергг. Лвйвя). Т«Л, НМ1' С» 1(111 прдоявгв в ;ч«Ивяав'кГ ГЧЧ»м|* I »ШЬ-

вц»к Квл Мл р. Пр.

Вг^танЕме* пшяи »- н^ РИ»и ьтшЫ м р«*са,м»>

»«■■Ст«« З-гч 1М ялышь! и/и»*, Т## ••^■■■шк

Ьщядм»?^« ^s»Il- «т» В—В-Л * ■ чт* ч. р»*.

__Дяр1РОрУ Д-р1| мел, Шгпоипльпяжовг.

ПРИ ОЧ И 1 Е *

X

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ы*х а. М С. Пяхяюл!, РЕВЛуЧВВВ!^ вД|ГС1Г1М*й 7СТр«га1»0Р9ДСрЕ>ВС1 И*стя ДАЙ

■ИЛЬЯ

Ж МРИ яП^ТСПЪ

Л-Ьь-ь, пгврА, абиооин-С; г| в колодцы.

У^чм ■'■ И; ..н г- ^ гкп

1* в а с р о ч на

|М*1(П|и4 1Н1Ш 14 8 пда

Изъ*а.Ллояск±& пр. 16-

е Иртыш ни« "а

Ч - ■■ Г»4- . >. ...и-" ■ Л,.....,„а,к <

Дйгтт-^лпг.-тги

.дпамг 11 дети

■ г":' г^-.

Дн^окврнзго Общества С -Пйтербургсккхъ

-говарныхъ сняадозъ

чт в^кпясяТк г.1, СКщч.;тз1 шл

и^увя!*, мвТ4ГГ*й1 Я1 «ь В1»!|[««и К*-

Й-Д|Л*В:й О/АмМПП* .Чт-сцирцпп К^ИМ^р-чип Бвшп (Иитввги*, 1 . 1в-г* 1явл гад», П й «й речи;*, ПрбдйгВГЫ ЗЛН*т1й;

1) С р1М11в «4-к -.а «лмвэгаго

^Н^г^тиц лицшмш» щдуш

Огсухмп ^ I шртн в

ягдзхтми* Я1с^щ'4!т1в В , РГ* (,ьлв:и.

а Вт

_

I ш?^ _

Г.г. яДв^рВч^и, кг :«г>в^е }ч»"г1-ит1 л, У ■" т- Йдв-

:939 цуядовтзтк г■ авежя ( не д л, Гив,л п Р]Н-!

Обгт^ш». ^«дтяВЫш, 12), в -чАгтящ*!*- идгел «^«м*^-1 СЯИТП^ № • тдугт^ь^р^' : Врмийя ЯВ ХрйК»

е[г язи ШДЦ1 н» гя^врвтниип^ п» ■ /.'Итувип п

ша Пгяавпшст*«« № -йитчи 1|с|тии КОМНАТЫ Отъ 70 рубя. НА СЕЭОНЪ

п. (Г-ивигвасл* п удвпав«ргп!я1-% вуяс^гъ вгп;1 в вре^ ;| ..ЛВ1

пищ ТОРСЕ А?

Пртирт'! ям'.|нк |«цпт1", п ]нчт«н[| И 1*рт* (49 гчвгт»

т I"1 р'п""» ■ ■-■> V 1^|1гта1» «т» '. «-гтрог1п»а*п ац^^т*

ПРОДДЖА ДАЧПЫХЪ ЧЧЁСТКОЕЪ.

4 в»1«1 К» г-лл'.ь 1П 1Н1ШГК

, иПи, ШП

и^и

Г Её^пршнтип рзк^тка из шь яЬгь,

«.V ЕГ■■мояоиркднъ пдне 1иИАТБ ирвввт. ЕМЮ I

г ■* умну"

ТОРГИ

! Пвюаор.ж. х в«вввр№, вяртрич!, «ФяИш. я рр

С в , с самая, енцъ. | Куш* ш?».к ртя.^р«-:1:з» " чпйвд»»- агы»«. п,-иг: к" "пТ«т«т От. ¡-риаловсидв. Твчсввгсь N'5 ОД, |

Рисунок 2. 5. Биржевые ведомости. 1913, № 13565 (25 мая (7 июня)). Седьмая

страница

Рисунок 2. 6. Биржевые ведомости. 1913, № 13587 (8 (21) июня). Вторая страница

Л1ИЗИ ШГЛИЫЛЗ. ИИ 1" 1.П J-.rni.il-г, 1711'.: ГТНУНИЦШИ Ш'^ЛГ «м ■■■1ии ).'[1иш и-

Лпиинь. 13-» (26-зщ ¡или, (Ш). Ни сд(.1Г.|||||| „ «ТИГЛуМ Шкф*, ПииИНЬ Ч Н.ч'боиь ниц™ да*лнл процишсинциоа попщмйа сь Травм* к Кикплдешь п

илшпт^пк инютрлмиии

.Лп1»5 Л Иипчи ,чц. яга

ГЛЫГП- Ч,ЪГ1 ЩЛЧНМЯГ«. Нуашсим иъ СтЬгъ-ЛлЛик-ЦпП. 1и ВДОВ №11-

ыкии пипе^тспчо-ч ч т«к Иш.ыи- и КмКнп-

Лплррн> 1!$-1С 1Ш1ГЯ ОД). Вь

АлШ ,'1. Ич,1.'та1-1гг*>гИ I ¡тт.шш РсЕ-1Чп Лпш-т, <пииг, 'УШ щлпщнгп. Пу-

1]|Мф№1П ИПЕЧаТД^ИцР 11ш

поИви* и ¡ччу 'Лу{юиа УФэнуУь мизлч. 1]ЫИЪ му Г^ЕЫДО, УЯДПЬ V .-. 1, : = - ■: ■ Т. I. Д|ИЯ1 1'.1-Ц ПКЛ.Ц-П- ЬИ *Л1£ЗИ1. |{1

УЦг» 1..1СИР ни .1 и и и МЯЦЭ ч1'|-[; I,, Г] й Л||. глгЛ. Киютиа. 'п» 1 <дууц. аьизлн*-14И и зт

ЧЗЮТСВ ]ГЪ НЧ11Гр*,1114' 'НЮ! 1,1 Щ

]и шукрчгддт ит» Клрхш.

(У.чТ.т, виЪзпй с» Здцщац

' Г|>»41. вц. т,тт-т пмпцфнъ щичшпк № '1л,1»йзг_ го в Ы1ЛПЦНП тлийп зкчим ■ леги вбоыъ нГвлгтовь па 'У/. ^-г .1^-31-«ш плрогщп, 4 в ни ииЛчг по-ргрлмиу инищчк (и'влна! игт.1. Пн-'1311. зц,—¿л ""лт гпклсл. тт- 1т. обцйн ь

элизлгкигц, лтатеСлгутши. <Лакш1 уяч ■-■■'-_

ВЫБОРНЫЕ ЗАПРОСА

ЛоИПЧЗШЗ. Сй Ьз&длпц.ит,. [', .[увд ,'с*.-

ГПГТЗ, КПК Л!Ы||Щ1|»ит|Ь |]||&4Р*

Гц** нщчезд. Ухе (сэдл 114 11 от

Гтягь п, лцГл^пьт алцтшп. титшп нитки.

Ли ЦиеиФИРК* Л» Ыуз1Р1 И Г. Дни ил* чуеевъ вдопивъ.

Гморт г.-л, ['КОЕ>КЗЕВЪ. мьтаЛ ив-[■лл. цмШиМЬ тв велвзншлгЛдейп!

¿ЬЧв. три С,.)-0М НПКПЗ ЦИЬЗбДяМЛп

1 втвдшап:

— Наин ийирлггпшл* «стал, лге— гЬтлию глудзретннзцео сзрж^ил з.ц

)№НП. л ЗЛП^СП И-Р^Д^ИЪ ТСГЛ, ЛРЧРГЗ Г«У

"¡"та. иагн-нк^^ рмкищннга кип нъ гмшл*. Ви,*'ц111 п 4-и Дку п а 1 п|

1Г^|Ч|-И ЧТИ УГТ4Г0ЛЛЧЛ|Г Г.гн.^п] 1-

IV зиЗ'зцчгншпю п|урд вшлм шМиожь

ИГ ЗЧЧ1.КР Дл.н.щрпз!!!, .1ЕП Н ИСГТДРИМИ Пи-

ГГдккщждапГгмш! Д?[Щ0НСК111 чт^

ДЯ ВС ЛЪ Ю'РНД» »1». X 1СВ «ой» «ияи-мшцн в! чойуру, ди'чг вунпъчлъи.гп! п].-?. тип;, ь (л. ш гмг1,ц,-_™

— .1УСЧИЯГП» ПРР'1 укпц 1.П, ЯП

Сммцнпи 1к<1вс;1ЙпИГО.-Гвппщтъ «ЯГ,,

—¡1 (»11, луимч:яого |ПЕЬГТЬ ПР111 уЧКГрг. В41Ъ 01, и&лиш, п 1)1^ щгнип Г1....11 и» ПР"10.

— Кн РррДпл^нтг. 1 кусит:,-. 1,1 вн.

ИС1|МПШ КШГООи. «-«.-тплимиц! и мл ЯРВ1ШН1, 1Щ1М11, (т, п пи. оду-епт, г.1.11.1. Деваем« £|И!рм на првмсл™1:р» Ду^пМнсгг-^. ДшндьнИ утиыят г. « тл «гмины:;.. . ■ ■ :. !11:-?и ПГ-Ц. нот:, п. йио и сит-

^ Спт ыгшлоштъ адпщ тлл |м ЬдвГпцрцд« минг I ^-уд ,, м ^ьрамв-1'иЫв 1П. |11Дги|-И1,1,. сп п щи 1-1» сллг ,1,)1гь чрс1|И1ч ¡I...-..: 'г;... ,-,, в

л[11]из (Ийср4т1. 11.,.41, у., " г] .

Г-1.1 Иг 1 лт -Й й -пи.

Опчвд рпаирята дшп.-'.-к'ксщи. а на илгдлсъ:

— 1!в («ди. ри сгШита.

+ + ч

Кииппотл, (ЯЛПСЛНВЕВ Я 1ГТТ||ПГ,!!И( Я ШСВЛНГИ), тч'ч? тмим ишовряг»

3) 1Л1Г]1ГТ..'Г

Тшшцвгъ ГЛ15 МИ>[[|[01!Ъ. _

- Л Сздл, 1Гт].>'Г¥ГЩ11Р11'Л-1|г

И^ЛВ <1Я|»КРЛ Ли - 1131'.-.111Iи Г. Л)"*!!. » , -.-133x4 зидНв I цраоддклу, я туп отиг-

¡тзнг: В уху рг.пи- и>чип иь (ччшщ я,-1...

№п Т.|":-Г'|ТГк -г'-глппя 1.-,ГШЛ]1. щ, 44-

г;..-1-:.'з шрАлы}! з^лщзд. члнгъ Рк,

ЕОЭр)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

же п. дор.

1 Рл:Р1 Ё^Сршвы! врдиЪишвЬ тчи-

II-- ¡Г1лй331 П^ИИОЕч-кОН ^.-влир-.'.': [|ГСК|1-ГгСУ]р1|1 Г.С11-.1Й ХгД, |да|]уГч.'В111> ^ЦРЙЫеЗЗЫ. Зиригилигуак!^. ВЛЗ|ВЛ^^СУ31,1 ■М1И11НЛ1 1. г. г. Н, Н. Дьмяснз^ а СУМЕ!;

| л[1шз зчидос.вп:

— Мн погорали г л щиилп. изшл

' ИЫ 1"11С 111 ■ )'1Д 1ТП Ы> СЛИ111П,

вплыша. &ул]-з|[рку. «инчтшло лкли-Л4|кш.',у|> сслр«(|1п1)1> жал. лор. 1 дан.

1 II 1.133 .АЙРИН. ЛМш'.р^тг ИР РД 1с р|Д-

цд™ и» 1Ц|"Л»ИРР»1 ул^или вшИ

I ЯП. П.'ЗИГИШШг ти£]|-13МЯ, Ь/Л.[.ЫИ 34- I . -1-111 КИЯЗ^ПЧ^ Л 1 И'У Ь 1Ё11Л4В1|3 ЕуНГТЬ \

ч иТИП., ||. кЫП ГлШипЗГк Л«|НЛ|, 1

I хрипи (-дишзсиотъ, бглгп песпигви и Е . СЛВ...[||В£13ВвВ 1'- 1 шцлззрч ¿11

Ц, !,,.'] II . .'1111111134||1:рч ЗШШ бип

П'-| И1еи|1 -- .1, во иц^дднп. ни

11.1 ши Зьь'Ы; , гллл мииу з^цггуву,

смлдецтм «жав ышгичкврп тлгг. 1И-

КУ4УТВВТЬ ЛУ1Ч111П1 311 Ц1|31].5|Г Луяшвх*

игрзцячта, л- чНЬзип, у|т, ирсзт»™

1 '(Утилиз 31 ; -,:л.п 1 п.ли-'сгЕглиг. грлрл-1.1111-1 и -г ьнм.:; 101^,1,.; ;г (1-(Цч|;г1,л;;.1 я з.. -] I -. I г щ. СлщдацчкииыД ул-.-,.>31, 1отчдЛ Ш пмерСугкгзд випЛвдв г 1г " ,..■■ н 1.1-. III. шилуг фтияп^ш. К] г. чв?1д т.ч-.цдлуил. лз'"1»1пмЛ

НПО шич'ь !],1Я:111Й ППк

вциушгрииптвп всЬ. иге улучлгенш. уиц <т> выСорг воин ву;т и^иит, 1 Ял, штрздлгязя.

| Из 1.1-11, Ш1, ||[.|||ИТ|| ЧУиСз! В1-

- п п ^1 ■ Р^1ДТТ1кЛиЛ УЛ1-Я-II >1111 11 В4-Э-

Н«ХЯР «И|Х»П. ЧШИ* yiU4Ui.il Ш-ЗИДЗ ■ .1.131 1Т|ИДА11Я щлпг.

4)1^1 шГЯ1|ВИ .Л|Цсв РОи^тШз^ НКЛРПИВДЪ -I ■■ ■.!■ ••■■.:-. -.-I 1111.11,1ч 14 ЦЩ

Рисунок 2. 7. Биржевые ведомости. 1913, № 13597 (14 (27) июня). Вторая страница

----

ш rruxgtoiEBii! aiirrraiii съ t№i№ tcimii rponwtjtfm. ПллЛол'Т.^ nrfjrrsae iirnnrcitlt твитгЬдтлпя лрслщмсии CBOI П1лп |ГЬ {иПИПМАъ. ^l^TtPCfli ]Г!ГПТ®Г»И

HK1DHI t pisfu.iiut в» Pwrlit. Dirti paa-

IHfb nwmttoCH. л it№rfll

(«тащил. Я|М:1^Г1Мл,Т1 ИМ инШрш. nm'llkkl л щА.имгпшп HtCIUb. UXlllM»-M1JJTV ЛКОТИЦЦИДЬЯЦ, Пй IfttttUIUli» ГГ4-.loisi'cftjLNnij. мн щш»™ сипи с* pt zkHWi ■ П Sfjjn« Bjmti Bpfiioy-rim ■riir (иГ^цтйтлт ЩЫИМфмТГШЛТ IH*-СТПГИЕЪ lie l4JITf«Tl ПИГТРЛОР» № nj№-

ii.ni.nini ил рмапнаия тосы к tinicii-im iwtyn. Pit» MWitoCttye, mimiir-EJ гь моСгв ИНТРИГ» ЮГЯГТ, 1 Tiiras

uptlrtluuiTb fiEiilVK) 111 IttnflflH П№И>-ХЁЧШЛТШ ещШиоШ sartiytomao imn r^J'in <пцлвщ.

Млыяь

Bj|4twijfc muni», [цлгжлта m :A-(ягчг™"т1 mjiteo ылчмккпл пЛм.1 ли PWAIWT flfnj;«anitirtMi.iij.Ti «flW F«dl>. Ft» JTWii чатгиЩръгРь rs-

ПЦГКНП <puwtp>>. «ЯЩКР-

msil вящп шиишвлмл nifi.fesit <олчч icp гнгт eirvannd, Bf.nn т. tiers« гимыпга!» ct пКоЛгйЯ! fitn^iii птягмнге ими» m по BtitHip* jejmi-irt. Ill cjtjui fixtam швингт врв-пи.та li оффпцплани ppunuurftu щь. сыпемго гкчдлглт шелтиримт!!!, ejv ..тлл* ечт ¿emilrimmnzni И тнип*. ■ iriS-□ 11.П Щ1- trljitr.lM I. t lUl\ 'J Гч-

ftu it <Tti ixxt лргпгтъ Ирмст""1*!* i m тлипт. lir. inuirt-TWEtinini, ипчиз-

' wtnl> FFJJJTFIUOrb. И аТЩШПП

ФиДпттъ rtm irr Ptiti-Нтр шдепнетнишь'?.

"Ли. nj ВДОвиП ipt*» Krf.ItilUfltUt btTt-i'W>ni. Тоги fu ntiJiti (iii.ii iVvrtt n-рлвтярсмш. w r(t ii' ПТГ71ГЛВШЧ1 и>Л-vp. rwaeiinni« яъ игэзшг! три tiu и

Фцвт.

i>»l4if мптнаы wnimiii pprimi. тявт> pip* rr.TTT Miff r«Lf.-in. Klif.TnTT. TO Oljl» ИП1.ЧТ. T'mijJTl (Ti.lKl! HJjflhotT. P III,

miifiman, в^гчттл tnrnitfk «гтшчче-cratii. ™tl,

K««HTcpc*ip uHtnin н имличичита»

НРПИ1УИ,

111 ПТПУЩККЗД!* РрйьигцгЦ t.IFTHTJ. Hlm.lfiTOiT. Mill Ejn«.H, nvtw Tl[«-lt.ffjipwi Г1ШЦ1ШНЛ tHiJ^Ti. ljll Щ1-

i f:i iti ffniii i.i tmijun ii првишшт isil.li |вп|«вяаик1м шичпмггмшш

Epltn. IlHli:!l!n«» Ul»PD!HHfbr

ЬфЛа РЬ фшсмфанЫеЛ.

— Fnjni .^nmnjiin, mv ш» ifnif —л? шит .n-

Kr кт!"" «-ИИПФЛгЛя. I TflfPHFlU I yjminstjf n iJ.itrBiirainiir. mueaim '■твт.тгг^г.'лта fjn и cini-n.. n.m и iFWWfriir ijt-л гшчимл innjnnirj«. ilitatjw wm nciisn. тцу.пи,

PI П «»Hi, g in. Tly:nr,«t глт'гл-t 111

iNii(jCiHnm44:ii niJHm»TT« пцчио toile ча^мг eunAiif). Tin зп> ттЛво вичптвлтсии ¡¿'кк'лчк. HfiMirb I^Jiiri ¡р^Дйвяп rciuiunwn

fcrtfl тн iwKrri' <4i! a ftui.r

fTTWFtUj ntmjuiff u nw.

ttfmuffifTp (rtiim. s* rtfpo)Mi(*nii!ii H4TIJ4 iMritw. iKcrjiusimm ль mr. jHirn, nunGin, ^iBimfiNNM. s;iA1>tii ■ tnimnHiv Tifr^PHTi ичип Afrniinmtii uiunb u il.nrflBir прамж ti Tir«wiu«l* ^kliftiun npotj'itfdfit.

Iru-iimf. raiatntiiiJt, kiitsjirr чгЫт. tpfjitp™ ЩГТ1ГЦ, m>e«icTjn*a«A; 16-rs «ипОм г.. йл.щ SI НЕОИ-П UUJ-твг. tiff ]ji'firi.ip\ Щ1., an mwn ftrp-

Wlt. Elt limfWltb. ntUJ.iiCi ДКЕТ1. nil if

(тгтоич-нлпрлитгриЯ ar,i up«*, гтев-aittn-b riunc 32 me. ■

lit. Mil. дс дм1. Каирнил jDrruniJi ei-тдрг № jojun-Ttiis cwL+iniri iiuBuiii, nt «Ейзиои. in nil рктрети

SI Ell. (IVUli 51111 ii .1|.1".И.1|[ИЧ

(iSnuin JIlTimiin» wp-iii. jrtsil Борапп, иппронг aimai и с nnnipui, tm «ek пг.шгм*)- iWtiii tCl.jriTU'b ITfTfi Hil, J4-

кию'г^зъ tK до1ъ CipiiEnpimpjhniri iss.li'-

If Mi,

(Чтшнит пиииа, ттч Блремя jrt-pi-п. nti[iii п. ¡нити, < Кн4рпи« VMnat ли п. ttwriflpT. liisi. лй лрия^шдо—ЫЗД-

'Tl'i'. НС ГиЯСШПО. № НТО ЛШ'ШШ, 1Р ¡Г.ииряпл съ EofurrMun шткпгтл ITC (¡НТВ

шпаи.

ЗА ?T(iTCTslfBt ГЛ1Е1 ito щкшхь psrm (и» inifTHmi'ini. » (uli шспви-

PXCBt Jin Dll1llSUtFIEII«Clt.

^isoiiiioF- xcignlc fiijjrr.vmS з'-тутчг. rt iDnig рп?п.1гриэтим unrt.-

■raid it oe* Jn »lliniinl Mi

ичп хртезг EEE.ll npfjumnil |КСЪ tt pu-(itjit iiinli nvm авяк«™ jnisjiir, t rn, umi (jjnrt oCsMiTPTi пттис* ii'..»iH-niit iprnt in aoj-icMnia imint

lEnlH JTL 4-fitkt JL fUr. py^Hl. DlWlll НПЛШ FPir. O'.t. 0, (X

Tpniipwi.

Рисунок 2. 8. Биржевые ведомости. 1913, № 13621 (28 июня (11 июля)). Третья страница

Рисунок 2. 9. Биржевые ведомости. 1913, № 13696 (12 (25) авг.). 1 страница Библиография

1. URL: http://docs.historyrussia.org/ru/nodes/1-glavnaya

2. Tze-I Yang, A.J.Torget, R.Mihalcea (2011). Topic modeling in historical newspapers.

3. Marjanen, J., Zosa, E., Hengchen, S., Pivovarova, L., & Tolonen, M. (2020). Topic Modelling Discourse Dynamics in Historical Newspapers. DHN Post-Proceedings.

4. Koentges, Thomas (2020). Measuring Philosophy in the First Thousand Years of Greek Literature.

5. Egger, Roman (2020). A Topic Modeling Comparison Between LDA, NMF, Top2Vec, and BERTopic to Demystify Twitter Posts.

6. Галушко И.Н. Корректировка результатов OCR-распознавания текста исторического источника с помощью нечетких множеств (на примере газеты начала XX века) // Историческая информатика. - 2023. - № 1. - С. 102-113.

7. Представленная статья является частью моей магистерской диссертации по теме:

«Поведенческие аспекты анализа доходности ценных бумаг на фондовом рынке Российской империи в начале XX века: контент-анализ биржевых нарративов». Найденные LDA-алгоритмом выпуски «Биржевых ведомостей» в данной работе рассматривались в сочетании с материалами фонда №143 ЦГАМ (Московский биржевой комитет) и трудами биржевых практиков начала XX в. (Васильев А.А. Биржевая спекуляция, теория и практика. СПб., 1912.).

8. Воронцов К. В. Вероятностное тематическое моделирование: теория, модели, алгоритмы и проект BigARTM. 2020.

9. GitHub. URL: https://github.com/iodinesky/Topic-modeling-in-historical-newspapers 10. Воронцов К. В. Вероятностное тематическое моделирование: теория регуляризации

ARTM и библиотека с открытым кодом BigARTM. 2023.

Результаты процедуры рецензирования статьи

В связи с политикой двойного слепого рецензирования личность рецензента не раскрывается.

Со списком рецензентов издательства можно ознакомиться здесь.

Рецензируемая статья посвящена анализу информационного потенциала коллекции исторических источников с помощью тематического моделирования. В данном случае тематическое моделирование, пригодное для различных направлений анализа текстов, используется как инструмент предварительной оценки содержания коллекции исторических документов для отбора текстов, релевантных исследовательским запросам. В качестве массива текстов, на котором проводится апробация предлагаемой методики, используется пресса (газета «Биржевые ведомости» за 1905 и 1913 гг.). Для исследования были взяты оцифрованные комплекты газет с сайта Российской национальной библиотеки (447 номеров). Автором была поставлена задача использования тематического моделирования для автоматического поиска тех газетных страниц, где есть информация о функционировании рынка ценных бумаг. В процессе поиска использовался хорошо апробированный в компьютерной лингвистике метод лемматизации. Использовались вероятностные LDA-модели, часть из которых была автоматически отобрана для дальнейшего анализа как содержащая биржевую информацию. Далее проводился содержательный анализ отобранного материала. Актуальность работы не вызывает сомнений, поскольку поиск и отбор необходимой для дальнейшего исследования информации является на сегодняшний день серьезной проблемой, на решение которой уходит огромное количество времени. Любой способ адекватного решения подобных вопросов - это большой вклад в научно-исследовательскую практику.

Научная новизна работа также очевидна. Тематическое моделирование почти не освоено в исторической науке, появляются только первые опыты его использования, а вопрос о степени его полезности в рамках творческой лаборатории профессионального историка до сих пор остается открытым.

Статья построена не вполне традиционным образом, поскольку носит во многом экспериментальный характер. После постановки проблемы практически сразу начинается логический раздел, посвященный созданию методики использования тематического моделирования для поиска информации. Далее анализируются результаты поиска. Показательно, что, с одной стороны, автор констатирует продуктивность созданной методики для оптимизации поиска, с другой, - подчеркивает, что полученные модели слишком фрагментарны и их можно использовать только для первичной оценки тематики информации источника. Статья дополнена примерами

топиков и ключевых слов, фрагментами отобранных текстов, словарем определений и фотографиями газетных страниц. Следует отметить, что безусловно интересная и новаторская статья рассчитана на подготовленного читателя, знакомого с основами анализа текстов. В то же время продуманный стиль статьи облегчает понимание довольно сложных и не всегда привычных для традиционного взгляда историка вещей, о которых идет речь.

Библиография статьи содержит достаточный для подобных исследований список, хотя, думается, что не лишним было бы добавить работ на русском языке.

Статья фактически является приглашением к обмену мнениями и дискуссиям по рассматриваемой проблематике, скорее всего, ей обеспечена хорошая цитируемость в силу актуальности рассмотренных вопросов.

Публикация исследования, связанного с методами машинного обучения, рассчитана на определенный круг читателей, который, безусловно, будет достаточно широким, поскольку любая работа, связанная с интеллектуальной обработкой данных, вызывает сегодня большой интерес научной общественности. Статья рекомендуется к публикации.

i Надоели баннеры? Вы всегда можете отключить рекламу.