Научная статья на тему 'Малые формы научного текста: ключевые слова и аннотация (информационный аспект)'

Малые формы научного текста: ключевые слова и аннотация (информационный аспект) Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
5135
376
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НАУЧНАЯ СТАТЬЯ / МОДЕЛИРОВАННЫЙ ТЕКСТ / СИНОНИМИЧЕСКИЙ ТЕКСТ / КЛЮЧЕВЫЕ СЛОВА (КС) / НАБОР КЛЮЧЕВЫХ СЛОВ (НКС) / АННОТАЦИЯ / ИНФОРМАЦИОННАЯ ЗНАЧИМОСТЬ / KEY WORDS (KW) / RESEARCH PAPER / MODELED TEXT / SYNONYMOUS TEXT / KEY WORDS LIST / ABSTRACTS / INFORMATION VALUE

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Камшилова Ольга Николаевна

Обсуждаются вопросы информационной значимости аннотации и списка ключевых слов, которые рассматриваются как синонимические тексты в рамках моделированного текста научной статьи. На основе корпусного анализа научных публикаций делаются выводы о характерных недостатках в выборе списка ключевых слов и написании аннотации авторами публикаций, предлагаются пути увеличения роли этих текстовых форм в поисковых / информационных целях.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Keywords and Abstracts as Small Forms of Academic Text (informational aspect)

The paper considers keywords and abstracts as small synonymous text forms within the modeled text of a research paper and deals with their information value. Based on a corpus analysis of current publications, the research pinpoints typical faults/weak points in the authors ’ key words lists and abstracts and suggests a way to improve these texts for information search.

Текст научной работы на тему «Малые формы научного текста: ключевые слова и аннотация (информационный аспект)»

ные осваиваются раньше согласных, смычные — раньше щелевых, однофокусные раньше двухфокусных. Это позволяет нам предположить, что морфонологическая ис-ходность коррелирует с артикуляционной простотой. Соответствующий данным положениям критерий определения направления чередований мы могли бы назвать артикуляционно-онтогенетическим.

Таким образом, мы видим, что, с одной стороны, материал детской речи дает нам возможность сформулировать дополнительные обоснования для подтверждения некоторых положений морфонологии, а с другой стороны, некоторые идеи морфонологии могут быть использованы для описания специфических фактов детской речи.

СПИСОК ЛИТЕРАТУРЫ

1. Касевич В. Б. Морфонология. Л.: Изд-во Ленинградского университета, 1986. 162 с.

2. Цейтлин С. Н. Очерки по словообразованию и формообразованию в детской речи. М.: Знак, 2009. 592 с.

3. ЧургановаВ. Г. Очерк русской морфонологии. М.: Наука, 1973. 239 с.

REFERENCES

1. Kasevich V. B. Morfonologija. L.: Izd-vo Leningradskogo universiteta, 1986. 162 s.

2. Tsejtlin S. N. Ocherki po slovoobrazovaniju i formoobrazovaniju v detskoj rechi. M.: Znak, 2009. 592 s.

3. Churganova V. G Ocherk russkoj morfonologii. M.: Nauka, 1973. 239 s.

О. Н. Камшилова

МАЛЫЕ ФОРМЫ НАУЧНОГО ТЕКСТА:

КЛЮЧЕВЫЕ СЛОВА И АННОТАЦИЯ (информационный аспект)

Обсуждаются вопросы информационной значимости аннотации и списка ключевых слов, которые рассматриваются как синонимические тексты в рамках моделированного текста научной статьи. На основе корпусного анализа научных публикаций делаются выводы о характерных недостатках в выборе списка ключевых слов и написании аннотации авторами публикаций, предлагаются пути увеличения роли этих текстовых форм в поисковых / информационных целях.

Ключевые слова: научная статья, моделированный текст, синонимический текст, ключевые слова (КС), набор ключевых слов (НКС), аннотация, информационная значимость.

O. Kamshilova

Keywords and Abstracts as Small Forms of Academic Text (informational aspect)

The paper considers keywords and abstracts as small synonymous text forms within the modeled text of a research paper and deals with their information value. Based on a corpus analysis of current publications, the research pinpoints typical faults/weak points in the authors ’ key words lists and abstracts and suggests a way to improve these texts for information search.

Keywords: research paper, modeled text, synonymous text, key words (KW), key words list, abstracts, information value.

Научная статья как моделированный текст

Выделение научного текста как особого типа относится, вероятно, к одному из самых ранних и бесспорных выводов в теории текста. Описания функциональных, композиционных и словарных характеристик научной статьи хорошо известны и стали основаниями для многих фундаментальных и прикладных исследований. Сегодняшний интерес к научному тексту вызван обращением к формально-типизированным характеристикам определенного рода текстов, моделирующим их структуру и позволяющим учитывать параметры, обеспечивающие коммуникацию в новой информационной среде.

Моделированными текстами (modeled texts) называют тексты с устоявшейся (принятой по эталону) стандартной структурой, часто имеющие вид бланков или создающиеся по заданной конвенциональной структуре.

С точки зрения структурных особенностей оформления моделированного текста различают жестко структурированные тексты (статические тексты, тексты с жесткой структурой), имеющие высокотипизи-рованое языковое оформление и ограниченную вариативность, и нежестко структурированные тексты (тексты с полужесткой структурой), имеющие типизированное языковое оформление с элементами вариативности [3-5; 7; 14-17; 20].

Формальная организация моделированных текстов, с одной стороны, обеспечивает стандарт, а с другой — оптимизирует процесс извлечения информации из таких текстов, поскольку их прагматическая установка предполагает целевого адресата, использующего эту структуру для свободной «навигации» по тексту. В этом плане регламентации для научных статей, к которым прибегают серьезные научные журналы или

организаторы научных конференций, издающие свои материалы и размещающие их в Интернете, являются тем формообразующим условием, которое позволяет причислить тексты научных статей к моделированным.

К регламентирующим (формообразующим) параметрам научной статьи относятся, наряду с заглавием, список ключевых слов (keywords), аннотация (abstracts), список цитируемых источников («литература», references), а также требования к ссылкам и сноскам. Наиболее значимыми для сегодняшнего информационного обмена являются те, которые обеспечивают информационный поиск, в первую очередь — автоматический. При этом стандарты для ключевых слов (КС) и аннотаций остаются неразработанными. Авторы научных публикаций либо исходят из некоторых собственных представлений о том, что такое «ключевые слова» и «аннотация», либо копируют образцы авторитетных изданий, либо пользуются достаточно приблизительными советами типа приводимых ниже:

«Ключевые слова — это текстовые метки, по которым можно найти статью при поиске и определить предметную область текста. Они как публикуются в самом журнале, так и указываются в электронной версии статьи. При отборе по определенному ключевому слову читатель сможет найти все статьи, затрагивающие данную предметную область. Если вы видели “облако тэгов” на сайтах с большим объемом текстовых статей, то сможете понять, о чем идет речь.

Чтобы представить, какими могут быть ключевые слова для вашей статьи, попробуйте представить, по каким поисковым запросам ваша статья должна быть найдена.

Таким образом, чтобы подобрать ключевые слова, перечислите основные терми-

ны, которые используются в статье. Это могут быть также названия компаний, упоминаемых в статье. Чтобы проверить каждое из ключевых слов, подумайте, будет ли кто-то искать статьи по этому слову?

Пример правильного подбора ключевых слов: интеллектуальный капитал, человеческий капитал, оценка человеческого капитала, капитал личности, нематериальные активы, Газпром.

Неправильно подобранные слова: интеллектуальный капитал организации, человеческий капитал, его оценка, личность работника, ОАО “Газпром ”.

Ключевые слова необходимо представить в редакцию на русском и английском языках» [10].

Примерно так же даются инструкции по составлению аннотаций:

«Как правильно составить текст аннотации? Самый лучший способ: попробуйте рассказать кому-нибудь в двух-трех предложениях, чему посвящена статья, для чего она написана, какие выводы в ней делаются. Иногда это бывает непросто сделать с первого раза, но такая задача под силу любому автору.

Постарайтесь сделать так, чтобы текст был понятен, иначе польза от такой аннотации будет очень небольшой. Проверить это можно следующим образом: попробуйте перевести аннотацию на английский язык автоматическим переводчиком, например translate.google.ru, а потом им же обратно на русский. Если вы сможете понять получившийся текст, значит, аннотация будет нормально восприниматься читателями <...> Какого объема должна быть аннотация? Обычно аннотация должна состоять из двух-трех, иногда че-тырех-пяти предложений. По объему текста аннотация должна занимать ориентировочно 500 знаков с пробелами (или в среднем — 50 слов)»» [10].

Эмпирический характер такого рода советов, вполне вероятно, оказывает поддерж-

ку молодым авторам, однако не гарантирует положительного результата, поскольку во многом опирается на интуицию и восприимчивость к шаблонам. Важным моментом в приведенном совете является ориентация авторов на поисковые информационные системы, в которых не должна затеряться новая публикация. Для этого внимание обращают на содержание поисковых запросов («подумайте, будет ли кто-то искать статьи по этому слову»»). Состав списка ключевых слов предполагает включение терминов («основные термины, которые используются в статье ») и номенов (« названия компаний, упоминаемых в статье»). Однако авторы советов не объясняют, например, почему «интеллектуальный капитал» лучше в качестве КС, чем «интеллектуальный капитал организации», а «Газпром» лучше, чем «ОАО “Газпром”».

Рекомендации по поводу написания аннотации также полезны, однако аннотация, как особая форма текста, не ограничивается кратким пересказом сути исследования. Здесь часто размещают сведения о разработчике научного проекта и областях его возможных применений.

Нельзя не отметить, что даже в таком неформальном руководстве, ориентированном на восприимчивость и интуицию адресата, намечаются важные содержательные («чему посвящена статья, для чего она написана, какие выводы в ней делаются») и структурные (количество предложений, знаков или словоупотреблений) компоненты аннотации. Эти ключевые моменты в целом соотносимы со стандартом аннотации, определенным для библиотечного и издательского дела. Так, Система стандартов по информации, библиотечному и издательскому делу (ГОСТ 7.9-95) определяет аннотацию как текст, который включает в себя «характеристику основной темы, проблемы объекта, цели работы и ее результаты. В аннотации указывают, что нового несет в себе данный документ в сравнении с другими, родственными по тематике и целевому назначению»* [19, а 3-7] , например:

«В статье показаны принципы составления ключевых слов для научной статьи, отражены направления использования [тема/проблема]. Автором выделены способы повышения доступности научных статей для читателей журнала [цель] с помощью более эффективного подбора ключевых слов [результат/новизна]. Материалом для данной статьи служит многолетний опыт работы редакций ведущих российских научных журналов» [2].

Количество КС и размер аннотации на сегодняшний день не имеют жестко регламентированных рамок. В список КС разными издательствами или оргкомитетами конференций рекомендуется включать от 3-5 до 15 терминологических единиц, размер аннотации может устанавливаться количеством предложений (как в приведенном выше примере) или строк, но чаще — количеством слов (словоупотреблений) — от 100 до 150, или знаков — от 500 до 2500. Часто количественные параметры не указываются совсем.

Таким образом, отсутствие в современной научной коммуникации, особенно в отечественной, правил и стандартов для оформления КС и аннотации, ставших обязательными компонентами структуры научной статьи, — очевидный факт. Определение этих стандартов должно опираться, как минимум, на два фактора: функциональный (прагматический) и лингвистический.

Прагматический фактор определяется функцией этих компонентов в научной коммуникации, которые, в свою очередь, должны направлять коммуникативные интенции автора научной статьи, и опирается на их текстовый характер, что позволяет говорить не только о специфическом содержании, но и об определенной грамматике этих текстов.

Аннотация и набор ключевых слов как тип текста («тексты-примитивы», «синонимические тексты»)

Термин «тексты-примитивы» принадлежит Л. В. Сахарному [18], который определил текстовую природу малых речевых

форм, реализующихся в определенных коммуникативных ситуациях (детская речь после полутора лет, речь больных с моторной афазией, наборы ассоциативных пар и назывных предложений), на основании наличия в них грамматики особого рода, обеспечивающей их целостность и связность. В отличие от традиционных объектов лингвистики текста — текстов больших размеров, грамматически правильно построенных, рассматривающихся вне процессов их создания и осознания, для текстов-примитивов основополагающими оказываются не формальные (размер и грамматическая правильность) критерии, а функциональные: учет «фактора человека», создающего или воспринимающего текст, и коммуникативной ситуации.

Набор ключевых слов (НКС), по определению Л. В. Сахарного, также относится к текстам-примитивам и обладает следующими несомненными характеристиками текста, обеспечивающими ему цельность и связность:

а) синтагматической природой (само соположение ключевых слов в «естественно» построенном наборе, их упорядоченность, построение НКС по типу цепочечной структуры);

б) тема-рематическими отношениями (сами ключевые слова отражают в основном тему текста, а их упорядоченность в наборе

— через ассоциативные связи — рему).

НКС соотносится с развернутым текстом

(РТ), отношения между этими двумя типами текста определяются как синонимические, которые обусловлены «некоторой цельностью как инвариантом содержания». «Таким образом, цельность как явление парадигматической природы выходит за рамки одного текста и характеризует всю динамическую парадигму «синонимических текстов» [18].

Исходя из этих соображений, можно утверждать, что в рамках научной статьи реализуются четыре «синонимических текста»

— заглавие, НКС, аннотация и РТ, собст-

венно текст статьи. Их функциональная природа определяется степенью сжатости/развернутости текста: линейная («цепочечная») грамматика НКС позволяет восстановить РТ.

Аннотация также обладает некоторыми признаками текста-примитива. Ее связанность с определенным типом коммуникативной ситуации и ориентацией на фактор человека (создающего и воспринимающего) очевидна. Синтагматическая природа текста аннотации близка к синтагматике текстов больших форм: двусоставные, полные, распространенные предложения, связанные тематическими отношениями, которые реализуются тематической лексикой, анафорой, повторами и связующими элементами:

Политическая власть описывается в категориях классической эстетики. Утверждается адекватность этих категорий природе власти. Достижение властью своего полного выражения показывается как переход от красивого к комическому (Текст 2)**.

С другой стороны, соположение / упорядоченность предложений аннотации не всегда и не обязательно следует правилам тематической прогрессии развернутого текста. В этом случае каждое из предложений аннотации может выполнять функцию темы по отношению к собственно тексту статьи (подобно НКС):

В статье раскрывается опыт изучения проблематики власти и доминирования в философии Ю. Хабермаса. Феномен власти получает истолкование в контексте осмысления обширного тематического поля человеческой коммуникации. Особое внимание уделяется процедурам достижения общественного консенсуса и преодоления кризиса легитимации (Текст 5).

Аннотация может состоять из одного предложения, при этом синтагматическая связь обеспечивается однородными дополнениями, подчиненными единственному личному глаголу в предложении:

Статья посвящена некоторым наиболее важным лингвистическим аспектам созда-

ния системы китайского русского машинного перевода, проведению статистического анализа репрезентативного пакета текстов на китайском языке, анализу результатов иероглифического и лексического состава исследуемого микроподъязыка водных коммерческих перевозок (Текст 3).

Синтагматические характеристики аннотации, сближающие ее с текстами «больших форм», не препятствуют отнесению аннотаций к текстам-примитивам. Определяющим моментом в этом случае стоит считать именно функциональную природу аннотации — ее особую коммуникативную задачу, обусловливающую «промежуточное» положение в структуре моделированного текста научной статьи. Кроме того, ее цельность характеризуется парадигматической природой, которая реализуется как инвариант содержания в ряду синонимических текстов «заглавие», «набор ключевых слов», «аннотация», «развернутый текст статьи».

Итак, в лингвистическом аспекте НКС и аннотация представляют собой специфическую форму текста (тексты-примитивы), единицы парадигмы (синонимические тексты), реализующие инвариант содержания. С функциональной точки зрения заглавие, НКС, аннотация и РТ отражают четыре стадии в порождении и восприятии научного текста, определенные характером научной коммуникативной ситуации — указанием / узнаванием темы текста, формированием представления о тексте, собственно текст.

КС в информатике (КС как поисковый образ документа)

Понятие КС как носителей наиболее существенной информации о тексте было введено в информатике и используется для задач обработки и извлечения информации в поисковых системах. На этом понятии основан так называемый метод координатного индексирования, предполагающий, что основное содержание документа может быть с достаточной степенью точности и полноты выражено соответствующим списком КС, которые отражают его тему [8, а 58; 11,

c. 270]. Этот список включает наиболее значимые единицы текста, например, слова с высокой частотой [8]. Список КС называют поисковым образом документа: «Ключевое слово — слово в тексте, способное в совокупности с другими ключевыми словами представлять текст <...> Набор ключевых слов документа называют поисковым образом документа. Набор ключевых слов близок к аннотации, плану и конспекту, которые тоже представляют документ с меньшей детализацией, но лишённый синтаксической структуры» [21].

Координатное индексирование основано на статистических методах. Частота КС в тексте является их важнейшим параметром. Для определения частоты КС в тексте в сетевых публикациях используется понятие «плотность ключевых слов» (см., например, работу [б]) — выраженное в процентах отношение суммарной частоты КС к количе -ству слов в тексте. Другая важная характеристика КС — соответствие КС статистике запросов, определяющей информационную значимость публикуемого в сетях документа. Свои инструменты для подбора КС предоставляют основные системы размещения рекламы (Яндекс, Рамблер, Бегун, Google). «Сегодня КС — это продукт, имеющий высокую ценность, который предлагается студиями веб-дизайна для продвижения сайтов и блогов, поскольку КС являются основой для большей части интернет-рекламы. Кроме того, именно благодаря КС оптимизаторы и рекламодатели находят целевых потребителей ... своих услуг и продуктов» [9].

В отличие от продвижения товаров и услуг, публикация и продвижение научного исследования часто становятся делом самого автора. Даже крупные издательства и журналы, имеющие электронные версии, принимают к печати материалы, в которых списки КС и аннотации создаются авторами статей, не имеющих специальных знаний для составления таких информационнозначимых компонентов. Необходимость ориентации авторов научных текстов на

требования современных поисковых систем рассматривается, например, в статье Е. Г. Абрамова [2], где автором выделяются способы повышения доступности научных статей для читателей журнала с помощью более эффективного подбора ключевых слов.

Как показывает анализ выборки научных статей из рецензируемого журнала «Известия РГПУ им. А. И. Герцена», списки КС и аннотации, предваряющие статьи в соответствии с журнальными требованиями, сильно отличаются друг от друга как по размеру, так и по отношению к развернутому тексту статьи. Рассмотрим некоторые примеры для того, чтобы понять, какие интенции реализовались в подборе авторами ключевых слов к собственным текстам и насколько авторские НКС соответствуют требованиям современного информационного поиска.

Анализ соотношения «заглавие — набор ключевых слов — аннотация — развернутый текст» по материалам научных публикаций

Согласно лингвистическому подходу к НКС [12; 18] под КС понимается слово или словосочетание, которое несет в сопоставленном ему развернутом тексте существенную семантическую нагрузку. НКС представляет собой свернутый сценарий РТ, по которому весь текст можно восстановить. В научных текстах КС присутствуют, как правило, в заглавии, в первом предложении текста, а также в начальных предложениях каждого абзаца [12, с. 91]. Оставляя в стороне анализ таких сильных позиций текста, как первые предложения текста и каждого абзаца, рассмотрим количественные характеристики НКС в текстах заглавий, аннотаций и в РТ статей.

Сопоставление НКС с текстом аннотации, заглавий и РТ приводит к заключению, что единицы НКС обнаруживаются во всех указанных компонентах научной статьи. Исключение представляет Текст 8, в котором в НКС вошли словосочетания профессиональное обучение, профессиональные знания, профессиональные и личностные

качества, ни одно из которых не нашло отражения в заглавии статьи, а в аннотации употреблено однокоренное существительное с обобщающим значением — профессионализация (табл. 1).

Объем НКС — от трех до семи слов, при этом число их употреблений в заглавии минимально, но в аннотации, из-за повтора, оно иногда превосходит объем самого НКС (Тексты 1, 7).

Таблица 1

Количество КС в заглавии, аннотации и РТ статьи

Текст Объем НКС КС в заглавии (*) — производные формы КС в аннотации (*) — производные формы КС в РТ (точные вхождения)

1 7 5 10 172

2 6 2 4 124

3 5 1 (1*) 0 (1*) 31

4 5 1 0 (2*) 23

5 3 1 (1*) 3 3

6 3 1 2 100

7 5 2 6 40

8 3 0 0 (1*) 6

Анализ КС в «синонимических текстах» показал, что цельность всей динамической парадигмы «заглавие — НКС — аннотация

— РТ» поддерживается отношениями про-изводности КС. Так, КС допускают преобразования по направлениям генерализации /

НКС

(а) иероглифика

(б) банковско-кредитные учреждения

(в) проблемы международной миграции

Представленность КС в тексте производными лексемами значительно увеличивает их плотность в тексте. Например, в Тексте 6 обнаружено 33 точных вхождения КС наука и 51 прилагательное с корнем научн-. В Тексте 3 одно из четырех слов НКС иероглифи-ка представлено только в самом наборе, в аннотации и РТ обнаружены однокоренные: иероглифический (1) и иероглифы (17). Поскольку в качестве КС возможно использование многокомпонентных именных групп (терминологических словосочетаний), то

конкретизации (кредитные институты / учреждения — банковско-кредитные учреждения), однокоренное словообразование (иероглифика — иероглифический, иероглифы), словосложение (власть — властеот-ношения):

Аннотация, РТ Иероглифический, иероглифы (Текст 3) Кредитные институты, кредитные учреждения (Текст 4)

международная миграция, миграция, проблема (Текст 7)

возможны такие случаи, когда такое многокомпонентное КС не встречается ни разу ни в аннотации, ни в развернутом тексте. Например, в Тексте 7 словосочетанию проблемы международной миграции из НКС в других разделах статьи соответствуют международная миграция (1), миграция (1), проблема (5).

Информационное продвижение текста, как отмечалось выше, зависит от величины плотности КС. «Оптимальная плотность ключевых слов (и словосочетаний) — от 1,5

до 7%, желательно не более 3,5%. И не менее двух точных вхождений в тексте страницы поисковой фразы целиком» [1].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Использование многокомпонентных терминов в НКС и производных в тексте статьи делает подсчет плотности КС достаточно сложной процедурой как при ручном, так и при автоматическом подсчете. При этом очевидно, что представление о насыщенности текста ключевыми словами только на основании их абсолютной частоты в тексте без учета объема текста (табл. 1) малоинформативно. Подсчет плотности отдельных КС может внести коррективы в эту оценку.

В табл. 2 приведены величины плотности самого частотного КС в каждом тексте выборки. Требованиям поисковых запросов удовлетворяют КС текстов 1, 2, 6 и 7. В трех из четырех случаев (тексты 2, 6 и 7) плот-

ность самого частотного КС в тексте можно считать достаточной для того, чтобы это ключевое слово учитывалось при автоматическом поиске. Доля остальных (от двух до пяти слов, указанных в НКС) незначительна и на результаты информационного поиска они не окажут ожидаемых результатов.

Другой важный для поиска аспект в подборе КС — ориентация на поисковые запросы: чем больше поисковых запросов включают данное КС, тем выше вероятность выхода на размещенный в Интернете текст. При этом верхние строчки в системах статистики КС, говорящие о популярности соответствующего запроса, могут предупреждать о высокой конкуренции, в результате которой данный текст не попадет на первые страницы результатов поиска [6; 9].

Таблица 2

Плотность наиболее частотного КС

Текст Главное КС статьи Абсолютная частота данного КС в РТ Плотность данного КС в РТ, %

1 Язык 33 2,2

Эмоция 34 2,3

2 Власть 66 1,8

3 Китайский язык 17 0,5

Иероглифика* (Иероглифы) 17 0,5

4 кредитный кооператив 12 0,7

5 Коммуникация* (Коммуникативный) 15 0,6

6 Рациональность 88 2,4

7 Глобализация 26 1,6

8 Профессиональное обучение 4 0,2

Высокочастотные запросы, как видно из табл. 3, характеризуют КС язык, власть, коммуникация, т. е. термины, которые мало отражают специфику статьи, поскольку могут использоваться в разных областях знания. Поэтому для создания поискового образа документа крайне важно, чтобы другие термины в НКС обладали высокой плотностью в тексте. Достаточно высок уровень

запросов по КС «иероглифы», однако у Текста 3 мало шансов попасть в поисковые системы по этому КС, поскольку его плотность в тексте ниже рекомендуемой. У низкочастотных в рейтингах запросов терминов больше шансов вывести текст на первые страницы поиска при условии, что насыщенность самого текста этими терминами достаточна высока.

Таблица 3

Популярность главного КС статьи по данным поисковой системы Яндекс

Текст Главное КС статьи Абсолютная частота КС в РТ Плотность данного КС в РТ, % Яндекс статистика КС (показов в месяц) на 19.09.11

1 Язык 33 2,2 8879640

Эмоция 34 2,3 85828

2 Власть 66 1,8 424926

3 Китайский язык Иероглифика* 17 0,5 49856 425

(Иероглифы) 17 0,5 218364

4 Кредитный кооператив 12 0,7 11166

5 Коммуникация* (Коммуникативный) 15 0,6 126415 34751

6 Рациональность 88 2,4 4274

7 Глобализация 26 1,6 17409

8 Профессиональное обучение 4 0,2 14207

Итоги и рекомендации

НКС и аннотация могут быть описаны как малые формы моделированного текста, поскольку, с одной стороны, имеют предписываемую форму — ограниченный список слов и ограниченный набор предложений, а с другой, демонстрируют «синонимические» и тема-рематические связи с остальными компонентами текста статьи — заглавием и собственно текстом (РТ). Содержательно эти формы демонстрируют некоторую свободу, свидетельствующую об отсутствии иных регламентаций кроме количественных. Однако в рамках этой относительной свободы прослеживаются общие закономерности, которые определяются именно синонимическими и тематическими связями компонентов моделированного текста. Так, распределение КС по «синонимическим текстам» (заглавие, НКС, аннотация, РТ) допускает отношения производности (генерализацию / конкретизацию, однокоренное словообразование, словосложение).

Линейное расположение КС в некоторых текстах подчиняется «цепочечной грамматике», о которой речь шла выше. Эта линейность определяется движением от более общих терминов к частным, например:

язык, концепт, эмоция, поле, доминанта, лезгинский, английский (Текст 1); власть, эстетика, красота, возвышенное, трагическое, комическое (Текст 2). В других статьях НКС включает словосочетания, формулировка которых напоминает классификационные рубрики при так называемом классификационном индексировании (ср. тематический рубрикатор): банковско-кредитные учреждения, кредитный кооператив, кредитное товарищество, ссудо-сберегательная касса, ростовщичество (Текст 4); профессиональное обучение, профессиональные знания, профессиональные и личностные качества (Текст 8). Наконец, в третьих статьях КС представляют собой формулировки ключевых вопросов статьи: соотношение глобализации и национализма, проблемы международной миграции, роли национальных государств (Текст 7).

Из этого следует, что НКС рассмотренных текстов научных статей являют собой «лингвистический» образ текста, представляющий его содержание по классификационным (тематическим) рубрикам, предполагающий его линейное развертывание либо по цепочке терминов, либо по ключевым вопросам.

Формальные рекомендации журнала были авторами соблюдены. При этом информационная значимость НКС остается под вопросом. Количественный анализ НКС и обращение к параметру «плотность КС в тексте» показывает, что ни один из текстов выборки не был ориентирован на автоматический поиск по КС.

Необходимость ориентации авторов научных текстов на требования современных поисковых систем рассматривается в работе [2], где автором выделяются способы повышения доступности научных статей для читателей журнала с помощью более эффективного подбора ключевых слов. В частности, взгляд на проблему с точки зрения редактора и издателя предлагает отказаться от ориентации на тематический рубрикатор. КС должны выбираться, в первую очередь, из терминов, содержащихся в заглавии, аннотации и первом и заключительном абзацах текста. Их список может быть расширен за счет таких слов и сочетаний, которые входили в статистику запросов по схожей тематике (см. статистики КС на поисковых системах). Сравнение списков КС нашей выборки по структурному составу их

ПРИМЕЧАНИЯ

* Курсив мой — О. К.

** Материалом анализа послужила выборка из малого корпуса научных статей, обозначенных в тексте статьи как (Текст 1), (Текст 2) и т. д.

*** Это весьма характерно для НКС, публикуемых в материалах конференций.

СПИСОК ЛИТЕРАТУРЫ

1. Анализатор плотности ключевых слов // SEO services. URL: http://site-submit.com.ua/7pg =servis_analizing

2. Абрамов Е. Г. Подбор ключевых слов для научной статьи // Научная периодика: проблемы и решения. 2011. № 2. С. 35-40.

3. Баранов А. Н. Введение в прикладную лингвистику. М.: Эдиториал УРСС, 2001. 35В с.

4. Беляева Л. Н. Теория и практика перевода. СПб.: Книжный Дом, 2007. 211 с.

5. Ванников Ю. В. Типы научных и технических текстов и их лингвистические особенности. М.: ВЦП, 19В4. 50 с.

6. Васильченко И. Как подбирать ключевые слова. URL: http://seomans.ru/nashel-info-about-plotnost-keywords.html

7. Горностай Т. А. Латышско-русский машинный перевод в системе социальной коммуникации: Дис. ... канд. филол. наук. СПб., 2010. 262 с.

В. Захаров В. П. Корпусная лингвистика: Учебно-методическое пособие. СПб.: СПбГУ, 2005. 50 с.

115

компонентов говорит о предпочтении простым именным группам одними авторами (тексты 1, 2, 5, 6) и терминологическим словосочетаниям у других (тексты 3, 4, 7, 8). При этом условие вхождения КС и в заглавие и в аннотацию соблюдается далеко не всегда (см. табл. 1).

По рекомендации работы [2], не следует ограничивать (как принято) количество КС тремя — пятью словами: лучше использовать набор из 10-15 слов, в котором вместе с многокомпонентным терминологическим сочетанием (бухгалтерский учет основных средств) будут представлены его составляющие: бухгалтерский учет основных

средств, бухгалтерский учет, основные средства [2, с. 39].

Поскольку публикация и продвижение научного исследования остаются делом самих авторов, не имеющих специальных знаний для составления таких значимых для современной информационной среды компонентов, как КС и аннотация, необходимо разрабатывать стандарты этих малых форм с учетом их лингвистического и прагматического (информационного) аспектов.

9. Ключевые слова: понятие и результативное использование. URL: http://www.proview. ru/keywords_concept_efficient/

10. Креативная экономика. URL: http://blog.creativeconomy.ru/2009/04/02/kak-sostavit-spisok-

klyuchevyx-slov/

11. Леонтьева Н. Н. Автоматическое понимание текстов: системы, модели, ресурсы. М.: Академия, 2006. 304 с.

12. Мурзин Л. Н., Штерн А. С. Текст и его восприятие. Свердловск: Урал. ун-т, 1991. 172 с.

13. Паршин А. Теория и практика перевода. 2000. URL: http://teneta.rinet.ru/rus/pe/parshin-and_teoria-i-praktika-perevoda.htm.

14. Пешкова Н. П. Психолингвистические аспекты типологии научного текста: Автореф. дис. ... д-ра филол. наук. Уфа, 2002. URL: http://psycholing.narod.ru/auto/peshkova-auto.htm

15. Пиотровский Р. Г. Лингвистический автомат. СПб.: Изд-во РГПУ А. И. Герцена, 1999. 255 с.

16. Пиотровский Р. Г. Синергетика текста. Минск: Минск. гос. лингвист, ун-т, 2005. 156 с.

17. Рязанцева Т. И. Теория и практика работы с гипертекстом. М.: Академия, 200В. 203 с.

1В. Сахарный Л. В., Штерн А. С. Набор ключевых слов как тип текста // Лексические аспекты в системе профессионально-ориентированного обучения иноязычной речевой деятельности. Пермь: Пермский политехнический ун-т, 19ВВ. С. 34-51.

19. Система стандартов по информации, библиотечному и издательскому делу. Реферат и аннотация. Общие требования. Минск: Межгосударственный совет по стандартизации, метрологии и сертификации, 1995. 7 с.

20. Хисамова Г. Г. Диалог как компонент художественного текста (на материале художественной прозы В. М. Шукшина). 2009. URL: http://dibase.ru/article/100В2009_khisamovagg/4

21. Энциклопедия SEO: Поисковая Оптимизация от «А до Я». URL: http://www.seobuilding.ru/wiki/

REFERENCES

1. Analizator plotnosti kljuchevyh slov // SEO services. URL: http://site-submit.com.ua/?pg= ervis_analizing

2. Abramov E. G Podbor kljuchevyh slov dlja nauchnoj stat'i // Nauchnaja periodika: problemy i reshenija. 2011. № 2. S. 35-40.

3. Baranov A. N. Vvedenie v prikladnuju lingvistiku. M.: Editorial URSS, 2001. 35В s.

4. Beljaeva L. N. Teorija i praktika perevoda. SPb.: Knizhnyj Dom, 2007. 211 s.

5. Vannikov Ju. V. Tipy nauchnyh i tehnicheskih tekstov i ih lingvisticheskie osobennosti. M.: VCP, 19В4.

50 s.

6. Vasilchenko I. Kak podbirat' kljuchevye slova. URL: http://seomans.ru/nashel-info-about-plotnost-keywords.html

7. Gornostaj T. A. Latyshsko-russkij mashinnyj perevod v sisteme sotsial'noj kommunikatsii: Dis. ... kand. filol. nauk. SPb., 2010. 262 s.

В. Zaharov V. P. Korpusnaja lingvistika: Uchebno-metodicheskoe posobie. SPb.: SPbGU, 2005. 50 s.

9. Kljuchevye slova: ponjatie i rezul'tativnoe ispol'zovanie. URL: http://www.proview.ru/keywords_ concept_efficient/

10. Kreativnaja ekonomika. URL: http://blog.creativeconomy.ru/2009/04/02/kak-sostavit-spisok-

klyuchevyx-slov/

11. Leont'eva N. N. Avtomaticheskoe ponimanie tekstov: sistemy, modeli, resursy. M.: Akademija, 2006.

304 s.

12. Murzin L. N., Shtern A. S. Tekst i ego vosprijatie. Sverdlovsk: Ural. un-t, 1991. 172 s.

13. Parshin A. Teorija i praktika perevoda. 2000. URL: http://teneta.rinet.ru/rus/pe/parshin-and_teoria-i-praktika-perevoda.htm.

14. Peshkova N. P. Psiholingvisticheskie aspekty tipologii nauchnogo teksta: Avtoref. dis. ... d-ra filol. nauk. Ufa, 2002. URL: http://psycholing.narod.ru/auto/peshkova-auto.htm

15. PiotrovskijR. G Lingvisticheskij avtomat. SPb.: Izd-vo RGPU A. I. Gertsena, 1999. 255 s.

16. PiotrovskijR. G Sinergetika teksta. Minsk: Minsk. gos. lingvist. un-t, 2005. 156 s.

17. Rjazantseva T. I. Teorija i praktika raboty s gipertekstom. M.: Akademija, 200В. 203 s.

1В. Saharnyj L. V., Shtern A. S. Nabor kljuchevyh slov kak tip teksta // Leksicheskie aspekty v sisteme professional'no-orientirovannogo obuchenija inojazychnoj rechevoj dejatel'nosti. Perm': Permskij

politehnicheskij un-t, 19ВВ. S. 34-51.

19. Sistema standartov po informatsii, bibliotechnomu i izdatel'skomu delu. Referat i annotatsija. Obshchie trebovanija. Minsk. Mezhgosudarstvennyj sovet po standartizatsii, metrologii i sertifikatsii. 1995. 7 s.

20. Hisamova G. G. Dialog kak komponent hudozhestvennogo teksta (na materiale hudozhestvennoj prozy V. M. Shukshina). 2009. URL: http://dibase.ru/article/100В2009_khisamovagg/4

21. Entsiklopedija SEO: Poiskovaja Optimizacija ot «A do Jа». URL: http://www.seobuilding.ru/wiki/

i Надоели баннеры? Вы всегда можете отключить рекламу.