Научная статья на тему 'Современные поисковые системы в сети Интернет как инструмент лингвиста-эксперта'

Современные поисковые системы в сети Интернет как инструмент лингвиста-эксперта Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
432
110
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛИНГВИСТИЧЕСКАЯ ЭКСПЕРТИЗА / ЯЗЫКОЗНАНИЕ / НАЦИОНАЛЬНЫЙ КОРПУС РУССКОГО ЯЗЫКА / ТЕКСТ / LINGUISTIC EXAMINATION / LINGUISTICS / RUSSIAN NATIONAL CORPUS / TEXT

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Ильина Татьяна Вячеславовна

В статье рассматриваются возможности Национального корпуса русского языка в рамках юридической практики. Кроме словарей, лингвисты-эксперты могут использовать поисковую систему при толковании значений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Ильина Татьяна Вячеславовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODERN WEB SEARCH ENGINES AS AN INSTRUMENT OF LINGUISTICS EXPERTS

The article deals with Russian National Corpus potential in the context of legal practice. Besides dictionaries linguistics experts can use web search engines while interpreting the meaning of words.

Текст научной работы на тему «Современные поисковые системы в сети Интернет как инструмент лингвиста-эксперта»

Т.В. Ильина,

кандидат филологических наук, Воронежский государственный университет

СОВРЕМЕННЫЕ ПОИСКОВЫ1Е СИСТЕМЫ В СЕТИ ИНТЕРНЕТ КАК ИНСТРУМЕНТ ЛИНГВИСТА-ЭКСПЕРТА

MODERN WEB SEARCH ENGINES AS AN INSTRUMENT OF LINGUISTICS EXPERTS

В статье рассматриваются возможности Национального корпуса русского языгка в рамках юридической практики. Кроме словарей, лингвистыг-жспертыг могут использовать поисковую систему при толковании значений.

The article deals with Russian National Corpus potential in the context of legal practice. Besides dictionaries linguistics experts can use web search engines while interpreting the meaning of words.

В последнее время приходится констатировать тот факт, что лингвистика перестаёт быть самодостаточным и необходимым научным знанием. Прикладное назначение языкознания обнаруживается во всех областях любой деятель -ности. Данное положение можно связывать и с тем, что лингвистика как дисциплина не имеет четких границ, и с тем, что в языке пытаются найти ответы на свои вопросы философы, социологи, историки, психологи [1]. А в том, что юридическая практика как никогда нуждается в лингвистике, уже нет никаких сомнений, так как право по происхождению связано с языком, оно объективируется в языке и через язык познается. Юристы прибегают к помощи специалистов, способных помочь в решении проблемных вопросов, которые находятся на границе права и языка. Юристы не обладают необходимым инст -рументарием для исследования текста, не владе -ют лингвистической терминологией и, как след -ствие, не могут правильно сформулировать вопросы, подлежащие разрешению лингвистами-экспертами. Лингвистическая экспертиза текстов становится все более и более востребованной в криминалистической практике.

Лингвистическая экспертиза — это особый вид языковедческого исследования, в котором объединяются различные лингвистические и экстралингвистические параметры, это иссле-дование достоверности различной вербальной информации, имеющее значение объективного доказательства. Заключение эксперта — один из источников доказательств, перечисленных в уголовно-процессуальном законе (ч. 2 ст. 74 УПК РФ). Содержание заключения эксперта регламентировано, например, ст. 204 УПК РФ, согласно которой после производства необхо-димых исследований эксперт составляет заклю -чение, в котором должны быть отражены сле-дующие сведения: когда, где, кем (фамилия, имя и отчество, образование, специальность,

ученая степень и звание, занимаемая долж-ность), на каком основании была произведена экспертиза, кто присутствовал при производст -ве экспертизы, какие материалы эксперт ис-пользовал, какие исследования произвел с ука -занием примененных методик, какие вопросы были поставлены эксперту и его мотивирован -ные ответы. Более подробно содержание за -ключения эксперта регламентировано ведомст -венными нормативными актами.

Целью лингвистической экспертизы являет -ся обнаружение и установление фактов и обстоя -тельств на основе филологических познаний и исследования закономерностей языка, которые будут способствовать успешному разрешению сложных случаев судебных разбирательств. Причем категоричность выводов будет напря-мую зависеть от полноты и качества материалов, предоставляемых эксперту органами суда и следствия. К компетенции лингвистов относится разрешение следующих вопросов: форма высказывания, содержащего оспариваемые истцом сведения (утверждение, предположение, мнение, то есть оценочное суждение); характер содержащихся в высказывании оспариваемых истцом сведений (сведения о фактах или событиях или иные суждения); соотносимость содержащихся в высказывании сведений с конкретным гражда-нином или юридическим лицом.

Лингвист работает только с текстом и не имеет права вмешиваться в правовые вопросы. Качественная лингвистическая экспертиза тре -бует от специалиста высокой квалификации, владения разными методиками анализа текста, опыта применения знаний на практике, а глав -ное — современных подходов к языку, речи, тексту, слову.

Задачами лингвистического исследования могут являться: толкование и разъяснение з наче-ний и происхождения слов, словосочетаний, устойчивых фразеологических выражений (идиом);

интерпретация основного и дополнительного значений языковой единицы или единицы речи (устной или письменной); толкование положений текста документа для установления того, какие варианты понимания этих положений возможны в современном дискурсе; изучение товарных знаков, словесных обозначений, девизов, слога -нов, рекламных текстов, коммерческих, фирменных наименований на предмет их тождественно -сти или сходности до степени смешения с другими обозначениями; изучение текста (фрагмента) с целью выявления его смысловой направленности , модальности пропозиций, экспрессив -ности и эмотивности речевых единиц, их формально-грамматической характеристики и семантики, специфики использованных стилисти-ческих средств и приемов.

Предметом лингвистической экспертизы яв -ляются факты и обстоятельства, устанавливае-мые на основе исследования закономерностей существования и функционирования языка.

Объекты лингвистической экспертизы — тексты, произведения устной или письменной речи (зафиксированные на материальном носителе) на русском языке.

Вынесение законных, обоснованных решений по делам, связанным со словесными оскорблениями, реализация закона о защите чести, достоинства и деловой репутации возможны лишь в том случае, когда суды смогут опираться на компетентные, объективные экспертные заключения. И тут встает вопрос об инструменте, кото -рым может пользоваться эксперт. Конечно, глав -ным инструментом лингвиста-эксперта является авторитетный и объективный словарь, из которого можно получить сведения о реальном составе лексического значения слова. Традиционное собрание интерпретаций устойчивой, принятой языковым коллективом семантики — толковый словарь.

Словарь, предназначенный для использо-вания в лингвистической экспертизе, по опре -делению должен быть не столько авторитетен, сколько объективен. Он должен быть прове-ряемым, то есть воспроизводимым на анало-гичной по размеру и составу выборке текстов. К сожалению, на сегодняшний день нет слова -ря, лишенного дефектов как семантического, так и стилистического характера. Традицион-ные толковые словари никогда не отражают всей полноты картины, поскольку не опирают -ся на исследование языкового сознания, а со -держат обобщение сем и семем, отстающее по времени от живых языковых процессов. Кроме того, многие смысловые компоненты не зафик -сированы в словарях литературного языка в силу ограничительного действия нормы.

Не случайным кажется тот факт, что в по -следнее время все больший интерес у лексико -графов вызывает корпусная лингвистика — построение автоматических корпусов (рус -ских) текстов, содержащих при каждом слово -

употреблении разнообразную лингвистиче -скую информацию.

К сегодняшнему дню технический арсенал автоматической текст-аналитики (и, в частности, автоматизированной лексикографии) достиг зна -чительных размеров и разнообразия. Многие из созданных в последние 10—15 лет процессоров и языковых баз данных могут быть с той или иной долей удобства применены как непосредственно в лингвистической экспертизе, так и опосредованно, для составления адекватных требованиям этой экспертизы словарей и анализаторов.

Имеются программы автоматического сравнения текстов между собой, которые используют для исследования и доказательства плагиата. Практически каждый из опубликованных сего -дня и в прошлом словарей преобразован в лексикографическую базу данных и доступен для формальных преобразований; немалая доля та -ких словарных баз данных, включая многоязычные, открыта в Интернете для свободного досту -па. Есть несколько версий автоматического синтаксического анализа; ряд аналитических программ и поисковых систем использует процессоры автоматического сбора синонимов и квазиси -нонимов. Работают программы автоматического составления тезаурусов (идеографических слова -рей), средства поиска в тексте заданных по смыслу фрагментов. Есть программы психологи -ческой оценки текста, построенные как на основе традиционной психологической семантики, так и на базе неориторических наблюдений.

Конечно, нельзя забывать о том, что многие словарные картотеки являются самостоятельны -ми памятниками истории языка, поскольку на бумажных карточках нередко зафиксированы фрагменты уже исчезнувших памятников пись -менности. Нам недоступны исходные текстовые выборки некоторых словарей, того же словаря Даля, материалом для которых послужили поле -вые исследования, которые мы уже не можем воспроизвести. По техническим причинам в электронной форме не представлены корпуса текстов на древнерусском языке. Отсутствие единой стандартной кодировки не только для древнерусских текстов, но и для текстов, напи-санных раньше 1918 года, не позволяет публико -вать их в Сети без ограничений, связанных с загрузкой для каждого из них специальных шрифтов, зачастую не совпадающих друг с другом. Весьма невысок уровень культуры электронных публикаций и републикаций, абсолютное боль -шинство которых не авторизовано и требует критической сверки. Все это, конечно, плохо, но отнюдь не критично.

Объем текстовой информации на русском языке, собранный в электронных библиотеках и на отдельных тематических страницах, уже давно превышает все те выборки, которые были использованы при составлении словарных кар -тотек, а по жанровому составу и датировке эти выборки, в отличие от картотечных массивов, достаточно полно иллюстрируют не только все

периоды в развитии языка (для 19 и 20 веков — безусловно), но и все многообразие его стили -стических подразделений. Это текстовое поле доступно для исследования, классификации и структурирования в пригодный (и привычный) для лексикографов и грамматистов вид. Уже сейчас история жизни любого слова за послед -ние два столетия может быть изучена по элек -тронным выборкам быстро, точно и с макси -мальной подробностью.

Где лингвист -эксперт может получить све -дения о реальном составе лексического значе -ния слова? Традиционное собрание интерпре-таций устойчивой, принятой языковым коллек -тивом семантики — толковый словарь. На -сколько полно и современно отражено лексическое значение в словаре? Относительно пол -но и не всегда современно. Этому есть много причин. Специфика словарной ситуации дик -тует необходимость при производстве экспер -тиз, подобных описанной выше, обращаться не только к «норме», но и к «узусу» или, если есть такая возможность, уточнять семантику по электронным словарям (например, элек -тронному словарю иностранных слов), функциональным или традиционным грамматикам, синтаксическим словарям, словарям разговорной речи, городского просторечья, жаргона. Лингвист -эксперт должен учитывать все ука -занные факты, иметь представление о разнооб -разии словарей, не исключать из своей работы в случае необходимости и словари ассоциа-тивного типа [2].

Кроме того, современное состояние языка не всегда успевает отражаться в словарях. В этом случае на помощь может прийти Национальный корпус русского языка, включающий массу текстов, разных жанров и времён [2]. Корпус — это информационно-справочная система, основанная на собрании текстов в электронной форме. Национальный корпус представляет данный язык на определенном этапе (или этапах) его сущест -вования и во всём многообразии жанров, стилей, территориальных и социальных вариантов и т. п. Созданная информационно-справочная

система предназначена для обеспечения научных исследований лексики и грамматики языка, а также тонких, но непрерывных процессов языковых изменений, происходящих в языке на протяжении сравнительно небольших периодов — от одного до двух столетий. Корпус предо став -ляет всевозможные справки, относящиеся к ука -занным областям (лексика, грамматика, акценто -логия, история языка). Современные компьютерные технологии многократно упрощают и ускоряют процедуры лингвистической обработки больших массивов текстов. Раньше иссле -дователь мог лишь просматривать тексты и вручную выписывать из них нужные примеры; эта предварительная (но абсолютно неизбежная) деятельность была очень трудоемкой и не позво -ляла обрабатывать большие массивы материала. Теперь же ограничений на объем анализируемо-

го материала и скорость поиска информации в нем нет, а это означает, что в распоряжении исследователя оказываются колоссальные массивы текстов самого разного типа.

Зачастую те слова, которые предлагаются для анализа лингвисту-эксперту, ещё не успели отразиться в авторитетных словарях, зато в корпусе всегда можно найти нужную лексему. Конечно, постоянно прибегать к помощи корпуса нет необходимости. Однако бывают случаи, ко -гда в разрешении спорного вопроса может помочь какой-либо подкорпус.

Попробуем проиллюстрировать сказанное выше. Некоторое время назад лингвисты -эксперты кафедры русского языка Воронежского госуниверситета столкнулись с проблемой анализа словоформы «крысятничать». В экспертизе был поставлен следующие вопросы: В каком значении использовано слово «крысятничать» в тексте статьи, предложенной для анализа экспертам? Если в представленных фрагментах (в кото -рых употребляется слово «крысятничать») содержится негативная информация о деловой репутации конкретного человека, то воспринимается ли эта информация как умаляющая его де -ловую репутацию?

С ложно найти тот неоспоримый источник, в котором можно было бы найти толкование. Единственным источником может послужить словарь жаргона, однако авторитетность подобного издания сомнительна. Эксперты обратились к ресурсам Национального корпуса.

Для того чтобы определить значение предла -гаемого слова, эксперты задали искомую словоформу в лексико-грамматическом поиске. Из корпуса объемом 59486 документов корпус нашел только 6 со словом «крысятничать» (4 гла -гола и 2 деепричастия). Небольшое количество примеров позволяет сделать максимально точные выводы о значении лексемы.

Тексты, содержащие нужное слово, относят -ся к художественному и публицистическому стилю. Все примеры можно продемострировать в те кс те нашей статьи:

1. Татуировку сделал. Все пацаны нормальные — никто не крысятничает. Офицеры тоже вроде ничего мужики. [Олег Гладов. Любовь стратегического назначения (2000—2003)].

2. Главное — получать блага, не вламываясь, как пьяный жлоб в церковь, не крысятничая и ша-каля по углам, отбирая последний кусок у сиротки. [Лариса Кислинская. Уходящие «в натуре» (2003) // Совершенно секретно. — 2003. — 4 авг.].

3. А там, глядишь, и настоящих преступни-

ков, которые «крысятничают» и продают оружие боевикам, начнут отлавливать. [Наталья Серова. Разговорчики в строю... (2003) // ПоЛиТ-

КОМ.РУ. — 2003. — 8 авг.].

4. Разрабатываю схемы, рою носом землю, а за счет моих результатов люди получают деньги. Грубо говоря, «крысятничают». Ну, я и не сдержался. [Александр Хинштейн. Бригада // Московский комсомолец. — 2003].

5. — Учти, он крысятничает. — злобно ощерился Долган. — У него еще один ларек завелся. я точно знаю. [Г еннадий Прашкевич, Александр Богдан. Человек « Ч» (2001)].

6. К тому же вряд ли на «Стрельца» была у КГБ подписка. свою антисоветскую библиотеку приходилось комитетчикам собирать по крохам. крысятничая на обысках. так что большую часть так необходимой им для работы литературы поставляли им сами донельзя разгильдяистые дис -сиденты. [Николай Климонтович. Далее - везде (2001)].

Анализ примеров наглядно показывает. что ни в одном из них слово «крысятничать» не имеет положительной оценки. Кроме того. из примеров 3.4 следует. что лексема может быть истол -кована следующим образом: крысятничать -наживаться незаконныгми способами. Следова-тельно. используя только ресурсы национального корпуса можно предварительно сделать выво -ды о том. что слово «крысятничать». безусловно. имеет негативное значение. которое накладывает негативный отпечаток на деловую репутацию любого человека.

Конечно. нельзя категорично утверждать. что подобные поисковые системы в сети Интернет станут основным инструментом лингвиста -эксперта. однако в некоторых случаях они могут оказать существенную помощь в работе над за -ключением специалиста.

ЛИТЕРАТУРА

1. Педагогика: семья—школа—общество. Кн. 4 / под ред. О. И. Кирикова.— Воронеж: Во -ронеж. гос. пед. ун-т. 2005. — 199с.

2. Национальный корпус русского языка.

[Электронный ресурс]. Режим доступа:

http ://www. ruscorpora.ru

3. Русский ассоциативный словарь: в 2т. / под ред. Ю .Н. Караулова. — М.: АСТ-Астрель. 2002.

i Надоели баннеры? Вы всегда можете отключить рекламу.