DOI: 10.12731/2218-7405-2015-9-24 УДК 801:001.8
Язык как информационная система: избыточность и оптимизация
некипелова и.М., Зарифуллина Э.Г.
Отличительным признаком любой естественной живой языковой системы является избыточность ее элементов. Избыточность как нарушение условий универсальности, которая является спецификой искусственных информационных систем, делает естественный язык мобильным во времени и пространстве. Следует выделять информационность двух типов: языковую избыточность, когда происходит информационное наложение языковых единиц в пределах одной системы, и речевую избыточность, когда происходит уплотнение информации на синтагматическом уровне. Языковая избыточность является потенциальной, а речевая избыточность - актуальной. В целом нужно отметить, что языковая избыточность необходима для языка: усложняя отношения между языковыми единицами, языковая избыточность создает определенную языковую ситуацию, в которой увеличивается энтропия, что приводит к порождению новой информации, которая в свою очередь может быть принята или не принята языковой системой. Языковая избыточность - одна из причин роста информации на языке. Кроме того, информационная избыточность на языке - один из факторов развития языковой системы.
Ключевые слова: философия языка; теория языка; информационная система; информационная среда; языковая избыточность; оптимизация языка.
LANGUAGE AS AN INFORMATION SYSTEM: REDUNDANCY AND OPTIMIZATION
Nekipelova I.M., Zarifullina E.G.
The paper is devoted to research of the language system as an information system. The distinguishing feature of any natural living language system is redundant of elements of its structure. Redundancy, broken terms of universality peculiar to artificial information systems,
makes language mobile in time and in space. It should be marked out informational redundancy of two types: language redundancy, when information overlay of language units within the system occurs and speech redundancy when condense of information into syntagmatic level occurs. Language redundancy is potential and speech redundancy is actual. In general, it should be noted that the language redundancy is necessary for language: complicating the relationships between language units, language redundancy creates in language situation of choice, leading to a disorder of language system, increasing of entropy and, as a result, the appearing of the information that can be accepted or cannot be by language system. Language redundancy is one of the reasons for growth of information in language. In addition, the information redundancy in language is one of the factors of language system development.
Keywords: philosophy of language; theory of language; information system; language space; language redundancy; optimization of language.
Язык - самая сложная из всех ныне существующих, созданных человеком и известных ему систем передачи информации. Информативность и это качество, присущее языку как основному и наиболее надежному средству коммуникации в человеческом обществе. Однако язык не является информацией в чистом виде. Под информацией следует понимать тексты и речь, созданные на языке, а сам язык следует понимать как базу данных, поскольку в мышлении человека язык представлен не в виде свободной информации, а в виде формализованной модели и языковой картины мира [1]. Таким образом, современные формы существования живых естественных языков и это «распределенные базы данных с параллельным доступом» [2], поскольку язык является принадлежностью не одного, а многих носителей языка, одновременно использующих его.
Поскольку база данных языка является распределенной, то каждой отдельной вариацией языка управляет отдельная система управления базы данных: в случае субъективного языка это отдельный человек, в случае объективного языка и общество (более подробно о разграничении субъективных и объективных языков см. [3]). Здесь обнаруживаются расхождения с теорией и практикой применения информационных систем и системы языка. Информационные системы стараются не допускать избыточности, повторения имеющейся на распределенных базах информации. Кроме того, одна база данных не может являться источником информации для другой базы. Тогда как язык, являясь распределенной базой, имеет некую общую область данных, повторяющихся, копирующихся от носителя к носителю, делая систему языка схожей с передачей генетической информации. Такое коренное отличие сформировано разностью
задач, выполняемых с одной стороны информационными системами, а с другой и языком и системой передачи генетической информации. Задача и генов, и языка - аккумулировать, хранить и передавать информацию, в случае с генами и от поколения к поколению, а в случае с языком и от человека к человеку, с учетом опыта, имеющегося у того, кто передает знание.
Понятие избыточности связано с понятием количества информации. «Попытки количественного измерения информации предпринимались неоднократно. Первые отчетливые предложения об общих способах измерения количества информации были сделаны Р. Фишером (1921 г.) в процессе решения вопросов математической статистики. Проблемами хранения информации, передачи ее по каналам связи и задачами определения количества информации занимались Р. Хартли (1928 г.) и X. Найквист (1924 г.). Р. Хартли заложил основы теории информации, определив меру количества информации для некоторых задач. Наиболее убедительно эти вопросы были разработаны и обобщены американским инженером Клодом Шенноном в 1948 г. С этого времени началось интенсивное развитие теории информации вообще и углубленное исследование вопроса об измерении ее количества в частности» [4].
Первоначально понятие избыточность использовалось только применительно в теории информации и только по отношению к информации. Впервые данный термин употребил X. Найквист. Под избыточностью он понимал бесполезную составляющую сигнала, которая не передает сообщения. Впоследствии К. Шеннон определил избыточность источника информации через понятие энтропия. В настоящее время в науке термин избыточность означает «дополнительные средства и возможности сверх минимально необходимых для выполнения объектом заданных функций» [5, с. 711], а избыточность информации - «величина, которой измеряется относительная доля излишне используемых сообщений в некотором алфавите» [6].
Во многом избыточность в теории информации связана с резервированием - методом повышения надежности объекта введением самой избыточности. Таким образом, ученые говорят о методах обеспечения надежности и достоверности информационной системы. С одной стороны, это методы, обеспечивающие безошибочность, безотказность, бессбойность функциональных звеньев информационной системы, повышающих ее надежность. С другой - это методы, обеспечивающие обнаружение и исправление ошибок, возникающих в информации. Все эти методы есть методы контроля достоверности информации и ее коррекции, также повышающие функциональную надежность системы [7, с. 709]. Обеспечение надежности информационной системы определяется использованием различных факторов, способствующих достижению поставленной цели. Однако это положение удовлетворяет требованиям языка лишь частично, поскольку язык в целом функционирует стихийно, и только его литературная форма
подвержена искусственному влиянию. Интересно, что «избыточность, как правило, вводится в систему искусственно, специально для повышения надежности системы и обеспечения достоверности преобразуемой информации, но может быть и естественной, внутренне присущей самой системе», последнее же «часто относится к семантической избыточности - семантическая избыточность связана с наличием в сообщении сведений, коррелирующих между собой или уже известных пользователю» [8, с. 712].
Виды избыточности, как правило, совпадают с видами обеспечения, в рамках которого они формируются. Например, в структурном обеспечении используется структурная избыточность, в алгоритмическом обеспечении - алгоритмическая избыточность и т.п. Однако понятие обеспечение шире понятия избыточность, поскольку обеспечение обусловливает как возможность проведения процедур, так и сами процедуры, а избыточность - только саму такую возможность.
Следует заметить, что «многие виды обеспечения надежности и достоверности тесно взаимосвязаны и пересекаются друг с другом, особенно это касается видов обеспечения, связанных с введением соответствующей им избыточности. Практически применение только одного какого-либо вида избыточности для обеспечения надежности и достоверности работы системы встречается довольно редко; значительно более эффективным оказывается комплексное использование сразу нескольких видов избыточности для одних и тех же процедур преобразования информации» [9, с. 712].
Избыточность чаще всего используется для выражения относительной категории, но может иметь и абсолютное исчисление. Современные исследования позволяют с большей или меньшей точностью рассчитать коэффициент избыточности. Для языков она определяется формулой, где учитываются параметры энтропии сообщения, средняя длина кодового слова и число символов алфавита. Естественным языкам свойственна значительная избыточность информации (например, для русского языка 0,5-0,8) [10]. Однако, как нам кажется, говорить о точных параметрах измерения информационной избыточности в языке очень сложно, так как следует учитывать не только возможности повтора и дублирования элементов языка в речи, но и напряженные показатели грамматики, а также постоянно ускользающие от внимания ученых показатели семантики.
Итак, отличительной чертой любой естественной живой языковой системы является избыточность элементов ее структуры. Избыточность, нарушая условие универсальности, присущее искусственным информационным системам, делает язык мобильным во времени (развитие языка, преемственность языковых поколений) и в пространстве (дивергенция языка на
множество форм его существования и их конвергенция в койне или кодифицированную форму литературного языка). Эта мобильность является главным фактором выживаемости языка в современном мире и определяет его поведение в условиях назревающего информационного и антропологического кризиса. Именно это качество языка позволяет языку функционировать практически без препятствий и ограничений, в то время как ограничение существования искусственных баз данных и расплата за их точность и закрытость.
Следует выделять информационную избыточность двух видов: языковую избыточность, когда происходит информационное наложение единиц языка в пределах системы, и речевую избыточность, когда происходит уплотнение информации на синтагматическом уровне.
Эти виды избыточности могут быть представлены на грамматико-семантическом уровне и на лексико-семантическом уровне. На грамматико-семантическом уровне языковая избыточность связана с частичным совпадением грамматических категорий различных частей речи, а речевая избыточность - с реализацией этих грамматических категорий в формах слов, вступающих в синтагматические отношения, явление референции на уровне синтаксиса и пр. Языковая избыточность всегда представлена лишь частично, в неполной форме (я иду и местоимение характеризуется грамматическими категориями 1 лица, ед. числа и теми же категориями, что и форма глагола), поскольку совпадение двух единиц в плане содержания и в плане выражения невозможно и оно не информативно (я иду и местоимение и глагол имеют частичное, а не полное совпадение грамматических категорий). Таким образом, языковая избыточность по своей сути потенциальна, а речевая избыточность актуальна.
Сказанное относится и к лексико-семантическому уровню. Здесь следует особо упомянуть явление синонимии, в рамках которого однозначно можно утверждать, что двух абсолютных синонимов не бывает. Такое соотношение синонимичных слов называется квазисинонимия. Квазисинонимы различаются либо оттенками значений (обычный и привычный и постоянный и обыденный и обыкновенный и усредненный и заурядный), либо стилистической окраской (квартира и апартаменты), либо степенью употребляемости (похороны и погребение и захоронение и погребение (слово погребение в обоих случаях употребляется реже)).
Избыточность заключается также и в гиперо-гипонимических отношениях. Так, в любом естественном языке есть слова, имеющее значение обобщённости: дерево, посуда, мебель, одежда, народ, животное, насекомое и пр. Все эти слова являются названиями некоей совокупности множества объектов материального мира, связанных между собой функциональными отношениями. В пределах реальности таких объектов не существует, это мыслимые категории, необходимые людям для того, чтобы оптимально осуществлять классификацию объектов
реального мира. Именно поэтому они необходимы языку, как, собственно, и иные языковые факты, фиксирующие языковую избыточность.
Даже в тех случаях, когда историческими процессами в языке определено формирование двух языковых единиц с одинаковым значением, язык начинает разводить эти единицы. Показательным примером этого процесса является соотношение реализаций полногласных и неполногласных словосочетаний на русской почве. Этот процесс имел длительную историю и продолжается до сих пор. Дивергенция восточнославянской и южнославянской веток общеславянского праязыка породила реализации полногласия в виде -оро- /-оло- и -ере-/-еле- на восточнославянской почве и неполногласия в виде -ра-/-ла-, -ре-/-ле- на южнославянской почве. Однако дальнейшая конвергенция языков этих веток привела к смешению форм с полногласием и неполногласием на почве русского языка.
В истории русского языка оказались возможными следующие соотношения вариантов:
■ сохранение восточнославянской и утрата южнославянской реализации: ворона и врана;
■ сохранение южнославянской и утрата восточнославянской реализации: враг и ворог;
■ расхождение вариантов в стилистическом аспекте: город (общеупотр.) и град (лит.), дерево (общеупотр.) и древо (лит., спец.),
■ расхождение вариантов по значениям: прах и порох; страна и сторона.
Тем более интересны такие процессы в дальнейшем, особенно в том, как они сказались на других языковых единицах. Так, от слова град было образовано слово гражданин в значении 'житель города'. Однако в дальнейшем происходит десемантизация этого значения, и оно начинает обозначать 'жителя страны' и более не связывается семантическими отношениями со словом град.
Также интересно развитие отношений слов страна и сторона. Ещё тогда, когда эти два слова не были разведены по значениям, людей, живущих на другой стороне, называли сторонними, они были не свои, а чужие. Они были сторонними и странными. В дальнейшем, когда слово страна стало обозначать 'государство', жители другой страны начали называться иностранными, а слово странный утратило семантические связи со словом страна.
Избыточность проявляется и в явлении непрямой семантической референции. Символизм, метонимия, метафора основаны на возможности языковой избыточности. Однако и в данном случае избыточность частична, так как, безусловно, эти образные средства языка базируются на уже известных языковых данных и содержат их, но одновременно обозначают нечто большее. Это происходит потому, что информационная избыточность является важным средством не только понимания, но и выражения оценочности и эмоциональности речи.
В решении вопроса о значимости языковой избыточности следует учитывать, что появление единицы, совпадающей по значению и по смыслу с другой единицей, является для языка неприемлемым. Это связано с тем, что в пределах одного языкового пространства одному денотату не может соответствовать несколько абсолютно одинаковых с точки зрения языковых характеристик единиц языка. Как следствие, языковая система разводит эти единицы.
Избыточность следует отличать от дублирования, которое в языке в принципе невозможно: языку не нужна единица, имеющая форму Х и значение Y, если в языке уже есть единица с такими показателями. Во многих открытых системах, имеющих материальную структуру, такая ситуация не только возможна, оно и объективно нормальна. Сказанное также не относится к речевой избыточности, в пределах которой возможны прямые повторы языковых единиц: К моей руке, которой не отдерну, / К моей руке, с которой снят запрет, / К моей руке, которой больше нет... (М. Цветаева).
Языковая избыточность является одной из причин роста информации в языке, поскольку за счет нее увеличивается объем языка. Расширение объёма языка должно непременно сопровождаться изменением состава языка: для того чтобы быть включённой в язык, единица не должна совпадать с какой-либо другой единицей одновременно по содержанию и по форме (хотя в других открытых системах эта ситуация возможна). Появление в языковой системе избыточности предполагает несколько иную ситуацию, поскольку она определяет функционирование не абсолютно одинаковых, а частично дублирующих друг друга единиц. Например, высказывания Он не может уснуть и Ему не спится описывают одну ситуацию, но с несколько разных точек зрения: в первом случае в высказывании присутствует субъект действия, а во втором случае он отсутствует и высказывание выражает состояние косвенного субъекта.
В целом следует отметить, что языковая избыточность не является ненужной языку: усложняя отношения между языковыми единицами, языковая избыточность создаёт в языке ситуацию выбора, приводящую к неупорядоченности языковой системы, увеличению энтропии и, как следствие, появлению информации, принимаемой или не принимаемой системой языка. Избыточность, которой сопутствует вариативность, неизбежна при противопоставлении литературной и нелитературной форм языка и именно она является переходным этапом в развитии языка в условиях конкуренции вариантов. С точки зрения энтропии языка происходит конкуренция элементов субъективных и объективных языковых систем, с точки зрения энтропии речи осуществляется отбор необходимых и возможных единиц языка. В речи осуществляется верификация языковых единиц и их употреблений, поэтому «энтропии речи предшествует энтропия языка» [11].
Конкуренция вариантов как результат языковой избыточности способствует накоплению в языке языковых фактов, которые можно трактовать как логические ошибки языка. Ср. Я и мой друг пошли и Мы с моим другом пошли. Эти две конструкции дублируют друг друга, причем первая правильна с точки зрения логики, чего нельзя сказать о второй. Однако вторая не только возможна, но и активно используется в речевой практике, что указывает на ее социальную значимость в осуществлении коммуникации. Она существует как реализация социального заказа.
Отклонения формируются на базе конкуренции вариантов, а любая вариативность, как мы уже определили, является признаком энтропии. И в этом случае возможно неоправданное сохранение старого варианта, неоправданное принятие нового варианта, компиляция вариативных форм. Особенно чётко это прослеживается на грамматико-семантическом уровне, однако выявляется и на других языковых уровнях. Особое внимание в этом вопросе следует уделять семантике и стилистике.
Ошибки в сложных информационных системах неизбежны. Однако избыточность может не только порождать логические ошибки, но и преодолевать их за счет оптимизации функционирования языковой системы. Языковая избыточность может быть направлена на уточнение информации, и за счет этого приводить к устранению информационных помех.
В большинстве исследований считается, что языковая избыточность перегружает язык, лишая его однозначности. Это может происходить с любой информационной системой. Она усложняет систему, увеличивает время обработки информации, снижает реальную пропускную способность каналов связи. С этой целью применяются разрабатываемые в теории кодирования методы для уменьшения информационной избыточности в информационных системах. Однако в теории информации информационная избыточность искусственно вводится для улучшения помехоустойчивости и надежности передачи и хранения информации. Существуют три основных способа введения избыточности: «1) многократное повторение информации; 2) введение в дискретные сигналы дополнительных элементов; 3) использование метода избыточных переменных» [12]. Таким образом, информационная избыточность оказывает двоякое влияние на характеристики информационных систем: создает помехи и устраняет их. Определение необходимой информационной избыточности решается в каждом конкретном случае. Её объем зависит от особенностей решаемой системой задачи и возможных ограничений в ней. В языке все эти процессы происходят естественным путём. Кроме того, информационная избыточность в языке, имея многоаспектный характер, является одним из факторов развития языковой системы.
Список литературы
1. Зарифуллина Э.Г. Язык и речь: база данных и информация // Филологические науки. Вопросы теории и практики. 2014. № 11-1. С. 80-82.
2. Зарифуллина Э.Г. Языковая система: информация, информативность, информационность // Современные исследования социальных проблем (электронный научный журнал). 2014. № 5 (37). URL: joumal-s.org/index.php/sisp/ article/view/5201410/pdf_676 (дата обращения 10.09.2015).
3. Некипелова И.М. Полицентризм языковой системы // В мире научных открытий. - Красноярск: Научно-инновационный центр, 2012. № 9.3 (33). С. 210-219.
4. Чурсин Н. Популярная информатика // Наука и техника [Электронный ресурс]. URL: http:// n-t.ru/ri/ch/pi02.htm (дата обращения 15.09.2015).
5. Бройдо В.Л., Ильина О.П. Избыточность информационных систем // Вычислительные системы, сети и телекоммуникации: Учебник для вузов. 3-е изд. - СПб.: Питер, 2008. 766 с.
6. Душков Б.А., Королев А.В., Смирнов Б.А. Избыточность информации // Энциклопедический словарь: Психология труда, управления, инженерная психология и эргономика [Электронный ресурс]. URL: http://vocabulary.ru/dic tionary/896/word/izbytochnost-informaci (дата обращения 14.09.2015).
7. Бройдо В.Л., Ильина О.П. Избыточность информационных систем // Вычислительные системы, сети и телекоммуникации: Учебник для вузов. 3-е изд. - СПб.: Питер, 2008. 766 с.
8. Там же.
9. Там же.
10. Душков Б.А., Королев А.В., Смирнов Б.А. Избыточность информации // Энциклопедический словарь: Психология труда, управления, инженерная психология и эргономика [Электронный ресурс]. URL: http://vocabulary.ru/ dictionary/896/word/izbytochnost-informaci (дата обращения 14.09.2015).
11. Некипелова И.М. Энтропия языковой системы как основной показатель её развития // Современные исследования социальных проблем (электронный научный журнал). 2013. № 12 (32). doi: http://dx.doi.org/10.12731/2218-7405-2013-12-4 (дата обращения 12.09.2015).
12. Душков Б.А., Королев А.В., Смирнов Б.А. Избыточность информации // Энциклопедический словарь: Психология труда, управления, инженерная психология и эргономика [Электронный ресурс]. URL: http://vocabulary.ru/ dictionary/896/word/izbytochnost-informaci (дата обращения 14.09.2015).
References
1. Zarifullina E.G. Filologicheskie nauki. Voprosy teorii ipraktiki [Philology Sciences. Theory and Practice], no. 11-1 (2014): 80-82.
2. Zarifullina E.G. Sovremennye issledovaniya sotsial'nykh problem [Modern Research of Social Problems], no. 5 (37) (2014): http://journal-s.org/index.php/ sisp/article/view/5201410/pdf_676 (accessed September 10, 2014).
3. Nekipelova I. M. Vmire nauchnykh otkrytiy [In the World of Scientific Researches], no. 9.3 (33) (2012): 210-219.
4. Chursin N. Populyarnayainformatika [Popular informatics]. http://n-t.ru/ri/ch/pi02.htm (accessed September 15, 2015).
5. Broydo V.L., Il'ina O.P. Vychislitel'nye sistemy, seti i telekommunikatsii [Computing systems, networks and telecommunications]. - SPb.: Piter, 2008. 766 p.
6. Dushkov B.A., Korolev A.V., Smirnov B.A. Izbytochnost'informatsii [Redundancy of information]. http://vocabulary.ru/dictionary/896/word/izbytochnost-informaci (accessed September 14, 2015).
7. Broydo V.L., Il'ina O.P. Vychislitel'nye sistemy, seti i telekommunikatsii [Computing systems, networks and telecommunications]. - SPb.: Piter, 2008. 766 p.
8. In the same place.
9. In the same place.
10. Dushkov B.A., Korolev A.V., Smirnov B.A. Izbytochnost'informatsii [Redundancy of information]. http://vocabulary.ru/dictionary/896/word/izbytochnost-informaci (accessed September 14, 2015).
11. Nekipelova I.M. Sovremennye issledovaniya sotsial'nykh problem [Modern Research of Social Problems], no. 12 (32) (2013): http://dx.doi.org/10.12731 /2218-7405-2013-12-4 (accessed September 12, 2014).
12. Dushkov B.A., Korolev A.V., Smirnov B.A. Izbytochnost'informatsii [Redundancy of information]. http://vocabulary.ru/dictionary/896/word/izbytochnost-informaci (accessed September 14, 2015).
данные об авторах
некипелова ирина михайловна, доцент кафедры философии, кандидат филологических
наук, доцент
Ижевский государственный технический университет им. М.Т. Калашникова ул. Студенческая, д. 7, г. Ижевск, Удмуртская Республика, 426069, Россия e-mail: irina.m.nekipelova@mail.ru
Зарифуллина Эльвира Галиевна, начальник отдела электронного обучения Ижевский государственный технический университет им. М.Т. Калашникова ул. Студенческая, д. 7, г. Ижевск, Удмуртская Республика, 426069, Россия e-mail: zarifullina_elvira@mail.ru
DATA ABOUT THE AUTHORS
Nekipelova Irina Mikhaylovna, associate professor of philosophy department, Ph.D. in Philological Science, Associate Professor
M.T. Kalashnikov Izhevsk State Technical University
7, Studencheskaya street, Izhevsk, Udmurt Republic, 426069, Russia
e-mail: irina.m.nekipelova@mail.ru
SPIN-code in SCIENCE INDEX: 8968-4493
Zarifullina Elvira Galievna, head of e-learning department
M.T. Kalashnikov Izhevsk State Technical University,
7, Studencheskaya street, Izhevsk, Udmurt Republic, 246069, Russia
e-mail: zarifullina_elvira@mail.ru
SPIN-code in SCIENCE INDEX: 2142-9185