верность информации в реальном масштабе времени требуют государственного регулирования. На начальном этапе это возможно и на уровне субъекта РФ.
В.А. Рожков'
ИНФОРМАТИЗАЦИЯ И ТЕОРИЯ КЛАССИФИКАЦИИ ПОЧВ
Информационный подход широко применяется в почвоведении. Почва как сложная динамическая самоорганизующаяся и саморазвивающаяся система существует, непрерывно обмениваясь информацией (веществом и энергией) с другими системами: атмосферой, породой, биотой.
Данный подход реализуется в интерпретации информации, «записанной» в почвенном генетическом профиле и заложенной в памяти почвы. Различаются «почва-память», содержащая совокупности консервативных показателей, и «почва-момент», содержащая совокупности более мобильных и динамичных свойств и состава почв. Почва определяется «как память био-сферно-геосферно-антропосферных взаимодействий» и «в целом, возможно, не будет преувеличением сказать, что концепция памяти почв позволяет выявить еще одну глобальную функцию почв в природе и обществе, а именно, информационную функцию почв». И далее: «Перспективным представляется также развитие количественных подходов в изучении информационной роли почв. В будущем, после завершения начального этапа в развитии концепции памяти почв, можно ожидать появления количественных разработок проблемы информационных функций почв и педосферы в целом, где основные понятия и подходы
* Доктор сельскохозяйственных наук, профессор, член-корреспондент Россельхозакадемии, главный научный сотрудник ГНУ Почвенного института им. В.В. Докучаева.
218
Труды Института государства и права Российской академии наук № 1/2012
будут тождественны базовым понятиям и походам информатики»'.
Становление «почвенной информатики» в нашей стране относится к началу 1980-х гг.
Как справедливо отмечают В. Дюк и В. Эммануэль, фундаментальной науке до известной степени безразлично, в какой конкретно области ее применяют2. И пока кибернетика считалась наукой, не прекращались попытки «создать» технические, медицинские, биологические, географические, экономические и прочие прикладные «кибернетические» науки. С моральной смертью кибернетики, о чем сейчас предпочитают не вспоминать, эти прикладные направления исчезли из всех планов научных и практических работ, оставшись только реликтами в названиях некоторых учреждений. Сегодня наблюдается новый цикл уже не «кибернетических», а «информационных» прикладных наук.
Сравнительно новая отечественная наука информациология должна быть отнесена к ряду универсальных и междисциплинарных концепций, таких как всеобщая организационная наука (тектология) A.A. Богданова, к повторяющим ее (хотя и в других терминах) общей теории систем Л. Берталанфи и кибернетике Н. Винера, а также к теории деятельности (праксеологии) Т. Котар-биньского. В настоящее время их развивает синергетика как наука о процессах развития и самоорганизации сложных систем произвольной природы.
Информациология базируется на анализе и синтезе отношений между компонентами системы и их внешних отношений с окружающими системами. Системный анализ - один из инструментов информационного подхода.
Самым важным разделом информациологии является информатика, уже ставшая общепризнанной дисциплиной, теория и практика которой направлена на автоматизированные процес-
Память почв: почва как память биосферно-геосферно-антропосферных взаимодействий / Ред. В О. Таргульян, C.B. Горячкин. М., 2008. С. 692.
2 См.: Дюк В., Эммануэль В. Информационные технологии в медико-биологических исследованиях. М.; СПб., 2003. С. 128.
сы получения, обработки, хранения и передачи информации с помощью компьютера. В почвоведении информатика уже имеет довольно длительную историю.
Н. Винер утверждал, что жизнь на земле — это островки информации в безбрежном море энтропии окружающего мира, и по аналогии с всеобъемлющим понятием материи, в рамках науки информация также является первичным и неопределяемым понятием. Смысл изучения информатики медиками и биологами точно такой же, как и математики - инструментальный и постановочный на первом этапе своего образования, системный и общенаучный - в последующей деятельности1. Это важное замечание, констатирующее смену концепций современного естествознания в сторону преобладания информационного подхода.
Информационный подход - метод научною познания объектов, процессов или явлений природы и общества, согласно которому в первую очередь выявляются и анализируются наиболее характерные информационные аспекты, определяющие функционирование и развитие изучаемых объектов. Производится анализ и синтез не свойств веществ и предметов или их элементов, а отношений внутри них и их отношений с внешним окружающим миром, после чего анализируются и синтезируются свойства на базе относительной информации. Таким образом, отношения, сравнения, анализ и синтез составляют основу информационного подхода исследований всех без исключения социальных процессов и явлений природы. На базе этой сравнительно новой для отечественной и зарубежной методологии предполагается создание теории классификации почв, формализованных и логически выдержанных правил построения почвенных классификаций различного целевого назначения.
Классификация является философской основой и языком любой науки. Она в концентрированном виде отражает представления о многообразии исследуемых или используемых объектов и в этом смысле, по существу, выполняет роль информационной системы, обобщающей свойства классифицируемых объектов до обозримых представлений и структур.
3 См.: Дюк В., Эммануэль В. Указ. сочь. С. 12. 220
Термин «классификация» имеет три значения: процесс создания таковой, описание классификации (результат разработки) и процедура ее использования при распознавании конкретной почвы. Последнее значение здесь называется классифицированием. Два других будут понятны из контекста.
В отличие от базы данных, которая включает описания реальных объектов, классификация абстрагирует многообразие почвенных образов и их отношений обычно в иерархической структуре, хотя не исключены сетевые и реляционные структуры классификаций. С формальных позиций база данных представляет предметную область, а классификация является ее отображением в классификационном поле.
Классификация почв предполагает организацию знаний, обобщение практического опыта и данных, содержательное представление о многообразии почв страны. Классификация как информационная система определяет положение почв в системе и предназначена для того, чтобы показать наибольшее число свойств.
Следует иметь в виду, что реальные почвенные объекты в базе данных представлены довольно неполными описаниями. Выбор системы информативных признаков объектов в принципе должен соответствовать конкретному целевому назначению базы данных. Вряд ли возможно создать универсальную - для любых целей - базу данных.
Существует такое понятие, как «двойственность классификации», подразумевающее два аспекта классификации - таксономию и мерономию. Таксономия исследует структуру множества объектов и их таксонов, связанных родовидовыми отношениями. а мерономия - структуру признаков, связанных между собой ассоциативными отношениями. Мерономия формулирует принципы расчленения объектов исследования и является областью, двойственной таксономии, - не заменой, а дополнением в описании реальности. К мерономической процедуре относятся морфологическое расчленение, биогеографическое, тектоническое и другие районирования, зональность и проч. На практике таксономия понимается именно как собственно классификация, однако наличие генетических горизонтов профиля почвы требует привлечения мерономического подхода в их классификации.
Архетип - содержание понятия, структура частей и внешних связей - меронов, присущая всем объектам данного понятия. Иными словами, архетип состоит из меронов - таких элементов структуры, которые обнаруживаются у всех объектов данного таксона. Мероны можно классифицировать как самостоятельные объекты.
Архетип почвы условно можно обозначить собственным именем «ABC». Генетические горизонты являются меронами, составляющими архетипы разнообразных почв, которые представляют собой обобщенные образы конкретных профилей.
Процедуры мерономии и таксономии неразрывно связаны, и систематика объектов учитывает их структуру, т.е. свойства и отношения их меронов. Формализация таксономии любых объектов будет продуктивной и полной, если в ней отражена обратная связь с мерономией и на входе задается незатронутое классификацией множество объектов, а также раз и навсегда заданный список признаков.
Прослеживается определенная аналогия рассмотренных понятий классификации с информационными понятиями. Так, термин «information (ознакомление, разъяснение, изложение) был производным - от «in» - в и «forma» - образ, вид, т.е. в смысле того, что вносит форму. Иными словами, люди склонны воспринимать окружающий мир в виде упорядоченных целостных конфигураций, а не отдельных фрагментов (человек изначально воспринимает лес вообще и лишь затем может выделить отдельные деревья как части целого). В классификации такие образы названы архетипами, а в данном случае эти конфигурации получили название «гештальтов» (от нем. Gestalt - образ, форма; gestalten - конфигурация, целостная форма, структура). Данный термин ввел Г. фон Эренфельс (1890 г.). Каждый гештальт воспринимается как фигура, имеющая четкие очертания и выделяющаяся в данный момент из окружающего мира. «Другие не поймут силлогизмов, если не нашли вокруг себя на практике или в природе основания... понятия. Под всяким словом они хотят разглядеть чувственный образ; необходимо, чтобы определение вызывало этот образ, чтобы на каждой стадии доказательства они видели его превращения и эволюцию. Лишь при таком условии они поймут и удержат в памяти доказатель-
ство... они не слушают рассуждений, а рассматривают фигуры, они воображают, что поняли, тогда как они только видели»4.
Практический смысл информационные процессы приобрели с появлением формализованных представлений об информации.
В их основе лежит предложенный в 1948 г. американским ученым К. Шенноном способ измерения количества информации, содержащейся в одном случайном объекте (событии, величине, функции и т. п.) относительно другого случайного объекта. Этот способ позволяет выражать количество информации числом.
В свою очередь, формальное понятие «классификация» может быть представлено в теоретико-множественных терминах.
Множество объектов делится на классы.
Отдельные классы называются классами эквивалентности. Отношение эквивалентности обладает свойствами рефлексивности, симметричности и транзитивности. Следовательно, классификация, точнее, таксономия есть система классов эквивалентности. Однако мерономическое членение не обладает свойством транзитивности, т.е. характеризуется отношением толерантности. К примеру, типологическое районирование характеризуется отношениями эквивалентности, но региональное районирование не обладает свойством транзитивности, т.е. «сосед моего соседа» не обязательно является моим соседом (отношение толерантности).
Это своего рода каноническая дефиниция классификации, которая одновременно иллюстрирует определение классификации через теоретико-множественные отношения, т.е. в терминах информациологии.
Следует признать, что существующие почвенные классификации слабо структурированы и логически слабо обоснованы. Зачастую используются несовместимые или пересекающиеся по содержанию основания деления; смешиваются таксономические и мерономические аспекты классификаций; их иерархическая структура не определена системными или информационными отношениями и, не обладая свойствами холархии, остается лишь
4 Пуанкаре А. О науке. М., 1983.
иллюстративной схемой, а не классификацией в строгом смысле. Важность проблемы подтверждается возникновением самостоятельной дисциплины - классиологии, которая исследует теорию классификационных построений и имеет последователей в разных странах, объединяющихся в организованные или неформальные (как у нас) сообщества. Методология классиологии объединяет широкий спектр методов и подходов - от экспертных суждений до формальной лог ики, строгих средств математики, многомерной статистики. Все они составляют формальный аппарат информатики.
К уже известным отечественным концепциям классиолог ии двойственности понятия классификации (таксономия и мерономия), теории классификации перечисления, информационной базы классификации. теоретико-множественных формализации, методов построения систем информативных признаков, оценки качества и сравнения классификаций находят приложения идеи всеобщей организационной науки-тектологии. Универсальность принципов и методов информа-циологии служит основанием для создания теории, объединяющей достижения в разных научных дисциплинах для создания единой теории классификации почв (comprehensive soil classification) и совершенствования классификационной деятельности в целом.
Приложение идей и средств информациологии к созданию теории классификации почв, логически и формально обоснованных правил построения классификаций разного назначения позволяет исключить претензии на название классификацией произвольных построений - многочисленных схем, списков и прочих структур.
Унификация классификационной деятельности дает возможность формулировать критерии качества и осуществлять сравнение классификаций разных авторов и школ с тем, чтобы объективно достичь максимально возможной согласованности с единой базовой классификацией почв как общего языка почвоведения. Только таким путем можно будет реставрировать прошлые представления о почвах, свести легенды разных почвенных карт и листов Государственной почвенной карты. Речь идет о создании своего рода отечественной справочной базы классификации, которую следует привести в соответствие с World Reference Base.
Как отмечалось выше, методы информациологии включают методы и средства информатики и системного подхода, являющихся важнейшими составляющими этой науки. И хотя основателем информациологии И.И. Юзвишиным она противопоставляется системному анализу, следует отметить их общность в целостном подходе, т.е. в анализе и синтезе целого и его частей. Информациология охватывает сферу отношений компонентов любых систем (включая Вселенную) и их отношений с внешними системами, а системный анализ - со свойствами системных объектов. Образно говоря, имеет место аналогия с соотношениями между интравертами (информациология) и экстравертами (системный анализ). Объединение методов информационного и системного подходов расширяет возможности исследований любых объектов, явлений и процессов.
Реализация подходов и методов информациологии к решению классификационных задач осуществляется средствами современных информационных технологий - геоинформационных и экспертных систем, базой декларативных знаний, в которых и выступает классификация. Такой подход является еще достаточно новым для нашей науки.
Численная классификация (или собственно таксономия, хотя она применима и в мерономии) использует многомерные статистические методы и пересекающийся с ними по составу алгоритмов кластер-анализ. Наряду с одномерными методами математической статистики они являются эффективным средством анализа данных в почвоведении, хотя еще слабо используются из-за трудоемкости расчетов и отсутствия доступных соответствующих компьютерных программ.
Оценка информативности признаков осуществляется методами многомерной статистики. Расчеты выполняются путем циклического перебора всех признаков и выявления наиболее малоинформативного. Он исключается из выборки, и повторяется процедура поиска наименее информативного до тех пор, пока потеря информации не станет существенной. Потеря информации при их исключении осуществляется путем сопоставления сходства классов объектов по полному и сокращенному набору показателей.
15-2045
225
В результате создается система информативных признаков, достаточных для статистически значимого разделения почвенных таксонов.
Современное состояние исследований в данной сфере характеризуется продолжающимися дискуссиями по проблемам классификации почв. В значительной мере это связано с отсутствием количественных критериев сравнения систем классификации почв разных авторов. Однако многие, если не все эти системы, не выдерживают критики с точки зрения логики, выбора оснований деления, строгих формальных определений объекта классификации, пространства почвенных показателей и т.п. Отсутствуют фиксированные системы таксонов и их взаимосвязей, т.е. нет завершенности самой структуры классификации, хотя все остается в рамках традиционной таксономии: тип - подтип -род - разновидность - разряд. Иными словами, старые конструкции представляют собой скорее произвольные схемы, списки, но не классификации в строгом смысле.
Остается низким уровень формализации классификаций и процедур их построения. В мировом почвоведении был период довольно широкого использования методов численной таксономии - кластер-анализа, многомерной статистики, распознавания образов и др. Они довольно хорошо разработаны, широко апробированы и доступны в почвоведении, однако практически не используются в классификации почв в силу слабой подготовки почвоведов в этой области.
В настоящее время многие из формальных методов создания систем информативных признаков почв, оценки качества и сравнения разных классификаций, процедуры автоматизированного распознавания (классифицирования) почв применимы на любых уровнях почвенной метасистемы. Однако о базовой классификации как общего языка почвоведения пока говорить не приходится.
Исходя из того, что почва неразрывна с природной средой и факторами почвообразования, образуя целостную открытую систему, организованную во времени и в пространстве (хроно- и хороорганизация), целесообразна разработка прежде всего теории факторно-генетической классификации почв, хотя могут использоваться некоторые положения и субстативные показате-
ли других почвенных классификаций, включая новую классификацию.
Таким образом, почва является информационной системой почвенных свойств, факторов почвообразования, а качество (плодородие) используемых почв - показателем культуры социума. Классификация почв - тоже информационная система в концентрированном виде, объединяющая все многообразие почв, поэтому можно исследовать эти системы с помощью информационных подходов и методов, которые предоставляет ин-формациология и прежде всего ее важнейшая составляющая -информатика, предполагающая организацию и анализ почвенных данных и знаний.