УДК 004.06; 004.94; 519.76; 81.133
В. Я. Цветков
Клод Элвуд ^Шеннон, как основоположник цифрового моделирования
В статье раскрывается работа К.Э.'Ш.еннона в отношении современных цифровых моделей и цифрового моделирования. Показано принципиальное создание цифровой модели на основе подхода,примененного К.Э.'Ш.енноном. Дается переход от временной модели К.Э.'Ш.еннона к пространственной модели. Описаны информационные единицы, составляющие основу современной цифровой модели.
Ключевые слова: информатика, обработка данных, информационные модели, цифровые модели, лингвистика.
V. Ia. Tsvetkov
Claude Elwood Shannon, as the founder of digital simulation
The article analyzes the work of K.E.Shannon and its relation to modern digital technology, digital models and simulations. The article shows how to create a digital model based on the approach used K.E.Shennon. The article describes the transition from the interim model K.E.Shannon to digital spatial model. The article reveals the features of information units as the basis of modern digital models.
Keywords: computer science, data processing, information models, digital models, linguistics.
ермин «цифрование» (digitizing, digitising, digitalization) используется для обозначения информационной технологии преобразования аналоговых данных в дискретную (цифровую) форму, пригодную для использования в компьютерных технологиях. Термин «цифровые» заимствован из названия «цифровые вычислительные машины» (ЦВМ). Это определяет связь данного термина с компьютерной обработкой.
На ранних этапах развития вычислительной техники существовало два типа вычислительных машин аналоговые и цифровые [1]. Аналоговые вычислительные машины (АВМ) обрабатывали непрерывные аналоговые сигналы. Они использовали специально разработанные электронные схемы, в которых осуществлялось функциональное преобразование аналоговой входной информации в другую аналоговую информацию. Например, на входе системы имелись данные для решения дифференциального уравнения движения тела переменной массы, а на выходе получалось решение. Переходная характеристика такой схемы соответствовала требуемому алгоритму обработки.
Так для дифференцирования непрерывного сигнала, поступающего на вход системы, использовалась дифференцирующая цепочка и не-
прерывный сигнал преобразовывался в другой, который представлял непрерывную производную от исходного. Аналогично дело обстояло с интегрированием или решением дифференциальных уравнений. Другими словами, алгоритм обработки был жестко зашит в электронную схему обработки и был не перестраиваемым. По этой причине эти ЭВМ были узко специализированными и дорогими в изготовлении.
Цифровые вычислительные машины были основаны на преобразовании аналоговых сигналов в дискретные последовательности с сохранением информативности в последних. Для того, чтобы обработать информацию с помощью ЦВМ она должна быть дигитализована (digtal — цифра), те преобразована в цифровой дискретный код. Именно цифровой код и является доминантой определяющей суть термина «цифровой».
ЦВМ машины были более универсальны в обработке, так как позволяли обрабатывать данные с помощью наборов программ. Кроме того, они были более дешевыми по стоимости производства. Такими образом, универсальность и низкая стоимость явились существенными конкурентными преимуществами ЦВМ перед АВМ, что и привело к вытеснению с рынка АВМ.
В настоящее время аналоговые вычислительные машины практически не используются за
исключением специальных устройств анализа данных. Все персональные компьютеры являются цифровыми и поэтому данный термин не употребляют по отношению к компьютерам.
Термин «цифровой» сохранился как характеристика для некоторых данных и систем (цифровые методы, цифровые снимки, цифровые фотокамеры, цифровые данные, цифровая информация) [2] в которых обрабатывается дискретная информация. В настоящее время он означает, что информация в этих системах содержится в дискретной форме и предназначена для обработки с помощью современных компьютерных технологий.
Термин «цифровой» в широком смысле обозначает качество «дискретный». Этот подход применяется при формировании цифровых подписей, цифровых моделей, цифрового моделирования [3]. Именно такой подход применяется при цифровой телефонии и цифровом телевидении.
В информатике и в науках о Земле термин «цифровое моделирование» означает моделирование с использованием дискретных моделей, предназначенных для обработки на компьютере. Поэтому в этом аспекте цифровое моделирование можно рассматривать как синоним термина «компьютерное моделирование».
В широком смысле слова термин «цифровые» связан с работами Клода Элвуда Шеннона, в частности, с введенным им принципом импуль-сно кодовой модуляции (ИКМ). В процессе этого преобразования аналоговый сигнал дискретизуется как по времени, так и по амплитуде. Непрерывный сигнал заменяется импульсами, а амплитуда этих импульсов принимает дискретные значения. По существу слово сигнал можно заменить словом модель.
Заслуга К.Э Шеннона в том, что он обосновал три свойства цифровых моделей (сигналов): информационное, коммуникационное, помехозащищенности, интерпретационное.
Информационное свойство цифровых моделей заключается в возможности применения цифровых моделей (сигналов), вместо аналоговых, без потери информативности.
Коммуникационное свойство цифровых моделей состоит в том, что цифровые модели (сигналы) требуют меньшей полосы пропускания при передаче по сравнению с аналоговыми моделями.
Свойство помехозащищенности цифровых моделей состоит в том, что на основе цифровых моделей (сигналов) можно восстанавливать исходные модели с большей степенью соответствия исходной информации, чем при передаче аналоговых сигналов. Именно на этом принципе работает цифровое телевидение и цифровая телефонная связь — цифровые технологии, которые обеспечивают более высокое качество сигналов.
Интерпретационное свойство цифровых моделей состоит в том, что цифровые модели при относительно высоком уровне «шума» (погрешностей) могут быть восстановлены и применены, когда при таком же отношении «сигнал-шум» аналоговые модели восстановить невозможно.
Еще раз подчеркнем, что именно К.Э. Шеннон доказал эти свойства в своих работах, хотя занимался теорией связи а не теорией цифрового моделирования.
Для полного понимания технологии цифрования необходимо остановится на работах К.Э. Шеннона, которые имеют большое значение для развития цифровых методов. В процессе исследований он разработал и проанализировал технологию получения дискретной модели, которую назвал имульсно-кодовой модуляцией (ИКМ). Но тогда речь шла о дискретной форме, которая теперь называется цифровой. Термин «цифровой» в новых информационных технологиях означает дискретный, кодированный, связанный с обработкой или хранением на компьютерах и в БД.
Период, когда Шеннон писал свою фундаментальную работу «A Mathematical Theory of Communication» соответствует периоду между третьей и четвертой информационными революциями [1]. Еще не был изобретен персональный компьютер, информация не рассматривалась как важный экономический и производственный ресурс. Поэтому проблемы связи были много важнее, чем проблемы теории информации или информатики. Хотя в то время еще не употреблялся термин «цифровой» и «цифровая информация», но по существу именно за счет использования цифровой информации Шеннон и получил свои результаты.
Перед 1948 связь была строго технической дисциплиной, с небольшой научной теорией для ее поддержки. Особенность состояния научного направления в области связи того времени состояла в том, что не было единой теории, объединяющей разные подходы в области связи.
К тому времени использовались следующие системы, характеризующие разные направления связи: телеграф (1830), телефон (1870), беспроволочный телеграф (1890), радио (1900), телевидение (1930), телетайп (1930), системы частотной модуляции (1930), импульсно кодовая модуляция (ИКМ) (1930), вокодер (1930) и др. Теория для объединения этих разных направлений не было. Шеннон поставил перед собой цель — создание научной теории связи, которая могла бы стать по возможности универсальной для объединения разных направлений в теории связи (того времени).
Некоторые компоненты разных направлений в теории связи стали ключевыми в научной теории связи, разработанной К.Э. Шенноном. Первый из этих элементов — код Морзе. Он
был в использовании, начиная с ранних дней возникновения и эксплуатации телеграфа.
В подавляющем большинстве работ по информатике, как правило, обращают внимание на этот код как пример способа кодирования символьной информации. Но К.Э. Шеннон выделил другой, не менее важный для передачи аспект, а именно, код Морзе, важен, потому что заложенная в его основу система кодирования принимает во внимание частоту символов, чтобы эффективно сжимать кодированную информацию и осуществлять передачу информации с максимальной скоростью.
Код Морзе кодирует информацию таким образом (а тогда основой был английский язык и соответственно его алфавит), чтобы максимизировать скорость передачи набора информационных единиц (символов алфавита).
Таким образом, Шеннон выявил и использовал в своей теории следующий информационный компонент: связь системы кодирования со
скоростью передачи кодированной информации.
Второй важный компонент, который использует К.Э. Шеннон — импульсно-кодовая модуляция (ИКМ).
На рис. 1 приведена схема обобщенной коммуникационной системы по Шеннону. На нем приведена схема передачи дискретной цифровой информации, а только таковую рассматривает К. Э. Шеннон в своей теории.
Слабым местом в этой схеме является канал связи. Напомним, что каналом связи в узком смысле слова понимают:
1) Совокупность технических устройств, обеспечивающих передачу сообщений любого вида от отправителя к получателю, осуществляемую с помощью сигналов, распространяющихся по проводам или другим путем.
2) Полосу частот, время передачи или иной физический ресурс, выделяемый в данной системе связи для передачи определенного сообщения.
INFORMATION
SOURCE TRANSMITTER
RECEIVER DESTINATION
SIGNAL
MESSAGE.
RECEIVEO
SIGNAL
MESSAGE
NOISE
SOURCE
Fig. 1—Schematic diagram of a general communication system.
Рис.1. Схема обобщенной коммуникационной системы, приводимая Шенноном в его работе C.E. Shannon "A Mathematical Theory of Communication", Bell System Technical Journal, vol. 27, pp. 379-423 & 623-656, July &
October, 1948.
По К.Э. Шеннону канал — просто среда для передачи сигнала с трансмиттера на приемник (рис.1). Это может быть пара проводов, коаксиального кабеля, полоса частот радио и т.д. В тот период К.Э. Шеннон мог констатировать следующие недостатки канала связи:
- во-первых он ограничивает спектр передаваемого аналогового сигнала,
- во-вторых он подвержен влиянию умышленных и случайных помех,
- в третьих он имеет ограничения по объему и скорости передаваемых сигналов.
Для устранения этих недостатков Шеннон использовал следующие идеи:
- оптимизация кода сообщения для повышения скорости передачи по каналу связи (заимствована из кода Морзе)
- применение импульсно-кодовой модуляции (pulse-code modulation — PCM) при переде сигналов по каналу связи для повышения помехо-
защищенности и сужения спектра передаваемых сигналов.
Говоря современным языком, импульсно-кодовая модуляция это способ получения цифровой информации или цифровой модели передаваемой информации. Таким образом, важным шагом в теории К.Э. Шеннона был переход от аналоговой (непрерывной модели) формы передачи информации к дискретной (цифровой) форме.
Этот переход осуществляется за счет аналогово-цифрового преобразования. В то время его назвали импульсно кодовой модуляцией, но существо это модуляции состоит в преобразовании непрерывного сигнала в дискретный. На рис.2 изображен непрерывный сигнал (сплошная линия) и показан принцип ИКМ, который основан на дискретизации аналогового сигнала в фиксированные моменты времени (^ и дискретном кодировании амплитуды (А) сигнала с помощью двоичного кода.
f
Рис. 2. Импульсно-кодовая модуляция или аналогово-цифровое преобразование
А А
111
110
101
100
011
Рис. 3. Цифровой код
Для деления амплитуды (А) сигнала используют термин «квантование». Для создания импульсов разделенных во времени используют термин дискретизация. Хотя по существу они в этом аспекте равнозначны.
На рис.3 приведен цифровой сигнал, полученный из непрерывного сигнала на рис.2.
Очевидно, что с энергетической точки зрения сигнал на рис.2 является менее мощным. Сигнал на рис.3 имеет меньшую площадь, что соответствует энергетическим характеристикам. Однако и шум, который попадает в зону сигнала (рис.3) тоже существенно ниже.
Устройства, которые осуществляют такое преобразование, называют аналого-цифровыми преобразователями. То есть термин цифровой входит в эту технологию вполне явно. И процесс получения импульсного кода можно с полным правом назвать цифрованием.
Однако, в теории связи такой термин не закрепился и в ней используют термин импульсно-кодовая модуляция и импульсный код. Этот импульсный код используют в технологиях цифрового телевидения и цифровой телефонии, а также в технологиях спутниковых радионавигационных систем.
Модель, которая полученная К.Э. Шенноном может быть названа цифровая амплитудно-временная модель. Она отражает факторы амплитуды и времени. Кроме того, такая модель можно дополнить характеристикой «регулярная». В математическом моделировании регулярными называют модели, у которых шаг аргумента яв-
ляется постоянной величиной. В данном случае временные интервалы получения импульсов являются постоянными, время является аргументом. Это дает основание считать такую модель регулярной в отношении аргумента.
Цифровой подход имеет ряд преимуществ, среди которых следует отметить.
• Унификация представления всех видов передаваемой информации;
• Сужение спектра передаваемого сигнала;
• Возможность восстановления при наложении больших помех.
• Возможность создания специальных помехозащищенных кодов
• Возможность качественного по сравнению с аналоговым сигналом восстановления принятой информации
• Повышенная селекция принимаемого сигнала.
Следовательно, подход К.Э. Шеннона дает возможность уменьшить влияние помех, и, говоря современным языком, создать интегрированную информационную основу для передаваемой информации. Наконец, контекстно К.Э. Шеннон вышел на возможность использования булевой алгебры для описания именно цифровых моделей. На этой основе он применил энтропию, которую 100 лет до него ввел Больцман, и разработал количественную меру объема передаваемой дискретной информации. Применительно к вычислительным системам цифровая форма требует меньшего времени на обработку и меньшего объема памяти для хранения.
Проанализируем подход К.Э. Шеннона применительно к информатике и наукам о Земле и для этого ответим на ряд вопросов. В чем состоит особенность применения подхода К.Э. Шеннона в науках о Земле?
На рис.2 параметром дискретизации является время. Но если мы вместо параметра «время» (1) возьмем параметр «пространство». В частности расстояние, то модель также будет работать.
Например, рассмотрим вместо параметра (I) одну из плановых координат (х или у), а вместо амплитуды сигнала рассмотрим аппликату ^), то процесс дискретизации можно осуществить точно также. Следовательно, подход К.Э. Шеннона дает возможность построения дискретных цифровых моделей рельефа местности.
Можно ли на основе теории К.Э. Шеннона воссоздавать аналоговые объекты? Ответ поло-
жительный. В теореме Шеннона-Котельникова показаны условия, при которых дискретизация, то есть цифрование, не уменьшает информативность сигнала. Это дает возможность восстановления аналогового объекта по цифровой модели без потери информативности.
Если в модели К.Э. Шеннона заменить амплитуду А на координату Z или на высоту Н, а время на одну из плановых координат x или у, то получим двухмерную цифровую модель местности. Точнее, такая модель называется профилем или разрезом. В реальных условиях рассматривают трехмерную модель Zi=f(xi,yi). Однако для анализа рассмотрим простую двухмерную модель.
На рис. 4 представлено сечение рельефа местности как функция Z=fl(x). Форма сечения совпадает с формой сигнала на рис.4. Это сделано специально для подчеркивания общности.
Рис.4. Сечение рельефа местности по координате х
На рис.5 приведена цифровая модель, для профиля на рис. 4. Она отличается тем, что моделируется при помощи точек, математически этот объект не имеет размеров, поэтому реальная ширина импульсов рис.5 на этом рисунке отсутствует. Эта модель регулярная, поскольку интервал для аргумента Ах является величиной постоянной.
Регулярная модель может использоваться при сборе информации. Она эффективна при сборе информации, поскольку при постоянном интервале Дх возможна организация автоматических режимов сбора, что существенно повышает производительность по сравнению с ручным вводом информации.
При моделировании регулярная модель не- Какие точки следует считать информативными?
эффективна, поскольку избыточна и не отра- Это точки минимума и максимума, точки пере-
жает наиболее важные информативные точки. гиба, в которых меняется кривизна и точки раз-
Рис. 6. Цифровая пространственная нерегулярная модель
В ней определены высоты информативных точек, но это привело к тому, что шаг аргумента х стал переменным. Говоря об информативных точках, следует напомнить, что отрезок прямой задается парой точек. Следовательно, достаточно задать точки начала и конца, а остальные можно исключить. При сборе избыточные точки нужны для уменьшения погрешностей, но при моделировании они не нужны [4].
Таким образом, пространственная цифровая модель (в нашем случае профиля) представляет собой дискретный ряд отдельных точек Zi=ф(xi). По данной цифровой модели можно восстановить профиль во всех точках местности, то есть восстановить функцию Z=f(x).
Цифровые модели могут храниться в базах данных или независимо в виде файловых структур. Наибольшее распространение цифровые модели нашли в геоинформатике [5], проектировании, строительстве, архитектуре, на транспорте. В последнем случае применяют динамические цифровые модели [6]. Цифровые модели могут использоваться для описания ситуаций [7] и для описания произвольных информационных образов, отражающих объекты внешнего мира [8].
Современные цифровые модели являются сложными комплексами. Для их описания точно также как К.Э. Шеннон использовал дискретный импульс, используют информационные единицы. Кодовый импульс является информационной единицей в теории связи. В науках о Земле и информатике таких единиц значительно больше. Кроме того различие в том что
эти единицы не гомогенны как у Шеннона, а гетерогенны [9]. В науках о земле применяют качественно разные наборы информационных единиц. Из которых потом моделируются ситуации и различные информационные образы реальных объектов. Это информационные единицы для хранения [10]. Информационные единицы — носители информации [11], информационные единицы передачи сообщений [12], информационные единицы передачи семантики [13], информационные единицы взаимодействия, информационные единицы визуального представления, информационные единицы визуального описания и даже информационные единицы при передаче знания и анализе [14].
Выводы. Цифровая модель в широком смысле — это кодированная дискретная модель. Цифровая модель в узком смысле — это кодированная дискретная модель, предназначенная для обработки на компьютере.
Цифровая модель местности — это кодированная дискретная модель, аргументами которой являются плановые координаты, которая предназначена для обработки на компьютере, для хранения в БД и для визуального представления в картографической или иной визуальной форме. Все цифровые модели опираются на систему информационных единиц. Современное цифровое моделирование значительно шире первоначальных цифровых моделей в качественном и количественном плане. Однако основы цифрового моделирования и теоретические принципы, в соответствии с которыми оно осуществляется, заложены К.Э. Шенноном.
3.
4.
5.
ЛИТЕРАТУРА
Поляков А.А., Цветков В.Я. Прикладная информатика: Учебно-методическое пособие для студентов, обучающихся по специальности «прикладная информатика» (по областям) и другим междисциплинарным специальностям: В 2-х частях; Под общ. ред. А.Н. Тихонова. - М.: МАКС Пресс, 2008.
Соловьев И.В., Кудж С.А., Дедегкаев З.Н. Об использовании универсального ключа хранения и поиска электронных аэрокосмических снимков и планов // Инженерные изыскания, 2010. - № 9. - С.62-65.
Соловьёв И.В. Формирование интеллектуальных ресурсов в геоинформатике // Науки о Земле, 2013. - № 2-3. - С.76-79. Соловьев И.В. Применение модели информационной ситуации в геоинформатике // Науки о Земле, 2012. - №1.- С.54-58. Цветков В.Я. Геоинформационное моделирование // Информационные технологии, 1999. - №3. - С.23-27.
6. Цветков В.Я. Модель геоданных для управления транспортом // Успехи современного естествознания, 2009. - №4. -С.50-51.
7. V. Ya. Tsvetkov. Information Situation and Information Position as a Management Tool // European Researcher, 2012, Vol.(36), № 12-1, p.2166-2170.
8. Соловьев И.В. Об информационном объекте и субъекте // Дистанционное и виртуальное обучение, 2012. -№5. - С.80-84.
9. S. A. Kuja, I. V. Solovjev, V. Y. Tsvetkov System Elements Heterogeneity // European Researcher, 2013, Vol.(60), № 10-1, p.2366-2373.
10. Соловьев И.В. Картографо-геодезический фонд Российской Федерации // Науки о Земле, 2012. - №1. - С.38-44.
11. Tsvetkov V.Ya. Information objects and information Units // European Journal of Natural History, 2009. - №2. - p.99.
12. Цветков В. Я. Информационные единицы сообщений // Фундаментальные исследования, 2007. - №12. - С.123-124.
13. V. Ya. Tsvetkov. Semantic Information Units as L. Florodi’s Ideas Development // European Researcher, 2012, Vol.(25), №7, p.1036-1041.
14. Соловьёв И.В. Анализ некоторых тенденций развития образования // Управление образованием: теория и практика, 2013. - №1. - С.10-16.
obshch. red. A.N. Tikhonova [Applied Informatics: textbook for the students on a speciality «applied computer science» (in some areas) and other interdisciplinary specialties: In 2 parts; Under the General Ed. A.N. Tikhonov]. Moscow, MAKS Press, 2008.
pp.54-58 (in Russian).
5. Tsvetkov V.Ia. Geoinformation modeling. Informatsionnye tekhnologii - Information technology, 1999, no.3, pp.23-27 (in Russian).
6. Tsvetkov V.Ia. Geodatabase model for mobility management. Uspekhi sovremennogo estestvoznaniia - Successes of modern natural Sciences, 2009, no.4, pp.50-51 (in Russian).
7. V. Ya. Tsvetkov. Information Situation and Information Position as a Management Tool. European Researcher, 2012, V.36, no.12-1, pp.2166-2170.
8. Solov'ev I.V. information about the object and subject. Distantsionnoe i virtual'noe obuchenie - Distance and virtual learning, 2012, no.5, pp.80-84 (in Russian).
9. S. A. Kuja, I. V. Solovjev, V. Y. Tsvetkov. System Elements Heterogeneity. European Researcher, 2013, V.60, no.10-1, pp.2366-2373 (in Russian).
10. Solov'ev I.V. Cartographic-geodesic fund of the Russian Federation. Nauki o Zemle - Earth Sciences, 2012, no.1, pp.38-44 (in Russian).
11. Tsvetkov V.Ya. Information objects and information units. European Journal of Natural History, 2009, no.2, p.99.
12. Tsvetkov V. Ia. Information units message. Fundamental'nye issledovaniia - Fundamental research, 2007, no.12, pp.123-124 (in Russian).
13. V. Ya. Tsvetkov. Semantic Information Units as L. Florodi’s Ideas Development. European Researcher, 2012, V.25, no.7, pp.1036-
2. Solov'ev I.V., Kudzh S.A., Dedegkaev Z.N. On the use of universal key of the storage and retrieval of electronic aerospace images
and plans. Inzhenernye izyskaniia - Engineering surveys, 2010, no.9, pp.62-65 (in Russian).
3. Solov'ev I.V. Development of intellectual resources in Geoinformatics. Nauki o Zemle - Earth Sciences, 2013, no.2-3, pp.76-79 (in
Russian).
4. Solov'ev I.V. Application of a model of information situation in Geoinformatics. Nauki o Zemle - Earth Sciences, 2012, no.01,
1041.
14. Solov'ev I.V. Analysis of some tendencies of development of education. Upravlenie obrazovaniem: teoriia i praktika - Education management: theory and practice, 2013, no.1, pp.10-16 (in Russian).
Информация об авторе
Цветков Виктор Яковлевич
(Россия, г. Москва)
Профессор, доктор технических наук, советник ректора. Московский государственный университет геодезии и картографии.
E-mail: [email protected]
Information about the author
Tsvetkov Viktor Iakovlevich
(Russia, Moscow)
Professor, Doctor of technical sciences, Advisor to the Rector. Moscow State University of Geodesy and Cartography.
E-mail: [email protected]