УДК 577.22 + 577.212.4 + 577.112.012 Карасев В. А., канд. биол. наук,
Санкт-Петербургский государственный электротехнический университет «ЛЭТИ»
О принципах построения цепных полимеров. I. Система пента-фрагментов
Ключевые слова: цепные полимеры, белки, пента-фрагменты, классификация
В целях поиска принципов построения структуры цепных полимеров, перспективных материалов для бионической наноэлектроники проведен анализ пента-фрагментов белков, относящихся к цепным полимерам. На основе выборки из 537 файлов белков с помощью специально написанных программ получено около 100 тысяч пента-фрагментов, сортированных на 512 видов, различающихся числом водородных связей в основной цепи белка. Полученные фрагменты подразделяются на циклические и ациклические, в каждой такой группе выделены по два класса пента-фрагментов, а внутри классов — по два подкласса. Представлена классификация пента-фрагментов для любых типов цепных полимеров, включая и белки, в основе которых лежит блочная суперматрица из 64 элементов.
Введение
В современной наноэлектронике существуют два направления развития [1]. Одно них, возникшее в начале 80-х годов прошлого века, связано с поиском принципиально новых материалов, пригодных для создания молекулярных проводов и элементной базы наноэлектроники. В рамках второго направления, называемого «бионической наноэлект-роникой», ведется поиск принципов построения и работы молекулярных биологических структур [2]. Конечная цель этого направления — создание искусственных наномолекулярных устройств, использующих биологические принципы.
Большая часть биологических устройств является белками или содержит в своем составе белки. Вопрос о принципах конструирования белков с заранее заданной структурой является одной из центральных проблем в этой области. Попытки создания искусственных белков, основанные на современных представлениях о принципах самоорганизации белков [3], носят компилятивный характер и не имеют под собой строгого теоретического обоснования.
На протяжении ряда лет нами разрабатывается теоретический подход к кодированию топологии
цепных полимеров, частным случаем которых являются белки [4, 5]. С использованием введенных понятий 4-звенного фрагмента цепного полимера (минимального фрагмента полимерных цепных структур, состоящего из пяти элементарных модулей — пента-фрагмента) и его аналога — 4-звен-ного цепного графа — были развиты представления о топологическом коде и о боковых цепях полимера как системе физических операторов. Их функциональные свойства реализуются в рамках работы молекулярной векторной машины (МВМ). В работах [4, 5] была показана применимость этих представлений к биологическому коду и каноническому набору аминокислот. Целью данной серии работ является поиск закономерностей формирования структуры цепных полимеров с учетом представлений о МВМ.
1. ПОСТАНОВКА ЗАДАЧИ И МЕТОДЫ ЕЕ РЕАЛИЗАЦИИ
1.1. Постановка задачи
Согласно развиваемым представлениям [4, 5], областью действия МВМ является 4-звенный фрагмент цепного полимера (пента-фрагмент), в котором возможно образование водородной связи его между 0Н...Хь4-атомами. Элементами МВМ являются: пента-фрагмент цепного полимера (а-ато-мы Д" - Да14), тетраэдрический Д^-атом, с которым связаны сменяемые физические операторы (в), действующие на связь и фрагмент г + 1-го
звена, имеющего направление на атом Д" + 1. Подчеркнем, что на каждой стадии синтеза полимера согласно модели происходят перемещение МВМ и срабатывание физического оператора в соответствии с тем вектором действия, для которого он предназначен.
Для решения вопросов, связанных с построением вторичных структур цепного полимера, можно использовать два подхода: чисто теоретический, при котором теория должна строиться «сама из себя», и полуэмпирический, состоящий в анализе и обобщении данных, которые предоставляют нам какие-либо конкретные цепные полимеры. Частным случаем цепных полимеров являются белки. Полагая, что второй подход может быть более быстрым и продуктивным, последующую теоретиче-
скую разработку мы проводили на основе анализа белковых структур.
Обратимся к структуре белков и рассмотрим взаимоотношения между старым и вновь синтезированным пента-фрагментами белка. Для этой цели в качестве примера выпишем слева фрагмент из шести аминокислот (рис. 1).
Из анализа свойств нового и старого фрагментов можно сделать следующие выводы: фрагменты г — I — 4 и I — 1 — г - 5 перекрываются (эта область выделена курсивом) — четыре аминокислоты у них общие; между фрагментами возможны различия, которые могут касаться особенностей структуры связей этих фрагментов в структуре белка. Это позволяет предполагать существование некоего множества различающихся между собой пента-фрагментов, образующих систему. С другой стороны, то, что фрагменты перекрываются, допускает образование связной цепи фрагментов. Это позволяет предполагать существование ряда стадий в процессе формирования вторичной структуры, которые могут быть каким-либо образом описаны.
Таким образом, в рамках модели МВМ обозначилась проблематика данной серии работ: анализ пента-фрагментов как системы и поиск алгоритмов построения вторичных структур. Настоящая работа посвящена анализу и систематизации пен-та-фрагментов в белках.
Фрагмент белка из шести аминокислот i Abc i - 1 Bed i - 2Cde i - 3 Def i- 4 Efg i - 5 Fgh
i — i-4 новый фрагмент i Abc i - 1 Bed i - 2 Cde i - 3 Def i-4 Efg
i — l — i — 5 старый фрагмент
i — l Bed i — 2 Cde i — 3 Def i — 4 Efg i - 5 Fgh
Рис. l
Взаимоотношения между старым и новым фрагментами белка
1.2. Способ описания связей пента-фрагментов
и условия проведения их систематизации
Для систематизации пента-фрагментов необходимо иметь наглядное их представление и описание связей в структуре белка. Один из способов описания конформации белка основан на задании двухгранных углов в области а-углеродного атома [6]. Однако для анализа связей пента-фрагментов этот подход оказался неудобным. С другой стороны, при разработке способов представления систем спряженных ионно-водородных связей (ССИВС) в работе [7] были предложены файлы, содержащие в линейной форме полное описание всех водородных связей белка. Этот способ описания связей в структуре белка оказался очень удобным для задания структуры связей пента-фрагментов и был использован в данной работе. В табл. 1 в левом столбце показан пример типичного спирального участка, полученного помощью программы Protein 3D [8] на основе файла 1a4i (фолат-зависимой дегидрогеназы/циклогид-ролазы). Обратим внимание, что в данном примере и далее в пента-фрагментах расположение и нумерация аминокислот идут снизу вверх, что обусловлено особенностями роста полипептидной цепи, который происходит со стороны «головы».
Из табл. 1 видно, что приведенный фрагмент имеет ряд характерных особенностей: начальные и конечные участки спирали содержат меньшее число Н-связей по сравнению с центральной областью; начальные участки образованы карбонильными группами пептидных связей основной цепи, а конечные — аминогруппами этих связей; центральная область фрагментов содержит большое число О, NH-групп.
Все эти особенности сохраняются и при последовательном выделении пента-фрагментов на этом спиральном участке (в табл. 1 справа). Фрагменты начала спирали обозначены буквой В (от Begin, англ. — начало) с индексами от 1 до 7, централь-
Таблица ll
Выделение пента-фрагментов на спиральном участке белка 1a4i и их обозначение
Исходный спиральный участок
Выделенные пента-фрагменты
Конец спирали
Обо-значение
Середина спирали
Обо-значение
Обо-
Начало спирали зна-
чение
151 GLY O - 155 LEU N B6
151 GLY N 147 CYS O
151 GLY
150 LYS O - 154 GLU N
150 LYS N - 146 PRO O
150 LYS
149 PRO O - 153 LEU N
149 PRO
148 THR O 152 CYS N
148 THR
147 CYS O - 151 GLY N
147 CYS
150 LYS O - 154 GLU N B5
150 LYS N - 146 PRO O
150 LYS
149 PRO O - 153 LEU N
149 PRO
148 THR O 152 CYS N
165 GLY 164 ALA 163ILE 162 PRO 161 VAL 160 GLY 159 THR N 159 THR 158 GLU N 158 GLU 157 LYS N ■ 157 LYS 156 ILE N -156ILE 155 LEU O 155 LEU N 155 LEU 154 GLU O 154 GLU N 154 GLU
- 155 LEU O
- 154 GLU O 153 LEU O 152 CYS O
- 159 THR N
- 151 GLY O
- 158 GLU N
- 150 LYS O
163 ILE 162 PRO 161 VAL 160 GLY 159 THR N 159 THR
E7
155 LEU O
157 LYS N -157 LYS 156 ILE N -156 ILE 155 LEU O 155 LEU N 155 LEU 154 GLU O 154 GLU N 154 GLU 153 LEU O 153 LEU N 153 LEU
153 LEU O 152 CYS O
- 159 THR N
- 151 GLY O
- 158 GLU N
- 150 LYS O
- 157 LYS N
- 149 PRO O
E1
162 PRO 161 VAL 160 GLY
159 THR N - 155 LEU O 159 THR
158 GLU N - 154 GLU O
E6
156 ILE N - 152 CYS O 156 ILE
155 LEU O - 159 THR N 155 LEU N - 151 GLY O 155 LEU
154 GLU O - 158 GLU N
C3
Продолжение табл. 1
Исходный спиральныйучасток
Выделенные пента-фрагменты
Конец спирали
Обо-значение
Середина спирали
Обо-значение
Начало спирали
Обо-значение
153 ЬЕи О 153 ЬЕи N 153 ЬЕи 152 СУв О 152 СУв N 152 СУв 151 йЬУ О 151 йЬУ N 151 йЬУ 150 ЬУв О 150 ЬУв N 150 ЬУв 149 РВД О 149 РВД 148 ТНИ О
148 ТНИ 147 СУв О 147 СУв
149 РО О -146 РВД 1451ЬЕ 144 РНЕ 143 СУв 142 АвР 141 АвN 140 ЬЕи
- 157 ЬУв N
- 149 РВД О
- 156 1ЬЕ N
- 148 ТНИ О
- 155 ЬЕи N
- 147 СУв О
- 154 вьи N
- 146 РВД О
- 153 ЬЕи N
- 152 СУв N
- 151 вЬУ N 150 ЬУв N
158 вьи
Е6
1540Ш N -154 вьи 153 ЬЕи О -153 ЬЕи N 153 ЬЕи 152 СУв О -152 СУв N -152 СУв
150 ЬУв О
157 ЬУв N 149 РВД О
156 1ЬЕ N 148 ТНИ О
С3
148 ТНИ
147 СУв О - 151 вЬУ N 147 СУв
146 РВД О - 150 ЬУв N 146 РВД
В5
161 УАЬ Е5 155 ЬЕи О - 159 ТНИ N С2 149 РВД О
160 вЬУ 155 ЬЕи N 151 вЬУ О 149 РВД
159 ТНИ N - 155 ЬЕи О 155 ЬЕи 148 ТНИО
159 ТНИ 154 вьи О - 158 вьи N 148 ТНИ
158 вьи N - 154 вьи О 154 вьи N 150 ЬУв О 147 СУв О
158 вьи 154 вьи 147 СУв
157 ЬУв N 153 ЬЕи О 153 ЬЕи О - 157 ЬУв N 146 РВД О
157 ЬУв 153 ЬЕи N 149 РВД О 146 РВД
153 ЬЕи 145 1ЬЕ
152 СУв О - 156 1ЬЕ N
152 СУв N - 148 ТНИ О
152 СУв
151 вЬУ О - 155 ЬЕи N
151 вЬУ N - 147 СУв О
151 вЬУ
160 вЬУ Е4 154 вьи О - 158 вьи N С2 148 ТНИО
159 ТНИ N - 155 ЬЕи О 154 вьи N 150 ЬУв О 148 ТНИ
159 ТНИ 154 вьи 147 СУв О
158 вьи N - 154 вьи О 153 ЬЕи О - 157 ЬУв N 147 СУв
158 вьи 153 ЬЕи N 149 РВД О 146 РВД О
157 ЬУв N - 153 ЬЕи О 153 ЬЕи 146 РВД
157 ЬУв 152 СУв О - 156 1ЬЕ N 145 1ЬЕ
156 1ЬЕ N - 152 СУв О 152 СУв N - 148 ТНИ О 144 РНЕ
156 1ЬЕ 152 СУв
151 вЬУ О - 155 ЬЕи N
151 вЬУ N - 147 СУв О
151 вЬУ
150 ЬУв О - 154 вьи N
150 ЬУв N - 146 РВД О
150 ЬУв
159 ТНИ N - 155 ЬЕи О Е3 153 ЬЕи О - 157 ЬУв N С1 147 СУв О
159 ТНИ 153 ЬЕи N 149 РВД О 147 СУв
158 вьи N - 154 вьи О 153 ЬЕи 146 РВД О
158 вьи 152 СУв О - 156 1ЬЕ N 146 РВД
157 ЬУв N 153 ЬЕи О 152 СУв N - 148 ТНИ О 145 1ЬЕ
157 ЬУв 152 СУв 144 РНЕ
156 1ЬЕ N - 152 СУв О 151 вЬУ О - 155 ЬЕи N 143 СУв
156 1ЬЕ 151 вЬУ N - 147 СУв О
155 ЬЕи О 159 ТНИ N 151 вЬУ
155 ЬЕи N - 151 вЬУ О 150 ЬУв О - 154 вьи N
155 ЬЕи 150 ЬУв N - 146 РВД О
150 ЬУв
149 РВДО- 153 ЬЕи N
149 РВД
158 вьи N - 154 вьи О Е2 152 СУв О - 156 1ЬЕ N В7 146 РИОО
158 вьи 152 СУв N - 148 ТНИ О 146 РИО
157 ЬУв N 153 ЬЕи О 152 СУв 145 1ЬЕ
157 ЬУв 151 вЬУ О - 155 ЬЕи N 144 РНЕ
156 1ЬЕ N - 152 СУв О 151 вЬУ N - 147 СУв О 143 СУв
156 1ЬЕ 151 вЬУ 142 АвР
155 ЬЕи О 159 ТНИ N 150 ЬУв О - 154 вьи N
155 ЬЕи N - 151 вЬУ О 150 ЬУв N - 146 РВД О
155 ЬЕи 150 ЬУв
154 вьи О 158 вьи N 149 РВДО- 153 ЬЕи N
154 вьи N - 150 ЬУв О 149 РВД
154 вьи 148 ТНИО - 152 СУв N
148 ТНИ
В4
152 СУв N
151 вЬУ N
150 ЬУв N
152 СУв N
151 вЬУ N
В3
151 вЬУ N
150 ЬУв N
В2
В1
ной области спирали — буквой С (Center) с индексами 1-3, а конца спирали — Е (End), так же как и фрагменты начала спирали, с индексами от 1 до 7. При таком выделении видно, что возникают своеобразные серии пента-фрагментов, причем внутри серии каждый из фрагментов обладает как общими для данной серии особенностями, так и индивидуальными. Так, во фрагментах начала спирали последовательно на единицу увеличивается число водородных связей, образуемых карбонильной группой (фрагменты В1 — В4). Затем увеличивается число связей образуемых одновременно атомами О и N (фрагменты В5-В7, С1). В центральных фрагментах (С2) количество связей О и NH не меняется. Затем во фрагментах конца спирали количество связей О и NH постепенно снижается (фрагменты С3, El — Е3). В конце спирали на каждом этапе на единицу снижается количество связей, образованных аминогруппой (Е4 — Е7). Наличие единичных различий между пента-фрагмен-тами создает предпосылки для их последующей классификации.
Использование файлов других белков, обработанных аналогичным образом программой Protein 3D, также позволяет получить из них многочисленные пента-фрагменты, которые можно сгруппировать в папки с общим названием. Однако для их сопоставления необходимо напомнить стандартные обозначения номеров атомов.
1.3 Форма записи, нумерация атомов
пента-фрагментов и их связей
Принято, что рассматриваемый первый а-угле-родный атом в белке обозначается буквой i, тогда ко всем предыдущим ему номерам атомов и связям добавляют цифры со знаком «-», а ко всем последующим — со знаком «+» [6]. Рассмотрим с этих позиций пента-фрагмент центральной области спирали (С2) из файла 1a4i в форме записи в файлах программы Protein 3D, имеющий максимальное число водородных связей (рис. 2, а).
Как видно на этой схеме, все аминогруппы (NH) образуют водородные связи с атомами кислорода (О) групп 0=C—NH, расположенных позади анализируемых групп (154 GLU N — 150 LYS О, 153 LEU N — 149 PRO О и т. д.). Атомы кислорода также образуют водородные связи, но с NH-груп-пами пептидных связей, расположенных впереди (154 GLU О — 158 GLU N, 153 LEU О — 157 LYS N и т. д.). Эта запись в целом правильно отражает все связи. Однако в таком представлении имеется ряд недостатков: все связи записаны с одной стороны, хотя на самом деле они расположены с разных сторон от О=С—NH-групп; пара связей, принадлежащих к одному а-углеродному атому расположена между двумя разными а-углеродными атомами, тогда как она должна быть расположена по разные стороны от своего а-углеродного атома. На рис. 2, б мы воспроизвели в общих чертах эту
а) 154 GLU O - 158 GLU N 154 GLU N - 150 LYS O 154 GLU
153 LEU O- 157 LYS N 153 LEU N - 149 PRO O 153 LEU
152 CYS O - 156 ILE N 152 CYS N - 148 THR O 152 CYS
151 GLY O - 155 LEU N 151 GLY N - 147 CYS O 151 GLY
150 LYS O - 154 GLU N 150 LYS N - 146 PRO O 150 LYS
N,H... Oj.4
Ni+зН-Ои
О
NI+2H...O,2
о
Nl2H...Ous
Nj+fH... Oj.3
о
NtfH... Of.7
wfh-ом la
о
Nh4H...0^8
Рис. 21 Пента-фрагмент центральной области спирали (С2)
запись связей, но в обобщенном виде, заменив конкретные значения цифр описанными выше общепринятыми обозначениями: атомы фрагмента обозначены от i-го до i - 4-го, показаны водородные связи NH с ОЬ4...ОЬ8 и С=0 с HNi + 4...HNr При этом мы устранили отмеченные выше недостатки записи рис. 2, а. Обратим внимание, что связь _ 4 повторя-
ется дважды — в i-м и i - 4-м положениях (показана в прямоугольнике), что отражает образование цикла с водородной связью в этом фрагменте. Аналогичная номенклатура связей сохраняется и для всех других вариантов пента-фрагментов, изменяться будет лишь число образуемых Н-связей.
1.4. Методы получения и сортировки пента-фрагментов
Для получения пента-фрагментов нами были использованы разнообразные по структуре белки из Protein Data Bank — как а-спиральные, |3-струк-турные, так и весь спектр разнообразных форм, сочетающих оба типа вторичных структур. В процессе обработки, помимо программы Protein 3D, был использован ряд специально разработанных компьютерных мини-программ, написанных совместно с программистом А. И. Беляевым.
Процесс обработки исходных PDB-файлов состоял в следующем. С помощью программы Protein 3D были получены текстовые файлы, описывающие структуру систем пептидно-водородных связей основной цепи белка (N;H...O;_4). Далее программаInvertor переводила запись в файле в направлении снизу вверх. Затем с помощью программы Cutter проводили нарезку всех файлов на пента-фрагменты, начинающиеся с заданной аминокислоты, причем для каждой из 20 аминокислот, содержащихся в белке, эта процедура повторялась. В результате мы получали 20 групп пента-фрагментов. В зависимости от положения в различных типах структур, эти фрагменты имели разное число строк, поэтому на следующем этапе, с помощью программы Selector была проведена сортировка пента-фрагментов по числу строк. Последним этапом в серии процедур была сортировка пента-фрагментов, имеющих одинаковое
Бионанотехнологии, биоэлектроника, биосенсорика
число строк, на определенные типы с одинаковым расположением связей. Это достигалось с помощью программы Separator, которая допускала для поиска и выделения того или иного типа фрагментов набор различных значений связей: N, О и прочерк ( — ), означавший отсутствие связей. Таким образом, мы получили набор сортированных по числу строк и расположению водородных связей пента-фраг-ментов. Далее на основе сопоставления этих фрагментов с теми, которые получаются при ручной обработке (пример — в табл. 2), им присваивали условные обозначения, например Bl, B2, B3, C1 и т. д., которые в данной работе не приводятся.
2. РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ
2.1. Принципы сортировки и классификации пента-фрагментов
Всего в данной работе было обработано 537 файлов белков, из которых было получено около 100
тысяч пента-фрагментов. В результате сортировки всего было найдено около 500 индивидуальных типов пента-фрагментов (как потом оказалось, теоретически их должно быть 512), на основе которых были сформированы две группы, содержащие по два класса, каждый из которых состоит из двух подклассов. В подклассах содержатся по 64 вида пента-фрагментов.
В процессе обработки было обращено внимание, что наличие или отсутствие водородной связи можно описать с помощью двоичной системы: 0 — это отсутствие Н-связи, 1 — наличие Н-связи. При этом порядок их написания был связан с принятой нами общей нумерацией пента-фрагментов снизу вверх.
Например, если снизу вверх в паре при а-атоме
n mh....o^
идет связь N.H, а затем N^H..^:
70
n h
то читается как 01, а если идет NH..^ ,, а затем
oj ill
О.: ,то такая пара читается как 10.
1 n h----oi-4
Принципы классификации пента-фрагментов
наглядно показаны в табл. 2. Предварительно от-
Таблица 2\ Принципы классификации пента-фрагментов
Группа
Ациклические фрагменты — 0
Циклические фрагменты — 1
Класс
00
01
10
11
Подкласс
00-00
01-00
10-01
11-01
00
О,
01
;о
10
11
i - 1 i - 2 i- 3
i - 4
00
Oi.4 (
i-4
n;.4h
00
n,H....O,.4 Jè
n,4h
01
n,H....0,.4
i-4
nmh
01
Подкласс
00-10
01-10
10-11
11-11
00
01
О,
10
11
i - 1 i - 2 i - 3
i - 4
n
i-4 N. ¿H O.,
10
i-40Nh4H....Oh(
10
Ni
-P
11
-P
11
метим, что для удобства анализа пента-фрагменты представлены в таблице состоящими из трех частей: начальной (¿-й а-углеродный атом и его связи), центральной (а-атомы ¿-^¿-2, ¿-Зиих связи), и конечной (а-атом ¡-4и его связи).
В табл. 2 пента-фрагменты разделены на две группы — циклические (обозначение 1) и ациклические (обозначение 0), что связано с наличием или отсутствием водородной связи между ^Н при ¿-м а-углеродном атоме и 0| 4 при ¿ - 4-м а-угле-родном атоме (М.Н...0._4) [4, 5]. Для циклических фрагментов, как упоминалось в разделе 1.З, связь ^Н...0Ь4 повторяется как при ¿-м а-углеродном атоме, так и при ¿ - 4-м (в табл. 2 она находится в прямоугольнике).
В каждую группу вошло по два класса фрагментов, различающихся числом водородных связей при ¿-м а-атоме — 00 и 01 в группе 0 и 10, 11 — в группе 1. Внутри каждого класса имеется по два подкласса фрагментов, различающихся числом водородных связей при ¿-4-м а-углеродном атоме. Для классов 00 и 01 это пары переменных — 00 и 10. Соответственно, названия подклассов будут обозначаться как 00-00, 00-10 и 01-00, 01-10. Аналогично, для классов 10 и 11 в положении ¿ - 4 будут пары переменных 01 и 11, а названия подклассов — 10-01, 10-11 и 11-01, 11-11. Таким образом, в качестве наименования подкласса были приняты ¿-я и ¿ - 4-я пары переменных. Центральная часть пента-фрагмента, приведенная в табл. 2 для пар переменных 11 11 11, внутри каждого подкласса является вариабельной и содержит по 64 вида пента-фрагментов.
2.2. Классификация пента-фрагментов белков
Дальнейшую классификацию пента-фрагментов проводили отдельно для каждого подкласса. В качестве примера в табл. З мы привели такую классификацию для класса 00, который содержит два подкласса групп — 00-00 и 00-10. Мы поместили их в одной таблице в целях последующего сравнения. Общими для всех фрагментов каждого подкласса являются пары переменных при ¿-м и ¿ - 4-м а-углеродном атомах, поэтому они вынесены соответственно в начало и конец таблицы. В левом столбце таблицы обозначены все номера а-атомов.
В основу классификации центральной части пента-фрагментов (а-атомы ¿-1,¿-2и¿-З) было положено сходство их вариаций с вариациями модели топологического кода [4]. Напомним, что в модели кода конформации 4-звенного графа формировали блоки, имевшие общие значения во второй паре переменных (х3х4): 00, 01, 10 и 11. По аналогии с этим в первый блок классификации центральной части пента-фрагментов подгруппы 00 мы поместили фрагменты, в которых отсутствовали связи атома О и группы при ¿ - 2-м а-угле-
родном атоме (блок 00), во второй блок (01) — фрагменты, в которых группа N. _ 2Н не образует Н-связь, а атом 0._2 — образует, в третий (10) — фрагменты, в которых Н-связь образует группа N. _ 2Н, а атом атом 0. _ 2 — не образует, и в четвертый — фрагменты, в которых водородные связи образуют как атом 0. _ 2, так и группа N. _ 2Н.
Таким образом, в результате мы получили классификацию центральной части пента-фрагментов подгруппы 00, имеющую блочную структуру (табл. З) — блоки 00, 01, 10 и 11, образованные общим типом связи при ¿ - 2-м а-углеродном атоме. Внутри блоков в строках расположены пента-фрагменты, имеющие общую пару переменных в ¿ - 1-положении, а в столбцах — пента-фрагменты, имеющие общую пару переменных в ¿ - З-положении. В результате такого расположения в клетках, расположенных симметрично относительно главной диагонали блока, оказались фрагменты, имеющие симметричные относительно ¿ - 2-го а-углеродного атома гомологичные Н-связи. Например, в столбце 01 в строке 00 блока 00 есть фрагмент фрагмент, в котором атом 0. _ 3 образует Н-связь с группой N. + 1Н, а в строке 10 и столбце 00 — пента-фрагмент, в котором аналогичную связь образует группа N. _ 1Н с атомом 0._ 5, и эти две связи симметричны относительно ¿ - 2-го а-углеродного атома. На главных диагоналях блоков оказались фрагменты, у которых симметрично относительно ¿ - 2-го а-углеродного атома расположены пары гомологичных Н-связей. Например, такая симметрия имеется в пента-фрагменте, который находится на пересечении столбца 01 и строки 10, между парой связей Ы.^1Н...0. 3 иМ ,Н...0. 5 в блоке 00.
1+1 I_ 3 I_ 1 I _ 5
Приведенные в табл. З количественные данные о числе найденных пента-фрагментов позволяют сделать ряд наблюдений. Так, максимальное число пента-фрагментов в подклассе 00-00 наблюдается для первого фрагмента каждого блока (слева вверху). Количество фрагментов уменьшается как сверху вниз, так и слева направо и минимально (вплоть до отсутствия) у фрагментов, находящихся справа внизу.
Количество фрагментов снижается парами: сначала много — в первом столбце или строке, затем меньше — во втором столбце или строке. Затем снова много и меньше, но количество их снижено по сравнению с первой парой (см., например, пары столбцов 00, 01 и 10, 11, а также пары строк 00, 10 и 01, 11 в блоках 01 или 10). В подклассе 00-10, в котором N. _ 4Н образует Н-связь с 0. _ 8, число пента-фрагментов существенно ниже. В табл. З они приведены в скобках. При этом, аналогично, пары с большим и меньшим числом фрагментов имеются как в столбцах, так и в строках.
В таблице имеются клетки, в которых пента-фрагменты в данной подгруппе не представлены (например, их много в блоке 00). Их отсутствие может быть объяснено несколькими причинами.
Таблица з\ Классификация пента-фрагментов подклассов GG-GG и GG-1G
i 0|O ' 00 NH
i- г 00 01
i -З i- l 00 Ol 10 ll 00 01 10 ll
00 5г 078 (З598) 15З1 (го4) l648 (г7ог) l96 (85) l648 (1ог) З77 (г8) 54 (186) l6 (гг)
0Ъ'-1 n- -h 0'b¡-2 o n -2h n -3H 0ъ-1 МИН nOIh о-з »f Q'-3 n -3h 0ъ-i »'н о-2 п о-з ^ »-н-о-7 O-i , О» О:, О NoiH. .. .О-з °N -н 2Н зН.... С-7 с-I -1 Q'' ЫИН n+23 С-2 2 О" n-'h °Ъ'-- n-3h о-i -1 n--h n-+Jh... с -2 .2 О"2 noih о-з n''h O h3Q--' n-3h с" -1 ®nmh n'+'h °i-2 ,2 О"2 nlJ-Í °-з »-3 »-h о-7 с "i -i n--h n-O2h 2 О 2 n.'H n 01h...o -з О Nh3H....Oh7
lO !54г (го9) г1 (1) г5 (15З) 0 (1) 6г (6) 10 (З) 0 (7) 0 (4)
n--h.... o-, "-O" N'-2H 0-3 ,-3 N'-3H оъ,-1 n-lh.o-, 0Ъ'-2 n-2H » oih 0-з N О »-зн °'-Io'-i N -2H N'-3H....° -7 °Ъ'-1 N-iH-Os No,H Оз »'f О'-3 N,'H--0,7 °Ъ'-1 n„н—с„ » O2h °--2 2 О' -2 »-'h с-з -О' n -3н о-- -1 0 »--H.. .. О-, N-oH.... 0--2 -2 о'-2 N-'H N'+'H....О-3 -з ®Nh3H о'-1 n --н..0-, "он 0-2 2 О'-2 n-2н 0'b,3 n33h о-7 °"io'-i n-O2h 2 О'-2 n-h noih...о-з '2 О »-зн...0-7
Ol !6г6 (95) гг (5) З1 (76) г (0) 457 (47) l97 (г5) 9 (З0) г (1г)
»O3h о-, О »-,h 0'-Ъ,-2 n-'h 0 -Ь'-з n -3h N 03Н...О - О1 N-Н N Ol H О N -3H NозН...°Н О1-' N--H °Ъ'-2 N-2H О-з , , N h3H....°h7 N озН.Оц OhI N-,Н °-'О-2 »-2Н Nо-Н.О-з ^ ^»ззН....° -7 N03H....O-- »--H N'+'H.i-' .2 О' -2 N -2Н "Ъ-з »-зН П-оН.Он О'-1 N-+2H....°'2 '2 О »-2H N'+iH... О-з о'-3 »-зН Nl+3H....0--I О1 '" N--H N'+'H... С'-2 -2 О N-2H о "3 -3 о'3 »-H ... О'4 N-'H "оН...° "2 . 2 О'-2 N-Н N'+lH... .О-з " О N-3H.... О-
ll l94 (9) 0 (0) З (З) 0 (0) l4 (0) 6 (0) 0 (З) l (0)
N 03H....O - О N-lH....0-, "-'О-' »-2H 0Ъ-2 N-зН »озН.Оц а-1 мИн....о-5 0-Ъ-2 N 2 NoiH....O'-з ¡Ц О N 3 NoiH.Ou О'-1 "„Н.С, °-Ъ--2 N-2H ""о'-3 N-^....С-7 NoiH.Ou О'-1 NИH--0,g °ъ'-2 N-2 '1 Ъ'-3 N -зН... О '-7 N 03H...O i-i , О'-1 NнH--0"S » O'H.. ..°--2 О'-2 N 22н О-з '3 О'-3 N-H »'•3Н.°И О-1 '--H.... O-, N'+'H... 0-2 , О'-2 »-H N-H....0'-з 12 '1 "о-3 »-зН NoH.... О,- '3 '"а'-1 "цН.О", N O2H . . °'-2 -1 о'-2 n"2h О "3 -3 О'3 »"зН...°"7 N03H....O-1 '3 'о'-1 N-1H....0-, "о'Н.... -2 N-23 N-+-H....О-з " 1 о--3
i- г lO ll
i -З i- l 00 01 10 ll 00 01 10 ll
00 l6l? (l54) 65 (8) З01 (г718) З5 (155) го4 (6) 1З (З) гг (76) l6 (З9)
0-ь-1 »-h 0Ъ'-2 NrJ4....0Kl о-з ' з о о -i -i ^»цН О-2 О NoH.O -з »г21-.0 *N3H °Ъ'-1 n--h °Ъ'-2 n-'h °-, о »-зн 0-7 0-Ъ-1 ыин °Ъ'-2 noih 03 »f 0- 0nhh с-7 o'i -1 %ih n '•¡h.. ..о-2 12 Q> '2 о-з 'з "о n-зн с"1 "1 n-O2h °-2 2 »-•-h...0-3 --- ®Mh3H о", " ®»ин "о'н "m 2 О'-2 n-2h...0-, °Ъ'-3 »-h 0-7 с-1 "1 ®пин n-O2h 2 noih. о" " "" О'-3 n-h.... с-
lO г9? (69) З9 (г) го5 (г8З7) l4 (1г8) З6 (З) г7 (З) г7 (14г) 6 (50)
o'-l ', о 1 n-lh-o-, o -2 -2 о'-2 n-2h..0-6 °-3 "3 n-3h о-i , О N-iH-..О -, "ъ-2 N-2H....0--»о-Н.О-з 3 О^зН n-h °-, °ъ-2 n-2h....0-6 n-3h...0-7 0io'H N ИН....°-, °"а-2 IN-2H...0-6 No-H....О-з Ц аМззН...0 - о -1 , О'-1 NHH....OKI n 02н °'2 О' -2 n-2н.... с-- с - - з ь-3 °ъ'-1 NhH....OKi »о'Н °4Q--2 n о,н о-з »f °"6 ^n^h 0NhiH....OKl n -O2h q -2 N -rh—o-ß с-з -з О -3 n -32... о-7 с", - an"ih.... o-, n-h о- 2 О'2 "oih... с- ■3 О'-3 n-зн.. .. 0-7
Ol З9 (l7) l (0) г1 (174) l (0) 1З (6) го (0) l (г9) 7 (г7)
» o3H....0-, o'-1 N -H 0-20'-2 N-2H.0-6 0'-3 '-3 N-H N03H....OH ', "V NoiH О у "-зН N'+Н....О' i V N-,H °-Ъ-2 о-з , ч -3о N-33....0 ^ NоН.°И оЛ О N'+'H.... С'з -i -Н-Оц '-з3Н . . . . С'-7 »-•зН. ...O-, о" N-,Н N'+'H.... °'-2 2 о" N-H... О--, О-з ' з N-3H NoîH.On 0И »-'H N02H...O-2 "о V2 N-o-H О- "Ю2 °" О ""H N-•33. ...О-, О'-1 » - ,Н »-•!^....0l-2 -2 О'-2 N'22H.-0 '-в О-з -3 "о Ni_3H....C>i_7 NoH... О,- О'-1 »-'H N'-H... О- '2 'Ъ'-2 N,oiH О-з »2Н °- о'-3 N-3H--0l-7
ll го (5) 0 (0) ll (66) 0 (1) ll (6) 8 (0) З (49) г (г1)
No+Н....Оц О'-1 N,IH--0,g 0Ъ'-2 N-H."' 0Ъ'-з N -3H N03H....O-Í О 0Ъ-2 NoiH....O-з 2 " ®N-3H »o32. "-I О"' N-H...O-, °Ъ--2 N-H..O-, О-з ' 3 N-H....0-7 N-+Н...O-l ои N-iH... О-, N-H.... No H.... 0-3 '1 а'-3 NO3H....0-1 О"1 nhh....o-s N-o2H °l-2 - N'-'H... O-, О-з -з Ni_3H N^Hn.ohh О'-1 nhh....o--5 "-о2Н '2 О N-H....О-я N-+-H.... О13 " '1 V ""H N03H.... O-, о'-1 N-H .О", » о'Н. .. °-2 -2 О'-2 »-2Н О-, ° Ъ '-3 N^3H....Oí_7 »озН.."-i О'-1 N-lH.O-, » oH....°-2 2 О'-2 N0IH..O-3 "2 -е '1 "а--3 » -зН... °-7
0'bi-4 0"q"4 , 00(l0)
UN-4H jNMH...0l-8) K '
Таблица А Количество пента-фрагментов, найденных в белках для классов 01, 10 и 11
Класс 01
Подкласс 01-00 Подкласс 01-10
00 01 00 01
00 01 10 11 00 01 10 11 00 01 10 11 00 01 10 11
00 3849 206 96 13 76 128 2 3 688 34 244 13 6 11 8 6
10 96 0 2 0 3 1 0 0 50 0 23 0 0 0 0 0
01 2972 64 111 1 2824 3008 106 60 245 5 254 3 318 280 198 132
11 67 3 0 0 172 31 0 3 4 1 10 0 15 3 11 4
10 11 10 11
00 01 10 11 00 01 10 11 00 01 10 11 00 01 10 11
00 124 2 49 4 3 2 3 1 17 0 284 14 0 0 0 9
10 35 9 16 5 2 3 1 2 11 0 360 7 0 2 3 8
01 107 2 26 1 58 165 32 68 8 0 201 4 4 10 112 208
11 29 1 13 2 70 65 24 11 3 0 129 3 5 11 211 64
Класс 10
Подкласс 10-01 Подкласс 10-11
00 01 00 01
00 01 10 11 00 01 10 11 00 01 10 11 00 01 10 11
00 1194 302 68 11 21 198 1 16 86 35 182 49 0 12 0 29
10 301 183 17 6 47 267 0 5 42 34 70 24 2 33 2 19
01 45 45 0 0 11 275 1 9 8 3 5 2 0 13 2 26
11 34 11 1 2 28 313 0 4 4 4 2 5 2 75 5 17
10 11 10 11
00 01 10 11 00 01 10 11 00 01 10 11 00 01 10 11
00 22 11 33 23 0 5 0 7 0 5 141 57 0 1 1 24
10 198 243 236 320 13 359 11 320 25 22 3073 2919 7 21 128 2888
01 0 0 3 0 0 3 0 8 0 0 4 2 0 1 2 18
11 14 10 23 8 8 336 4 326 4 2 123 124 1 24 51 2757
Класс 11
Подкласс 11-01 Подкласс 11-11
00 01 00 01
00 01 10 11 00 01 10 11 00 01 10 11 00 01 10 11
00 81 107 2 4 3 30 0 4 102 2 7 6 0 2 1 5
10 36 27 0 0 1 210 0 0 18 11 10 8 0 2 0 6
01 174 94 2 2 37 3084 1 167 11 6 13 8 1 177 2 251
11 75 21 2 0 72 2949 1 34 6 23 9 1 8 343 9 119
10 11 01 11
00 01 10 11 00 01 10 11 00 01 10 11 00 01 10 11
00 0 3 8 8 0 2 0 0 0 0 4 3 0 0 0 6
10 20 57 29 60 1 29 1 41 5 2 166 290 0 0 4 195
01 0 1 6 5 4 32 1 69 0 0 8 10 0 6 4 67
11 23 13 36 21 18 2956 13 2759 4 4 227 112 0 128 82 12 699
Бионанотехнологии, биоэлектроника, биосенсорика
Одна из них связана с тем, что они редко встречаются, и того количества белков, которое обработано в данной выборке, недостаточно, чтобы обеспечить их появление. Другое объяснение — в них могут находиться пента-фрагменты, образующие
не 4-звенные, а 3-звенные циклы (спирали 3-10), данные о которых отсутствуют. Наконец, третье объяснение — эти фрагменты в данном подклассе по структурным причинам не используются. Так или иначе, наличие «пустых» клеток позволяет
Таблица ц Система для генерации пента-фрагментов цепных полимеров
Тип фрагментов
Ациклические
Циклические
О'' QH
00
Q+4H....X¡ .
о'
_QH
01
о'
QH....Xh4
10
Q .+4H....X1 ' О'
_Q H....X-4
11
i - 2
00
01
i -1 i - 3
00
01
10
11
00
01
10
11
00
V
X Q'-H ХЪ-2 y Q-H
ХЪ„
Q-зН
Qi+3H-Xi-1
о К
v Q-H
ХЪ,-3 Q -3H
Х-1
ОХ Q'-H-X-з
Х-Ы Q-.H
'3 3 Q.-H
Х_,
Х-
Q-+3H-X--1
Он
Q'-,H-X-3
"Ъ 1
у Q-H Ъз
Q -3H
X.'
' Q -'Н
Q-+2H -X¡J-1 0-2 Х Q"H
Х'Ь-3 Q-H
Q-+3H-X--'
9и
Q-+2H-----XQ2 '
0-2 Х Q--H
1-3--3
Q -3H
X,' О --'
Q+2H....X?2-'H"~X-5
О'-2
X Q--H
X'-ó-3 Q -3H
Q-+3H....X--'
о-'..
..."
X3 3
Q -3H
10
X'á,-'
X,?'-'H 0-2 Q+,H....XQ-2H 0--3
Q--3H
Q+3H....X-'
O-'
X-á 2 q„'H...XQ'H 0-3 Q'-H
X.-
X-
<2
. Q
4
O
Q
H....X-5
2H
3H
Q+3H....XI-' Oh
X Q'-'H....X-5 X2 2 q'+}h....x'q'h
0-3
Q--3H
Xi-'
' QH
Q-+2H....X-J -Q,-2 <-?"2H 0'-3
Q -3H
Q
Qi+3H....Xi-'
O-'
Q+2H....XQ2-' 0-2 Q„H....X¿-2H
0-3 Q -3H
O -'
QH
Q'+'H....X' 3
0-3 Q-3H
O'-' Q H Q'-H....
Q2 H
Q+'H....X-3i-2
0'-3 Qh3H
01
X-' O'-' X Q-'H
X'Ó-2 X Q-2H
Q-3H....X.7
X,'
0
Q H
-Q" 2H
и Q H....X,
X'
X Q-H....X5 X Q -2H
X'á-3
nh3н....xi-7
Qi+3H....Xi-'
O'
XQ
ó
Q
"Ó Q
X -
H....X-5 2H
H....X-7
X.' O'-' Q"H Q"+H... ■Xí-2
O'-2
X Q-H
X'Ó-3
Qí-3H....Xi-7
Q+3H....X-'
O-'
Q+2H....XÍ2-'
0-2 X Q-H X3-3
Q-3H....X-7
X'-W
o-'
n H XQi-'H....Xi-5 Qi+2H... ¿2
0-2 X Q'-H
X-ó-3
Q3H....X7
Q+3H....X'-'
O'-'
Q+2H...A'H-X-5
0-2 X Q^
Q-3H...X-7
11
XX'
Q '+1H....X,
'ó-Q'H
"Ó ' Ъ-3
n'зH...X"T
Qi+2H....Xi-1
H
xh
q+1h....x^q H
Q H....X .
X'6-
X Q-H....X-5
X'-6 "2 QMH....X,Q"lH
0"3
Q.3H....X.-
Qi+2H....XИ
0-'
X Q",H....X"5
- ---
Q„H....X,Q'-'H
01-3
Q^H.^.X^
' QH
Q+H—X-J"
o'-2
Q+'H^xS^
С3-3
Q--3H....X-.7
О+H....Xg^
Q+2H....XQ2-H
O -2 Q+'H...X,Q"-H
0"3
Q^H.^.X^
X'-U O-'
П W XQi-'H...X--5
О-2 Qi+'H....X¡ Q"-H
0-3
Q^H.^.X^
Qi+2H....Xi--O
Q"2H....X"T
i - 2
10
11
i-1 i - 3
00
01
10
11
00
01
10
11
00
X-°"H
O"2
X Q-2H..
X3 "3
Q-3H
Q"+3H....XH
x Q-'H
X-3 Q1-2H...X1 Xá-3
Q.3H
Ъ-'
Q-H....X--5
Ъ"2
, Q-2H...X4
'3-3
Q-3H
n+2h....x'-1
x qhh....x"-5
Ь"2
x q"-2h....x"6
X-á-3
XbI Q+3H....X",
,..xQ ''H Qi+-H....XQ- H Q-+2H....X.2
2H....Xi-6 Q xl3Qi -H...X"S °QI-H...x, Xi-3
"¡- 'á'3 0-3
Qi- 3H Qi-3 H Qi-3H
Qi+2H....XИ
O"'
n H nиH...X-5J
Qi+2H—X-2 0--2
v Q--2H....X",
X'á-3 Q"3H
10
X Qii--''H Xb"2 q+,H...x.qq'-2h....x'-'
Oi-3
Qi-3H
Qi+2H....X"1 Oh
X Q-'H
"'б' „ „ v Q'-2H. ...X'-B
У-ó--
. Q--H....X-5
Q+2H....X-ó Oh
X"ó"2 QI,'H....XI'Q-2H....X-'
0-3 Q'-3H
X"b' Q H XQ"'h
Qi+2H—X-2 0--2
q„h...xiq"2h....x"'
0"3 Q--3H
Q+3H... .X—
Q"H it
Q"+íH....X"-3 "" d"3 Q-.3H
XЪo
qi,2H...xqI-H...xi-5
<3-2
Q+,H....x,QI-!H....X"'
0'-3 QI3H
Q+3H...X,
O"'
Q+2H...XQ/-H...Xi-5
Oi-3
Q.-3H
01
X-' Он
X Qi-'H "2 '-2 „ QI-2H....XI6
Xi-6"2 n-H-X^
x-'
Q-H Ъ-2 Q x'h- H. X"
Qi-2H....Xi6 x ,Q' -H. .X
Oi-
Q-2H....X-T Q- H.. X-
X' X-' a Q+3H....X- x'-b Q„H...XI-' o- '
Q H.. X"5 Qi+2H....Xi-¿ . O- Q+2H X"' q„h....xq- H. X'-5 Q-+-H.—XQ2 H.. X"
'"3 -H. .X.6 Qi-2H....X,-C xó-2 v Q--H x-6 X-á-3 ¿ X"°Q -H. .X"t x Q- Xló " -H.
Q H.. X"7 QlH....X-7 Q 3H... xi-7 Q" H.. X-
11
Xb-X Q'-H
Xb"2 Q"+1H...X- Qi-2H....Xi-e
0"3
Пс-Н....^
X
OI-' X Q-H....X^ "2 "2
П+'H....X, Q-2H.."X-3
Oi-3
Q-3H....X-7
Q+3н....x--0"< X Q-H x-5 X-2 n
\н
Q-+2H....X-.2
0-2
Q,oH....X?-2H.X-^
01-3
Q-3H....X-7
Q+3H....X—
°е1н Q-+2H....X-.2 ' "
0-2
Q"+2H....X- Q-2H....X-S
01-3 Q.3H....Xi-7
Q H ПН..^
o-
Q"+1H....X- Qi--H .yi-6
Oi3
n-H-X^
Q+3H. ..Xi-
ón
Q+-H. ..Xi-5
O'-- .x,?"H .X'
Q+H..
Q13H.. .X'
i - 4
'V4
Q-4H
00
o-4
Q.4H
o"4
Q-4H....X-8
10
-4
Q H....X ¡-4
O"
Q I-4H....XI-8
01
11
Q -2H
Q -2H
Q,^H....X
Q -2H
ОС2
QoH....X,
Q i+^H...-X
0-3
Q.-.H
Q.3H
X
Q+3H....X
Oh
Q.'H
X
QoH....X,
Q'+'H... .X
Qi.'H.... X
O-
QnH...:x
0--3 QH.... X
применить предлагаемую классификацию для направленного поиска недостающих пента-фрагмен-тов. Данные по количеству фрагментов в остальных подклассах приведены в табл. 4.
В табл. 4 наблюдается ряд других закономерностей, однако детальный их анализ, с использованием пространственных представлений, будет проведен в следующей статье.
2.3. Система пента-фрагментов цепных полимеров
Конечной целью нашей работы было построение на основе данных, полученных на белках, обобщенной системы пента-фрагментов для цепных полимеров. Такая задача оказалась вполне выполнимой.
В процессе ее построения нами был учтен ряд моментов. В частности, пептидные группы 0=С—МН в структуре пента-фрагментов были заменены на формальные группы Х=В,—[4, 5]. В результате, вместо букв Q, Д, X можно представлять разные конкретные атомы и получать варианты связующих групп для цепных полимеров [2, 4, 5]. Кроме того, выделение в структуре пента-фрагмен-тов начальной, центральной и конечной частей, которое привело к выявлению восьми подклассов пента-фрагментов, позволило использовать центральную область пента-фрагментов в качестве основы для построения общей системы. При этом начальные и конечные участки будут задавать тот или иной подкласс пента-фрагментов.
С учетом этих соображений, в табл. 5 представлена обобщенная система пента-фрагментов, пригодная для их генерации при построении любого цепного полимера, содержащего группы Х1=И—QiН. Нетрудно видеть, что из нее могут быть получены все восемь подклассов пента-фрагментов (512 видов), найденных в белках. В частности, использование вариантов, где атомы при ¿-м а-атоме принимают значения 00, а при при ¿ - 4-м а-атоме 00 и 01 приводит к табл. 3. Аналогичным образом легко получить и другие варианты пента-фрагмен-тов.
Заключение
Цепные полимеры — перспективные материалы для создания систем бионической наноэлект-роники. Белки являются частным случаем таких полимеров [4, 5] и могут служить удобной моделью для поиска общих принципов их построения. В настоящей работе, исходя из представлений о молекулярной векторной машине, элементом которой является фрагмент цепного полимера, состоящий из пяти а-атомов (пента-фрагмент), проведен анализ принципов формирования системы пен-та-фрагментов белков. С этой целью было обра-
ботано 537 файлов белков, из которых с помощью специально написанных программ было получено и сортировано около 100 тысяч пента-фрагментов, сохраняющих информацию о характере водородных связей внутри основной цепи.
Каждый а-атом пента-фрагмента может образовать по две связи внутри цепи, а в целом таких связей оказалось 9 (четыре пары, плюс одна связь, которая повторяется дважды для ¿-го и ¿ - 4-го а-атома). Наличие Н-связи было обозначено цифрой 1, а ее отсутствие — цифрой 0. В результате отсортировки всего было найдено около 500 индивидуальных типов пента-фрагментов (теория предсказывает 512), которые образуют группу циклических и группу ациклических фрагментов.
Внутри каждой группы было выделено по два класса, различающихся начальной парой связей при ¿-м а-атоме (00, 01 и 10, 11). В свою очередь, каждый класс подразделяется на два подкласса на основе различий в паре переменных при ¿ - 4-м а-атоме. В классах 00 и 01 они принимают значения 00 и 10 (подклассы 00-00, 00-10, 01-00 и 0110), а в классах 10 и 11 — значения 01 и 11 (подклассы 10-01, 10-11, 11-01, 11-11). Внутри каждого подкласса содержится по 64 вида пента-фрагментов (пары переменных при ¿ - 1-м, ¿ - 2-м и ¿ - 3-м а-атомах). Сортировка пента-фраг-ментов внутри подклассов проведена по аналогии с формированием блочной структуры топологического кода, при которой вторая пара переменных является одинаковой для пента-фрагментов всего блока. На основе блочной структуры и подразделения на подклассы проведена обработка полученных данных и показано, что количество найденных фрагментов в подклассах закономерно изменяется.
Конечным результатом проведенной работы явилось построение полной системы для генерации пента-фрагментов цепных полимеров, в основе которой лежит система из четырех блоков по 16 элементов, составляющих суперматрицу из 64 пента-фрагментов. С помощью этой системы можно получить все восемь подклассов пента-фрагментов. Следует отметить, что возможны и иные принципы расположения видов пента-фрагментов при их сортировке, например на основе однобитовых переходов между соседними элементами. Однако двумерное расположение элементов все равно не решает проблему представления всех взаимосвязей пента-фрагментов. Это можно сделать только на основе пространственных представлений, изложению которых посвящена следующая статья данной серии.
Выражаю искреннюю благодарность В. В. Лучи-нину за поддержку и интерес к этой работе, а про-граммистамА. И. Беляеву и Е. Л. Демченко — за написание программ, обеспечивших реализацию данного проекта.
|Л и т е р а т у р а I
1. Пул Ч. П., Оуэне Ф. Нанотехнологии. 3-е изд. М.: Техносфера, 2008, 375 с.
2. Караеев В. А., Лучинин В. В. Введение в конструирование бионических наносистем. М.: Физматлит, 2009. 464 с.
3. Лаврикова М. А., Замотин В. В., Малишауека М. и
др. Амилоидные свойства искусственного белка аль-бебетина и его биологически активных производных. Роль электростатических взаимодействий в фиб-риллообразовании//Биохимия, 2006. Т. 71, № 3. С. 386-395.
4. Караеев В. А., Лучинин В. В. Модель топологического кодирования цепных полимеров для бионической наноэлектроники. I. Топологический код и
соответствия физических операторов триплетам кода//Биотехносфера, 2009. № 1. С. 2-10.
5. Караеев В. А., Лучинин В. В. Модель топологического кодирования цепных полимеров для бионической наноэлектроники. II. Молекулярная векторная машина и структура канонического набора физических операторов//Биотехносфера. 2009. № 2. С. 6-12.
6. Финкельштейн А. В., Птицын О. В. Физика белка. М.: Книжный дом «Университет», 2002. 376 с.
7. Демченко Е. Л., Караеев В. А. Компьютерный анализ систем сопряженных ионно-водородных связей в белках//Тез. докл. II съезда биофизиков России 23-27 августа 1999. М., 1999. Т. III. С. 946-947.
8. Караеев В. А., Демченко Е. Л. Компьютерная программа «Декодер надмолекулярной структуры белка — Протеин 3Д». СПб.: СПбГЭТУ— РАПО РФ. № 980143. 05.03. 1998.
КАК ОФОРМИТЬ ПОДПИСКУ?
• В любом отделении связи по каталогам «Роспечать» (по России) и «Прессинформ» (по Санкт-Петербургу и Ленобласти) — индекс № 45886
• Через Интернет:
по электронному каталогу «Книга-сервис» www.akc.ru — индекс № 29877
• Через редакцию, отправив по факсу (812) 312-57-68 или электронной почте [email protected] заполненный запрос счета на подписку
Запрос счета для редакционной подписки на журнал «Биотехносфера»
Полное название организации. Юридический адрес_
Банковские реквизиты,
Адрес доставки.
Срок подписки_Кол-во экз._
Тел._Факс_e-mail,
Ф. И. О. исполнителя_
Стоимость одного номера журнала 550 руб. (в том числе НДС 10 %) с добавлением стоимости доставки (простой бандеролью). К каждому номеру журнала будут приложены накладная и счет-фактура. Журнал выходит 6 раз в год.
Отдельные номера можно заказать с получением наложенным платежом. Информация о журнале — www.polytechnics.ru.
Для ознакомления высылаем по заявке бесплатно один номер журнала.
Журнал «Биотехносфера» распространяется только по подписке в России и странах СНГ.