Научная статья на тему 'О принципах построения цепных полимеров. I. система пента-фрагментов'

О принципах построения цепных полимеров. I. система пента-фрагментов Текст научной статьи по специальности «Математика»

CC BY
73
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Биотехносфера
ВАК
Область наук
Ключевые слова
ЦЕПНЫЕ ПОЛИМЕРЫ / БЕЛКИ / ПЕНТА-ФРАГМЕНТЫ / КЛАССИФИКАЦИЯ

Аннотация научной статьи по математике, автор научной работы — Карасев В. А.

В целях поиска принципов построения структуры цепных полимеров, перспективных материалов для бионической наноэлектроники проведен анализ пента-фрагментов белков, относящихся к цепным полимерам. На основе выборки из 537 файлов белков с помощью специально написанных программ получено около 100 тысяч пента-фрагментов, сортированных на 512 видов, различающихся числом водородных связей в основной цепи белка. Полученные фрагменты подразделяются на циклические и ациклические, в каждой такой группе выделены по два класса пента-фрагментов, а внутри классов по два подкласса. Представлена классификация пента-фрагментов для любых типов цепных полимеров, включая и белки, в основе которых лежит блочная суперматрица из 64 элементов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Карасев В. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On principles of construction of chain polymers. I. System of penta-fragments

Analysis of penta-fragments of proteins belonging to chain polymers is carried out in within the task of searching principles for construction of structure of chain polymers considered as perspective materials for bionical nanoelectronics. About 100 000 penta-fragments sorted into 512 types with different number of hydrogen bonds in the basic chain of protein were obtained on the basis of 537 files of proteins selected by means of the specially written programs. The obtained fragments are subdivided into cyclic and acyclic ones. In each such group two classes of penta-fragments are allocated, each class comprising two subclasses. Classification of penta-fragments is proposed which is valid for all types of chain polymers, including proteins based on the block supermatrix of 64 elements.

Текст научной работы на тему «О принципах построения цепных полимеров. I. система пента-фрагментов»

УДК 577.22 + 577.212.4 + 577.112.012 Карасев В. А., канд. биол. наук,

Санкт-Петербургский государственный электротехнический университет «ЛЭТИ»

О принципах построения цепных полимеров. I. Система пента-фрагментов

Ключевые слова: цепные полимеры, белки, пента-фрагменты, классификация

В целях поиска принципов построения структуры цепных полимеров, перспективных материалов для бионической наноэлектроники проведен анализ пента-фрагментов белков, относящихся к цепным полимерам. На основе выборки из 537 файлов белков с помощью специально написанных программ получено около 100 тысяч пента-фрагментов, сортированных на 512 видов, различающихся числом водородных связей в основной цепи белка. Полученные фрагменты подразделяются на циклические и ациклические, в каждой такой группе выделены по два класса пента-фрагментов, а внутри классов — по два подкласса. Представлена классификация пента-фрагментов для любых типов цепных полимеров, включая и белки, в основе которых лежит блочная суперматрица из 64 элементов.

Введение

В современной наноэлектронике существуют два направления развития [1]. Одно них, возникшее в начале 80-х годов прошлого века, связано с поиском принципиально новых материалов, пригодных для создания молекулярных проводов и элементной базы наноэлектроники. В рамках второго направления, называемого «бионической наноэлект-роникой», ведется поиск принципов построения и работы молекулярных биологических структур [2]. Конечная цель этого направления — создание искусственных наномолекулярных устройств, использующих биологические принципы.

Большая часть биологических устройств является белками или содержит в своем составе белки. Вопрос о принципах конструирования белков с заранее заданной структурой является одной из центральных проблем в этой области. Попытки создания искусственных белков, основанные на современных представлениях о принципах самоорганизации белков [3], носят компилятивный характер и не имеют под собой строгого теоретического обоснования.

На протяжении ряда лет нами разрабатывается теоретический подход к кодированию топологии

цепных полимеров, частным случаем которых являются белки [4, 5]. С использованием введенных понятий 4-звенного фрагмента цепного полимера (минимального фрагмента полимерных цепных структур, состоящего из пяти элементарных модулей — пента-фрагмента) и его аналога — 4-звен-ного цепного графа — были развиты представления о топологическом коде и о боковых цепях полимера как системе физических операторов. Их функциональные свойства реализуются в рамках работы молекулярной векторной машины (МВМ). В работах [4, 5] была показана применимость этих представлений к биологическому коду и каноническому набору аминокислот. Целью данной серии работ является поиск закономерностей формирования структуры цепных полимеров с учетом представлений о МВМ.

1. ПОСТАНОВКА ЗАДАЧИ И МЕТОДЫ ЕЕ РЕАЛИЗАЦИИ

1.1. Постановка задачи

Согласно развиваемым представлениям [4, 5], областью действия МВМ является 4-звенный фрагмент цепного полимера (пента-фрагмент), в котором возможно образование водородной связи его между 0Н...Хь4-атомами. Элементами МВМ являются: пента-фрагмент цепного полимера (а-ато-мы Д" - Да14), тетраэдрический Д^-атом, с которым связаны сменяемые физические операторы (в), действующие на связь и фрагмент г + 1-го

звена, имеющего направление на атом Д" + 1. Подчеркнем, что на каждой стадии синтеза полимера согласно модели происходят перемещение МВМ и срабатывание физического оператора в соответствии с тем вектором действия, для которого он предназначен.

Для решения вопросов, связанных с построением вторичных структур цепного полимера, можно использовать два подхода: чисто теоретический, при котором теория должна строиться «сама из себя», и полуэмпирический, состоящий в анализе и обобщении данных, которые предоставляют нам какие-либо конкретные цепные полимеры. Частным случаем цепных полимеров являются белки. Полагая, что второй подход может быть более быстрым и продуктивным, последующую теоретиче-

скую разработку мы проводили на основе анализа белковых структур.

Обратимся к структуре белков и рассмотрим взаимоотношения между старым и вновь синтезированным пента-фрагментами белка. Для этой цели в качестве примера выпишем слева фрагмент из шести аминокислот (рис. 1).

Из анализа свойств нового и старого фрагментов можно сделать следующие выводы: фрагменты г — I — 4 и I — 1 — г - 5 перекрываются (эта область выделена курсивом) — четыре аминокислоты у них общие; между фрагментами возможны различия, которые могут касаться особенностей структуры связей этих фрагментов в структуре белка. Это позволяет предполагать существование некоего множества различающихся между собой пента-фрагментов, образующих систему. С другой стороны, то, что фрагменты перекрываются, допускает образование связной цепи фрагментов. Это позволяет предполагать существование ряда стадий в процессе формирования вторичной структуры, которые могут быть каким-либо образом описаны.

Таким образом, в рамках модели МВМ обозначилась проблематика данной серии работ: анализ пента-фрагментов как системы и поиск алгоритмов построения вторичных структур. Настоящая работа посвящена анализу и систематизации пен-та-фрагментов в белках.

Фрагмент белка из шести аминокислот i Abc i - 1 Bed i - 2Cde i - 3 Def i- 4 Efg i - 5 Fgh

i — i-4 новый фрагмент i Abc i - 1 Bed i - 2 Cde i - 3 Def i-4 Efg

i — l — i — 5 старый фрагмент

i — l Bed i — 2 Cde i — 3 Def i — 4 Efg i - 5 Fgh

Рис. l

Взаимоотношения между старым и новым фрагментами белка

1.2. Способ описания связей пента-фрагментов

и условия проведения их систематизации

Для систематизации пента-фрагментов необходимо иметь наглядное их представление и описание связей в структуре белка. Один из способов описания конформации белка основан на задании двухгранных углов в области а-углеродного атома [6]. Однако для анализа связей пента-фрагментов этот подход оказался неудобным. С другой стороны, при разработке способов представления систем спряженных ионно-водородных связей (ССИВС) в работе [7] были предложены файлы, содержащие в линейной форме полное описание всех водородных связей белка. Этот способ описания связей в структуре белка оказался очень удобным для задания структуры связей пента-фрагментов и был использован в данной работе. В табл. 1 в левом столбце показан пример типичного спирального участка, полученного помощью программы Protein 3D [8] на основе файла 1a4i (фолат-зависимой дегидрогеназы/циклогид-ролазы). Обратим внимание, что в данном примере и далее в пента-фрагментах расположение и нумерация аминокислот идут снизу вверх, что обусловлено особенностями роста полипептидной цепи, который происходит со стороны «головы».

Из табл. 1 видно, что приведенный фрагмент имеет ряд характерных особенностей: начальные и конечные участки спирали содержат меньшее число Н-связей по сравнению с центральной областью; начальные участки образованы карбонильными группами пептидных связей основной цепи, а конечные — аминогруппами этих связей; центральная область фрагментов содержит большое число О, NH-групп.

Все эти особенности сохраняются и при последовательном выделении пента-фрагментов на этом спиральном участке (в табл. 1 справа). Фрагменты начала спирали обозначены буквой В (от Begin, англ. — начало) с индексами от 1 до 7, централь-

Таблица ll

Выделение пента-фрагментов на спиральном участке белка 1a4i и их обозначение

Исходный спиральный участок

Выделенные пента-фрагменты

Конец спирали

Обо-значение

Середина спирали

Обо-значение

Обо-

Начало спирали зна-

чение

151 GLY O - 155 LEU N B6

151 GLY N 147 CYS O

151 GLY

150 LYS O - 154 GLU N

150 LYS N - 146 PRO O

150 LYS

149 PRO O - 153 LEU N

149 PRO

148 THR O 152 CYS N

148 THR

147 CYS O - 151 GLY N

147 CYS

150 LYS O - 154 GLU N B5

150 LYS N - 146 PRO O

150 LYS

149 PRO O - 153 LEU N

149 PRO

148 THR O 152 CYS N

165 GLY 164 ALA 163ILE 162 PRO 161 VAL 160 GLY 159 THR N 159 THR 158 GLU N 158 GLU 157 LYS N ■ 157 LYS 156 ILE N -156ILE 155 LEU O 155 LEU N 155 LEU 154 GLU O 154 GLU N 154 GLU

- 155 LEU O

- 154 GLU O 153 LEU O 152 CYS O

- 159 THR N

- 151 GLY O

- 158 GLU N

- 150 LYS O

163 ILE 162 PRO 161 VAL 160 GLY 159 THR N 159 THR

E7

155 LEU O

157 LYS N -157 LYS 156 ILE N -156 ILE 155 LEU O 155 LEU N 155 LEU 154 GLU O 154 GLU N 154 GLU 153 LEU O 153 LEU N 153 LEU

153 LEU O 152 CYS O

- 159 THR N

- 151 GLY O

- 158 GLU N

- 150 LYS O

- 157 LYS N

- 149 PRO O

E1

162 PRO 161 VAL 160 GLY

159 THR N - 155 LEU O 159 THR

158 GLU N - 154 GLU O

E6

156 ILE N - 152 CYS O 156 ILE

155 LEU O - 159 THR N 155 LEU N - 151 GLY O 155 LEU

154 GLU O - 158 GLU N

C3

Продолжение табл. 1

Исходный спиральныйучасток

Выделенные пента-фрагменты

Конец спирали

Обо-значение

Середина спирали

Обо-значение

Начало спирали

Обо-значение

153 ЬЕи О 153 ЬЕи N 153 ЬЕи 152 СУв О 152 СУв N 152 СУв 151 йЬУ О 151 йЬУ N 151 йЬУ 150 ЬУв О 150 ЬУв N 150 ЬУв 149 РВД О 149 РВД 148 ТНИ О

148 ТНИ 147 СУв О 147 СУв

149 РО О -146 РВД 1451ЬЕ 144 РНЕ 143 СУв 142 АвР 141 АвN 140 ЬЕи

- 157 ЬУв N

- 149 РВД О

- 156 1ЬЕ N

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- 148 ТНИ О

- 155 ЬЕи N

- 147 СУв О

- 154 вьи N

- 146 РВД О

- 153 ЬЕи N

- 152 СУв N

- 151 вЬУ N 150 ЬУв N

158 вьи

Е6

1540Ш N -154 вьи 153 ЬЕи О -153 ЬЕи N 153 ЬЕи 152 СУв О -152 СУв N -152 СУв

150 ЬУв О

157 ЬУв N 149 РВД О

156 1ЬЕ N 148 ТНИ О

С3

148 ТНИ

147 СУв О - 151 вЬУ N 147 СУв

146 РВД О - 150 ЬУв N 146 РВД

В5

161 УАЬ Е5 155 ЬЕи О - 159 ТНИ N С2 149 РВД О

160 вЬУ 155 ЬЕи N 151 вЬУ О 149 РВД

159 ТНИ N - 155 ЬЕи О 155 ЬЕи 148 ТНИО

159 ТНИ 154 вьи О - 158 вьи N 148 ТНИ

158 вьи N - 154 вьи О 154 вьи N 150 ЬУв О 147 СУв О

158 вьи 154 вьи 147 СУв

157 ЬУв N 153 ЬЕи О 153 ЬЕи О - 157 ЬУв N 146 РВД О

157 ЬУв 153 ЬЕи N 149 РВД О 146 РВД

153 ЬЕи 145 1ЬЕ

152 СУв О - 156 1ЬЕ N

152 СУв N - 148 ТНИ О

152 СУв

151 вЬУ О - 155 ЬЕи N

151 вЬУ N - 147 СУв О

151 вЬУ

160 вЬУ Е4 154 вьи О - 158 вьи N С2 148 ТНИО

159 ТНИ N - 155 ЬЕи О 154 вьи N 150 ЬУв О 148 ТНИ

159 ТНИ 154 вьи 147 СУв О

158 вьи N - 154 вьи О 153 ЬЕи О - 157 ЬУв N 147 СУв

158 вьи 153 ЬЕи N 149 РВД О 146 РВД О

157 ЬУв N - 153 ЬЕи О 153 ЬЕи 146 РВД

157 ЬУв 152 СУв О - 156 1ЬЕ N 145 1ЬЕ

156 1ЬЕ N - 152 СУв О 152 СУв N - 148 ТНИ О 144 РНЕ

156 1ЬЕ 152 СУв

151 вЬУ О - 155 ЬЕи N

151 вЬУ N - 147 СУв О

151 вЬУ

150 ЬУв О - 154 вьи N

150 ЬУв N - 146 РВД О

150 ЬУв

159 ТНИ N - 155 ЬЕи О Е3 153 ЬЕи О - 157 ЬУв N С1 147 СУв О

159 ТНИ 153 ЬЕи N 149 РВД О 147 СУв

158 вьи N - 154 вьи О 153 ЬЕи 146 РВД О

158 вьи 152 СУв О - 156 1ЬЕ N 146 РВД

157 ЬУв N 153 ЬЕи О 152 СУв N - 148 ТНИ О 145 1ЬЕ

157 ЬУв 152 СУв 144 РНЕ

156 1ЬЕ N - 152 СУв О 151 вЬУ О - 155 ЬЕи N 143 СУв

156 1ЬЕ 151 вЬУ N - 147 СУв О

155 ЬЕи О 159 ТНИ N 151 вЬУ

155 ЬЕи N - 151 вЬУ О 150 ЬУв О - 154 вьи N

155 ЬЕи 150 ЬУв N - 146 РВД О

150 ЬУв

149 РВДО- 153 ЬЕи N

149 РВД

158 вьи N - 154 вьи О Е2 152 СУв О - 156 1ЬЕ N В7 146 РИОО

158 вьи 152 СУв N - 148 ТНИ О 146 РИО

157 ЬУв N 153 ЬЕи О 152 СУв 145 1ЬЕ

157 ЬУв 151 вЬУ О - 155 ЬЕи N 144 РНЕ

156 1ЬЕ N - 152 СУв О 151 вЬУ N - 147 СУв О 143 СУв

156 1ЬЕ 151 вЬУ 142 АвР

155 ЬЕи О 159 ТНИ N 150 ЬУв О - 154 вьи N

155 ЬЕи N - 151 вЬУ О 150 ЬУв N - 146 РВД О

155 ЬЕи 150 ЬУв

154 вьи О 158 вьи N 149 РВДО- 153 ЬЕи N

154 вьи N - 150 ЬУв О 149 РВД

154 вьи 148 ТНИО - 152 СУв N

148 ТНИ

В4

152 СУв N

151 вЬУ N

150 ЬУв N

152 СУв N

151 вЬУ N

В3

151 вЬУ N

150 ЬУв N

В2

В1

ной области спирали — буквой С (Center) с индексами 1-3, а конца спирали — Е (End), так же как и фрагменты начала спирали, с индексами от 1 до 7. При таком выделении видно, что возникают своеобразные серии пента-фрагментов, причем внутри серии каждый из фрагментов обладает как общими для данной серии особенностями, так и индивидуальными. Так, во фрагментах начала спирали последовательно на единицу увеличивается число водородных связей, образуемых карбонильной группой (фрагменты В1 — В4). Затем увеличивается число связей образуемых одновременно атомами О и N (фрагменты В5-В7, С1). В центральных фрагментах (С2) количество связей О и NH не меняется. Затем во фрагментах конца спирали количество связей О и NH постепенно снижается (фрагменты С3, El — Е3). В конце спирали на каждом этапе на единицу снижается количество связей, образованных аминогруппой (Е4 — Е7). Наличие единичных различий между пента-фрагмен-тами создает предпосылки для их последующей классификации.

Использование файлов других белков, обработанных аналогичным образом программой Protein 3D, также позволяет получить из них многочисленные пента-фрагменты, которые можно сгруппировать в папки с общим названием. Однако для их сопоставления необходимо напомнить стандартные обозначения номеров атомов.

1.3 Форма записи, нумерация атомов

пента-фрагментов и их связей

Принято, что рассматриваемый первый а-угле-родный атом в белке обозначается буквой i, тогда ко всем предыдущим ему номерам атомов и связям добавляют цифры со знаком «-», а ко всем последующим — со знаком «+» [6]. Рассмотрим с этих позиций пента-фрагмент центральной области спирали (С2) из файла 1a4i в форме записи в файлах программы Protein 3D, имеющий максимальное число водородных связей (рис. 2, а).

Как видно на этой схеме, все аминогруппы (NH) образуют водородные связи с атомами кислорода (О) групп 0=C—NH, расположенных позади анализируемых групп (154 GLU N — 150 LYS О, 153 LEU N — 149 PRO О и т. д.). Атомы кислорода также образуют водородные связи, но с NH-груп-пами пептидных связей, расположенных впереди (154 GLU О — 158 GLU N, 153 LEU О — 157 LYS N и т. д.). Эта запись в целом правильно отражает все связи. Однако в таком представлении имеется ряд недостатков: все связи записаны с одной стороны, хотя на самом деле они расположены с разных сторон от О=С—NH-групп; пара связей, принадлежащих к одному а-углеродному атому расположена между двумя разными а-углеродными атомами, тогда как она должна быть расположена по разные стороны от своего а-углеродного атома. На рис. 2, б мы воспроизвели в общих чертах эту

а) 154 GLU O - 158 GLU N 154 GLU N - 150 LYS O 154 GLU

153 LEU O- 157 LYS N 153 LEU N - 149 PRO O 153 LEU

152 CYS O - 156 ILE N 152 CYS N - 148 THR O 152 CYS

151 GLY O - 155 LEU N 151 GLY N - 147 CYS O 151 GLY

150 LYS O - 154 GLU N 150 LYS N - 146 PRO O 150 LYS

N,H... Oj.4

Ni+зН-Ои

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

О

NI+2H...O,2

о

Nl2H...Ous

Nj+fH... Oj.3

о

NtfH... Of.7

wfh-ом la

о

Nh4H...0^8

Рис. 21 Пента-фрагмент центральной области спирали (С2)

запись связей, но в обобщенном виде, заменив конкретные значения цифр описанными выше общепринятыми обозначениями: атомы фрагмента обозначены от i-го до i - 4-го, показаны водородные связи NH с ОЬ4...ОЬ8 и С=0 с HNi + 4...HNr При этом мы устранили отмеченные выше недостатки записи рис. 2, а. Обратим внимание, что связь _ 4 повторя-

ется дважды — в i-м и i - 4-м положениях (показана в прямоугольнике), что отражает образование цикла с водородной связью в этом фрагменте. Аналогичная номенклатура связей сохраняется и для всех других вариантов пента-фрагментов, изменяться будет лишь число образуемых Н-связей.

1.4. Методы получения и сортировки пента-фрагментов

Для получения пента-фрагментов нами были использованы разнообразные по структуре белки из Protein Data Bank — как а-спиральные, |3-струк-турные, так и весь спектр разнообразных форм, сочетающих оба типа вторичных структур. В процессе обработки, помимо программы Protein 3D, был использован ряд специально разработанных компьютерных мини-программ, написанных совместно с программистом А. И. Беляевым.

Процесс обработки исходных PDB-файлов состоял в следующем. С помощью программы Protein 3D были получены текстовые файлы, описывающие структуру систем пептидно-водородных связей основной цепи белка (N;H...O;_4). Далее программаInvertor переводила запись в файле в направлении снизу вверх. Затем с помощью программы Cutter проводили нарезку всех файлов на пента-фрагменты, начинающиеся с заданной аминокислоты, причем для каждой из 20 аминокислот, содержащихся в белке, эта процедура повторялась. В результате мы получали 20 групп пента-фрагментов. В зависимости от положения в различных типах структур, эти фрагменты имели разное число строк, поэтому на следующем этапе, с помощью программы Selector была проведена сортировка пента-фрагментов по числу строк. Последним этапом в серии процедур была сортировка пента-фрагментов, имеющих одинаковое

Бионанотехнологии, биоэлектроника, биосенсорика

число строк, на определенные типы с одинаковым расположением связей. Это достигалось с помощью программы Separator, которая допускала для поиска и выделения того или иного типа фрагментов набор различных значений связей: N, О и прочерк ( — ), означавший отсутствие связей. Таким образом, мы получили набор сортированных по числу строк и расположению водородных связей пента-фраг-ментов. Далее на основе сопоставления этих фрагментов с теми, которые получаются при ручной обработке (пример — в табл. 2), им присваивали условные обозначения, например Bl, B2, B3, C1 и т. д., которые в данной работе не приводятся.

2. РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ

2.1. Принципы сортировки и классификации пента-фрагментов

Всего в данной работе было обработано 537 файлов белков, из которых было получено около 100

тысяч пента-фрагментов. В результате сортировки всего было найдено около 500 индивидуальных типов пента-фрагментов (как потом оказалось, теоретически их должно быть 512), на основе которых были сформированы две группы, содержащие по два класса, каждый из которых состоит из двух подклассов. В подклассах содержатся по 64 вида пента-фрагментов.

В процессе обработки было обращено внимание, что наличие или отсутствие водородной связи можно описать с помощью двоичной системы: 0 — это отсутствие Н-связи, 1 — наличие Н-связи. При этом порядок их написания был связан с принятой нами общей нумерацией пента-фрагментов снизу вверх.

Например, если снизу вверх в паре при а-атоме

n mh....o^

идет связь N.H, а затем N^H..^:

70

n h

то читается как 01, а если идет NH..^ ,, а затем

oj ill

О.: ,то такая пара читается как 10.

1 n h----oi-4

Принципы классификации пента-фрагментов

наглядно показаны в табл. 2. Предварительно от-

Таблица 2\ Принципы классификации пента-фрагментов

Группа

Ациклические фрагменты — 0

Циклические фрагменты — 1

Класс

00

01

10

11

Подкласс

00-00

01-00

10-01

11-01

00

О,

01

10

11

i - 1 i - 2 i- 3

i - 4

00

Oi.4 (

i-4

n;.4h

00

n,H....O,.4 Jè

n,4h

01

n,H....0,.4

i-4

nmh

01

Подкласс

00-10

01-10

10-11

11-11

00

01

О,

10

11

i - 1 i - 2 i - 3

i - 4

n

i-4 N. ¿H O.,

10

i-40Nh4H....Oh(

10

Ni

-P

11

-P

11

метим, что для удобства анализа пента-фрагменты представлены в таблице состоящими из трех частей: начальной (¿-й а-углеродный атом и его связи), центральной (а-атомы ¿-^¿-2, ¿-Зиих связи), и конечной (а-атом ¡-4и его связи).

В табл. 2 пента-фрагменты разделены на две группы — циклические (обозначение 1) и ациклические (обозначение 0), что связано с наличием или отсутствием водородной связи между ^Н при ¿-м а-углеродном атоме и 0| 4 при ¿ - 4-м а-угле-родном атоме (М.Н...0._4) [4, 5]. Для циклических фрагментов, как упоминалось в разделе 1.З, связь ^Н...0Ь4 повторяется как при ¿-м а-углеродном атоме, так и при ¿ - 4-м (в табл. 2 она находится в прямоугольнике).

В каждую группу вошло по два класса фрагментов, различающихся числом водородных связей при ¿-м а-атоме — 00 и 01 в группе 0 и 10, 11 — в группе 1. Внутри каждого класса имеется по два подкласса фрагментов, различающихся числом водородных связей при ¿-4-м а-углеродном атоме. Для классов 00 и 01 это пары переменных — 00 и 10. Соответственно, названия подклассов будут обозначаться как 00-00, 00-10 и 01-00, 01-10. Аналогично, для классов 10 и 11 в положении ¿ - 4 будут пары переменных 01 и 11, а названия подклассов — 10-01, 10-11 и 11-01, 11-11. Таким образом, в качестве наименования подкласса были приняты ¿-я и ¿ - 4-я пары переменных. Центральная часть пента-фрагмента, приведенная в табл. 2 для пар переменных 11 11 11, внутри каждого подкласса является вариабельной и содержит по 64 вида пента-фрагментов.

2.2. Классификация пента-фрагментов белков

Дальнейшую классификацию пента-фрагментов проводили отдельно для каждого подкласса. В качестве примера в табл. З мы привели такую классификацию для класса 00, который содержит два подкласса групп — 00-00 и 00-10. Мы поместили их в одной таблице в целях последующего сравнения. Общими для всех фрагментов каждого подкласса являются пары переменных при ¿-м и ¿ - 4-м а-углеродном атомах, поэтому они вынесены соответственно в начало и конец таблицы. В левом столбце таблицы обозначены все номера а-атомов.

В основу классификации центральной части пента-фрагментов (а-атомы ¿-1,¿-2и¿-З) было положено сходство их вариаций с вариациями модели топологического кода [4]. Напомним, что в модели кода конформации 4-звенного графа формировали блоки, имевшие общие значения во второй паре переменных (х3х4): 00, 01, 10 и 11. По аналогии с этим в первый блок классификации центральной части пента-фрагментов подгруппы 00 мы поместили фрагменты, в которых отсутствовали связи атома О и группы при ¿ - 2-м а-угле-

родном атоме (блок 00), во второй блок (01) — фрагменты, в которых группа N. _ 2Н не образует Н-связь, а атом 0._2 — образует, в третий (10) — фрагменты, в которых Н-связь образует группа N. _ 2Н, а атом атом 0. _ 2 — не образует, и в четвертый — фрагменты, в которых водородные связи образуют как атом 0. _ 2, так и группа N. _ 2Н.

Таким образом, в результате мы получили классификацию центральной части пента-фрагментов подгруппы 00, имеющую блочную структуру (табл. З) — блоки 00, 01, 10 и 11, образованные общим типом связи при ¿ - 2-м а-углеродном атоме. Внутри блоков в строках расположены пента-фрагменты, имеющие общую пару переменных в ¿ - 1-положении, а в столбцах — пента-фрагменты, имеющие общую пару переменных в ¿ - З-положении. В результате такого расположения в клетках, расположенных симметрично относительно главной диагонали блока, оказались фрагменты, имеющие симметричные относительно ¿ - 2-го а-углеродного атома гомологичные Н-связи. Например, в столбце 01 в строке 00 блока 00 есть фрагмент фрагмент, в котором атом 0. _ 3 образует Н-связь с группой N. + 1Н, а в строке 10 и столбце 00 — пента-фрагмент, в котором аналогичную связь образует группа N. _ 1Н с атомом 0._ 5, и эти две связи симметричны относительно ¿ - 2-го а-углеродного атома. На главных диагоналях блоков оказались фрагменты, у которых симметрично относительно ¿ - 2-го а-углеродного атома расположены пары гомологичных Н-связей. Например, такая симметрия имеется в пента-фрагменте, который находится на пересечении столбца 01 и строки 10, между парой связей Ы.^1Н...0. 3 иМ ,Н...0. 5 в блоке 00.

1+1 I_ 3 I_ 1 I _ 5

Приведенные в табл. З количественные данные о числе найденных пента-фрагментов позволяют сделать ряд наблюдений. Так, максимальное число пента-фрагментов в подклассе 00-00 наблюдается для первого фрагмента каждого блока (слева вверху). Количество фрагментов уменьшается как сверху вниз, так и слева направо и минимально (вплоть до отсутствия) у фрагментов, находящихся справа внизу.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Количество фрагментов снижается парами: сначала много — в первом столбце или строке, затем меньше — во втором столбце или строке. Затем снова много и меньше, но количество их снижено по сравнению с первой парой (см., например, пары столбцов 00, 01 и 10, 11, а также пары строк 00, 10 и 01, 11 в блоках 01 или 10). В подклассе 00-10, в котором N. _ 4Н образует Н-связь с 0. _ 8, число пента-фрагментов существенно ниже. В табл. З они приведены в скобках. При этом, аналогично, пары с большим и меньшим числом фрагментов имеются как в столбцах, так и в строках.

В таблице имеются клетки, в которых пента-фрагменты в данной подгруппе не представлены (например, их много в блоке 00). Их отсутствие может быть объяснено несколькими причинами.

Таблица з\ Классификация пента-фрагментов подклассов GG-GG и GG-1G

i 0|O ' 00 NH

i- г 00 01

i -З i- l 00 Ol 10 ll 00 01 10 ll

00 5г 078 (З598) 15З1 (го4) l648 (г7ог) l96 (85) l648 (1ог) З77 (г8) 54 (186) l6 (гг)

0Ъ'-1 n- -h 0'b¡-2 o n -2h n -3H 0ъ-1 МИН nOIh о-з »f Q'-3 n -3h 0ъ-i »'н о-2 п о-з ^ »-н-о-7 O-i , О» О:, О NoiH. .. .О-з °N -н 2Н зН.... С-7 с-I -1 Q'' ЫИН n+23 С-2 2 О" n-'h °Ъ'-- n-3h о-i -1 n--h n-+Jh... с -2 .2 О"2 noih о-з n''h O h3Q--' n-3h с" -1 ®nmh n'+'h °i-2 ,2 О"2 nlJ-Í °-з »-3 »-h о-7 с "i -i n--h n-O2h 2 О 2 n.'H n 01h...o -з О Nh3H....Oh7

lO !54г (го9) г1 (1) г5 (15З) 0 (1) 6г (6) 10 (З) 0 (7) 0 (4)

n--h.... o-, "-O" N'-2H 0-3 ,-3 N'-3H оъ,-1 n-lh.o-, 0Ъ'-2 n-2H » oih 0-з N О »-зн °'-Io'-i N -2H N'-3H....° -7 °Ъ'-1 N-iH-Os No,H Оз »'f О'-3 N,'H--0,7 °Ъ'-1 n„н—с„ » O2h °--2 2 О' -2 »-'h с-з -О' n -3н о-- -1 0 »--H.. .. О-, N-oH.... 0--2 -2 о'-2 N-'H N'+'H....О-3 -з ®Nh3H о'-1 n --н..0-, "он 0-2 2 О'-2 n-2н 0'b,3 n33h о-7 °"io'-i n-O2h 2 О'-2 n-h noih...о-з '2 О »-зн...0-7

Ol !6г6 (95) гг (5) З1 (76) г (0) 457 (47) l97 (г5) 9 (З0) г (1г)

»O3h о-, О »-,h 0'-Ъ,-2 n-'h 0 -Ь'-з n -3h N 03Н...О - О1 N-Н N Ol H О N -3H NозН...°Н О1-' N--H °Ъ'-2 N-2H О-з , , N h3H....°h7 N озН.Оц OhI N-,Н °-'О-2 »-2Н Nо-Н.О-з ^ ^»ззН....° -7 N03H....O-- »--H N'+'H.i-' .2 О' -2 N -2Н "Ъ-з »-зН П-оН.Он О'-1 N-+2H....°'2 '2 О »-2H N'+iH... О-з о'-3 »-зН Nl+3H....0--I О1 '" N--H N'+'H... С'-2 -2 О N-2H о "3 -3 о'3 »-H ... О'4 N-'H "оН...° "2 . 2 О'-2 N-Н N'+lH... .О-з " О N-3H.... О-

ll l94 (9) 0 (0) З (З) 0 (0) l4 (0) 6 (0) 0 (З) l (0)

N 03H....O - О N-lH....0-, "-'О-' »-2H 0Ъ-2 N-зН »озН.Оц а-1 мИн....о-5 0-Ъ-2 N 2 NoiH....O'-з ¡Ц О N 3 NoiH.Ou О'-1 "„Н.С, °-Ъ--2 N-2H ""о'-3 N-^....С-7 NoiH.Ou О'-1 NИH--0,g °ъ'-2 N-2 '1 Ъ'-3 N -зН... О '-7 N 03H...O i-i , О'-1 NнH--0"S » O'H.. ..°--2 О'-2 N 22н О-з '3 О'-3 N-H »'•3Н.°И О-1 '--H.... O-, N'+'H... 0-2 , О'-2 »-H N-H....0'-з 12 '1 "о-3 »-зН NoH.... О,- '3 '"а'-1 "цН.О", N O2H . . °'-2 -1 о'-2 n"2h О "3 -3 О'3 »"зН...°"7 N03H....O-1 '3 'о'-1 N-1H....0-, "о'Н.... -2 N-23 N-+-H....О-з " 1 о--3

i- г lO ll

i -З i- l 00 01 10 ll 00 01 10 ll

00 l6l? (l54) 65 (8) З01 (г718) З5 (155) го4 (6) 1З (З) гг (76) l6 (З9)

0-ь-1 »-h 0Ъ'-2 NrJ4....0Kl о-з ' з о о -i -i ^»цН О-2 О NoH.O -з »г21-.0 *N3H °Ъ'-1 n--h °Ъ'-2 n-'h °-, о »-зн 0-7 0-Ъ-1 ыин °Ъ'-2 noih 03 »f 0- 0nhh с-7 o'i -1 %ih n '•¡h.. ..о-2 12 Q> '2 о-з 'з "о n-зн с"1 "1 n-O2h °-2 2 »-•-h...0-3 --- ®Mh3H о", " ®»ин "о'н "m 2 О'-2 n-2h...0-, °Ъ'-3 »-h 0-7 с-1 "1 ®пин n-O2h 2 noih. о" " "" О'-3 n-h.... с-

lO г9? (69) З9 (г) го5 (г8З7) l4 (1г8) З6 (З) г7 (З) г7 (14г) 6 (50)

o'-l ', о 1 n-lh-o-, o -2 -2 о'-2 n-2h..0-6 °-3 "3 n-3h о-i , О N-iH-..О -, "ъ-2 N-2H....0--»о-Н.О-з 3 О^зН n-h °-, °ъ-2 n-2h....0-6 n-3h...0-7 0io'H N ИН....°-, °"а-2 IN-2H...0-6 No-H....О-з Ц аМззН...0 - о -1 , О'-1 NHH....OKI n 02н °'2 О' -2 n-2н.... с-- с - - з ь-3 °ъ'-1 NhH....OKi »о'Н °4Q--2 n о,н о-з »f °"6 ^n^h 0NhiH....OKl n -O2h q -2 N -rh—o-ß с-з -з О -3 n -32... о-7 с", - an"ih.... o-, n-h о- 2 О'2 "oih... с- ■3 О'-3 n-зн.. .. 0-7

Ol З9 (l7) l (0) г1 (174) l (0) 1З (6) го (0) l (г9) 7 (г7)

» o3H....0-, o'-1 N -H 0-20'-2 N-2H.0-6 0'-3 '-3 N-H N03H....OH ', "V NoiH О у "-зН N'+Н....О' i V N-,H °-Ъ-2 о-з , ч -3о N-33....0 ^ NоН.°И оЛ О N'+'H.... С'з -i -Н-Оц '-з3Н . . . . С'-7 »-•зН. ...O-, о" N-,Н N'+'H.... °'-2 2 о" N-H... О--, О-з ' з N-3H NoîH.On 0И »-'H N02H...O-2 "о V2 N-o-H О- "Ю2 °" О ""H N-•33. ...О-, О'-1 » - ,Н »-•!^....0l-2 -2 О'-2 N'22H.-0 '-в О-з -3 "о Ni_3H....C>i_7 NoH... О,- О'-1 »-'H N'-H... О- '2 'Ъ'-2 N,oiH О-з »2Н °- о'-3 N-3H--0l-7

ll го (5) 0 (0) ll (66) 0 (1) ll (6) 8 (0) З (49) г (г1)

No+Н....Оц О'-1 N,IH--0,g 0Ъ'-2 N-H."' 0Ъ'-з N -3H N03H....O-Í О 0Ъ-2 NoiH....O-з 2 " ®N-3H »o32. "-I О"' N-H...O-, °Ъ--2 N-H..O-, О-з ' 3 N-H....0-7 N-+Н...O-l ои N-iH... О-, N-H.... No H.... 0-3 '1 а'-3 NO3H....0-1 О"1 nhh....o-s N-o2H °l-2 - N'-'H... O-, О-з -з Ni_3H N^Hn.ohh О'-1 nhh....o--5 "-о2Н '2 О N-H....О-я N-+-H.... О13 " '1 V ""H N03H.... O-, о'-1 N-H .О", » о'Н. .. °-2 -2 О'-2 »-2Н О-, ° Ъ '-3 N^3H....Oí_7 »озН.."-i О'-1 N-lH.O-, » oH....°-2 2 О'-2 N0IH..O-3 "2 -е '1 "а--3 » -зН... °-7

0'bi-4 0"q"4 , 00(l0)

UN-4H jNMH...0l-8) K '

Таблица А Количество пента-фрагментов, найденных в белках для классов 01, 10 и 11

Класс 01

Подкласс 01-00 Подкласс 01-10

00 01 00 01

00 01 10 11 00 01 10 11 00 01 10 11 00 01 10 11

00 3849 206 96 13 76 128 2 3 688 34 244 13 6 11 8 6

10 96 0 2 0 3 1 0 0 50 0 23 0 0 0 0 0

01 2972 64 111 1 2824 3008 106 60 245 5 254 3 318 280 198 132

11 67 3 0 0 172 31 0 3 4 1 10 0 15 3 11 4

10 11 10 11

00 01 10 11 00 01 10 11 00 01 10 11 00 01 10 11

00 124 2 49 4 3 2 3 1 17 0 284 14 0 0 0 9

10 35 9 16 5 2 3 1 2 11 0 360 7 0 2 3 8

01 107 2 26 1 58 165 32 68 8 0 201 4 4 10 112 208

11 29 1 13 2 70 65 24 11 3 0 129 3 5 11 211 64

Класс 10

Подкласс 10-01 Подкласс 10-11

00 01 00 01

00 01 10 11 00 01 10 11 00 01 10 11 00 01 10 11

00 1194 302 68 11 21 198 1 16 86 35 182 49 0 12 0 29

10 301 183 17 6 47 267 0 5 42 34 70 24 2 33 2 19

01 45 45 0 0 11 275 1 9 8 3 5 2 0 13 2 26

11 34 11 1 2 28 313 0 4 4 4 2 5 2 75 5 17

10 11 10 11

00 01 10 11 00 01 10 11 00 01 10 11 00 01 10 11

00 22 11 33 23 0 5 0 7 0 5 141 57 0 1 1 24

10 198 243 236 320 13 359 11 320 25 22 3073 2919 7 21 128 2888

01 0 0 3 0 0 3 0 8 0 0 4 2 0 1 2 18

11 14 10 23 8 8 336 4 326 4 2 123 124 1 24 51 2757

Класс 11

Подкласс 11-01 Подкласс 11-11

00 01 00 01

00 01 10 11 00 01 10 11 00 01 10 11 00 01 10 11

00 81 107 2 4 3 30 0 4 102 2 7 6 0 2 1 5

10 36 27 0 0 1 210 0 0 18 11 10 8 0 2 0 6

01 174 94 2 2 37 3084 1 167 11 6 13 8 1 177 2 251

11 75 21 2 0 72 2949 1 34 6 23 9 1 8 343 9 119

10 11 01 11

00 01 10 11 00 01 10 11 00 01 10 11 00 01 10 11

00 0 3 8 8 0 2 0 0 0 0 4 3 0 0 0 6

10 20 57 29 60 1 29 1 41 5 2 166 290 0 0 4 195

01 0 1 6 5 4 32 1 69 0 0 8 10 0 6 4 67

11 23 13 36 21 18 2956 13 2759 4 4 227 112 0 128 82 12 699

Бионанотехнологии, биоэлектроника, биосенсорика

Одна из них связана с тем, что они редко встречаются, и того количества белков, которое обработано в данной выборке, недостаточно, чтобы обеспечить их появление. Другое объяснение — в них могут находиться пента-фрагменты, образующие

не 4-звенные, а 3-звенные циклы (спирали 3-10), данные о которых отсутствуют. Наконец, третье объяснение — эти фрагменты в данном подклассе по структурным причинам не используются. Так или иначе, наличие «пустых» клеток позволяет

Таблица ц Система для генерации пента-фрагментов цепных полимеров

Тип фрагментов

Ациклические

Циклические

О'' QH

00

Q+4H....X¡ .

о'

_QH

01

о'

QH....Xh4

10

Q .+4H....X1 ' О'

_Q H....X-4

11

i - 2

00

01

i -1 i - 3

00

01

10

11

00

01

10

11

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

00

V

X Q'-H ХЪ-2 y Q-H

ХЪ„

Q-зН

Qi+3H-Xi-1

о К

v Q-H

ХЪ,-3 Q -3H

Х-1

ОХ Q'-H-X-з

Х-Ы Q-.H

'3 3 Q.-H

Х_,

Х-

Q-+3H-X--1

Он

Q'-,H-X-3

"Ъ 1

у Q-H Ъз

Q -3H

X.'

' Q -'Н

Q-+2H -X¡J-1 0-2 Х Q"H

Х'Ь-3 Q-H

Q-+3H-X--'

Q-+2H-----XQ2 '

0-2 Х Q--H

1-3--3

Q -3H

X,' О --'

Q+2H....X?2-'H"~X-5

О'-2

X Q--H

X'-ó-3 Q -3H

Q-+3H....X--'

о-'..

..."

X3 3

Q -3H

10

X'á,-'

X,?'-'H 0-2 Q+,H....XQ-2H 0--3

Q--3H

Q+3H....X-'

O-'

X-á 2 q„'H...XQ'H 0-3 Q'-H

X.-

X-

<2

. Q

4

O

Q

H....X-5

2H

3H

Q+3H....XI-' Oh

X Q'-'H....X-5 X2 2 q'+}h....x'q'h

0-3

Q--3H

Xi-'

' QH

Q-+2H....X-J -Q,-2 <-?"2H 0'-3

Q -3H

Q

Qi+3H....Xi-'

O-'

Q+2H....XQ2-' 0-2 Q„H....X¿-2H

0-3 Q -3H

O -'

QH

Q'+'H....X' 3

0-3 Q-3H

O'-' Q H Q'-H....

Q2 H

Q+'H....X-3i-2

0'-3 Qh3H

01

X-' O'-' X Q-'H

X'Ó-2 X Q-2H

Q-3H....X.7

X,'

0

Q H

-Q" 2H

и Q H....X,

X'

X Q-H....X5 X Q -2H

X'á-3

nh3н....xi-7

Qi+3H....Xi-'

O'

XQ

ó

Q

"Ó Q

X -

H....X-5 2H

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

H....X-7

X.' O'-' Q"H Q"+H... ■Xí-2

O'-2

X Q-H

X'Ó-3

Qí-3H....Xi-7

Q+3H....X-'

O-'

Q+2H....XÍ2-'

0-2 X Q-H X3-3

Q-3H....X-7

X'-W

o-'

n H XQi-'H....Xi-5 Qi+2H... ¿2

0-2 X Q'-H

X-ó-3

Q3H....X7

Q+3H....X'-'

O'-'

Q+2H...A'H-X-5

0-2 X Q^

Q-3H...X-7

11

XX'

Q '+1H....X,

'ó-Q'H

"Ó ' Ъ-3

n'зH...X"T

Qi+2H....Xi-1

H

xh

q+1h....x^q H

Q H....X .

X'6-

X Q-H....X-5

X'-6 "2 QMH....X,Q"lH

0"3

Q.3H....X.-

Qi+2H....XИ

0-'

X Q",H....X"5

- ---

Q„H....X,Q'-'H

01-3

Q^H.^.X^

' QH

Q+H—X-J"

o'-2

Q+'H^xS^

С3-3

Q--3H....X-.7

О+H....Xg^

Q+2H....XQ2-H

O -2 Q+'H...X,Q"-H

0"3

Q^H.^.X^

X'-U O-'

П W XQi-'H...X--5

О-2 Qi+'H....X¡ Q"-H

0-3

Q^H.^.X^

Qi+2H....Xi--O

Q"2H....X"T

i - 2

10

11

i-1 i - 3

00

01

10

11

00

01

10

11

00

X-°"H

O"2

X Q-2H..

X3 "3

Q-3H

Q"+3H....XH

x Q-'H

X-3 Q1-2H...X1 Xá-3

Q.3H

Ъ-'

Q-H....X--5

Ъ"2

, Q-2H...X4

'3-3

Q-3H

n+2h....x'-1

x qhh....x"-5

Ь"2

x q"-2h....x"6

X-á-3

XbI Q+3H....X",

,..xQ ''H Qi+-H....XQ- H Q-+2H....X.2

2H....Xi-6 Q xl3Qi -H...X"S °QI-H...x, Xi-3

"¡- 'á'3 0-3

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Qi- 3H Qi-3 H Qi-3H

Qi+2H....XИ

O"'

n H nиH...X-5J

Qi+2H—X-2 0--2

v Q--2H....X",

X'á-3 Q"3H

10

X Qii--''H Xb"2 q+,H...x.qq'-2h....x'-'

Oi-3

Qi-3H

Qi+2H....X"1 Oh

X Q-'H

"'б' „ „ v Q'-2H. ...X'-B

У-ó--

. Q--H....X-5

Q+2H....X-ó Oh

X"ó"2 QI,'H....XI'Q-2H....X-'

0-3 Q'-3H

X"b' Q H XQ"'h

Qi+2H—X-2 0--2

q„h...xiq"2h....x"'

0"3 Q--3H

Q+3H... .X—

Q"H it

Q"+íH....X"-3 "" d"3 Q-.3H

XЪo

qi,2H...xqI-H...xi-5

<3-2

Q+,H....x,QI-!H....X"'

0'-3 QI3H

Q+3H...X,

O"'

Q+2H...XQ/-H...Xi-5

Oi-3

Q.-3H

01

X-' Он

X Qi-'H "2 '-2 „ QI-2H....XI6

Xi-6"2 n-H-X^

x-'

Q-H Ъ-2 Q x'h- H. X"

Qi-2H....Xi6 x ,Q' -H. .X

Oi-

Q-2H....X-T Q- H.. X-

X' X-' a Q+3H....X- x'-b Q„H...XI-' o- '

Q H.. X"5 Qi+2H....Xi-¿ . O- Q+2H X"' q„h....xq- H. X'-5 Q-+-H.—XQ2 H.. X"

'"3 -H. .X.6 Qi-2H....X,-C xó-2 v Q--H x-6 X-á-3 ¿ X"°Q -H. .X"t x Q- Xló " -H.

Q H.. X"7 QlH....X-7 Q 3H... xi-7 Q" H.. X-

11

Xb-X Q'-H

Xb"2 Q"+1H...X- Qi-2H....Xi-e

0"3

Пс-Н....^

X

OI-' X Q-H....X^ "2 "2

П+'H....X, Q-2H.."X-3

Oi-3

Q-3H....X-7

Q+3н....x--0"< X Q-H x-5 X-2 n

Q-+2H....X-.2

0-2

Q,oH....X?-2H.X-^

01-3

Q-3H....X-7

Q+3H....X—

°е1н Q-+2H....X-.2 ' "

0-2

Q"+2H....X- Q-2H....X-S

01-3 Q.3H....Xi-7

Q H ПН..^

o-

Q"+1H....X- Qi--H .yi-6

Oi3

n-H-X^

Q+3H. ..Xi-

ón

Q+-H. ..Xi-5

O'-- .x,?"H .X'

Q+H..

Q13H.. .X'

i - 4

'V4

Q-4H

00

o-4

Q.4H

o"4

Q-4H....X-8

10

-4

Q H....X ¡-4

O"

Q I-4H....XI-8

01

11

Q -2H

Q -2H

Q,^H....X

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Q -2H

ОС2

QoH....X,

Q i+^H...-X

0-3

Q.-.H

Q.3H

X

Q+3H....X

Oh

Q.'H

X

QoH....X,

Q'+'H... .X

Qi.'H.... X

O-

QnH...:x

0--3 QH.... X

применить предлагаемую классификацию для направленного поиска недостающих пента-фрагмен-тов. Данные по количеству фрагментов в остальных подклассах приведены в табл. 4.

В табл. 4 наблюдается ряд других закономерностей, однако детальный их анализ, с использованием пространственных представлений, будет проведен в следующей статье.

2.3. Система пента-фрагментов цепных полимеров

Конечной целью нашей работы было построение на основе данных, полученных на белках, обобщенной системы пента-фрагментов для цепных полимеров. Такая задача оказалась вполне выполнимой.

В процессе ее построения нами был учтен ряд моментов. В частности, пептидные группы 0=С—МН в структуре пента-фрагментов были заменены на формальные группы Х=В,—[4, 5]. В результате, вместо букв Q, Д, X можно представлять разные конкретные атомы и получать варианты связующих групп для цепных полимеров [2, 4, 5]. Кроме того, выделение в структуре пента-фрагмен-тов начальной, центральной и конечной частей, которое привело к выявлению восьми подклассов пента-фрагментов, позволило использовать центральную область пента-фрагментов в качестве основы для построения общей системы. При этом начальные и конечные участки будут задавать тот или иной подкласс пента-фрагментов.

С учетом этих соображений, в табл. 5 представлена обобщенная система пента-фрагментов, пригодная для их генерации при построении любого цепного полимера, содержащего группы Х1=И—QiН. Нетрудно видеть, что из нее могут быть получены все восемь подклассов пента-фрагментов (512 видов), найденных в белках. В частности, использование вариантов, где атомы при ¿-м а-атоме принимают значения 00, а при при ¿ - 4-м а-атоме 00 и 01 приводит к табл. 3. Аналогичным образом легко получить и другие варианты пента-фрагмен-тов.

Заключение

Цепные полимеры — перспективные материалы для создания систем бионической наноэлект-роники. Белки являются частным случаем таких полимеров [4, 5] и могут служить удобной моделью для поиска общих принципов их построения. В настоящей работе, исходя из представлений о молекулярной векторной машине, элементом которой является фрагмент цепного полимера, состоящий из пяти а-атомов (пента-фрагмент), проведен анализ принципов формирования системы пен-та-фрагментов белков. С этой целью было обра-

ботано 537 файлов белков, из которых с помощью специально написанных программ было получено и сортировано около 100 тысяч пента-фрагментов, сохраняющих информацию о характере водородных связей внутри основной цепи.

Каждый а-атом пента-фрагмента может образовать по две связи внутри цепи, а в целом таких связей оказалось 9 (четыре пары, плюс одна связь, которая повторяется дважды для ¿-го и ¿ - 4-го а-атома). Наличие Н-связи было обозначено цифрой 1, а ее отсутствие — цифрой 0. В результате отсортировки всего было найдено около 500 индивидуальных типов пента-фрагментов (теория предсказывает 512), которые образуют группу циклических и группу ациклических фрагментов.

Внутри каждой группы было выделено по два класса, различающихся начальной парой связей при ¿-м а-атоме (00, 01 и 10, 11). В свою очередь, каждый класс подразделяется на два подкласса на основе различий в паре переменных при ¿ - 4-м а-атоме. В классах 00 и 01 они принимают значения 00 и 10 (подклассы 00-00, 00-10, 01-00 и 0110), а в классах 10 и 11 — значения 01 и 11 (подклассы 10-01, 10-11, 11-01, 11-11). Внутри каждого подкласса содержится по 64 вида пента-фрагментов (пары переменных при ¿ - 1-м, ¿ - 2-м и ¿ - 3-м а-атомах). Сортировка пента-фраг-ментов внутри подклассов проведена по аналогии с формированием блочной структуры топологического кода, при которой вторая пара переменных является одинаковой для пента-фрагментов всего блока. На основе блочной структуры и подразделения на подклассы проведена обработка полученных данных и показано, что количество найденных фрагментов в подклассах закономерно изменяется.

Конечным результатом проведенной работы явилось построение полной системы для генерации пента-фрагментов цепных полимеров, в основе которой лежит система из четырех блоков по 16 элементов, составляющих суперматрицу из 64 пента-фрагментов. С помощью этой системы можно получить все восемь подклассов пента-фрагментов. Следует отметить, что возможны и иные принципы расположения видов пента-фрагментов при их сортировке, например на основе однобитовых переходов между соседними элементами. Однако двумерное расположение элементов все равно не решает проблему представления всех взаимосвязей пента-фрагментов. Это можно сделать только на основе пространственных представлений, изложению которых посвящена следующая статья данной серии.

Выражаю искреннюю благодарность В. В. Лучи-нину за поддержку и интерес к этой работе, а про-граммистамА. И. Беляеву и Е. Л. Демченко — за написание программ, обеспечивших реализацию данного проекта.

|Л и т е р а т у р а I

1. Пул Ч. П., Оуэне Ф. Нанотехнологии. 3-е изд. М.: Техносфера, 2008, 375 с.

2. Караеев В. А., Лучинин В. В. Введение в конструирование бионических наносистем. М.: Физматлит, 2009. 464 с.

3. Лаврикова М. А., Замотин В. В., Малишауека М. и

др. Амилоидные свойства искусственного белка аль-бебетина и его биологически активных производных. Роль электростатических взаимодействий в фиб-риллообразовании//Биохимия, 2006. Т. 71, № 3. С. 386-395.

4. Караеев В. А., Лучинин В. В. Модель топологического кодирования цепных полимеров для бионической наноэлектроники. I. Топологический код и

соответствия физических операторов триплетам кода//Биотехносфера, 2009. № 1. С. 2-10.

5. Караеев В. А., Лучинин В. В. Модель топологического кодирования цепных полимеров для бионической наноэлектроники. II. Молекулярная векторная машина и структура канонического набора физических операторов//Биотехносфера. 2009. № 2. С. 6-12.

6. Финкельштейн А. В., Птицын О. В. Физика белка. М.: Книжный дом «Университет», 2002. 376 с.

7. Демченко Е. Л., Караеев В. А. Компьютерный анализ систем сопряженных ионно-водородных связей в белках//Тез. докл. II съезда биофизиков России 23-27 августа 1999. М., 1999. Т. III. С. 946-947.

8. Караеев В. А., Демченко Е. Л. Компьютерная программа «Декодер надмолекулярной структуры белка — Протеин 3Д». СПб.: СПбГЭТУ— РАПО РФ. № 980143. 05.03. 1998.

КАК ОФОРМИТЬ ПОДПИСКУ?

• В любом отделении связи по каталогам «Роспечать» (по России) и «Прессинформ» (по Санкт-Петербургу и Ленобласти) — индекс № 45886

• Через Интернет:

по электронному каталогу «Книга-сервис» www.akc.ru — индекс № 29877

• Через редакцию, отправив по факсу (812) 312-57-68 или электронной почте [email protected] заполненный запрос счета на подписку

Запрос счета для редакционной подписки на журнал «Биотехносфера»

Полное название организации. Юридический адрес_

Банковские реквизиты,

Адрес доставки.

Срок подписки_Кол-во экз._

Тел._Факс_e-mail,

Ф. И. О. исполнителя_

Стоимость одного номера журнала 550 руб. (в том числе НДС 10 %) с добавлением стоимости доставки (простой бандеролью). К каждому номеру журнала будут приложены накладная и счет-фактура. Журнал выходит 6 раз в год.

Отдельные номера можно заказать с получением наложенным платежом. Информация о журнале — www.polytechnics.ru.

Для ознакомления высылаем по заявке бесплатно один номер журнала.

Журнал «Биотехносфера» распространяется только по подписке в России и странах СНГ.

i Надоели баннеры? Вы всегда можете отключить рекламу.