УДК 5 47.12:541.14(083.73)
ЛИНЕЙНО-ЦЕПНОЕ КОДИРОВАНИЕ ФОРМУЛ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ
III. Кодирование сложных углеводородов
© Я.Э. Брюске
Brüske Ya.E. The Line-Chain Notation of Organic Compound Formulas. III. The Notation of Combined Hydrocarboas. The line-chain notation of combined hydrocarbons and hydrocarbon ring assemblies worked out is based on the line-chain notation of simple cyclic and aliphatic hydrocaibons. The distinguishing of simple fragments and the independent (autonomic) numbering of carbon atoms of these fragments give the possibility to construct a line-chain code giving necessaiy information about the structure of each fragment. Systematic names of such hydrocaibons can be coded then.
Линейно-цепное кодирование циклических и алифатических (ациклических) углеводородов описано в первых двух сообщениях [1, 2].
При последовательной нумерации атомов углерода в молекуле по неразветвленным цепям связей между ними, как это делают обычно при составлении номенклатурного названия, в коде обозначают связи между атомами с непоследовательными номерами (нецепные связи). Если же между атомами с последовательными номерами связь отсутствует, это обозначают "незначащим" нулем перед большим из этих номеров. Линейно-цепной код состоит из отдельных сообщений о нецепных связях, каждое из них отделяют друг от друга тире (дефис). В одном и том же сообщении номера атомов разделяются запятыми, при этом связь между соответствующими атомами считается существующей только тогда, когда больший (старший) номер в сообщении находится впереди. Коды, например, трех изомеров пентана: 5, 05,2, 04,05,2.
Названия алифатических углеводородов во всех номенклатурах, начиная с Женевской, построены нелогично: изомеры одного и того же углеводорода называют, как производные различных углеводородов с наиболее длинными неразветвленными цепями углеродных атомов. Например, изомеры гексана называют: гексан, 2-метилпентан, 3-метилпентан,
2.2-диметилбутан, 2,3-диметилбутан. Линейно-
цепные коды позволяют дать одно и то же название для всех этих изомеров: гексан,
06.2-гексан, 06,3-гексан, 05,06,2-гексан,
05.2-06,3-гексан.
Определение сложных углеводородов. К сложным углеводородам относят такие, которые содержат в одной и той же молекуле циклическую и алифатическую части или же такие циклические углеводороды, которые содержат хотя бы одну внециклическую связь
(ансамбли [3, 4]). На рис. 1а приведен простой ансамбль, а на рис. 16 - смешанный циклическо-алифатический углеводород. Углеводороды со срощенными циклами отнесены к простым, т.к. они могут быть однозначно прокодированы и названы по [1], хотя структурно они могут быть более сложными, чем некоторые ансамбли и смешанные углеводороды.
Простые составные части сложного углеводорода целесообразно назвать фрагментами.
Классификация фрагментов и связей. Для
упорядочения структуры кода необходимо один из фрагментов сложного углеводорода выбрать в качестве главного. При этом все остальные фрагменты должны быть заместителями атомов водорода или у главного фрагмента, или же у фрагмента, более близкого к главному в последовательности такого замещения. Выбор главного фрагмента производят в определенном порядке старшинства, полные правила которого будут изложены в одном из последующих сообщений. Здесь необходимо указать главный критерий старшинства: старше фрагмент, содержащий
большее общее число углеродных атомов, например, фрагмент гептана (любой его изомер) старше фрагмента циклогексана. При одинаковом числе углеродных атомов старше циклический фрагмент.
ОО
в
в
Рис. 1. Пояснения в тексте.
На рис. 16 главным является фрагмент циклогептана. Заместителями у него являются фрагменты метана и пропана, а фрагменты циклобутана и циклопентана являются заместителями у пропана, т.е. здесь положение заместителя не зависит от его относительного старшинства.
В сложном углеводороде выделяют два типа связей: внутренние и внешние. Каждая внешняя связь для фрагмента, который является заместителем, называется выходящей, а для фрагмента, у которого происходит замещение - входящей связью. Таким образом, у каждого фрагмента, кроме главного, имеется одна выходящая связь, а входящих связей может быть больше одной. Фрагмент, не имеющий входящих связей, называется концевым (фрагменты метана, циклобутана и циклопентана на рис. 16).
Выбор принципа кодирования и нумерация углеродных атомов фрагментов. Для линейноцепного кодирования ациклических углеводородов так же, как и для циклических, и в отличие от нумерации, принятой в современной официальной номенклатуре, подходящей нумерацией оказалась единая (сплошная) нумерация всех углеродных атомов молекулы. Попытка применения единой нумерации для углеродных атомов всей молекулы сложного углеводорода показала, что при этом в значительной степени утрачивается информация о структуре отдельных его фрагментов. Поэтому здесь от единой нумерации пришлось отказаться в пользу самостоятельной (автономной) нумерации углеродных атомов каждого фрагмента.
Углеродные атомы каждого циклического фрагмента нумеруют по правилам, изложенным в [1], а каждого алифатического - по правилам [2]. Если после выполнения этих правил симметрия углеродных атомов нумеруемого фрагмента дает возможность для неоднозначной нумерации, ее проводят так, чтобы атом углерода, имеющий выходящую связь, получил как можно меньший номер. Если и после этого остается выбор, нумеруют так, чтобы меньшие номера получили атомы углерода, имеющие входящие связи от более старших фрагментов. Их старшинство определяют так же, как при выборе главного фрагмента.
На рис. 2 приведены номера углеродных атомов, образующих входящие и выходящие связи каждого фрагмента. Главные фрагменты на рис. 2а и 26 помечены нулями, римскими цифрами обозначена удаленность каждого фрагмента от главного по замещению.
Номера на рис. 2 показывают, что при автономной нумерации появляется необходимость в различении одинаковых номеров разных фрагментов. Для этого, в дополнение к коду простого углеводорода, в состав кода сложного углеводорода добавлены два новых знака: открывающая и закрывающая
скобки и, таким образом, код каждого фрагмента, кроме главного, заключают в "свою" пару скобок. При этом если внутри пары скобок старшим, как и в коде простого углеводорода, считается больший номер, то первый номер вне данной пары скобок считается старше последнего номера внутри этой пары.
Состав и структура кода. В коде сложного углеводорода к сообщениям о внутренних связях каждого фрагмента добавляются сообщения о входящих связях. Для этого после номера углерода этой связи открывают скобку, после которой помещают весь код фрагмента, присоединенного этой связью. После записи всего кода этого фрагмента ставят закрывающую скобку. Последовательное применение этого приема, начинающееся от главного фрагмента, приводит к тому, что коды фрагментов, более удаленных от главного, находятся (в своих парах скобок) внутри пар скобок кодов, более близких к главному фрагменту.
Вначале в коде располагают сообщения о входящих связях, начиная от связей с менее старшими фрагментами, после чего располагают сообщения о внутренних связях каждого фрагмента в порядке, определенном в [1, 2]. После окончания записи кода фрагмента, если номер атома его выходящей связи равен единице, закрывают скобку, если больше, то в отдельном сообщении ставят запятую, пишут этот номер и закрывают скобку. Кодуглеводорода рис. 2а запишется следующим образом:
7(1(4(3(3-,2)-6Д)-6,1))-6(2)-1(3(10,1,5-,2)-6,1)-10,1,5. Связь, входящая в фрагмент метана, имеет, естественно, номер 1 и идет от фрагмента
II II
Рис. 2. Пояснения в тексте.
циюгогексана (И). Входящая в этот фрагмент связь имеет номер 4 и идет от фрагмента циклогексана (III), который, в свою очередь, имеет входящую связь в номер 3 от фрагмента пропана (IV).
Фрагмент пропана концевой, и после открытой скобки пишут его внутренний код: 3. Поскольку атом выходящей связи пропана имеет номер 2, его ставят в следующем сообщении после запятой и закрывают скобку.
У циклогексана (III) больше нет непро-кодированных входящих связей, поэтому пишут код его внутренних связей: 6,1, и т.к. номер атома выходящей связи у него 1, закрывают скобку. У фрагмента циклогексана (II) также нет больше непрокодированных входящих связей, поэтому помещают его код: 6,1 и закрывают скобку. Затем идет фрагмент метана, информация о коде которого (он равен 1) уже имеется в качестве номера входящей в этот фрагмент связи, поэтому его код не повторяют, а закрывают вторую скобку. У номера 6 главного фрагмента имеется следующий по возрастающему старшинству заместитель: концевой фрагмент этана с выходящей связью номер 1. Входящая в главный фрагмент следующая связь присоединена к углероду номер 1 и идет от циклогексана (I), к которому, в свою очередь, идет входящая в номер 3 связь от цикло-10,5-декана (II). Фрагмент циклодекана концевой, поэтому пишут его внутренний код, а т.к. номер его выходящей связи равен 2, его пишут после запятой и закрывают скобку. У фрагмента циюгогексана (I) больше нет непрокодированных входящих связей, поэтому пишут его внутренний код и закрывают скобку. Теперь у главного фрагмента больше нет непрокодированных внешних связей, поэтому пишут его внутренний код. Кодирование закончено.
Аналогично составляют код любого другого сложного углеводорода. У углеводорода рис. 1а главным фрагментом может быть любой из шестичленных циклов, его код: 1(6,1)-6,1.
Код углеводорода рис. 16:
3(1)-1(3(4,1)-2(5,1)-3)-7,1-
У углеводорода рис. 26 с главным ациклическим фрагментом код следующий: 6(5,1)-4(3(2)-6,1)-07,2.
Таким образом, код фрагмента, более удаленного от главного, является сложным сообщением в коде того фрагмента, у которого он является заместителем, т.е. в "алгебраическом" смысле он вложен (в своих скобках) в этот код. В код главного фрагмента последовательно вложены коды всех остальных фрагментов. Чем более удален фрагмент от главного, тем больше глубина его вложения, что хорошо видно в коде углеводорода рис. 2а у седьмого и первого номеров главного фрагмента.
При большой глубине вложения фрагментов в коде можно запутаться и неправильно рас-
ставить скобки. Правильность их расстановки позволяет проверить следующий прием. Код просматривают слева направо и, встретив первую открывающую скобку, пишут под (над) ней номер 1. Продолжая просмотр и встретив следующую скобку, увеличивают номер под ней на единицу, если она снова открывающая, или повторяют предыдущий номер, если она закрывающая. При встрече подряд закрывающих скобок предшествующий номер уменьшают на единицу, а если после закрывающей скобки встречается открывающая, прежний номер и в этом случае повторяют. Код углеводорода рис. 2а получит при этом следующий вид:
7(1(4(3(3-,2)-6,1)-6,1))-6(2)-1(3(10,1,5-,2)-6,1)-10,1,5.
1234 4 3 21 1112 2 1
Если скобки расставлены правильно, номер последней закрывающей скобки будет равен единице. О равенстве глубины вложения фрагмента и удаленности его от главного свидетельствует равенство номеров под скобками соответствующим римским цифрам в формуле рис. 2а.
Составление названия сложного углеводорода по его линейно-цепному коду. По линейно-цепным кодам были составлены названия алифатических углеводородов в работе [2], принципиально не отличающиеся от некоторых систематических названий сложных (по раз-ветвленности цепей, в рассматриваемом здесь аспекте все они являются простыми) алифатических углеводородов по номенклатуре ИЮ-ПАК [3].
По этому же принципу по линейноцепному коду сложного углеводорода также можно составить его название. При построении названия по коду главный фрагмент называют в корне слова-названия как углеводород. Остальные фрагменты называют как соответствующие их углеводородам алкилы или циклоалкилы; эти названия располагают в префиксах, начиная от названий фрагментов, более удаленных от главного, а при одинаковом удалении - от младших к старшим. При преобразовании кода в название внутренние коды фрагментов заменяют названиями соответствующих углеводородных заместителей, оставляя на своих местах номера входящих связей и соответствующие им открывающую и закрывающую скобки. Если о номере входящей связи имеется достаточная информация в какой-либо части названия, этот номер опускают вместе с его скобками.
Углеводороды, формулы которых приведены на рисунках, получают следующие названия:
рис. 1а: циклогексилциклогексан;
рис. 16: 3-метил-1(3-циклобутил-2-циклопен-
тил)пропилциклогептан;
рис. 2а: 7(4(3(пропил-2)циклогексил)цикло-
гексил)метил-6-этил-1(3(цикло-10, 5-децил-2) циклогексил) цикло-10,5-декан; рис. 26: 6-циклопентил-4(3-этилциклогексил)-
07,2-гептан.
При построении названия там, где это возможно, некоторые пары скобок заменяют дефисами. В названии углеводорода рис. 2а исключена информация о номере входящей связи метила, информация о котором имеется в самом его названии. Так же, как и в коде, номера разных уровней вложения не должны быть включены в одну и ту же пару скобок, что можно проверить аналогично изложенному выше. В отличие от номеров, названия фрагментов различных уровней могут быть заключены в одну и ту же пару скобок.
Таким образом, классификация сложных углеводородов, углерод-углеродных связей в них и автономная нумерация различных фрагментов, составляющих сложный углево-
дород, позволила разработать простой способ линейно-цепного кодирования их молекул, дающий достаточную информацию о строении каждого фрагмента. Наличие такой информации дает возможность непосредственно по коду составить систематическое название сложного углеводорода.
ЛИТЕРАТУРА
1. Брюске Я.Э. Цепная нумерация и кодирование циклических углеводородов // Ж. структурной химии. 1995. Т. 36. № 4. С. 729-734.
2. Брюске Я.Э. Линейно-цепное кодирование и названия алифатических углеводородов // Вестн. ТГУ. Сер. Естественные и технические науки. Тамбов, 1996. Т. 1. Вып. 1. С. 34-38.
3. Номенклатурные правила ИЮПАК по химии. М.: ВИНИТИ, 1979. Т. 2. С. 62, 18-20.
4. Бенкс Дж. Названия органических соединений. М.: Химия. 1980. С. 104.
Поступила в редакцию 6 декабря 1996 г.