УДК 547.12:541.614(083.73)
ЛИНЕЙНО-ЦЕПНОЕ КОДИРОВАНИЕ И НАЗВАНИЯ АЛИФАТИЧЕСКИХ УГЛЕВОДОРОДОВ
© Я.Э. Брюске
Bruske Ya.E. Line-Chain Notation and Names of the Aliphatic Hydrocarbons. The bonds between carbon atoms of aliphatic hydrocarbons were separated into classes of chain and non-chain bonds depending on numbering conforming carbon atoms to work out the method of the notation of hydrocarbons. The carbon atoms which have no chain bonds with atoms having foregoing numbers were picked out as the initial atoms. The classes of bonds and atoms have the proper numbering. Line-chain code of hydrocarbon consists of the messages containing the information about non-chain bonds, about initial atoms and last atom of carbon. The rules were worked out to obtain of the unambigious code for one and the same hydrocarbon. The methods of the construction of the hydrocarbon names by their line-chain codes resulted in the simplification and systematisation of their names and gave the possibility for the construction of the unified names for all isomers of one and the same alcane.
Нумерация углеродных атомов органических молекул, в которой их последовательно перечисляют от одного конца неразветвленной цепи углерод-углеродных связей до другого и которая вошла во все типы номенклатур органических соединений с самого их возникновения, в работе [1], по-видимому, впервые названа цепной.
Предложенное в этой работе кодирование молекул углеводородов было названо линейноцепным (линейный код цепной нумерации) [2].
Разделение углерод-углеродных связей на цепные (между атомами с последовательными номерами) и нецепные сделало возможной разработку способа кодирования с относительно небольшим количеством информации, так как в сообщениях кода достаточно было дать информацию о нецепных связях, об отсутствии некоторых цепных связей и о номере последнего атома (атом, имеющий наибольший номер) [3].
Сообщение в коде о каждой нецепной связи включает номера соединенных ею атомов, эти номера разделяют запятой, а тире отделяет друг от 1руга отдельные сообщения. Отсутствие цепной связи атома с атомом, имеющим предшествующий номер, обозначают “незначащим” нулем перед номером этого атома в его нецепной связи.
Линейно-цепное кодирование молекул циклического углеводорода позволило систематизировать и упростить их номенклатурные названия, а выделение атомов, не имеющих цепной связи со своим предшественником, в качестве начальных дало возможность определить число (С) ерошенных (конденсированных) циклов:
С =5 -г, (1)
где 5 - число нецепных связей и г - число начальных атомов, с тем, чтобы не включать число
ерошенных циклов в номенклатурное название циклического углеводорода, как это делают сейчас [4].
С целью систематизации и упрощения номенклатурных названий предельных алифатических углеводородов (алканов) в настоящей работе описано их линейно-цепное кодирование и приведены различные варианты названий.
Структуру алканов удобно взаимнооднозначно отображать без атомов водорода, в виде углеродных “скелетов”, на ациклические графы (молекулярные графы: МГ [5]), называемые в теории графов деревьями [6]. МГ нормальных углеводородов состоят из одной цепи (рис. 1,а). Углеводород с разветвленной цепью, состоящий из нескольких соединенных между собой неразветвленных цепей (далее: цепи), в номенклатуре рассматривают, как производный от нормального углеводорода с наиболее длинной [4] главной [4, 7] цепью атомов, которая в этом углеводороде содержится. В углеводороде (рис. 1,6) главная цепь состоит из 12 атомов, и его следует назвать как производный от додека-на. Цепи, не вошедшие в главную, являются боковыми цепями, которые рассматривают, как углеводородные радикалы (алкилы), замещающие атом водорода в главной цепи и в ранее выбранных боковых цепях [4].
По аналогии с [6] цепи, два атома которых связаны, названы смежными.
Атомы главной и каждой из боковых цепей имеют свою самостоятельную нумерацию от одного из концов [4]. В названиях углеводородов, если это необходимо, номер атома в боковой цепи пишут в виде индекса над номером того атома главной цепи, к которому присоединена эта боковая цепь [7], или же ставят штрихи над номерами атомов боковых цепей [4]. В [7] показано, что цепи, не смежные с главной, по-
лучают индексы над индексами, что неудобно в печати и письме. Предложенная в [7] замена чисел в номерах атомов боковых цепей латинскими буквами позволяет избавиться от индексов, но нарушает единство вида нумерации, а при удалении буквы от начала алфавита становится труднее определить, какому числу она соответствует.
Дж. М. Дайсон предложил единую (сплошную) нумерацию всех углеродных атомов в алифатическом углеводороде, начиная ее с главной цепи [8]. Эта нумерация, критически рассмотренная и рекомендованная в [7] для применения в номенклатуре, используется в настоящей работе в качестве основной. Сохранена также самостоятельная нумерация атомов каждой боковой цепи, которая, по предложению авторов [7], названа автономной.
На рис. 1,6 показано, как после нумерации атомов главной цепи последовательно нумеруют атомы боковых цепей от более длинных из них, в скобках показана автономная нумерация атомов каждой боковой цепи.
В одной и той же связи атом с меньшим номером называется первым номером (атомом) связи, атом с большим номером - вторым [1]. В порядке увеличения основных вторых номеров нецепные связи получают свои собственные номера. На рис. 1,6, например, связь 14, 6 -первая нецепная связь, а 21, 10 - третья. Начальные атомы (13, 17, 20, 23, 26 и 27 на рис. 1 ,б) получают собственные номера в порядке увеличения их основных номеров, например, 17 - второй и 23 - четвертый начальный атом (автономные номера всех начальных атомов равны единице). Сами боковые цепи (алкилы) получают те же собственные номера, которые имеют находящиеся в них начальные атомы. Атом N° 1 в главной цепи назван первым атомом углеводорода, в число начальных он не входит, так как не имеет атома с предшествующим номером. Начальный атом № 27 является одновременно последним.
1 2 3 4 5 6 7
а
Рис. 1. МГ нормального (а) и разветвленного (б) алканов и их нумерация.
В ациклическом углеводороде первые атомы связей не могут быть начальными. Две цепи в нем не могут быть соединены более чем одной нецепной связью (иначе образуется цикл), поэтому число нецепных связей равно числу боковых цепей и, соответственно, числу начальных атомов.
Во всех номенклатурах, начиная с Женевской 1892 года [4, 7], любой алкил считают первичным, т.е. нумеруют от атома, соединяющего его с главной или более длинной боковой цепью. Например, если на рис. 2,а выбрать в качестве главной цепь аЬ, то следующая по длине цепь Должна быть цепи кс, 1в, <1 и Г смежны уже с цепью 1е. Между тем, можно выбрать более длинную следующую боковую цепь, например, с§, являющуюся вторичным алкилом и также смежную с главной цепью. Выбор таких боковых цепей, впервые, по-видимому, предложенный Дайсоном [7], и обоснованный в [7] приобретает признание и, в качестве альтернативы, допускается в современной номенклатуре [9, 10]. Однако, при выборе боковой цепи наибольшей возможной длины она может оказаться не смежной с главной цепью, Так получится, например, если в МГ рис. 2,6 выбрать главную цепь ас (9 атомов) и следующую боковую цепь Ь<3 (5 атомов). В таком случае, в соответствии с рекомендацией [7], следует выбрать смежную с главной более короткую боковую цепь еЬ или е<3. Из этого следует правило выбора: следующая нумеруемая боковая цепь должна быть смежной с одной из цепей, пронумерованных раньше.
Между основным (п) и автономным (ф номерами одного и того же атома т-й боковой цепи существует зависимость:
ц = п - пт + 1, (2)
где пт - основной номер т-го начального атома. Для главной цепи ? = л, откуда п0 = 1 (0 - собственный номер главной цепи, не имеющей начального атома).
Если число атомов в главной цепи равно р, а боковая цепь присоединена к ее атому с номером <7, который не больше номера г этого же атома от другого конца цепи, то длина боковой цепи от атома, присоединенного к атому <7, не может быть больше <7-/ в одну сторону и <7 - 2
- в другую (всего 2q - 3). Сумма номеров рассматриваемого атома от разных концов цепи
<7 + Г = /> + /, (3)
так как этот атом считают два раза. Наибольшая величина <7 может быть у среднего атома, когда
Я = и и
<7=0 + 1)/2, (4)
что может быть в цепи с нечетным числом атомов, и боковая цепь может иметь максимальную длину, равную р - 2. Для четного р наибольшая
величина <7 равна р/2 и максимально возможная длина боковой цепи р - 3. Этот расчет позволяет правильно определить максимально возможную длину любой боковой цепи и показывает, что две правильно выбранные смежные цепи не могут иметь одну и ту же длину. Для определения максимальной длины цепи алкила, присоединенного к боковой цепи, номера и / должны быть автономными.
Связь между атомами смежных цепей для более короткой из них называется главной связью. Главная цепь такой связи не имеет, так как она самая длинная. Одна и та же цепь не может иметь более одной главной связи, так как иначе будет нарушено правило выбора; признаком такой ошибки в выборе цепей является наличие вторых атомов более чем у одной нецепной связи в одной и той же цепи.
В линейно-цепном коде алифатического углеводорода вначале помещают необходимые сообщения о начальных и конечном атомах, которые не имеют нецепных связей, в порядке увеличения их основных номеров. Затем располагают сообщения о нецепных связях в порядке увеличения их первых номеров, а если первые номера одинаковые, то в порядке увеличения собственных номеров. Углеводород рис. 1,а получает код 7, а рис. 1,6 - код 013 - 017 - 020 -
023,5 - 14,6 - 18,10 - 21,10 - 026,15 - 027,24.
Для уменьшения числа знаков в коде сообщения о начальных атомах, не имеющих нецепных связей, объединяют в одно с незначащими нулем на первом месте, ноль отделяют от следующего номера запятой. Номера располагают в возрастающем порядке, который свидетельствует об отсутствии связи между атомами с этими номерами. Сообщения, имеющие одинаковые первые номера, объединяют, помещая общий первый номер на последнее место, а оба вторых номера - перед ним также в возрастающем порядке. Все номера разделяют запятыми. Код углеводорода рис. 1,6 станет теперь таким:
0,13,17,20 - 023,5 - 14,6 - 18,21,10 - 026,15 -027,24.
В МГ углеводорода рис. 2,а главную цепь можно выбрать семнадцатью различными способами (6 - от а, 6 - от Ь и 5 - от И). В МГ рис.
2,6 таких способов пять. Ввиду симметричного положения некоторых вершин в этих МГ, есть идентичные варианты, так что действительно различных способов выбора главной цепи в МГ
2,а - пять: ас, ас!т аЬ, сЬ, <№, а в МГ 2,6 - два: аЬ и ас. Поскольку цепь можно пронумеровать от любого из двух ее концов, число нумераций цепей с несимметричными концевыми вершинами удваивается: у МГ 2,а оно станет равным-десяти, а у МГ 2, б - трем.
На рис. 3,а1 показан выбор и нумерация главной и боковых цепей в МГ рис. 2,а, произведенный по правилам [4], а на рис. 3,а2 цепи в МГ 2, а выбраны по правилам, изложенным ниже. Названия алканов, соответствующие рассмотренным выше МГ, можно построить по правилам современной номенклатуры [41. Адап-
тация международных номенклатурных правил к русскому языку осуществлена в [9, 10].
Рис. 1,6: 5(2-метилпропил)-10,10-ди(пропил-2)-6(3-метилбутил-2)додекан (код смотри выше);
рис. 3,а1: 2,2,5-триметил-3,3-диэтил-4(2-
метилпропил)гептан, код: 015,016,2 - 011,013,3 -08,4 - 017,5 - 018,9;
рис. 3,а2: 2,5-диметил-4(3(2-метилпропил-2)пентил-3)гептан, код: 0,8,13 - 016,2 - 10,4 -
017,5 - 14,10 - 018,14;
рис. 3,6: З-этил-5-бутилнонан, код: 15 - 014,3
- 010,5.
В этих названиях внутри скобок - автономная нумерация. После номера перед скобкой дефис, в отличие от английских и американских правил [10] не ставится (смотри также [7] и примечание редактора в [10]).
Авторы [7] рекомендуют выносить названия всех одинаковых алкилов в одно место независимо от того, к главной или к другой боковой цепи алкил присоединен. Нумерация Дайсона позволяет обойтись при этом без индексов и штрихов.
Рис. 1,6: 15,24-диметил-5-пропил-10,10-
дипропил(2)-6-бутил(2)додекан;
рис. 3,а1: 2,2,5,9-тетраметил-3,3-диэтил-4-
пропилгептан;
рис. 3,а2: 2,5,14-триметил-10-пропил(2)-4-
пентил(3)гептан.
а■ 1 <—4. I . » ■!II • •—> ■ . . -----.—.с
к I )
с----------------<8 -е
<1 -------Г п<---------------'<1
С'
а 3
Рис. 2. МГ углеводородов, показывающие множественность выбора цепей.
18 10 [9 * 17 16 [5 в 7 1 [2 з 17 [5 6
12 II 3 13 14 3 9 10 11 12
15 2 16 . и 14 13
1 • 18
а! а2
13 12 11 10 5 6 7 8 9
• 4
1 2 3 14 15
б
Рис. 3. Выбор главной и боковых цепей по правилам современной номенклатуры (а!) и по наиболее длинным боковым цепям (а2). МГ 3,6 (вместе с МГ 2,6) показывает правило выбора. Нумерация - по Дайсону.
Автономные номера главных связей вторичных алкилов здесь также взяты в скобки.
Выбор в пользу одного из этих вариантов названий в данной работе не делается, однако, в отличие от применяющегося в номенклатуре неодинакового для разных языков алфавитного порядка [4], выбор, нумерация и расположение алкилов в названии осуществляется в определенном порядке старшинства [4, 7]. В принятом в настоящей работе порядке старше цепь большей длины, с большим автономным вторым номером главной связи, меньшим основным номером главной связи, затем - имеющая свои более старшие боковые цепи. Боковые цепи выбирают и нумеруют в порядке уменьшающегося старшинства, а в названии соответствующие алкилы располагают в обратном порядке.
В соответствии с вышеизложенным, предлагаются правила однозначной нумерации, по которым оптимальную нумерацию можно определить, сравнивая различные коды одного и того же углеводорода:
1. Каждая боковая цепь должна иметь одну главную связь (правило выбора).
2. Основной номер первого начального атома должен быть как можно большим (в число начальных включают фиктивный атом с номером, на единицу большим, чем у последнего, и присваивают ему наибольший собственный номер, см. список обозначений для х+Г).
3. Требования п. 2 последовательно выполняют для второго, третьего и т.д. начальных атомов.
4. Автономные вторые номера главных связей должны быть как можно меньшими.
5. Меньшие основные номера дают цепям с большими автономными номерами главных связей.
6. Первый номер первой нецепной связи должен быть как можно меньшим.
7. Требования п. 6 последовательно выполняют для второй, третьей и т.д. нецепной связи.
Начиная со второго ни один из этих пунктов не применяют, если это ухудшает действие хотя бы одного из пунктов с меньшим номером.
Большая сложность этих правил по сравнению с аналогичными правилами для циклических углеводородов (1) обусловлена нелогичностью некоторых установившихся в номенклатуре алифатических углеводородов традиций, от которых, по мнению автора настоящей работы, отказываться нецелесообразно. Это - правило выбора (п. 1) и большее старшинство вторичных алкилов по сравнению с первичными (п. 5).
По линейно-цепному коду можно определить такие параметры строения апканов, как длину (число углеродных атомов) главной (Ь0) и каждой боковой (Ьт) цепи, кроме последней:
Ь0 = п, - 1, (5)
= пт+1 ~ пт, (6)
где пт - основной номер т-го начального атома; длину последней боковой цепи (£*):
^х=1-пх + 1, (7)
где I - основной номер последнего атома, пх -основной номер начального атома с наибольшим собственным номером;
основные (или собственные) вторые номера главных связей алкилов по формуле (2);
по первому основному номеру главной связи алкила (п) определить, с какой цепью он смежный : если п < п1, то с главной, если пт<п< пт+ь то с т-й;
по основному номеру последнего атома - название нормального алкана, изомером которого является рассматриваемый углеводород.
Если есть сомнения в правильности исходного кода (и, соответственно, названия), то, определив эти параметры, можно построить МГ углеводорода и по МГ найти другие варианты выбора цепей. Эти варианты нумеруют и составляют соответствующие коды, по которым, включая исходный код, проверяют выполнение правил однозначной нумерации. Из них выбирают код, который лучше других по пункту правил с меньшим номером, а по соответствующему ему варианту выбора главной и боковых цепей дают название углеводороду.
Так, например, если пронумеровать главную цепь углеводорода рис. 2,а от Ь до е, то его код станет следующим: 015,3 - 08,4 - 011,013,5 -
016.017.6 - 018,9. Код МГ 3,а1 лучше этого кода по п. 7 для второй нецепной связи, а код МГ
3,а2 лучше кода МГ 3,а1 по п. 3 для второй начальной вершины. Код МГ 3,а2, очевидно, улучшить нельзя, поэтому из двух приведенных выше названий углеводорода рис. 2,6 правильным является название его по МГ 3,а2.
Чтобы составить код по названию, проще всего построить МГ соответствующего углеводорода и пронумеровать его вершины.
Линейно-цепное кодирование дает возможность построения единого названия для всех изомеров одного и того же алкана, например: гептан, 07,2-гептан, 06,3-гептан, 07,3-гептан, 06,07,2-гептан, 06,2 - 07,3-гептан, 06,2 - 07,4-гептан, 06,07,3-гептан, 05,06,2 - 07,3-гептан для всех изомеров гептана. В кодах названий гептан и 06,3-гептан номер последнего атома не пишут, так как достаточная информация о нем имеется в этих названиях. Углеводород рис. 2,6 является изомером нормального алкана гептаэйкозана (С27Н56), и его название, построенное по этому способу, будет следующим: 0,13,17,20 - 023,5 -
14.6 - 18,21,10 - 026,15 - 027,24-гептаэйкозан. Хотя эти названия непривычные, они соответствуют имеющейся в номенклатуре углеводородов с конденсированными циклами тенденции называть их, если не используют тривиальных названий, по общему числу содержащихся в молекуле углеродных атомов [4, 7).
Таким образом, классификация связей и атомов, автономная и собственная йумерация
элементов этих классов и единая нумерация всех углеродных атомов ациклического углеводорода дали возможность для разработки ли-нейно-цепного кодирования алканов. Разработаны правила однозначной нумерации углеродных атомов алкана, основанные на выборе наиболее длинных цепей, ограниченном правилом выбора, и на порядке старшинства отдельных неразветвленных цепей. Приведены способы построения названия ациклического углеводорода по коду и кода по названию и варианты упрощенных систематизированных названий некоторых алканов.
ОБОЗНАЧЕНИЯ
а, Ь, с, ё, е, / g, И, /, к, I - обозначения некоторых вершин в МГ углеводорода (рис. 2) до их нумерации; С - число ерошенных (конденсированных) циклов в углеводороде; 1# - длина (число углеродных атомов) главной цепи углеводорода; 1т - длина т-й боковой цепи углеводорода; 1Х - длина последней боковой цепи углеводорода; т - собственный номер начального атома углерода; собственный номер боковой цепи, в которую этот атом входит; п - основной номер углеродного атома в молекуле углеводорода; пт -основной номер т-го начального атома углерода; р -число атомов углерода в одной (главной или боковой) цепи; <7 - автономный номер атома углерода в боковой цепи, равен основному номеру атома углерода в главной цепи; г - число начальных атомов углерода в молекуле углеводорода; 5 - число нецепных связей в молекуле углеводорода; / - автономный номер (в главной цепи - основной) атома углерода, имеющего
номер q, при нумерации углеродных атомов цепи от другого ее конца; х - наибольший собственный номер начального атома углерода; собственный номер последней боковой цепи х = 0 для нормального алкана; х + 1 - собственный номер, присваиваемый фиктивному начальному атому (лх+/ = z+1, см. п. 2 правил однозначной нумерации); z - основной номер последнего атома; общее число атомов углерода в молекуле.
ЛИТЕРАТУРА
1. Брюске Я.Э. Цепная нумерация и кодирование циклических углеводородов. // Ж. структурной химии, 1995. Т. 36. № 4. С. 729-734.
2. Стьюпер Э., Брюггер У., Джуре П. Машинный анализ связи химической структуры с биологической активностью. М.: Мир, 1982. С. 75.
3. Математический энциклопедический словарь. М.: Советская энциклопедия, 1988. С. 292, 551.
4. Номенклатура органической химии // Номенклатурные правила ИЮПАК по химии. М.: ВИНИТИ, 1979. Т. 2. С. 15-217.
5. Станкевич И. В. Графы в структурной химии // Применение графов в химии. Новосибирск: Наука, 1988. 306 с.
6. Харари Ф. Теория графов. М.: Мир, 1973. С. 22, 48.
7. Терентьев А.П., Кост А.Н., Цукерман Л.Н., Потапов В.М. Номенклатура органических соединений. М.: АН СССР, 1955. С. 102-287.
8. Dyson G.M. Lecture on a New Notation for Organic Chemistry. London, 1946.
9. Бенкс Дж. Названия органических соединений. М.: Химия. 1980. С. 7, 8, 55, 155.
10. Кан Р., Дермер О. Введение в химическую номенклатуру. М.: Химия, 1983. С. 11-13, 67, 123.
Поступила в редакцию 8 апреля 1996 г.