УДК 004.021,519.683
АДЕКВАТНОСТЬ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ НА ПРИМЕРЕ ЗАДАЧИ КОММИВОЯЖЕРА
МАКАРКИН Сергей Борисович,
аспирант, Тольяттинский государственный университет, Тольятти, Россия [email protected]
МЕЛЬНИКОВ Борис Феликсович,
профессор, доктор физико-математических наук, Самарский государственный университет, Самара, Россия [email protected]
Аннотация. В статье рассматривается один из возможных подходов к проблеме адекватности математических моделей - на примере входных данных, использующихся при создании и анализе алгоритмов решения задачи коммивояжера для возникающих на практике частных случаев этой проблемы. Авторы считают, что т.н. псевдогеометрическая версия этой проблемы более адекватно описывает множество ее частных случаев, встречающихся в большинстве предметных областей, чем значительно более распространенная геометрическая версия.
Это утверждение обусловливается следующими фактами. В ходе разработки алгоритмов (а также в целях оценки их эффективности) для конкретных предметных областей необходимо принимать во внимание, насколько данные, сгенерированные выбранным методом, репрезентативны для исследуемой предметной области. Как правило, тестовые данные задаются набором случайных величин с заданным распределением. При этом используется некая идеализированная модель входных данных, чаще всего - с равномерными или нормальными распределениями значений характеристик. Однако на практике входные данные, как правило, поступают в соответствии с некоторым вероятностным распределением, отличным от равномерного или нормального. В результате производительность алгоритма на реальных данных - причем как в среднем, так и в худшем случае - неадекватна.
Самый важный вывод, который хотели бы сделать авторы данной статьи, состоит в следующем. Существуют различные области - как в теоретической информатике, так и в математике, - в которых основные направления исследований, проводимых самыми разными научными группами, в действительности являются мало похожими на реальные задачи, возникающие в различных областях на практике. И «увлечение» многих
математиков-программистов последовательным улучшением алгоритмов и программ, предназначенных для решения геометрической версии задачи коммивояжера (вместо псевдогеометрической ее версии), - это один из многих подобных примеров.
Ключевые слова: математическая модель; адекватность; задача коммивояжера; псевдогеометрическая версия.
THE ADEQUATE OF MATHEMATICAL MODELS FOR TRAVELLING SALESMAN PROBLEM
MAKARKIN Sergey,
post-graduate student,
Togliatti State University, Togliatti, Russia [email protected]
MELNIKOV Boris,
professor, doctor of physical and mathematical sciences, Samara State University, Samara, Russia [email protected]
Abstract. We consider one of the possible approaches to adequacy of mathematical models by the example of data samples used to design and analysis algorithms to solve real-life instances of travelling salesman problem (TSP). Authors consider so-called pseudo-Euclidian version of that problem to be more adequate description of the real-life examples of TSP, than more common Euclidian TSP.
Latter is explained by the following: designing an algorithms (and estimating its effectiveness) for a given object domain one has to consider the representativeness of generated sample data for this domain. Commonly a set if random variables with a given distribution function is used as a sample data using some idealized data model (mostly with uniform distribution of attributes values). However in practice the input data has some special distribution of attributes values, different from uniform or Gaussian. As a result the algorithm’s performance on a real-life data is inadequate (both on average and at worst).
The most important conclusion made by the authors is the following. There are different object domains (as in theoretical information, so in mathematics), in which mainstream research conducted by different scientific groups has not much in common with the real-life instances of the studied problems. One of such examples is the «enthusiasm» of many mathematicians and pro-
grammers about the improvement of algorithms for Euclidian TSP (instead of pseudo-Euclidian).
Keywords: mathematical model; adequate; travelling salesman problem; pseudo-Euclidian version.
1. Введение
Современная наука во многом обязана своими успехами широкому применению математического моделирования - замены исследуемого объекта его «образом», математической моделью, и изучению этой модели с помощью компьютерных алгоритмов [1]. Проблема построения математической модели, адекватно отражающей моделируемую систему, является краеугольной задачей математического моделирования. Данная проблема имеет и философский аспект, прежде всего заключающийся в необходимости ответа на вопрос: что считать адекватным отражением реальности1. Адекватность математических моделей, в свою очередь, может оцениваться по двум критериям: гносеологичность и праксео-логичность [4]. Под адекватностью, как правило, подразумевается гносеологичность (качественная адекватность) - т.е. соответствие отображения и модели структуры, и механизмов функционирования экосистем. В то же время праксеологичность (количественная адекватность) - т.е. применимость модели для практических действий: прогнозирования, управления и пр. - является, несомненно, не менее важным свойством моделей. Из четырех основных парадигм математического моделирования (вербальной, функциональной, эскизной и имитационной) обе стороны адекватности проявляются в имитационных моделях - за счет отображения в модели и структуры, и механизмов функционирования объектов [5].
Часто математическая модель, а также основанные на данной модели алгоритмы, созданные для одной предметной области, находят применение в других областях. Примером такой модели является задача коммивояжера (ЗКВ), которая заключается в нахождении наименее затратного маршрута, проходящего через все заданные города с возвратом в исходную точку (Гамильтонов цикл). Первоначально разработанные для решения проблемы построения
1 Сам по себе термин «адекватность» представляется авторам наиболее
удачным, посколь-ку, согласно [2], невозможно доказать, что все компоненты
модели реальной системы ис-тинны (корректны). Еще жестче подобная мысль
высказывается в [3]: «все модели невер-ны; практический вопрос заключается в
том, насколько они должны быть неверны, что-бы перестать быть полезными».
б
маршрутов математические модели и алгоритмы, созданные для задачи коммивояжера, используются при решении прикладных проблем:
• как в смежных предметных областях, например:
— в проблеме маршрутизации транспортных потоков,
— при выборе оптимальной траектории движения рабочего инструмента (в обоих случаях необходимо найти оптимальный
маршрут);
• так и в областях, на первый взгляд с маршрутизацией не связанных:
— для секвенирования нуклеотидных последовательностей биополимеров [см. 6]2;
— для эвристического определения схожести последовательностей (как нуклеотидных, так и каких-либо иных [7, 8]);
— для построения практических алгоритмов исследования специально определенных бесконечных грамматических струк-тур3;
— для построения эволюционных деревьев [см. 12].
Особенностью этой задачи является то, что при относительной простоте постановки нахождение оптимального маршрута является весьма сложной проблемой; строго говоря, задача - как в обобщенной ее постановке, так и для большинства ее вариаций -относится к классу КР-полных [см. 13, 14].
2 Для применения задачи коммивояжера в анализе ДНК используется следующий подход. После процесса секвенирования мы получаем набор строк небольшой длины (на практике обычно от 20 до 100, в зависимости от технологии), в которых есть совпадающие участки. Весом ребра ориентированного графа является степень сходства (где суффиксы относятся к вершинам, из которых выходят дуги, а префиксы - в которые они входят). При этом путем с максимальной стоимостью будет являться наиболее длинная общая надстрока за-данной последовательности.
По мнению авторов статьи, данная постановка близка к псевдогеометри-ческой версии ЗКВ в связи со следующим обстоятельством. В случае если бы перекрывающиеся участки ДНК обязательно имели одинаковую длину, мы бы получали геометрическую версию ЗКВ. Однако длина перекрывающихся участков может быть произвольной (в некоторых границах).
Подробное исследование такой постановки псевдогеометрической версии ЗКВ (т.е. полученных именно таким образом вариантов проблемы) является предметом дальнейшей работы авторов.
3 Постановку задачи исследования бесконечных грамматических структур см. в [9] и далее в [10], оформление соответствующих задач в виде алгоритмов, в том числе эвристических,- в [10, 11]. При этом процесс сведения данной задачи к ЗКВ, а также обоснование желательности исследования псевдогеометрической версии ЗКВ для данного случая являются предметом дальнейших публикаций.
2. Предварительные сведения (формальная постановка задачи коммивояжера)
Приведем формальное определение ЗКВ, выполненное на основе требований монографии [14].
Вход. Взвешенный полный граф (G,c), где G=(V,E), V={v J
для некоторого neN, а также функция c:E^N.
Ограничения'. Для каждого частного случая проблемы (G,c) множество M(G,c) включает все Гамильтоновы циклы графа G. Каждый Гамильтонов цикл может быть представлен в виде последовательности
••• * Vin’
где (i, i) - некоторая перестановка множества (1,2,...,n).
Стоимость. Для Гамильтонова цикла
полагаем
т.е. стоимость Гамильтонова цикла равна сумме весов входящих в него ребер.
Цель: minimum.
Для ясности необходимо отметить, что мы в различных публикациях применяем следующую терминологию (по-видимому, достаточно удачную). Вариант (или версия) проблемы определяется некоторым подмножеством всех возможных входов (аналог в обычных математических обозначениях - знак с). Также отметим, что применяемые иногда в русскоязычной литературе альтернативные термины для данного понятия - фактически кальки с английского, слова «подзадача» и даже «подпроблема» - представляются значительно менее удачными, поскольку в литературе на русском языке они обычно употребляются в другом смысле.
А термин частный случай проблемы, согласованный с классической монографией [14], - это один конкретный возможный вход (аналог в обычных математических обозначениях - знак e). Еще отметим, что в англоязычной литературе для «варианта проблемы» и «частного случая проблемы» применяются термины “subproblem” и “problem instance” соответственно.
3. Геометрическая и псевдогеометрическая версии задачи коммивояжера
Среди множества различных вариаций ЗКВ одной из наиболее изученных является геометрическая ЗКВ (именуемая также Евклидовой [14, 16 и мн. др.]): стоимость маршрута равна расстоянию между точками на плоскости, вычисляемому как Евклидова норма. Для дальнейшего изложения необходимо указать, что характерной особенностью данной задачи является выполнение неравенства треугольника для любых трех городов, т. е.
с({и, г}) < с({и, И'}) + с( {иг, и]) .
(Вообще, варианты проблемы ЗКВ с выполненным для любых трех городов неравенства треугольника называются метрическими - т.е. все геометрические ЗКВ представляют собой собственное подмножество метрических.)
А основные исследования авторов данной статьи направлены на изучение т.н. псевдогеометрической версии ЗКВ [см. 16, 17, 18 и др.] - в которой к входным данным добавляется вектор К={к1...кп}: кЛ е Н, п=\Е\ - н. о. р. с. в. с ц=1 и некоторым зара-
нее заданным «хорошим» значением а; также используется функция т:(и. г) —» N. а в качестве элемента матрицы стоимостей используется следующее значение:
с(1и. г}) = ктіиг„) • 2^ - vi)
N
где и и V - 7-я компонента вектора, задающего координаты точки и и V соответственно. Очевидным отличием псевдогеометрического варианта ЗКВ от геометрического является наличие возможности нарушения неравенства треугольника для некоторых троек городов; более того, существует вероятность появления расстояний с отрицательной стоимостью - которые обычно после генерации входных данных заменяются на 0.
Важно отметить, что геометрический вариант ЗКВ можно считать частным случаем псевдогеометрического (со значением а=0).
4. О репрезентативности входных данных Как правило, тестовые данные задаются набором случайных величин с заданным распределением. Однако при разработке алгоритмов (а также для оценки их эффективности) для конкретных предметных областей необходимо принимать во внимание, насколько данные, сгенерированные выбранным методом, репрезентативны для исследуемой предметной области.
Мы часто рассматриваем свою интерпретацию понятия репрезентативности и некоторые определения, связанные с этим понятием [19 и др.]. В статистике репрезентативностью называют соответствие характеристик выборки аналогичным характеристикам популяции (генеральной совокупности) [см. 20]; однако важно отметить, что стандартного численного определения понятия «репрезентативность», по-видимому, не существует - в отличие от понятия «ошибка репрезентативности». Более широкое определение репрезентативности - «мера возможности восстановить, воспроизвести представление о целом по его части или мера возможности распространить представление о части на включающее эту часть целое» [см. 21] - является более сложным, т.к. описывает процесс, а не объект (выборку).
Как уже было сказано, репрезентативность может быть определена ошибкой репрезентативности, т.е. разностью между специально выбираемыми характеристиками выборочной и генеральной совокупностей; рассматриваемое множество таких характеристик удобно называть сигнатурой. Вследствие того, что оценить характеристики генеральной совокупности часто не представляется возможным (например из-за размеров этой совокупности), на практике чаще используется средняя ошибка репрезентативности - разность между средними или относительными величинами, полученными при проведении выборочного исследования, и аналогичными величинами, которые были бы получены при проведении исследования на генеральной совокупности.
При разработке алгоритмов используется некая идеализированная модель входных данных, чаще всего - с равномерными или нормальными распределениями значений характеристик. Однако на практике входные данные, как правило, поступают в соответствии с некоторым вероятностным распределением, отличным от равномерного или нормального. В результате производительность алгоритма на реальных данных - причем как в среднем, так и в худшем случае - неадекватна. Возможна иная ситуация, когда при создании алгоритма учитываются особенности входных данных, характерные для определенной предметной области; применение таких алгоритмов для другой предметной области может оказаться крайне неэффективным из-за того, что характерные особенности данных оказываются отличными от тех, которые учитывались при разработке алгоритма. Многие ученые работают над теорией, опи-
сывающей алгоритмы для предположительно правильного распределения в каждом конкретном случае, которые достаточно адекватно описывали бы многие практические ситуации. Наибольший прогресс в этом направлении был достигнут в работах американских математиков Л. Левина и Ю. Гуревича [22 и др.]. В некоторых случаях оценка репрезентативности может являться не самоцелью, но служить основой для оценки эффективности алгоритмов.
Авторами в качестве критерия классификации входных данных варианта проблемы ЗКВ была разработана оценка степени нарушения неравенства треугольника матрицы стоимости, после чего был создан рандомизированный алгоритм [14 и др.] количественной оценки нарушения этого неравенства. В ходе вычислительных экспериментов данный алгоритм применялся к нескольким вариантам ЗКВ, сгенерированных с заданными параметрами. Полученные данные были применены для обучения классификатора на основе искусственной нейронной сети (персептрона; [см. 23, 24 и мн. др.], которая в дальнейшем использовалась для классификации случайно сгенерированных различных псевдогеометриче-ских вариантов ЗКВ (т.е. вариантов с разными значениями о).
Далее в исследуемом диапазоне параметров нами были выделены три класса вариантов псевдогеометрических ЗКВ, условно названные следующим образом:
• «р8еи^0» - к этому классу отнесены варианты с о < 0,1; заметим, что сюда относятся собственно геометрические частные случаи ЗКВ;
• «р8еи^1»- с 0,1 < о < 0,55;
• «р8еи^2» - с о > 0,55.
Для псевдогеометрических вариантов случайно с равномерным распределением выбирались различные значения дисперсии при 1 (либо несколько раз бралось значение о = 0, соответствующее геометрическому варианту). На рис. 1 приведены результаты классификации 100 случайно сгенерированных вариантов ЗКВ. Отметим еще, что частный случай ЗКВ, полученный авторами «вручную» на основании реальных данных о стоимости авиабилетов (110 городов), был отнесен программой классификации к классу р8еи^2 (на рисунке не показан).
Рис. 1. Классификация случайно сгеренированных вариантов ЗКВ согласно степени нарушения неравенства треугольника.
Ось абсцисс - порядковый номер наборов входных данных
в классе, ось ординат - значение а. Результаты: зеленый кружок - pseudo0, красный треугольник - р8еи<Зо1, желтый треугольник -pseudo2.
5. Некоторые результаты и возможные направления дальнейшей работы
Итак, авторами данной статьи были проведены исследования характеристик входных данных, получаемых при случайной генерации, а также их сравнение с аналогичными характеристиками входных данных, возникающих в реальных задачах. Был разработан эвристический алгоритм, позволяющий численно оценить степень нарушения неравенства треугольника во входных данных. Численный анализ наборов входных данных, возникающих в реальных задачах (когда метрикой стоимость является цена авиа- или железнодорожного билета), показал, что в использованных данных в большинстве случаев неравенство треугольника нарушается. На основании этого авторами сделан вывод о том, что более адекватной моделью для подобного рода данных являются модели псев-догеометрической задачи, соответствующие алгоритмы позволяют найти более качественное решение.
Исследования авторов [8, 17, 25 и др.] показали, что при решении конкретной прикладной задачи не всегда следует применять общепринятые модели. Более того, даже задачи из очень близких предметных областей могут требовать разработки различных математических моделей и алгоритмов. Действительно, в рассмотренной нами задаче замена одной метрики (расстояние между городами) на другую (стоимость проезда) - казалось бы, близкую к первой - приводит к тому, что математическая модель становится менее адекватной; при этом некоторые алгоритмы, использующие особенности исходной модели, становятся непригодными. Последнее происходит, например, из-за использования эвристиками одного из свойств, вытекающего из неравенства треугольника: прямой путь между двумя городами не может быть более дорогим, чем любой другой путь между ними. Таким образом, в отсутствие универсальных методов оценки адекватности математических моделей единственным выходом является, по-видимому, разработка т.н. методов “ad hoc”, дающих оценки пригодности той или иной модели для каждой конкретной предметной области.
Пока мы почти не касались самих методов решения заданного частного случая ЗКВ - коснемся их очень кратко. (Однако специально отметим, что это не является предметом данной статьи.) Как мы уже говорили, одной из наиболее изученных является геометрическая версия ЗКВ; в результате теоретических исследований было разработано множество подходов к решению ее частных случаев [26 и др.]. Среди них можно выделить т.н. геометрические4 -подходы, использующие при поиске решения информацию о том, что координаты городов были получены как частный случай геометрической ЗКВ. В качестве примеров алгоритмов, относящихся к группе таких геометрических подходов, можно привести луковичный (onion-peeling) алгоритм [27], а также алгоритм эластичной сети [28]. Имея небольшую вычислительную сложность, эти подходы позволяют получить достаточно хорошее решение.
Несмотря на то что применение подобных алгоритмов к псев-догеометрической задаче напрямую невозможно (матрица расстояний псевдогеометрического частного случая, вообще говоря, не соответствует расстояниям между городами, рассчитываемым на основании координат городов), мы, однако, пытаемся решить задачу расположения городов (обычно - в единичном квадрате) прак-
4 Их не следует путать с геометрической версией ЗКВ.
13
тически теми же способами, которые применяются для геометрического варианта: решая оптимизационную задачу минимизации специальным образом вычисляемой невязки. После выполнения этой операции применяются описанные выше методы решения геометрического варианта ЗКВ [подробно см. в 25 и др.]. Заключение («И что?..»)
Самый важный вывод, который хотели бы сделать авторы данной статьи, состоит в следующем. Существуют различные области - как в теоретической информатике, так и в математике, в которых основные направления исследований, проводимых самыми разными научными группами, в действительности являются мало похожими на реальные задачи, возникающие в различных областях на практике. И «увлечение» многих математиков-программистов последовательным (и многоаспектным) улучшением алгоритмов и программ, предназначенных для решения геометрической версии задачи коммивояжера (вместо псевдогеометрической ее версии), -это один из многих подобных примеров.
Литература:
1. Самарский А., Михайлов А. Математическое моделирование: Идеи. Методы. Примеры. - М.: Физматлит, 2001. (Samarskiy A., Mikhaylov A. Mathematical modeling: Ideas. Methods. Examples. - M.: Fizmatlit, 2001.)
2. Oreskes N., Shrader-Frechette K., Belitz K. Verification, validation, and confirmation of numerical models in the earth sciences // Science. -Vol. 263. - 1994. - P. 641-646.
3. Box G., Draper N. Empirical Model Building and Response Surfaces. -NY: Wiley Series in Probability and Statistics, 1987.
4. Гаспарский В. Праксеологический анализ проектно-конструкторских разработок. - М.: Мир, 1978. (Gasparskiy V Praxeological analysis of project design developments. - M.: Mir, 1978.)
5. Розенберг Г., Шитиков В., Брусиловский П. Экологическое прогнозирование (Функциональные предикторы временных рядов). - Тольятти: Изд-во РАН, 1994. (Rozenberg G., Shitikov V., Brusilovskiy P. Ecological forecasting (Functional predictors of time series). - Togliatti, Izd-vo RAN, 1994.)
6. Korostensky C. et al. Near Optimal Multiple Sequence Alignments Using a Travelling Salesman Problem Approach. / String Processing and Information Retrieval Symposium & International Workshop on Groupware. -1999.- P. 105-114.
7. Мельников Б., Панин А. Параллельная реализация мультиэвристиче-ского подхода в задаче сравнения генетических последовательностей // Вектор науки Тольяттинского государственного университета. -
2012. - N° 4. - С. 83-86. (Melnikov B., Panin A. Parallel implementation of multi-heuristic approach to the problem of comparing genetic sequences // Vektor nauki To-l’yattinskogo gosudarstvennogo universiteta. - 2012. -No. 4.- P. 83-86.)
8. Makarkin S., Melnikov B., Panin A. On the metaheuristics approach to the problem of genetic sequence comparison and its parallel implementation // Applied Mathematics.- 2013.- Vol. 4, No. 10A, P. 35-39. doi: 10.4236/ am.2013.410A1006.
9. Melnikov B., Kashlakova E. Some grammatical structures of programming languages as simple bracketed languages // Informatica (Lithuania). - 2000. - V. 11, No. 4. - P. 441-453.
10. Алексеева А., Мельников Б. Итерации конечных и бесконечных языков и недетерминированные конечные автоматы // Вектор науки Тольят-тинского государственного университета. - 2011. - № 3. - С. 30-33. (Alekseyeva A., Melnikov B. Iteration of finite and infinite languages and non-deterministic finite automata // Vektor nauki Tol’yattinskogo gosu-darstvennogo universiteta. - 2011. - No. 3. - P. 30-33.)
11. Мельников Б. Алгоритм проверки равенства бесконечных итераций конечных языков / Вестник Московского университета. Серия 15: Вычислительная математика и кибернетика. - 1996. - № 4. - С. 4953. (Melnikov B. An algorithm for testing the equality of infinite iterations of finite languages // Vestnik Moskovskogo universiteta. Seriya 15: Vychislitel’naya matematika i kibernetika. - 1996. - No. 4. - P. 49-53.)
12. Korostensky C. et al. Using traveling salesman problem algorithms for evolutionary tree construction // Bioinformatics. - 2000. - Vol. 16. -P. 619-627.
13. Hromkoviu J.Algorithmics for Hard Problems. Introduction to Combinatorial Optimization, Randomization, Approximation, and Heuristics. -Springer, 2003.
14. Громкович Ю. Теоретическая информатика. Введение в теорию автоматов, теорию вычислимости, теорию сложности, теорию алгоритмов, рандомизацию, теорию связи и криптографию. - СПб.: БХВ-Петербург, 2010. (Hromkoviu J.Introduction to Automata, Computability, Complexity, Algorithmics, Randomization, Communication, and Cryptography. - Springer, 2004.)
15. Гэри М., Джонсон Д. Вычислительные машины и труднорешаемые задачи. - М.: Мир, 1982. (Garey M., Johnson D. Computers and Intractability: A Guide to the Theory of NP-Completeness. - W. H. Freeman and Company, 1979.)
16. Melnikov B., Radionov A., Gumayunov V Some special heuristics for discrete optimization problems // Proc. of 8th International Conference on Enterprise Information Systems, ICEIS-2006. - Cyprus. - 2006. - P. 360364.
17. Мельников Б., Романов Н. Еще раз об эвристиках для задачи коммивояжера // Теоретические проблемы информатики и ее приложений. - 2001. - Т. 4. - С. 81-92. (Melnikov B., Romanov N.Once more on
heuristics for the traveling salesman problem // Teoreticheskiye problemy informatiki i yeyo prilozheniy. - 2001. - Vol. 4. - P. 81-92.)
18. Melnikov B. Multiheuristic approach to discrete optimization problems // Cybernetics and Systems Analysis. - 2006. - Vol. 42. - No. 3. - P. 335-341.
19. Мельников Б., Пивнева С., Рогова О. Репрезентативность случайно сгенерированных недетерминированных конечных автоматов с точки зрения соответствующих базисных автоматов // Стохастическая оптимизация в информатике. - 2010. - Т. 6. - № 1. - С. 74-82. (Melnikov B., Pivneva S., Rogova O. The representativeness of a randomly generated non-deterministic finite automata from the point of view of the relevant basis automata. / Stokhasticheskaya optimizatsiya v informatike. - 2010. -Vol. 6.- No. 1.- P. 74-82.)
20. Балинова В. Статистика в вопросах и ответах: учеб. пособие. - М.: ТК Велби, изд-во Проспект, 2004. (Balinova V Statistics: Questions and Answers. Textbook. - M.: TK Velbi, izd-vo Prospekt, 2004.)
21. Философский энциклопедический словарь; гл. редакция: Л. Ильичев, П. Федосеев, С. Ковалев, В. Панов. - М.: Сов. Энциклопедия, 1983. (Filosofskiy entsiklopedicheskiy slovar’; editors: L. Il’ichov, P. Fe-doseyev, S. Kovalov, V Panov. - M.: Sov. Entsiklopediya, 1983.)
22. Gurevich Y., VeanesM., Wallace C. Can abstract state machines be useful in language theory? // Theoretical Computer Science (Developments in Language Theory). - 2007. - V. 376, No. 1-2. - P. 17-29.
23. Люгер Дж. Искусственный интеллект. Стратегии и методы решения сложных проблем. - Вильямс, 2003. (Luger G. Artificial Intelligence: Structures and Strategies for Complex Problem Solving. - Addison-Wes-ley, 1999.)
24. Мельников Б., Радионов А. О выборе стратегии в недетерминированных антагонистических играх // Программирование. - 1998. -№ 5. - С. 55-62. (Melnikov B., Radionov A. The choice of strategy in the non-deterministic zero-sum games // Programmirovaniye. - 1998. -No. 5.- P. 55-62.)
25. Макаркин С. Еще об одном подходе к решению псевдогеометриче-ской задачи коммивояжера // Вектор науки Тольяттинского государственного университета. - 2012. - № 4, C. 79-82. (Makarkin S. About one approach to solving the traveling salesman problem pseudogeo-metrical // Vektor nauki Tol’yattinskogo gosudarstvennogo universiteta. -2012.- No. 4.- P. 79-82.)
26. Gutin G., Punnen A. (editors). The Traveling Salesman problem. - Kluwer Academic Publishers, 2002.
27. http://arxiv.org/ftp/arxiv/papers/1204/1204.2350.pdf - Liew Sing. Introducing convex layers to the Traveling Salesman Problem / Preprint: arX-iv:1204.2348. - 2012. - Режим доступа - свободный. (Access mode -free.)
28. Somhom S., Modares A., Enkawa T. Competition-based neural network for the multiple travelling salesmen problem with minimax objective // Computers & Operations Research. - 1999. - Vol. 26, No. 4. - P. 395-407.
УДК 004.023,004.8 АЛГОРИТМИЗАЦИЯ ТРУДНОРЕШАЕМЫХ ЗАДАЧ.
ЧАСТЬ I. ПРОСТЫЕ ПРИМЕРЫ И ПРОСТЫЕ ЭВРИСТИКИ
ГРОМКОВИЧ Юрай,
профессор, доктор физико-математических наук,
Eidgenössische Technische Hochschule, Цюрих, Швейцария [email protected]
МЕЛЬНИКОВ Борис Феликсович,
профессор, доктор физико-математических наук, Самарский государственный университет,
Самара, Россия [email protected]
Аннотация. В статье мы излагаем свой взгляд на т.н. труднорешаемые вычислительные задачи и возможные подходы к их алгоритмизации - на уровне, «несколько превышающем научно-популярный», однако «несколько меньшем, чем научный».
При этом мы делаем упор на описании методов разработки алгоритмов для них и не сводим рассмотрение трудных задач, а также нашу интерпретацию трудности, к т.н. NP-трудности. В центре нашего внимания находятся проблемы, для которых (пока) не доказаны ни NP-трудность, ни полиномиальная разрешимость, т.е. неизвестно, существуют ли алгоритмы, решающие эту задачу за т.н. полиномиальное время (время, ограниченное некоторым полиномом относительно размера входных данных). Однако, кроме того, мы считаем трудными и такие задачи, для которых полиномиальная разрешимость доказана - однако (пока) неизвестны полиномиальные алгоритмы малых степеней.
Среди рассматриваемых нами примеров задач - известные интеллектуальные игры-головоломки, а также задача коммивояжера и проблемы минимизации недетерминированных конечных автоматов и дизъюнктивных нормальных форм.
Среди алгоритмов мы в первую очередь рассматриваем эвристические - которые обычно не гарантируют получение оптимального решения, однако с приемлемо большой вероятностью дают решение, близкое к нему. Важной их разновидностью являются т.н. anytime-алгоритмы -алгоритмы реального времени, которые в каждый определенный момент работы имеют лучшее (на данный момент) решение; при этом пользователь в режиме реального времени может просматривать эти псевдоопти-мальные решения, а последовательность таких решений в пределе обыч-