Научная статья на тему 'Применение моделей ассоциативного поиска для прогнозирования в задачах трейдинга'

Применение моделей ассоциативного поиска для прогнозирования в задачах трейдинга Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
487
80
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бахтадзе Н. Н., Валиахметов Р. Т.

Рассмотрен подход к краткосрочному прогнозированию на фондовом рынке, основанный на применении виртуальных моделей и алгоритмов ассоциативного поиска.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF ASSOCIATIVE SEARCH MODELS FOR PREDICTION IN TRADING TASKS

An approach to short-term stock market forecasting based on virtual models and associative search algorithms application is discussed.

Текст научной работы на тему «Применение моделей ассоциативного поиска для прогнозирования в задачах трейдинга»

УДК 658.15(075.8)

ПРИМЕНЕНИЕ МНДЕЛЕЙ АССОЦИАТИВНОГО ПОИСКА ДЛЯ ПРОГНОЗИРОВАНИЯ В ЗАДАЧАХ ТРЕЙДИНГА

Н.Н. Бахтадзе, Р.Т. Валиахметов Институт проблем управления им. В.А. Трапезникова РАН, г. Москва

Рассмотрен подход к краткосрочному прогнозированию на фондовом рынке, основанный на применении виртуальных моделей и алгоритмов ассоциативного поиска.

ВВЕДЕНИЕ

Краткосрочное прогнозирование цен на финансовые и фондовые активы, в частности, для трейдинга (торгов «on line» на валютной или фондовой бирже) представляет собой одну из самых важных и одновременно самых сложных задач финансовой математики. В рамках двух основных технологий прогнозирования (фундаментального анализа и технического анализа) накоплен существенный опыт и предложено большое число методов. Классический фундаментальный анализ основан на хорошо развитом аппарате математической статистики и теории временных рядов [1].

Результаты исследования процессов долгосрочного прогнозирования дохода по цене акций продемонстрировали высокий коэффициент автокорреляции ценообразующих факторов в регрессионных моделях, что свидетельствует о стабильной предсказуемой динамике.

Сложно выявляемая динамика цен, обусловленная межфакторной корреляцией, приводит к долгосрочному отклонению цен от равновесного значения, что предопределяет низкую эффективность применения регрессионных моделей для прогнозирования в задачах трейдинга. Неплохой результат для решения подобных задач демонстрирует применение рекуррентных одношаговых алгоритмов идентификации, однако он не вполне соответствует требованиям высокой точности и быстродействия. Отчасти это обусловлено слабой формализуемостью отдельных ценообразующих факторов (влияние на состояние фондового рынка политических событий, природных катаклизмов и др.).

Технический анализ, или чартизм, позволяет идентифицировать различные рыночные аномалии на основе визуального графического анализа

архива статистических данных и автоматического выявления характерных геометрических форм («голова и плечи», «клин», «блюдце», «прямоугольник» и т. п.), т. е. выявления закономерностей, характерных для определенной ситуации на рынке. Несмотря на то, что метод продемонстрировал эффективность в ряде случаев даже для среднесрочного и краткосрочного прогнозирования на валютном рынке (более 90 % дилеров лондонского валютного рынка применяют технический анализ для прогнозирования валютных курсов на четыре недели вперед), официального признания он так и не получил.

Однако основная гипотеза чартизма — «рынок повторяется», т. е. цена активов определяется динамикой цен в прошлом — безусловно, заслуживает внимания. Альтернативой техническому анализу может послужить метод разработки прогнозирующих моделей, основанный на имитации ассоциативного мышления аналитика.

В алгоритмах идентификации, применяемых в современных системах управления, часто используются экспертные знания, причем как знания лица, принимающего решение (ЛПР) об управлении, так и хранящиеся в базе знаний. Во втором случае трейдеру может быть предоставлено рекомендуемое управляющее воздействие (решение о покупке либо продаже) либо — прогноз, получаемый посредством мониторинга ситуации на рынке.

Различают два типа знаний: декларативные и процедурные, или процедуральные [2]. К первым относят описание различных фактов, явлений, наблюдений, формулирование теорий. Второй тип составляют различного рода умения и навыки. Эксперты (в нашем случае — аналитики, трейдеры) отличаются от новичков структурой и способом мышления, в частности, стратегией поиска решений [3]. Если человек не эксперт, он использует

так называемый «обратный вывод» (backward reasoning), когда на основе полученной информации о текущем состоянии процесса он перебирает варианты решений и ищет аргументы в пользу того или другого. Эксперту не требуется анализ текущей информации, он использует в процессе принятия решения так называемый «прямой вывод» (forward reasoning), при котором стратегия принятия решений по формированию экспертом управляющего воздействия создается на подсознательном уровне и невербализуемая. Таким образом, в аспекте информационного подхода (computational view of thought) [4] эффективность системы в значительной степени будет определяться квалификацией эксперта и априорной информацией, которой он будет располагать. В рамках такого подхода когнитивная психология определяет знание как определенный набор реально существующих элементов — символов, которые хранятся в памяти человека, обрабатываются в процессе мышления и определяют поведение. Символы, в свою очередь, могут быть определены структурой и характером межнейронных связей [5].

Процесс обработки знаний в интеллектуальной системе заключается в восстановлении (ассоциативном поиске) знания по его фрагменту [6]. Знание можно интерпретировать как ассоциативную связь между образами. Ассоциативный поиск может осуществляться либо как процесс восстановления образа по частично заданным признакам (или восстановления фрагмента знания в условиях неполной информации; как правило, именно этот процесс имитируется в различных моделях ассоциативной памяти), либо как процесс поиска других образов (связанных ассоциативно с исходным образом), привязанных к другим моментам времени. Такие образы могут иметь смысл причины или следствия исходного образа.

Известны различные схемы ассоциативного поиска [6]. Так, во фреймовых системах задача поиска реализуется в виде сопоставления (matching) фреймов. В семантических сетях поиск осуществляется путем сопоставления фрагментов сети и графа-запроса. Применительно к решению дискретных задач многокритериального выбора эффективным оказался подход, основанный на методе вербального анализа решений [7]. В рамках такого подхода производится декомпозиция описания объектов по многим критериям на их частичные описания меньшей размерности, которые предлагаются ЛПР для сравнения (в предположении попарно равных оценок по критериям, не вошедшим в такие описания).

В работе [6] предложена модель, описывающая процесс ассоциативного мышления как последовательный процесс вспоминания на основе применения ассоциаций — пары образов, характеризу-

ющихся своим набором признаков. Такая модель представляется промежуточной генерацией между моделями нейронных сетей и логическими моделями, используемыми в классических системах искусственного интеллекта.

В настоящей работе предложен подход к формированию поддержки в режиме «on line» принятия решения трейдером, основанный на динамическом моделировании процедуры ассоциативного поиска и метода идентификации на базе виртуальных моделей.

1. АЛГОРИТМ НЕЛИНЕЙНОГО ДИНАМИЧЕСКОГО ПРОГНОЗИРОВАНИЯ НА БАЗЕ ВИРТУАЛЬНЫХ МОДЕЛЕЙ

В работах [8, 9] для статических объектов управления был предложен метод, получивший название метода кусочно-линейной аппроксимации. Его суть заключается в построении прогнозирующей модели для статических объектов управления на основе подбора для каждого вновь приходящего вектора входов такого набора векторов в многомерном пространстве, которые были бы «близки» к текущему входному вектору в смысле определенного критерия. Расширение возможностей предложенного метода на класс динамических объектов оказалось затруднительным ввиду существенных вычислительных сложностей, связанных с низкой производительностью компьютерной техники того времени.

Спустя более чем тридцать лет в работе [10] был предложен алгоритм идентификации с непрерывной самонастройкой в режиме реального времени для идентификации сложных нелинейных динамических объектов на основе построения виртуальных моделей.

Алгоритм состоит в построении в каждый момент времени аппроксимирующей гиперповерхности пространства входных векторов и соответствующих им одномерных выходов. Для построения виртуальной модели, соответствующей некоторому моменту времени, выбираются векторы, в смысле определенного критерия близкие к текущему входному вектору. Размерность получаемой в результате такого отбора гиперповерхности выбирается эвристически. Далее на основе метода наименьших квадратов определяется значение выхода в следующий момент времени.

Подчеркнем, что такой алгоритм не строит единственную аппроксимирующую модель реального процесса — он строит новую модель для каждого момента времени. При этом каждая точка глобальной нелинейной поверхности регрессии получается в результате использования линейных «локальных» моделей.

Для построения модели формируется временная база данных архивной и текущей информации

об идентифицируемом объекте. После определения прогноза выхода по текущему состоянию объекта эта виртуальная база уничтожается без запоминания.

Линейная динамическая прогнозирующая модель имеет следующий вид:

т п S

Ум = X й1Ум -1 + X X / хм - ^,

/ = 1 / = 1 $ = 1

где ум — прогноз выхода объекта на момент времени N хм — вектор входных воздействий, ш — глубина памяти по выходу, п — глубина памяти по входу, Б — размерность вектора входов.

Алгоритм продемонстрировал высокую точность прогнозирования для среднесрочного прогнозирования цен акций (см. Приложение). Однако ряд моментов требовал дополнительных исследований, в частности, возможные методы построения аппроксимирующей гиперповерхности и определение ее размерности.

В частности, для выбора (из архива) набора входных векторов, образующих аппроксимирующую гиперповерхность, может быть предложен следующий подход.

Введем в качестве расстояния между точками Б-мерного пространства входов следующую величину:

S

^м,м-/ = X 1 хм - хм-./,$1, V/ = 1, ..., п,

$ = 1

где хм$ — компоненты вектора входов в текущий момент времени N.

В силу неравенства треугольника

S S

^м,м-/ т X 1 хт\ + X 1 хм,м-|, ^ = 1, ..., п.

$ = 1 $ = 1

Пусть для текущего вектора входов хм

S

X 1 хт\ = ^#.

$ = 1

Для построения аппроксимирующей гиперповерхности для вектора хм отберем из архива входных данных такие векторы хм ., / = 1, ..., п, что для некоторого заданного Бм будет выполнено условие:

S

^м,м -} т ^м + X 1 хм,м - }$1 т ^м + ^м,

$ = 1

V/ = 1, ..., п,

где, вообще говоря, п < N и не требуется упорядоченность моментов времени /.

Если в выбранной области не наберется достаточного числа входных векторов таких, что соответствующая система линейных уравнений окажется разрешимой, то выбранный критерий отбора точек в пространстве входов можно будет ослабить путем увеличения порога Бм.

Предлагаемая процедура построения аппроксимирующей поверхности обладает большим быстродействием по сравнению с алгоритмом, предложенным в работе [10], поскольку величины йм - к =

S

= X Iх(М- к) $1, к = 1, ..., N — 1 для всех моментов

$ = 1

времени, предшествующих N могут быть на этапе обучения однократно определены и ранжированы, а по мере поступления нового входа эта последовательность пополняется новым членом.

2. ПРИМЕНЕНИЕ АЛГОРИТМА ИДЕНТИФИКАЦИИ С ИСПОЛЬЗОВАНИЕМ ВИРТУАЛЬНЫХ МОДЕЛЕЙ ДЛЯ ПРОЦЕДУРЫ АССОЦИАТИВНОГО ПОИСКА

Для выявления закономерностей при анализе статистических данных трейдинга применим метод, основанный на использовании модели ассоциативного мышления для прогнозирования.

Сначала рассмотрим следующий подход [11] для построения процедуры ассоциативного поиска.

Пусть множество значений технологических параметров (компонент вектора входов), а также значения выходов системы в предыдущие моменты времени вместе составляют множество признаков К = {х^$, у}, 1 = 1, ..., N 5 = 1, ..., Б. Общее число

признаков Ыр = Ы(Б + 1).

Множество входных векторов, с помощью которых были построены аппроксимирующие гиперповерхности (включая текущий вектор), и соответствующих им выходов назовем множеством комбинаций значений признаков на множестве К:

Рм = {хы, хы_/, ум-}}, о т / т N

описывающих конкретные образы, с которыми сталкивается при своем функционировании интеллектуальная система.

Обозначим образ, инициирующий ассоциативный поиск, через Р, и соответственно образ-результат ассоциативного поиска — через Я. В процессе ассоциативного вспоминания используются образы, описываемые признаками. Пару образов (Р, Я) назовем ассоциацией А или А(Р, Я). Множество всех ассоциаций на множестве образов составляет память или базу знаний интеллектуальной системы.

В нашем случае в качестве начального образа Pa ассоциативного поиска будем рассматривать текущий вектор входов xN Конечным образом Ra ассоциативного поиска будет аппроксимирующая гиперповерхность, построенная с помощью описанного в § 1 алгоритма. Алгоритм реализует процесс

восстановления образа Ra по образу Pa (т. е. процесс ассоциативного поиска) и может быть описан

предикатом Е (Pa, Ra, Ta), где Pa с P и Ra с R,

T a — время ассоциативного поиска.

Ассоциативный поиск, принимающий значение TRUE, называется успешным, а принимающий значение FALSE — неудачным. Каждой ассоциации A = A(P, R) в общем случае соответствует множество успешных ассоциативных поисков Q = {Е;( Pa, Ra, Ta)}. Ассоциативный поиск

E(Pa, Ra, Ta), использующий только одну ассоциацию, содержащуюся в памяти интеллектуальной системы, называется элементарным ассоциативным поиском [5].

Формирование множества успешных ассоциативных поисков зависит от особенностей конкретной реализации ассоциативной памяти (а именно, сопоставления начального образа ассоциативного

поиска Pia с образом P).

Для алгоритма, представленного в § 1, предикат

E(Pa, Ra, Ta) служит высказывательной функцией, утверждающей истинность либо ложность принадлежности текущего входного вектора области в пространстве входов:

dN m dN,N - j m dN + DN. (1)

Иллюстрация для двумерного случая представлена на рисунке.

Результатом такой процедуры ассоциативного

поиска, т. е. результирующим образом Ra, является гиперповерхность в пространстве входов, отвечающая условию

S

S

X 1XN - jj m DN X |:

'Ns''

(2)

s = І

s = І

Если не найдется в архиве ни одного набора входных данных, удовлетворяющего условию (2), то из архива входных векторов выбирается еще один вектор из области (1) в соответствии с условием

dN,N - і . minN m dN + X 1XN - i,s1 m dN + DN,

,*j, ,<N s = І

т. е. число «признаков» увеличивается на единицу, и т. д.

Область успешных ассоциативных поисков

Таким образом, процесс принятия решений аналитиком о покупке либо продаже акций в любой момент времени N интерпретируется как ассоциативный поиск (процесс вспоминания) образов, инициируемый начальным входным образом (т. е. значением текущих компонент входного воздействия). В общем случае этот процесс можно представить как ассоциативный поиск, раскладываемый в цепочку элементарных ассоциативных поисков [5]. При этом используется так называемая цепочка с запоминанием, когда начальным образом для текущего ассоциативного поиска является образ, формируемый с учетом истории поиска на предыдущих этапах. В случае алгоритма, описанного в § 1, в архиве сохраняются координаты используемых на предыдущих этапах аппроксимирующих гиперповерхностей.

3. ПРОЦЕДУРЫ АССОЦИАТИВНОГО ПОИСКА В ЗАДАЧЕ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ

Для задач краткосрочного прогнозирования цен в биржевой игре определяющее значение обретает учет не только текущего состояния, но и динамики цен. На практике, например, для выявления «точки перегиба» (момента, когда прекращается рост либо падение цены акции) требуется учет динамики небольшой глубины. Однако при использовании обычных регрессионных моделей точность прогнозирования оказывается неудовлетворительной.

Используем процедуру ассоциативного поиска, усложнив требования к отбору аппроксимирующей гиперповерхности: теперь из архива выберем такую из них (соответствующую некоторому вектору хм - /, / = 1, ..., п), что не только вектор входа

S

в текущий момент времени N принадлежит этой гиперповерхности, но и вектор входов в предыдущий момент времени N — 1 попадает на гиперповерхность, соответствующую вектору Хм _ ^ _ р j = 1, ..., п. Формально это выражается в усложнении предиката

Г S S

■(PR\ T■) = I X |XN- J m DN - X IxNsl;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 s = І s = І

SS

X 1XN - j - u1 m DN - І X 1

X

s = І

s = І

Существует принципиальная возможность выявления и более тонких закономерностей в процессе изменения цен, увеличивая глубину динамики, скажем, на I шагов (I < N):

Г S S

=(р■, г, т■> = Г X \х« - ,) т о„ - X Ы;

s = І

m

s = І

X 1XN- j - U1 m DN - І X 1 XNsI;

s = І

s = І S

..., X 1XN- J m DN- I X 1

X

Ns І Г '

s = І

s = І

ЗАКЛЮЧЕНИЕ

Для краткосрочного прогнозирования в процессе трейдинга могут быть применены алгоритмы идентификации на основе процедуры ассоциативного поиска. Используются цепочки ассоциаций с запоминанием любой возможной глубины. Процесс успешного ассоциативного поиска возможен при наличии базы знаний, формируемой и пополняемой трейдинговой системой поддержки принятия решений аналитиком (трейдером) о покупке или продаже акций непосредственно в процессе торгов.

ПРИЛОЖЕНИЕ

Представим методику определения цены акции компании на один день вперед, с помощью алгоритмов идентификации. Для исследования выбирались акции американских компаний, прошедших листинг на NYSE (New-York Stock Exchange) — Нью-Йоркской фондовой бирже. Такой выбор был обусловлен двумя критериями — эффективностью рынка и его ликвидностью.

NYSE является крупнейшей биржей мира с большим числом участников торгов. Ее характеризуют хорошая законодательная база и мощный инструментарий SEC (Security Exchange Commission) с широкими полномочиями, позволяющий эффективно бороться с inside trading, т. е. использованием внутренней («инсай-

дерской»), конфиденциальной информации, исходящей от руководства компании, для проведения сделок с ценными бумагами этой компании. Незаконное использование инсайдерской информации преследуется законодательствами всех развитых стран.

Период наблюдения для всех данных: 1 год с 01.06.04 по 01.06.05. Источник: база данных ресурса yahoo.com.

Для расчетов параметров моделей использовался пакет Ма^аЬ 6.2.

Результаты моделирования

Модель 1:

^ = ам Бы - ! + ъ] + СОы - ! ъ] + БРЫ - ! ъ], (П1)

где и _ 1 — соответственно цены акции в моменты времени N и N — 1; СОм _ 1 — цена сырой нефти в момент времени N — 1; БРМ _ 1 — нормированное значение индекса SP500 в момент времени N — 1; а],

ъ], Ъ] и Ъ] — числовые коэффициенты модели, подлежащие определению.

Для вычисления числовых коэффициентов модели (П1) был выбран известный рекуррентный алгоритм:

K = K + YN- (KN-1, Xn) X

Kn Kn - 1 + 1 + (x№ Xn) n

(П2)

где Км — вектор параметров, Ум — выход, Хм — вектор входов.

Модель была применена к исследованию динамики цен акций компаний из различных областей американской экономики. Ошибка вычислялась в виде:

М = 1/N £|3 - 4

I = 1

где — цена акции, У( — прогнозируемый выход, N — число дней.

Выражение для ошибки имеет очевидную экономическую интерпретацию, являясь выражением среднего

Рис. П1. Прогноз цены акций компании MT (Mittal Steel Company — одна из крупнейших американских компаний производителей стали. Рыночная капитализация 58 млрд долл. США), полученный с помощью модели 1 и алгоритма (2)

S

Рис. П2. Прогноз цены акций компании МХ, полученный с помощью модели 2 и алгоритма ассоциативного поиска

количества денежных единиц, теряемых участником торгов за 1 день при длинной или короткой позиции при объеме позиции в одну акцию.

Для вычисления коэффициентов модели (П1) применялся также алгоритм

KN KN - 1 +

sign ( Yn - (KN- 1 XN) ) 1 + (X№ XN)

XN,

(П3)

и алгоритм идентификации на основе виртуальных моделей. На рис. П1 и П2 приведены графики динамики цен акций для различных компаний, полученные с помощью перечисленных алгоритмов.

Далее к модели 1 была добавлена еще одна входная переменная — дивиденд. Данный вход может иметь только два значения в течение наблюдаемого периода. Дата объявления дивиденда является датой изменения этого входа.

Модель 2:

- 1 + ЪК + С0Ы - 1 ък +

+ $РЫ - 1 ъ\ + БіУм Ъ%,

4

где Віум — дивиденд компании в день И, Ъм — числовой коэффициент.

Коэффициенты модели 2 определялись с помощью как алгоритма (П2), так и алгоритма (П3). На графиках (см. рис. П1 и П2) представлены результаты соответствующих расчетов.

ЛИТЕРАТУРА

1. Ширяев А.Н. Основы стохастической финансовой математики. Теория, факты, модели. — М.: Фазис, 1998.

2. Ларичев О.И., Нарыжный Е.В. Компьютерное обучение процедуральным знаниям // Психологический журнал. — 1999. — № 6. — С. 53—61.

3. Patel V.L., Ramoni M.F. Cognitive Models of Directional Inference in Expert Medical Reasoning // In: Feltovich P., Ford K., Hofman R. (Eds.) Expertise in Context: Human and Machine. — Menlo Parc, CA: — AAAI Press, 1997.

4. Hunt E. Cognitive Science: Definition, Status and Questions // Annual Review of Psichology. — 1989. — Vol. 40. — P. 603—629.

5. Newell A., Simon H.A. Human Problem Solving, Englewood Cliffs. — NJ: Prentice-Hall Inc., 1972.

6. Gavrilov A.V. The Model of Associative Memory of Intelligent System // The 6-th Russian-Korean Intern. Symp. on Science and Technology / Proceedings. — Novosibirsk, 2002. — Vol. 1. — P. 174—177.

7. Ларичев О.И., Мошкович Е.М. Качественные методы принятия решения. — М.; Физматгиз, 1996.

8. Дорофеюк А.А., Касавин А.Д., Торговицкий И.Ш. Контроль качества и восстановление характеристик объектов, работающих в нескольких режимах // В кн. «Доклады II Всесоюз. совещания по статистическим проблемам теории управления. Идентификация». — М.: Наука, 1970. — С. 181—182.

9. Касавин А.Д. Адаптивные алгоритмы кусочной аппроксимации в задаче идентификации // Автоматика и телемеханика. — 1972. — № 12.

10. Чадеев В.М. Цифровая идентификация нелинейных динамических объектов // Автоматика и телемеханика. — 2004. — № 12. — С. 85—93.

11. Bachtadze N, Lototsky V, Maximov E, Pavlov B. Associative Search Models in Industrial systems // IFAC Intern. Workshops Intelligent Assembly and Disassembly (IAD'07) & Intelligent Manufacturing Systems (IMS'07). — Alicante, Spain, 2007. — Vol. 1. — P. 120—126.

® (495) 334-92-01, e-mail: [email protected]

Статья представлена к публикации членом редколлегии А.С. Манделем. □

“Новая

книга

Индикативное планирование и проведение региональной политики / А.Б. Левинталь, В.Ф. Ефременко, В.Б. Гусев и др. — М.:

Финансы и статистика, 2007. — 368 с.

На примере Хабаровского края рассмотрена методология построения и функционирования системы индикативного планирования для программ развития региона. Описаны формализованные процедуры, применяемые при разработке и реализации индикативных планов: расчет равновесных (сбалансированных) параметров экономического развития региона, комплексное оценивание объектов планирования (проектов, мероприятий, программ), расчет сценарных прогнозов экономической динамики региона.

Для специалистов по управлению в социально-экономических структурах, руководителей и администрации регионов, студентов, аспирантов и научных работников, занимающихся вопросами организации управления.

По вопросам приобретения книги обращайтесь по тел. (495) 334-88-21, e-mail: [email protected].

i Надоели баннеры? Вы всегда можете отключить рекламу.