ОТЗЫВ НАУЧНОГО РУКОВОДИТЕЛЯ на выпускную квалификационную работу Замарахиной М.С. «Анализ аналогов ляпуновских показателей эмпирических мод финансовых временных рядов на основе нейросетевых технологий» представленную на соискание степени бакалавра искусств и гуманитарных наук по направлению подготовки 035300 «Искусства и гуманитарные науки» Согласно различным гипотезам рынка: гипотезе эффективности (цена актива - это мартингал относительно того или иного потока "информации", то есть прогноз цены на завтра есть значение цены сегодня), гипотезе отсутствия арбитража (невозможность получения мгновенной безрисковой прибыли), гипотезе фрактальности (инвестиционные горизонты трейдеров не однородны, цена "складывается " в результате действий краткосрочных и долгосрочных инвесторов, поэтому цены обладают фрактальной структурой), движение цены описывается случайным процессом. Это делает невозможным предсказание будущих цен и соответствующих доходностей. Попытки выделения детерминированной хаотической компоненты в финансовых рядах является уже классической задачей, которая, при ее успешном решении, существенно повышает вероятность прогноза Количественной мерой хаоса в динамических системах традиционно является положительность старшего показателя Ляпунова Главной целью ВКР Замарахиной М.С. являлось выделение детерминированной компоненты в доходностях финансового временного ряда и ответ на вопрос, является ли эта компонента хаотической. Более конкретно, в работе анализировались временные ряды логарифмических доходностей значений фондовых индексов MICEX (взвешенный по рыночной капитализации композитный индекс российского фондового рынка, включающий 50 наиболее ликвидных акций крупнейших российских эмитентов) и фондового индекса S&P500 (в корзину которого включены 500 избранных акционерных компаний США, имеющих наибольшую капитализацию). Значения индексов взяты за период с 1 августа 2016 года по 30 декабря 2016 года, использовались данные с минутной нарезкой. Для реализации этой цели были решены следующие задачи: 1. метод разложения на эмпирические моды (EMD-разложения) был применен для выделения двух компонент логарифмических доходностей: суммы нескольких первых высокочастотных мод и суммы оставшихся мод. 2. исследовано поведение корреляционных размерностей реконструированных аттракторов указанных двух компонент в зависимости от размерности вложения (размерности лагового пространства) при фиксированном лаге, который определялся на основании метода взаимной информации. 3. вычислены спектры так называемых локальных показателей разбегания траекторий (ЛПР) на реконструированных аттракторах двух выделенных компонент логарифмических доходностей (метод ЛПР основан на использовании комитетов искусственных нейронных сетей, а набор характеристик спектров ЛПР можно рассматривать в качестве обобщенного аналога старшего ляпуновского показателя). Все перечисленные задачи были решены автором численными методами, программно реализованными в среде Matlab. Основные этапы практической части ВКР Ряды очищенных от выбросов логарифмических доходностей для удобства вычислений были обрезаны до 41000 значений. Затем по этим рядам с помощью реализованной в среде Matlab функции emd (находится в свободном доступе), были вычислены эмпирические моды. Всего для каждого ряда получилось 20 мод. Далее из временных рядов по очереди удалялись первые 2, 3, 4, 5 мод и результаты сравнивались. Эмпирическим путём было установлено, что оптимальным вариантом выделения двух компонент логарифмических доходностей являются 1) суммы первых 4 мод и 2) сумма оставшихся 16 мод. Чтобы проверить адекватность выделения компонент, для каждого варианта разложения строились корреляционные суммы, корреляционные размерности и график зависимости корреляционной размерности от размерности вложения. (Вычисления производились в среде Matlab. Были использованы коды, написанные магистром физического факультета СПбГУ Сметаниным Н. (под руководством Дмитриевой Л.А.). Для суммы первых 4 мод была получена линейная зависимость корреляционной размерности от размерности вложения Известно, что в этом случае данные имеют случайную природу. Если происходит насыщение корреляционной размерности (значения корреляционной размерности, начиная с некоторой размерности вложения, перестают изменяться в пределах погрешности вычисления)) – значит, данные детерминированы, такая картина была получена для суммы оставшихся 16 мод. Значение максимальной размерности вложения, для которой вычисление корреляционных размерностей осмысленно, тесно связано с длиной ряда и может быть определено, например, по критерию Цониса. Именно для того, чтобы иметь длииные ряды, использовалась высокочастотная (минутная) нарезка. Насыщение для суммы последних 16 мод происходило на размерности вложения 4.. Из этого делался предварительный вывод, что эта компонента - детерминирована. Для дальнейшего применения нейросетевого метода ЛПР, из двух выделенных компонент были нарезаны куски длиной 2000 отсчётов: с 1003 по 3002, с 15001 по 17000 и с 30001 по 32000. Для этих отрезков были посчитаны спектры ЛПР. Метод ЛПР был разработан Дмитриевой Л.А. с соавторами. Идея метода ЛПР связана с циклом работ В.А. Головко, Н.Ю. Чумерина и Ю.В.Савицкого, посвященных поиску решения проблем вычисления старшего показателя Ляпунова и всего спектра ляпуновских экспонент по коротким временным рядам методами нейросетевого прогнозирования. На первом шаге метода ЛПР осуществляется обучение нескольких "затравочных" нейронных сетей, каждая из которых является, например, 4-слойным персептроном. При обучении используется алгоритм Левенберга-Марквардта, который, как известно, хорошо работает на коротких временных рядах. Каждая сеть имеет m входов и m выходов, где m – размерность лагового пространства изучаемого временного ряда. Каждая сеть обучается аппроксимировать отображение, связывающее лаговый вектор, построенный по отсчету временного ряда с номером t, и лаговый вектор, построенный по отсчету временного ряда с номером t+1. На затравочных сетях фиксируется минимальная MSE(MeanSquareError) на тестовом множестве: MSEmin. Далее обучаются новые сети. В комитет, который будет считать ЛПР, включаются только те нейронные сети, у которых MSE на тестовом множестве меньше, чем 1.1* MSEmin. Число сетей в комитете, разумно выбирать равным 10. Далее каждая сеть в комитете осуществляет многошаговый прогноз (прогноз по прогнозу на один отсчет вперед) каждого лагового вектора. Количество шагов прогноза по прогнозу выбиралось равным 8. Этот 8-шаговый прогноз рассматривался как часть опорной траектории в лаговом пространстве. Затем в лаговом пространстве для каждого лагового вектора генерировалось 250 возмущений лагового вектора. Возмущения задавались с помощью генератора случайных чисел так, чтобы модуль разности компонент лагового и каждого возмущенного вектора не превышало определенного порога Для возмущенных лаговых векторов с помощью обученных сетей их комитета также совершался многошаговый прогноз, в результате чего для каждого лагового вектора получался пучок возмущенных траекторий в лаговом пространстве. Далее для каждого шага 8-шагового прогноза вычислялись расстояния между точками на опорной и на возмущенных траекториях. Затем строились линейные регрессии логарифмов этих расстояний относительно номеров прогнозов. Для каждого лагового вектора число построенных регрессий совпадало с количеством возмущенных траекторий в пучке. Далее отбирались "хорошие" регрессии. Алгоритм отбора состоял из двух этапов: 1) для каждой нейросети отбирались регрессий на основе среднеквадратичного отклонения регрессионной ошибки, 2) формировался "подкомитета хороших сетей", в который не включались сети, дающие "мало" хороших регрессий отобранных в пункте 1). Критерий "малости" был четко сформулирован. Локальными показателями разбегания определялись как значения наклонов регрессионных прямых, отобранным "подкомитетом хороших сетей" для всех точек опорной траектории и всех возмущений. Эти значения объединялись в общую выборку, характеризующую изучаемый «срез» аттрактора, и по ней строилась гистограмма распределения ЛПР иcследуемого временного ряда. Описанный алгоритм был реализован в программе NeuroSLDE, созданной магистром физического факультета СПбГУ Чепилко С.С. (под руководством Дмитриевой Л. А. ) в среде Matlab. Этот метод и соответствующая программа были использован в ВКР Замарахиной М.С. для доказательства хаотического характера компоненты логарифмических доходностей, состоящей из последних 16 мод и случайной природы суммы первых 4 мод. Выпускная квалификационная работа Замарахиной М.С.выполнена на актуальную тему на хорошем научном уровне. Все главные результаты работы имеет научную ценность. Выпускная квалификационная работа «АНАЛИЗ АНАЛОГОВ ЛЯПУНОВСКИХ ПОКАЗАТЕЛЕЙ ЭМПИРИЧЕСКИХ МОД ФИНАНСОВЫХ ВРЕМЕННЫХ РЯДОВ НА ОСНОВЕ НЕЙРОСЕТЕВЫХ ТЕХНОЛОГИЙ» удовлетворяет всем требованиям, предъявляемым к бакалаврским диссертациям, а ее автор, несомненно, заслуживает присуждения ему искомой степени бакалавра искусств и гуманитарных наук. Замарахина М.С. к защите допущена. доцент кафедры высшей математики и математической физики физического факультета СПбГУ кандидат физ.-мат. наук Л.А.Дмитриева 31.05.2017