авторефераты диссертаций БЕСПЛАТНАЯ РОССИЙСКАЯ БИБЛИОТЕКА - WWW.DISLIB.RU

АВТОРЕФЕРАТЫ, ДИССЕРТАЦИИ, МОНОГРАФИИ, НАУЧНЫЕ СТАТЬИ, КНИГИ

 
<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:   || 2 | 3 |

Прогнозирование временных рядов с долговременной корреляционной зависимостью

-- [ Страница 1 ] --

На правах рукописи

КРИЧЕВСКИЙ Андрей Михайлович

ПРОГНОЗИРОВАНИЕ ВРЕМЕННЫХ РЯДОВ С ДОЛГОВРЕМЕННОЙ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТЬЮ

Специальность 05.13.01 - Системный анализ, управление и обработка информации

(в технике и технологиях)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени

кандидата технических наук

Санкт-Петербург - 2008

Работа выполнена в Государственном образовательном учреждении высшего профессионального образования «Санкт-Петербургский государственный университет аэрокосмического приборостроения» (ГУАП)

Научный руководитель:

доктор технических наук, профессор Осипов Леонид Андроникович

Официальные оппоненты: доктор технических наук, профессор

Коновалов Александр Сергеевич

кандидат технических наук, доцент

Муравьев Евгений Александрович

Ведущая организация:

ОАО «НИИ ВС «Спектр» - Открытое акционерное общество «Научно-исследовательский институт вычислительных средств «Спектр».

Защита состоится «23» декабря 2008г. в 14 часов на заседании диссертационного совета Д 212.233.02 при Государственном образовательном учреждении высшего профессионального образования «Санкт-Петербургский государственный университет аэрокосмического приборостроения» по адресу: 190000, Санкт-Петербург, ул.Б.Морская, 67, ГУАП.

С диссертацией можно ознакомиться в библиотеке ГУАП.

Автореферат разослан «22» ноября 2008г.

Ученый секретарь

диссертационного совета

доктор технических наук, профессор Л.А. Осипов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность исследования. Все формальные процедуры прогнозирования предусматривают перенос прошлого опыта в неопределенное будущее. Такие алгоритмы прогнозирования построены на предположении, что условия, породившие полученные ранее данные, неотличимы от условий будущего. Исключение составляют только те переменные, которые точно распознаны моделью прогнозирования. В подавляющем большинстве случаев предположение о неразличимости прошлого и будущего не выполняется в полной мере.

Одним из возможных методов улучшения точности прогнозирования служит применение новых моделей, способных к более адекватному описанию наблюдаемых данных и получению прогнозных оценок путем экстраполяции. Для построения модели временного ряда не требуются знания ни производства, ни условий, в которых протекает тот или иной процесс. Модель строится только на основе имеющейся числовой информации. Задача аналитика в этом случае заключается в том, чтобы выяснить статистическую закономерность, которой подчиняются отсчеты, образующие временной ряд, и сделать прогноз на будущее, основываясь на этой закономерности.

Зависимость структуры ряда от времени играет ключевую роль при моделировании или анализе временных рядов различной природы. В последние годы появился увеличивающийся интерес к временным рядам, обладающим долговременной положительной корреляционной зависимостью. В английском языке синонимами этого понятия являются такие термины как long memory (долгая память), long-range dependence (долговременная зависимость), strong dependence (сильная зависимость) или persistence (персистентность). Ни у одного из этих терминов еще нет адекватного перевода на русский язык, поэтому в работе такой ряд будем называть рядом с долговременной корреляционной зависимостью (ДКЗ).

В задаче анализа временного ряда со сложной структурой часто используются модели класса ARIMA(p,d,q) (авторегрессионные проинтегрированные скользящего среднего – Autoregressive Integrated Moving Average) порядка (p,d,q), которые моделируют различные ситуации, встречающиеся при анализе стационарных и нестационарных рядов. В зависимости от анализируемого ряда модель ARIMA (p,d,q) может трансформироваться к авторегрессионной модели AR(p), модели скользящего среднего MA(q) или смешанной модели ARMA (p,q). При переходе от нестационарного ряда к стационарному значение параметра d, определяющего порядок разности, принимается равным 0 или 1, т.е. этот параметр имеет только целочисленные значения. Обычно ограничиваются выбором между d = 0 и d = 1. Однако из поля зрения исследователей выпадала ситуация, когда параметр d может принимать дробные значения.

Для разрешения этой проблемы в работах зарубежных ученых, в первую очередь, C.W.Granger, J.R.Hosking, P.M.Robinson, R. Beran, был предложен новый класс моделей ARFIMA(p,d,q) (F: fractional - дробный), допускающий возможность нецелого параметра d и получивший название авторегрессионный дробно интегрированный процесс скользящего среднего. Такие ряды обладают своей спецификой: самоподобием, дробной размерностью, медленно спадающей корреляцией. Прогнозирование временных рядов с помощью модели ARFIMA(p,d,q) открывает более широкие перспективы для повышения точности прогноза, что подчеркивает актуальность темы исследования.

Цель диссертационной работы заключается в разработке алгоритмов прогнозирования временных рядов, обладающих долговременной корреляционной зависимостью, и оценке точности прогнозирования.

Для достижения поставленной цели в диссертации решаются следующие основные задачи:

  • создание алгоритмов моделирования фрактальных временных рядов с ДКЗ;
  • разработка алгоритмов прогнозирования для временных рядов, характеризующихся ДКЗ;
  • применение искусственных нейронных сетей для получения прогнозных оценок временного ряда;
  • экспериментальные исследования точности прогнозирования реальных временных рядов, обладающих ДКЗ.

Методы исследования. Для решения поставленных задач используются методы теории вероятностей, корреляционно-спектрального анализа, нейросетевого моделирования, статистической обработки экспериментальных данных.

Научная новизна работы

  1. Разработанный алгоритм моделирования фрактальных временных рядов отличается от известных тем, что позволяет создавать ряды по заданным значениям показателя Херста, являющегося в определенной степени классификатором рядов, и необходимой длине исходных данных.
  2. Новым в предложенном алгоритме прогнозирования являются начальный выбор параметров p и q модели ARMA(p,q) по виду и характеру изменения частной автокорреляционной функции временного ряда и последующая трансформация к модели ARFIMA(p,d,q) с вычислением показателя d.
  3. Развитие нейросетевой технологии в задаче прогнозирования, реализованной в работе, заключается в использовании и построении различных конфигураций нейронных сетей, введении этапа тестирования полученной сети и расчете ошибок прогнозирования на обучающей и тестовых выборках.
  4. Новизна экспериментальных исследований состоит в комплексном изучении реальных и смоделированных временных рядов, включающем в себя анализ авто- и частной корреляционных функций, спектральной плотности, расчет и нахождение главных компонентов, построение прогнозных оценок ряда, основанных на рассмотренных теоретических моделях, оценку точности прогнозирования.

Практическая ценность. Предложенные в работе алгоритмы прогнозирования временных рядов, основанные на модели временных рядов с ДКЗ, позволяют увеличить точность прогнозных оценок и достоверность выводов. Такие методы могут быть использованы в различных ситуациях и сферах деятельности, где необходимо получать информацию о будущем поведении систем.

Полученные результаты и разработанные алгоритмы используются в аналитической деятельности инвестиционной компании «Доходъ», учебном процессе ГУАП и Международного банковского института.

Программная разработка «Исследование фрактальных рядов» зарегистрирована в Отраслевом фонде алгоритмов и программ Федерального агентства по образованию.

Положения диссертационной работы, выносимые на защиту:

  1. Алгоритм моделирования фрактальных временных рядов, которые обладают долговременной корреляционной зависимостью, отличающийся от известных тем, что позволяет создавать ряды по заданным значениям показателя Херста и необходимой длине ряда.
  2. Алгоритм прогнозирования временного ряда по модели ARFIMA(p,d,q), включающий начальный выбор параметров p и q модели ARMA(p,q) по виду и характеру изменения частной автокорреляционной функции временного ряда и последующую трансформацию к модели ARFIMA(p,d,q) с вычислением показателя d.
  3. Нейросетевое прогнозирование временных рядов, основанное на построении различных типов нейронных сетей и выборе наиболее пригодной сети по величине погрешности прогноза на обучающей и тестовой выборках.
  4. Экспериментальное исследование реальных и смоделированных временных рядов, в частности, анализа авто- и частной корреляционных функций, спектральной плотности, расчета и нахождения главных компонентов, построения прогнозных оценок ряда и оценке точности прогнозирования.

Апробация работы. Результаты отдельных этапов работы докладывались и обсуждались на заседаниях 11, 12 и 14 Международной студенческой школы-семинара «Новые информационные технологии» (Москва, МИЭМ, 2003, 2004, 2006), 9 и 11 Международной научно-технической конференции студентов и аспирантов (Москва, МЭИ, 2003, 2005), 4 и 6 Международной научно-практической конференции «Актуальные проблемы экономики и новые технологии преподавания» (Санкт-Петербург, МБИ, 2005, 2007), 3 Всероссийской научной конференции «Управление и информационные технологии» (Санкт-Петербург, ЛЭТИ, 2005), 3 школы-семинара БИКАМП-01 (Санкт-Петербург, ГУАП, 2001), 8 и 9 научных сессий аспирантов ГУАП (Санкт-Петербург, ГУАП, 2005, 2006).

Публикации. Основные результаты диссертационной работы опубликованы в 15 печатных работах, в том числе 3 из перечня ведущих рецензируемых научных журналов и изданий, в которых должны быть опубликованы основные научные результаты диссертации на соискание ученой степени доктора и кандидата наук ВАК.

Объем и структура работы. Диссертационная работа состоит из введения, четырех разделов, заключения, списка использованных источников (67 наименований), двух приложений. Основная часть работы изложена на 179 страницах машинописного текста, содержит 49 рисунков, 6 страниц приложений с двумя рисунками.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность выбранной темы, определена цель и сформулированы решаемые в диссертации задачи. Перечислены новые научные результаты, полученные в работе, показаны ее практическая ценность и апробация, приведены основные положения, выносимые на защиту.

В разделе 1 проводится краткий обзор литературных источников по методам анализа временных рядов, обладающих свойством ДКЗ.

Вначале рассматриваются самоподобные фрактальные временные ряды. Фрактальные пространственные объекты демонстрируют пространственное са­моподобие. Фрактальные временные ряды имеют статисти­ческое самоподобие во времени. Они являются случайными фракталами и имеют больше общего с естественными объ­ектами, чем чистые математические фракталы.

Указывается, что для временных рядов классическая геометрия предлагает малую помощь в понимании основ поведения ряда: система так сложна, что предсказание становится невозможным. В решении проблемы прогнозирования временных рядов важную роль играет методология Бокса-Дженкинса. Эта методология основывается на параметрической модели класса ARIMA(p,d,q) и сводится к идентификации модели и оценке ее параметров. Дальнейшим развитием этой методологии является новый класс моделей ARFIMA(p,d,q) (fractional - дробный), допускающий возможность нецелого параметра d и получивший название авторегрессионный дробный интегрированный процесс скользящего среднего. Проявление интереса к временным рядам с ДКЗ возникло из анализа физических задач (исследование Г.Херста о колебаниях уровней воды в водохранилищах), перешло в область эконометрических задач, привлекло внимание к применению таких моделей в задачах передачи сигналов через Интернет.

На основании проведенного обзора делается вывод об актуальности исследования и применения моделей класса ARFIMA(p,d,q) в задаче прогнозирования. Кроме того, выполненный анализ литературных источников по тематике исследования позволил поставить цель диссертационной работы и сформулировать ее задачи.

Во втором разделе с использованием теории фракталов проводится анализ временных рядов. Вначале обсуждается сам термин «фрактал», рассматриваются пространственные фрактальные объекты, начиная с простейших геометрических объектов, и способы формирования фракталов. Далее анализируются способы генерирования фрактальных временных рядов. Продолжением исследования является изучение важного вопроса по оценке фрактальной размерности временных рядов. Приводится определение фрактала, данное Б.Мандельбротом: фракталом называется структура, состоящая из частей, которые в каком-то смысле подобны целому. В двухмерном случае фракталы можно получить, задав некоторую ломаную, называемую генератором.

Для гладкой кривой ее приближенная длина L(r) определяется как произведение числа N прямолинейных отрезков, умещающихся на кривой, на длину такого отрезка r, т.е. . При длине шага величина L(r) стремится к конечному пределу: длине L рассматриваемой кривой.

Иначе обстоит дело в случае фракталов. Произведение обращается в бесконечность, так как при учитываются все более мелкие извивы фрактала. Однако асимптотически это стремление к бесконечности происходит по некоторому четко определенному степенному закону от r. Иначе говоря, существует некоторый критический показатель такой, что произведение остается конечным. При показателях меньших, чем DH, произведение расходится, т.е. обращается в бесконечность, а при показателях, больших DH, стремится к нулю. Этот критический показатель DH называют размерностью Хаусдорфа, определяемой как

.

Переходя от пространственных фракталов к временным, вначале рассматриваются способы генерирования фрактальных временных рядов, начиная с классического броуновского движения. Простейшей дискретной аппроксимацией броуновского движения служит одномерное случайное блуждание.

Далее описывается метод случайного срединного смещения (МССС) для моделирования фрактальных рядов. Сущность МССС заключается в следующем. Для построения фрактального временного ряда берется отрезок единичной длины на оси абсцисс. Этот отрезок разбивается на N = 2m частей, где m - любое положительное целое число. В результате на отрезке [0, 1] имеем N +1 точку, включая концы отрезка. В ходе работы исходный единичный отрезок постепенно разбивается на более мелкие части посредством многократного деления пополам. При этом каждый раз вычисляется значение функции xс в середине нового рабочего отрезка tс, исходя из значений xlef и xrig в граничных точках отрезка tlef и trig. Для этого используется следующее выражение

,

где h - случайная величина, распределенная по нормальному закону с нулевым средним и дисперсией h, которая определяется соотношением . Здесь - расстояние от средней точки рабочего отрезка tс, где вычисляется новое значение функции, до концов этого отрезка; H - показатель Херста.

На рис.1 показаны фрактальные кривые, полученные МССС, для разных значений H. Общая тенденция ясна: чем меньше H, тем кривая более сложная, изрезанная, и, наоборот, при больших H кривая становится более гладкой.

Следующим шагом в работе является оценка фрактальной размерности. Существуют различные способы расчета размерности, но все они включают в себя подсчет объема или площади фрактальной формы и того, как она изменяется в масштабах в том случае, если этот объем или форма увеличиваются. Методы расчета фрактальной размерности сводятся или к подсчету степени изрезанности ряда с помощью окружностей определенного радиуса (метод Ричардсона), или к определению числа ячеек в пространстве, занимаемом фрактальной кривой (емкостная размерность), или посредством так называемой корреляционной суммы (корреляционная размерность), или к расчету показателя Херста H (метод нормированного размаха). В работе приводятся формулы расчета фрактальной размерности для каждого метода. В любом случае размерность определяется напрямую из метода или через связь между размерностью и показателем Херста в виде D = 2 – H.

В завершение этого раздела рассматривается метод анализа временных рядов, основанный на вычислении главных компонентов.

а) H =0,2 б) H = 0,8

Рисунок 1 - Фрактальные кривые для двух значений H

Таким образом, основными результатами этого раздела являются анализ способов генерирования фрактальных временных рядов, расчет спектров различных видов фрактальных шумов, разработка алгоритма метода случайного срединного смещения для генерирования фрактальных временных рядов, расчет главных компонентов временного ряда.

В разделе 3 вначале анализируется класс параметрических моделей временных рядов. В общем случае этот класс может быть описан моделью вида ARIMA (p,d,q) (Autoregressive integrated moving average - авторегрессионная проинтегрированная модель скользящего среднего). Рассматриваются различные ситуации, приводящие к описанию ряда моделями, которые следуют из общей модели ARIMA (p,d,q). В частности, авторегрессионная модель, которая сокращенно обозначается AR(p) (autoregressive process) порядка р, представима в виде

,

где - весовые коэффициенты; at - помеха.

В этой модели текущее значение ряда в момент t выражается через конечное число прошлых значений и величину возмущения at. Модель скользящего среднего (moving average) предполагает, что в ошибках модели в предшествующие периоды сосредоточена информация по всей предистории ряда. Такая модель порядка q запишется в виде

где символы 1,..., q - весовые параметры.

Смешанные модели авторегрессии - скользящего среднего, т.е. модели АRMA (р,q), которые имеют следующий вид

,

где - полиномы, представляющие компоненты процессов AR и MA, соответственно; - весовые коэффициенты; - оператор сдвига назад.

В нестационарном случае модель ARIMA (p,d,q) можно представить в виде

,

где .



Pages:   || 2 | 3 |
 





 
© 2013 www.dislib.ru - «Авторефераты диссертаций - бесплатно»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.