Эллипсоидальные квазилинейные фильтры для оперативной обработки информации в нелинейных стохастических системах
На правах рукописи
Хоанг Тхо Ши
ЭЛЛИПСОИДАЛЬНЫЕ КВАЗИЛИНЕЙНЫЕ ФИЛЬТРЫ
ДЛЯ ОПЕРАТИВНОЙ ОБРАБОТКИ ИНФОРМАЦИИ В НЕЛИНЕЙНЫХ СТОХАСТИЧЕСКИХ СИСТЕМАХ
Специальность 05.13.17 – Теоретические основы информатики
Автореферат
диссертации на соискание ученой степени
кандидата технических наук
Москва 2007
Диссертация выполнена в Московском физико–техническом институте (государственном университете).
Научный руководитель – заслуженный деятель науки РФ,
доктор технических наук,
профессор Синицын Игорь Николаевич
Официальные оппоненты – доктор физико-математических наук,
профессор Морозов Андрей Николаевич
кандидат технических наук,
старший научный сотрудник
Ушмаев Олег Станиславович
Ведущая организация – Институт проблем управления РАН (Москва)
Защита диссертации состоится 23 мая 2007 г. в 13 часов на заседании диссертационного Совета Д002.073.01 при Институте проблем информатики РАН по адресу: 119333, Москва, ул. Вавилова, 44, корп. 2.
С диссертацией можно ознакомиться в библиотеке Института проблем информатики РАН.
Отзывы в одном экземпляре, с заверенной подписью, просим направлять по адресу: 119333, Москва, ул. Вавилова, 44, корп. 2. в диссертационный Совет.
Автореферат разослан « » апреля 2007 г.
Председатель
диссертационного Совета Д002.073.01,
доктор технических наук И.А. Соколов
Общая характеристика работы
Актуальность работы. Как известно 1–3, статистическая информатика обладает обширным арсеналом эффективных статистических методов анализа и оперативной (быстрой) обработки информации. Применение методов статистической информатики сдерживается практически полным отсутствием доступного для инженера и исследователя эффективного алгоритмического и программного обеспечения. При этом требуются нестандартные методы исследования, в первую очередь, одно- и многомерных распределений процессов в нелинейных стохастических системах (СтС).
В задачах стандартного анализа качества информационных технологий и систем обычно ограничиваются спектрально-корреляционными характеристиками, в то время как функционирование систем в экстремальных условиях требует развития нестандартных методов анализа, основанных на одно- и многомерных распределениях.
Для решения задачи анализа распределений в нелинейных СтС применяют следующие три принципиально различных подхода.
Первый подход состоит в использовании прямого численного решения уравнений СтС методом Монте-Карло. Часто этот метод называют методом статистического моделирования (МСМ). В случае дифференциальных СтС этот метод сводится к численному интегрированию дифференциальных уравнений СтС со статистическим моделированием приращений винеровского процесса и пуассоновских процессов на каждом шаге интегрирования, а также к статистическому моделированию начальных условий и последующей статистической обработке полученных реализаций. При реализации МСМ для нелинейных и параметрических задач ключевой проблемой является задача разработки стохастических аналогов формулы Тейлора и специальных вычислительных методов аппроксимации повторных
1 Синицын И.Н. Из опыта преподавания статистических основ информации в технических университетах // Системы и средства информатики: Вып. 8. – М.: Наука. Физмалит. 1996. С.68–73.
2 Пугачев B.C., Синицын И.Н. Теория стохастических систем. – М.: Изд-во «Логос».2000 (1-е изд.).[пер. на англ. яз. Stochastic Systems. Theory and Applications. World Scientific, 2001. Singapore], 2004 (2-е изд.).
3 Синицын И.Н. Фильтры Калмана и Пугачева. – М.: Изд-во «Логос». 2006.
стохастических интегралов. Слабо развита теория многошаговых численных схем. К недостаткам МСМ можно отнести необходимость проведения большого количества моделирования реализаций для получения приемлемой точности и сильный рост объёмов вычислительных экспериментов с увеличением размерности вектора состояния, что затруднительно выполнить оперативно в реальном масштабе времени. Широчайшее использование МСМ обусловлено небольшой вычислительной трудоёмкостью исследования СтС и простотой программной реализации МСМ. Кроме того, МСМ позволяет включать в процесс моделирования некоторые реальные элементы моделируемой систем или их действующие макеты, а также людей, участвующих в работе системы. Развитие МСМ применительно к СтС связано с именами: Авериной Т.А., Артемьева А.А., Вагнера В., Клойдена П.Е., Платена Е., Кузнецова Д.Ф., Пугачева В.Н., Ньютона Н., Дзагнидзе З.А. Читашвили Р.Я., Никитина Н.Н., Разевига В.Д., Шюртуа X., Чанга К.К., Райта Д., Маруама Г., Мильштейна Г.Н., Карпенко А.П., Талая Д., Мачхсоди Я., Харриса К., Микулевичуса Р., Хофмана Н., Румелина В., Клаудера Д.
Второй подход состоит в непосредственном составлении и интегрировании эволюционных функциональных уравнений, например, уравнений Фоккера-Планка-Колмогорова, Колмогорова-Феллера и их обобщений, а также уравнений Пугачева для характеристических функций. Этот подход позволил найти точные решения для ряда простых СтС. Для многомерных СтС единственным путем решения эволюционных функциональных уравнений является численное интегрирование на высокопроизводительных средствах вычислительной техники (СВТ), в первую очередь высокопроизводительных ЭВМ, и с использованием GRID-технологий. В настоящее время использование рассматриваемого подхода для задач анализа многомерных СтС даже для высокопроизводительных СВТ проблематично. Важный вклад внесли: Андронов А.А., Витт А.А., Понтрягин Л.С, Колмогоров А.Н., Бернштейн С.Н., Пугачев B.C., Гихман И.И., Скороход А.В., Закаи М., Уонхэм В.М., Феллер В., Фридман А., Ито К., Баррет Р.Ф., Свешников А.А., Мерклингер К.Д., Ширяев А.Н., Лин И.К., Сойз С., Семенов В.В., Синицын И.Н., Хасьминский Р.З., Арнольд Л., Кушнер Г.Дж., Рискин X., Стратонович Р.Л., Строк Д.В., Ван-Камиен Р.Г.
Третий подход состоит в применении аналитических методов для приближенного решения уравнений, определяющих параметры одно- и многомерных распределений. К их числу относятся методы нормальной аппроксимации и статистической линеаризации, методы эквивалентной линеаризации, методы моментов, семиинвариантов, квазимоментов и их модификации, методы ортогональных разложений и др. Эти методы позволяют по исходной СтС получить детерминированные уравнения для параметров распределений. Основной трудностью практического применения упомянутых методов, особенно для многомерных СтС, является чрезвычайно быстрый рост числа уравнений для параметров распределений с увеличением размерности вектора состояния. Сокращение числа уравнений для параметров распределений возможно только путем введения дополнительных ограничений на структуру распределения. Существенный вклад в развитие методов параметризации распределений внесли: Пугачев B.C., Казаков И.Е., Бутон Р.К., Богуславский И.А., Липцер Р.Ш., Кузнецов П.И., Малахов А.Н., Стратонович Р.Л., Синицын И.Н., Тихонов В.И., Мальчиков С.В., Первозванский А.А., Пупков К.А., Альберендт Н., Кемпе Ф., Фокс Р.Ф., Шин В.И., Мощук Н.К.
Радикальным подходом к сокращению числа уравнений для параметров распределения является подход, основанный на параметризации структуры распределения. Так, как обнаружено В.И. Синицыным, радикального сокращения числа уравнений для параметров распределения удается добиться для эллипсоидальной структуры распределения.
Прикладные статистические методы оперативной обработки информации в сложных информационно-измерительных и информационных системах как в условиях нормальной эксплуатации, так и в экстремальных условиях, доказали свою практическую эффективность. Развитие статистической информатики идет как в направлении всё большего усложнения моделей и методов адекватного описания, так и путём создания современных вычислительных стохастических информационных технологий. Важнейшей причиной, затрудняющей использование оптимальных методов оперативной обработки информации в СтС, является, во-первых, отсутствие необходимой априорной информации и, во-вторых, требование к быстроте реализации статистических вычислительных технологий. В настоящее время сформировалось два основанных подхода к синтезу нелинейных фильтров для оперативной обработки информации в нелинейных СтС: аналитический и алгоритмический.
В рамках первого подхода, во-первых используются различные приближённые методы, основанные на численном решении фильтрационных уравнений (методы нормальной аппроксимации и статистической линеаризации, методы эквивалентной линеаризации, методы моментов, квазимоментов, семиинвариантов, ортогональных разложений, метод эллипсоидальной структурной аппроксимации и др. [3]). Применение этих методов для задач оперативной обработки информации (on-line оценивания) практически невозможно. Во-вторых, во многих задачах практически приемлемые результаты получаются на основе превращения формул для стохастических дифференциалов оптимальной оценки и апостериорной ковариационной матрицы ошибки
в стохастические дифференциальные уравнения для
и
путем разложения правых частей уравнений в степенные ряды в окрестности
отбрасывания остаточных членов. Этот способ приводит к уравнениям обобщенного фильтра Калмана – Бьюси, фильтров второго порядка и др. [3]. Такие фильтры также не полной мере удобны для задач реального времени. Для задач реального времени В.С. Пугачевым предложены так называемые условно оптимальные фильтры, позволяющие проводить априорный синтез простых в реализации фильтров без использования результатов измерений. Такие нелинейные фильтры получили название фильтров Пугачева. Развитие теории условно оптимальной фильтрации Пугачева В.С. для непрерывных стохастических систем связано с именами Казакова И.Е., Мальчикова С.В., Дашевского М.Л., Синицына И.Н., Шина В.И., Силуяновой И.Д., Домбровского В.В., Руденко Е.А., Rool J.R., Sinha N.K. и др., а для дискретных и непрерывно-дискретных систем – Казакова И.Е., Синицына И.Н., Шина В.И., Домбровского В.В., Панкова А.Р., Борисова А.В., Rool J.R., Sinha N.K. и др.
В рамках алгоритмического подхода широкую известность получим разнообразные, градиентные, поисковые, обучающиеся адаптивные и комбинированные походы и технологии. Как правило, такие подходы допускают применение в задачах реального времени только с учётом специфики архитектуры высокопроизводительных СВТ и решаемых функциональных задач.
Для комплесной обработки информации в нелинейных СтС научного и промышленного назначения, функционирующих в экстремальных условиях и отказах оборудования, важное значение имеют методы анализа и синтеза нелинейных фильтров на основе априорной информации без использования текущей информации. Здесь наряду с фильтрами Пугачева, как показано в работах Пугачева В.С. и Синицына И.Н. Казакова И.Е. и Гладкова Д.И., О М. и Шина В.И. [3], если вычислять коэффициенты эквивалентной линеаризации на основе отрезка пира параметризованной плотности, возможно создание эффективных квазилинейных фильтров для оперативной обработки информации. М. О и В.И. Шином [3] разработан квазилинейный фильтр на основе моментной аппроксимации апостериорного распределения. Основываясь на работах по эллипсоидальной аппроксимации [2], продолжим названные исследования для существенно негауссовских нелинейных СтС, допускающих эллипсоидальную линеаризацию и статистическую наблюдаемость. При этом особое внимание уделим разработке алгоритмов и специального программного обеспечения в среде MATLAB для реализации стохастической информационной технологии обработки информации.
Цели и задачи работы. Целью диссертации является разработка методов, алгоритмов и программного обеспечения эллипсоидального анализа информации в нелинейных стохастических системах.
Для достижения сформулированной цели ставятся следующие основные задачи:
- Построить теорию анализа распределений по априорным данным в непрерывных (дискретных) негауссовских СтС на основе эллипсоидальной линеаризации.
- Разработать теорию синтеза квазилинейных фильтров для оперативной обработки апостериорной информации в непрерывных (дискретных) гауссовских СтС на основе эллипсоидальной линеаризации.
- Разработать алгоритмы и экспериментальное программное обеспечение для эллипсоидального анализа информации в нелинейных СтС.
Методы исследования. В работе использованы современные методы теории вероятностей и математической статистики, стохастического анализа и теории стохастических дифференциальных уравнений, теории оптимального оценивания, вычислительные методы информатики.
Научная новизна. В работе получены новые теоретические результаты в области статистической информатики, среди которых следует выделить следующие:
- Получены уравнения методов эллипсоидальной линеаризации в непрерывных (дискретных) негауссовских СтС для анализа информации по априорным данным.
- Выведены фильтрационные уравнения для эллипсоидальной обработки информации в непрерывных (дискретных) гауссовских СтС на основе апостериорных данных.
Практическая ценность работы состоит в том, что она является основой для создания современных информационных технологий статистического анализа и синтеза сложных информационно-измерительных и информационных систем. На основе результатов исследования разработаны:
- Стохастические модели обработки информации в информационно-измерительных системах на основе интерферометра Фабри – Перо.
- Стохастические модели флуктуаций чандлеровских колебаний полюса Земли.
Реализация результатов работы. Результаты диссертации реализованы в 2-х НИР ИПИ РАН (2005–2007 гг.) и в проекте 1.5 Программы ОИТВС РАН “Фундаментальные основы информационных технологий и систем” (2005–2007 гг.).
Апробация работы. Результаты работы докладывались на следующих международных и всероссийских конференциях:
- X Международная конференция МАИ «Системный анализ, управление и навигация», Москва, 2005;
- XLIX Научная конференция МФТИ «Современные проблемы фундаментальных и прикладных наук», Москва – Долгопрудный, 2006;
- XLII Всероссийская конференция РУДН «Математика и информатика», Москва, 2006;
- XLIII Всероссийская конференция РУДН «Оптические, математические и электронные методы обработки изображений и сигналов», Москва, 2007.
Публикации. Список публикаций насчитывает 7 названий. Материалы также опубликованы в 2-х научно-технических отчётах ИПИ РАН.
Структура и объём работы. Диссертация состоит из введения, шести разделов, заключения и приложения. Содержание работы изложено на 220 страницах машинописного текста, иллюстрированного 9 рисунками. Список использованных источников содержит 66 наименования.
Содержание работы
Во введении обоснована актуальность работы, сформулирована ее цель, определена научная новизна и практическая ценность работы. Изложены основные результаты. Раздел 1 посвящен обзору работ и постановке основных задач.
В разделе 2 приведены сведения, положенные в основу программного обеспечения эллипсоидальной аппроксимации (ЭА) распределений случайных векторов.
Предлагается для структурной аппроксимации плотностей вероятности конечномерных случайных векторов можно использовать плотности, имеющие эллипсоидальную структуру, т.е. плотности, у которых поверхностями уровней равной вероятности являются подобные концентрические эллипсоиды (эллипсы для двумерных векторов, эллипсоиды для трехмерных векторов, гиперэллипсоиды для векторов размерности больше трех). В частности, эллипсоидальную структуру имеет нормальное (гауссовское) распределение в любом конечномерном пространстве. Характерная особенность таких распределений состоит в том, что их плотности вероятности являются функциями положительно определенной квадратичной формы , где
– математическое ожидание случайного вектора
,
– некоторая положительно определенная матрица.
Для нахождения ЭА плотности вероятности -мерного случайного вектора будем пользоваться конечным отрезком разложения по биортонормальной системе полиномов
, зависящих только от квадратичной формы
, весом для которых служит некоторая плотность вероятности эллипсоидальной структуры
. Тогда плотность вероятности вектора
может быть приближенно представлена выражением следующего вида:
(1)
Выбор системы полиномов , используемой при ЭА плотностей (1), сводится к нахождению биортонормальной системы полиномов, для которой с весом служит
– распределение с
степенями свободы. Если ввести систему полиномов, ортогональных по отношению к
– распределению с
степенями свободы:
(2)
то между полиномами и системой полиномов
имеют место следующие соотношения:
(3)
Для тестирования разработанного программного обеспечения (приложение 1) приведены точные и приближенные формулы, описывающие свойства , теоремы об средней квадратической (с.к.) сходимости разложений плотностей векторов и их проекций по полиномам, точные и приближенные (укороченные) рекуррентные формулы, связывающие старшие и младшие вероятностные моменты эллипсоидальных распределений, а также приближенный метод оценки точности ЭА по моментам четвёртого и шестого порядка.
В разделе 3 применительно к непрерывными (дискретным) СтС приведены уравнения методов эллипсоидальной аппроксимации (МЭА) и эллипсоидальной линеаризации (МЭЛ) для одно- и многомерных распределений.
Предполагается, что эволюция состояния системы (в общем случае расширенного вектора состояния ) описывается векторным стохастическим дифференциальным уравнением Ито вида:
(4)