Модели и методы декодирования помехоустойчивых кодов на основе нейросетевого базиса
- На правах рукописи
Берёзкин
Александр Александрович
МОДЕЛИ И МЕТОДЫ ДЕКОДИРОВАНИЯ ПОМЕХОУСТОЙЧИВЫХ КОДОВ НА ОСНОВЕ НЕЙРОСЕТЕВОГО БАЗИСА
Специальность 05.13.01 – Системный анализ, управление и обработка информации
АВТОРЕФЕРАТ
диссертации на соискание
ученой степени кандидата технических наук
Санкт-Петербург
2009г.
Работа выполнена в Санкт-Петербургском государственном университете телекоммуникаций им. проф. М.А. Бонч-Бруевича.
Научный руководитель: кандидат технических наук, доцент
- Охорзин Виктор Михайлович
Официальные оппоненты: доктор технических наук, профессор
Саенко Игорь Борисович
кандидат технических наук
Кунгурцев Вадим Викторович
- Ведущая организация: ФГУП НИИ «Рубин»
- Защита состоится «02» июля 2009г. в 14 часов на заседании диссертационного совета Д219.004.02 при Санкт-Петербургском государственном университете телекоммуникаций им. проф. М.А. Бонч-Бруевича по адресу: 191065, Санкт-Петербург наб.р. Мойки, 61.
С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского государственного университета телекоммуникаций им. проф. М.А. Бонч-Бруевича.
Отзыв на автореферат в двух экземплярах, заверенный печатью учреждения, просим направлять по указанному адресу на имя ученого секретаря диссертационного совета.
Автореферат разослан «01» июня 2009 г.
Ученый секретарь диссертационного совета,
кандидат технических наук, доцент В.Х. Харитонов
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы. Современный этап развития телекоммуникационных систем характеризуется широким развитием проводных и беспроводных сетей передачи данных. Рост числа пользователей таких сетей, появление новых мультимедийных услуг предъявляют высокие требования к скорости, надежности и времени задержки при обработке информации. Одна из самых весомых задержек связана с помехоустойчивым кодированием и декодированием данных. Для снижения этого фактора постоянно необходимо решать проблемы совершенствования существующих и разработки новых методов обработки информации.
В настоящее время подобные проблемы решаются различными путями, в том числе внедрением параллельных методов кодирования и декодирования, основанных на элементах теории искусственных нейронных сетей (ИНС). На сегодняшний день отечественными и зарубежными исследователями (Галушкин А.И., Горбань А.Н., Комашинский В.И., Оссовский С., Bruck J., Blaum M., Mayora-Ibarra O., Zeng G., Hush D., Ahmed N., Stefano A.D., Lippmann R.P., Ahmed S. и др.) предложено множество различных нейросетевых моделей, в том числе решающих задачи декодирования помехоустойчивых кодов. Однако они слабо связаны с параметрами используемых кодов и до сих пор не разработана единая концепция их применения и настройки. Это влечет за собой увеличение структурной избыточности и сложности функционирования нейронных декодеров. Более того, в современной научно-технической литературе недостаточно проработан вопрос обоснованности применения различных нейросетевых моделей для декодирования широко используемых на практике блоковых помехоустойчивых кодов, что обуславливает актуальность настоящей работы, направленной на повышение обоснованности применения ИНС в задачах помехоустойчивого кодирования.
В то же время разработчики систем помехоустойчивого кодирования решают компромиссную задачу «сложность-эффективность». На программно-аппаратном уровне, решение этой задачи приводит к необходимости как алгоритмического, так и технического упрощения, включающего выбор наименее сложной реализации алгоритма.
Объектом исследования система помехоустойчивого кодирования (СПК).
Предметом исследования являются методы декодирования и их реализация на основе ИНС.
Цель исследования. Целью диссертационной работы является повышение эффективности системы помехоустойчивого кодирования на основе совершенствования методов и параметров итеративных и нейронных декодеров двоичных блоковых кодов.
В связи с этим выделены два направления, определяющие постановку задачи диссертационной работы. Первое направление связано с исследованием современного итеративного метода декодирования. Второе – направлено на повышение эффективности системы помехоустойчивого кодирования за счет использования параллельных нейронных декодеров, существенно снижающих задержки на операцию декодирования.
Научная задача заключается в разработке методов и моделей итеративных и нейронных декодеров, обеспечивающих повышение эффективности системы помехоустойчивого кодирования и характеризуемых предельно малой сложностью функционирования.
Методы исследования. В работе использовался математический аппарат теорий вероятностей, помехоустойчивого кодирования, нейронных сетей, статистического обучения, полезности, сложности вычислений, а также методы имитационного моделирования (Монте-Карло). Экспериментальные исследования проведены с использованием пакета математического, статистического и имитационного моделирования MATLAB.7.01 и программных средств Statistica Neural Networks 4.0.
Научная новизна работы определяется:
1. Разработанным лично автором итеративно-перестановочным (ИП) методом декодирования, обеспечивающим увеличение надежности приема информационных элементов путем мажоритарного построения дополнительных проверочных уравнений, который является дальнейшим развитием метода итеративного декодирования блоковых кодов.
2. Кроме того, новым является разработанный лично автором подход к выбору параметров моделей нейронных декодеров, который отличается от известных в части более точной настройки параметров на характеристики используемых кодов и структуру кодового пространства. Это позволяет сократить структурную избыточность нейронных декодеров и повысить обоснованность их применения по сравнению с существующими подходами.
3. Впервые автором предлагается использовать нейронные декодеры и для исправления стираний, что не рассматривалось в работах других исследователей.
4. В работе впервые разработан подход, позволяющий обоснованно сократить размер обучающего множества путем использования запрещенных кодовых комбинаций только с максимально исправляемой кодом кратностью ошибок и стираний. Это позволят существенно сократить объем обучающих данных и, как следствие, уменьшить время на разработку нейронных декодеров, сократить число используемых нейронов, а также расширить применение нейронных декодеров в область исправления стираний.
5. Автором впервые предложена методика оценки сложности методов декодирования, позволяющая учесть большее, по сравнению с классическими методиками, количество факторов, влияющих на сложность функционирования, за счет использования комплексного показателя сложности, в который включены сложность алгоритмической и программной реализаций, и тем самым повысить точность оценки.
Обоснованность и достоверность научных положений обеспечены преемственностью проводимых исследований, подтверждена адекватным применением математических методов, корректностью постановок задач, вводимых допущений, ограничений и формулировок выводов; соответствием применяемых моделей физическим процессам в СПК; непротиворечивостью полученных результатов известным научным данным; результатами экспериментов; апробацией основных теоретических положений в печатных трудах и докладах на научных конференциях и семинарах.
Практическая ценность. Предложенный подход к повышению обоснованности выбора параметров нейронных декодеров (НД) расширяет возможности их реализации для кодов больших длин и может быть использован при проектировании перспективных СПК, работающих в реальном масштабе времени.
Предложенная методика формирования обучающего множества позволяет разрабатывать НД с меньшим числом нейронов, что при практической реализации уменьшает время декодирования.
Результаты также могут быть использованы в образовательном процессе высших учебных заведений связи, при написании учебников и учебных пособий, при разработке перспективных СПК.
Реализация результатов работы. Основные научные и практические результаты диссертационной работы использованы в разработках ЗАО НПП «ИСТА-Системс» для обоснования выбора перспективных методов передачи и обработки речевых и факсимильных данных, а также в учебном процессе СПбГУТ им. проф. М.А. Бонч-Бруевича при разработке лекций по перспективным методам декодирования, что подтверждается актами внедрения и реализации.
Апробация работы и публикации. Результаты работы обсуждались и были одобрены на: 57, 58, 59, 60, 61-й НТК профессорско-преподавательского состава, научных сотрудников и аспирантов ГУТ им. проф. М.А. Бонч-Бруевича, XI международной конференции «Региональная информатика-2008», Международной НПК «Перспективы развития телекоммуникационных систем и информационные технологии-2008». По результатам диссертации опубликовано 13 печатных работ (3 в соавторстве), из них 3 в изданиях, рекомендованных ВАК, получено положительное решение о выдаче патента РФ на полезную модель.
Структура и объем работы. Диссертационная работа состоит из введения, четырех глав с выводами, заключения, списка литературы и двух приложений. Основная часть работы содержит 155 страниц текста, 44 рисунка, 16 таблиц, включает 169 наименований отечественной и зарубежной литературы, объем приложений составляет 24 страницы.
Основные научные положения, выносимые на защиту:
- Метод декодирования двоичных линейных блоковых кодов на основе итеративно-перестановочного подхода.
- Модель «жесткого» и «мягкого» нейронного декодера с исправлением ошибок и стираний.
- Методика формирования обучающего множества, обеспечивающая построение нейронного декодера как обучаемой модели с меньшим числом нейронов.
- Методика оценки сложности функционирования методов кодирования и декодирования на основе комплексного показателя.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность рассматриваемой проблемы, сформулированы цели и задачи работы, определены практическая ценность и область применения результатов, представлены основные научные положения, выносимые на защиту.
В первой главе диссертации рассмотрено современное состояние проблемы декодирования помехоустойчивых кодов и оценки сложности методов декодирования.
Показано, что декодирование есть отображение множества принимаемых кодовых комбинаций (КК) на множество информационных слов, которое может состоять из композиции двух отображений (нахождения кодового слова по принятому и определения вектора информационных символов по кодовому слову):
а) или б)
, (1)
где – алфавит из
: * – символ стирания, D – оператор нахождения кодового слова,
– множество принимаемых КК,
– множество всех разрешенных кодовых комбинаций (РКК),
– множество информационных слов РКК. Отмечено, что на задержки декодирования напрямую влияет сложность отображения D.
Отмечено, что новые методы декодирования, необходимо рассматривать с позиций развития существующих современных методов. Приведен обзор направлений развития современных методов «мягкого» декодирования блоковых кодов и отмечены их недостатки. Обосновывается выбор метода итеративного декодирования, а также направление его модификации.
Выявлена необходимость в разработке параллельных методов кодирования и декодирования на основе моделей ИНС. Проведен обзор результатов различных исследователей в данной области.
Сделаны выводы об актуальности рассмотрения проблем декодирования применительно к сложности их функционирования.
Таким образом, полученные в главе 1 результаты, позволили обосновать выбор направления исследований и выявить необходимость в разработке параллельных методов кодирования и декодирования на основе моделей ИНС.
Во второй главе выбраны, изучены и исследованы известные модели НД и итеративного декодера.
Обосновывается использование известной математической модели итеративного декодера, описываемой формулой
, (2)
где LLR («мягкий» выход) вне декодера, Lc(x) LLR канала (получается в результате канальных измерений в приемнике), L(d) априорное LLR бита данных,
внешнее LLR (внешняя информация о структуре кода, выявляемая в процессе декодирования). На основе используемой математической модели описан обобщенный алгоритм итеративного декодирования блоковых кодов и показаны возможности его модификации [4].
Для достижения цели работы выбраны, изучены и исследованы известные в научно-технической литературе модели ИНС, предназначенные для решения задач классификации и задач, относящихся к классу проблем построения отношений на множестве объектов. Показано, что данные модели непосредственно осуществляют отображение (1) без проведения сложных процедур комбинаторного или алгебраического декодирования:
модель нейронного классификатора Хэмминга, в виде рекуррентного нейронного декодера 1-й модификации (РНД1) (рис. 1а) [5–7]. Использование данной модели позволяет решить задачу декодирования блоковых кодов по критерию максимального правдоподобия с использованием «жесткой» схемы принятия решений в демодуляторе. Показано, что РНД1 обеспечивает отображение (1б);
модель обучаемой ИНС (рис. 1б), построенной на основе многослойного персептрона (сети с прямым распространением сигнала) с антисимметричными сигмоидальными функциями активации, в виде нейронного декодера прямого распространения (НДПР), обеспечивающего отображение (1а). Использование НДПР позволит разработчику СПК полностью реализовать корректирующие возможности используемых кодов [8].
![]() |
![]() |