авторефераты диссертаций БЕСПЛАТНАЯ РОССИЙСКАЯ БИБЛИОТЕКА - WWW.DISLIB.RU

АВТОРЕФЕРАТЫ, ДИССЕРТАЦИИ, МОНОГРАФИИ, НАУЧНЫЕ СТАТЬИ, КНИГИ

 
<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ

Pages:   || 2 |

Статистические модели трафика ip-телефонии

-- [ Страница 1 ] --

На правах рукописи

САХАРОВ АЛЕКСЕЙ ВЛАДИМИРОВИЧ

СТАТИСТИЧЕСКИЕ МОДЕЛИ ТРАФИКА IP-ТЕЛЕФОНИИ

05.13.01 – Системный анализ, управление и обработка информации (технические науки)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени

кандидата технических наук

Нижний Новгород – 2007

Работа выполнена на кафедре «Теория цепей и телекоммуникации» Нижегородского государственного технического университета

Научный руководитель: доктор технических наук

профессор Крылов В.В.

Официальные оппоненты: доктор технических наук

профессор Ямпурин Н.П.;

кандидат технических наук

Волохович А.В.

Ведущая организация:

ООО «Агентство деловой связи» группа компаний Голден Телеком

Защита диссертации состоится «______»___________ 2007 г. в _____ часов на заседании диссертационного совета Д212.165.05 при Нижегородском государственном техническом университете по адресу: 603600, Нижний Новгород, ул. Минина, 24, НГТУ, корпус _____, аудитория _______.

С диссертацией можно ознакомиться в научно-технической библиотеке Нижегородского государственного технического университета.

Автореферат разослан «______»___________ 2007 г.

Ученый секретарь

диссертационного совета

кандидат технических наук, доцент Иванов А.П.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы

Все большая доля пропускной способности глобальной сети Интернет, корпоративных и локальных сетей отводится для передачи речевого трафика. Между тем такой вид трафика предъявляет ряд специфических требований по отношению к сети, которые существенно определяются состоянием уровня развития технологий сжатия и передачи речевой информации по IP-сети. Наиболее важным требованием к сети для обеспечения необходимого качества передачи речи является задержка при передаче, определяемая как промежуток времени, затрачиваемый на то, чтобы пакеты от источника достигли получателя. Согласно рекомендации G.114 союза ITU-T качество передачи речи считается хорошим, если сквозная задержка при передаче сигнала в одну сторону не превышает 150 мс. При этом пакеты, задержавшиеся в пути дольше некоторого определенного значения, считаются потерянными, и качество воспроизводимой речи, соответственно, снижается. Еще одной трудностью является то, что даже если величина задержки находится в допустимых пределах, но при передаче по IP-сети будет существенно непостоянной и будет изменяться от пакета к пакету (джиттер), это вызовет у слушающего неприятное ощущение дрожания речи. Тем самым, несмотря на то, что требование VoIP к пропускной способности сети является относительно невысоким, многие тонкие характеристики сети оказываются принципиально значимыми для обеспечения заданного качества передачи речевого трафика. Связь этих характеристик сети с параметрами трафика VoIP оказывается весьма сложной, и анализ сетей на этапе проектирования и обслуживания может проводиться только методами имитационного моделирования. Для использования имитационных моделей необходимо располагать достаточно хорошими статистическими моделями источников трафика.



Анализ литературных источников показывает, что относительно небольшое число исследований посвящено изучению его характера с точки зрения IP-телефонии. В большинстве случаев используются грубые модели, основанные на работах по анализу пауз в речевом сигнале, выполненных в классической телефонии. Между тем такие модели не позволяют оценивать эффекты, возникающие в сети при динамичном изменении VoIP трафика от многих источников и при передаче через перегруженные участки сети. Модель источника речевого трафика оказывается полезной при моделировании и не IP сетей, например при анализе статистического мультиплексирования с разделением времени, когда несколько речевых потоков объединяются в один за счет того, что в каждом потоке присутствуют периоды, в течение которых речевая информация не передается. Здесь в соответствии с моделью можно генерировать входящие потоки, как последовательности значений продолжительностей интервалов с речью и паузами.

Цель работы

Целью данной работы является разработка статистических моделей источников трафика IP-телефонии как в ходе монологе, так и в диалоге, с последующей их реализацией в виде компонентов широко распространенной системы имитационного моделирования J-Sim. Разработанные модели должны учитывать влияние уровня кодируемого сигнала на их параметры и, как следствие, – на создаваемую нагрузку на сеть. Оценивание качества разработанных моделей проводится в процессе сетевого моделирования путем определения средней битовой скорости и сравнения полученных результатов с экспериментальными данными.

Задачи работы

В данной работе поставлены и решены следующие задачи:

  1. Проведен сбор и анализ задержки, возникающей в стеке протоколов UDP/IP/ETHERNET при передаче блоков с речевой информацией как вверх, так и вниз по стеку, при разных значениях количества блоков, содержащихся в одном пакете;
  2. Разработаны статистические и имитационные модели источников трафика IP-телефонии как в ходе монолога, так и в ходе диалога, где присутствует парная корреляция источников;
  3. Определен метод вычисления параметров модели источника речевого трафика при монологе в зависимости от уровня кодируемого сигнала;
  4. Проведено вычисление ошибок моделирования средней битовой скорости при монологе и диалоге при разных значениях уровня кодируемого сигнала.

Методы исследования

Для решения поставленных задач использовался математический аппарат частотного и регрессионного анализа, а также непараметрические тесты. Сбор статистической информации производился с помощью сетевого анализатора пакетов CommView. Измерение задержки в стеке протоколов проводилось с использованием языка программирования C++ и архитектуры WinPcap. Разбор и анализ собранных экспериментальных данных осуществлялся с помощью языка программирования C++ и пакета прикладных программ MATLAB. Моделирование выполнялось средствами MATLAB и пакета сетевого моделирования J-SIM.

Научная новизна

  • На основе исследования статистики распределения продолжительностей интервалов передачи пакетов и пауз в процессе VoIP монологов и пересечений таких интервалов в ходе диалога, построены статистические модели, описывающие источники трафика IP-телефонии, в том числе с учетом корреляции диалоговых пар;
  • Впервые проверялось согласие эмпирических и теоретических распределений на основе результатов нескольких непараметрических критериев согласия, по-разному оценивающим отличия между распределениями. При этом учитывалась сложность проверяемой гипотезы.
  • Впервые в качестве входного параметра моделей учитывается энергия входного сигнала, что позволяет в итоге генерировать динамический трафик, создающий различную нагрузку на сеть, отражая тем самым с большей правдоподобностью процессы, протекающие в реальных сетях.

Практическая ценность

Практическая ценность работы заключается в том, что разработанные модели источников трафика IP-телефонии могут быть реализованы в широком классе систем имитационного моделирования. Написанные автором компоненты системы сетевого моделирования J-Sim, могут быть использованы при генерировании нагрузки, создаваемой приложениями IP-телефонии. С помощью построенной модели можно также моделировать входящие потоки, как последовательности значений продолжительностей периодов с речью и паузами, что может использоваться для анализа качества статистического мультиплексирования с разделением времени, когда несколько речевых потоков объединяются в один за счет того, что в каждом потоке присутствуют периоды, в течение которых речевая информация не передается. Также практическая ценность работы подтверждена внедрением разработанных моделей в продуктах VoIP компании «МЕРА РУ».

Апробация работы

Основные результаты работы были представлены на:

  • Всероссийской научно-технической конференции «Информационные системы и технологии ИСТ-2005», посвященной 60-летию Победы в Великой Отечественной войне и 110-летию изобретения радио А. С. Поповым (г. Нижний Новгород, 2005);
  • Международной научно-технической конференции «Информационные системы и технологии ИСТ-2006», посвященной 70-летию факультета информационных систем и технологий (г. Нижний Новгород, 2006);
  • Всероссийской научно-технической конференции «Новые материалы и технологии» (г. Москва, 2006);
  • 2-ом Международном форуме «Актуальные проблемы современной науки» (г. Самара, 2006);
  • VI Международной молодежной научно-технической конференции «Будущее технической науки» (г. Н. Новгород, 2007);
  • Международной молодежной научно-технической конференции «Информационные системы и технологии (ИСТ-2007)», посвященной 90-летию НГТУ (г. Н. Новгород, 2007).

Публикации

Основное содержание диссертации отражено в десяти печатных работах.

Положения, выносимые на защиту

  1. Метод определения параметров модели источника речевого IP трафика при монологе в зависимости от уровня кодируемого сигнала;
  2. Имитационная модель источника трафика IP-телефонии в ходе монолога;
  3. Имитационное моделирование трафика IP-телефонии в ходе диалога в виде совокупности коррелированной пары источников.

Структура и объем работы

Текст диссертационной работы состоит из введения, четырех глав, заключения, списка литературы и приложения.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность диссертационной работы, сформулированы ее цель и решаемые в работе задачи, определена новизна полученных результатов, их практическая значимость, сформулированы основные положения, выносимые на защиту.

В первой главе диссертационной работы рассмотрены основные аспекты передачи речи по IP-сетям. Представлены этапы обработки речи на стороне источника (рис. 1). Формирование речевого трафика происходит в несколько этапов. Аналоговые речевые сигналы, поступающие с микрофона, оцифровываются с помощью аналого-цифрового преобразователя. Как правило, частота дискретизации составляет 8 КГц при 8 битах/отсчет. В результате получается оцифрованный речевой поток с битовой скоростью в 64 Кбит/с (рис. 1а). Далее полученные данные поступают на вход кодека, где происходит разбиение потока отсчетов на блоки (рис. 1б), с помощью детекторов речевой активности из потока исключаются блоки, не содержащие речь (рис. 1в), что позволяет сократить требования к пропускной способности канала. Сжатие в 4 – 12 раз (рис. 1г). Затем выходные блоки распределяются по RTP пакетам (рис. 1д), добавляются заголовки протоколов UDP, IP и, в случае подключения к сети Ethernet, заголовок Ethernet. По IP-сети переданные пакеты достигают принимающей стороны. Здесь весь процесс повторяется с точностью до наоборот.

 Заголовки всех протоколов-1

Рис. 1.

Заголовки всех протоколов отбрасываются, блоки декодируются, и полученные данные поступают на вход цифро-аналогового преобразователя, звучит речь. Наличие в кодеках функций DTX (discontinuous transmission – поддержка прерывистой передачи), VAD (voice activity detector – детектор речевой активности), CNG (comfort noise generator – генератор комфортного шума) позволяет существенно уменьшить объем передаваемых данных за счет исключения из выходного потока блоков, не содержащих речь, что, в свою очередь, значительно усложняет динамику потоков трафика.

Отмечено, что согласно ранее проведенным исследованиям только 28% – 40% продолжительности диалога содержит речь, и 80% продолжительности речи содержится в монологе. Таким образом, использование VAD позволяет уменьшить нагрузку на сеть в 2.5 раза при диалоге и в 1.25 раза при монологе. При проведении децентрализованных многоадресных конференций при большом количестве участников постоянно активно бывает от одного до двух человек. В данном случае удается достичь еще большего сокращения объема передаваемой информации.





Перечислены различные задержки, возникающие при передаче блоков в сеть. Алгоритмическая задержка имеет фиксированное значение и определяется продолжительностью речи, содержащейся в одном блоке, и размером буфера предварительного анализа. Задержки при кодировании/декодировании характеризуются настолько малыми значениями, что учитывать их при построении модели источника трафика не имеет смысла. А вот задержки, возникающие при инкапсуляции/деинкапсуляции, мало представлены в литературе. Делается вывод о необходимости определить значения данных задержек и характер их изменения.

Модель трафика при монологе решено представить в виде On/Off-последовательности. Такая последовательность состоит из чередующихся On- и Off-интервалов. Значения On-интервалов соответствуют продолжительностям интервалов речи, т.е. периодам непрерывной передачи блоков с речевой информацией в сеть. Значения Off-интервалов соответствуют продолжительностям пауз, т.е. периодам, когда никакие данные не передаются. Построение такой модели заключается в нахождении функций плотностей распределения вероятностей, наиболее точно соответствующих эмпирическим распределениям продолжительностей On- и Off-интервалов. Классическим результатом в данной области является результат, полученный Brady P. T. еще для аналоговых детекторов пауз, состоящий в том, что интервалы, как с речью, так и с паузами распределены в соответствии с экспоненциальным законом (рис. 2).

Рис. 2.

Несостоятельность данного результата по отношению к современным цифровым детекторам речевой активности отмечается в работах авторов Jiang W. и Schulzrinne H. К такому же выводу можно прийти, построив гистограмму интервалов речи (рис. 3). Гистограмма интервалов пауз имеет похожий вид.

Рис. 3.

Более удачными распределениями в данном случае могут быть гамма, Вейбулла, логнормальное и подобные им распределения (рис. 4)

Рис. 4.

В современных работах, посвященных данной тематике, таких авторов, как B. Bellalta, M. Oliver, D. Rincon, E. Casilari, H. Montes, F. Sandoval, делаются выводы о распределении интервалов с речью и паузами в пользу разных распределений. Подобная неопределенность может быть следствием того, что заключение о согласии эмпирических и теоретических распределений делалось на основе одного критерия Колмогорова. Как показывает практика, более мощными являются критерии Смирнова, -Мизеса, -Мизеса. При этом в данных работах ничего не говориться об учете сложности проверяемой гипотезы. В случае если параметры теоретических распределений вычисляются по той же самой выборке, по которой проверяется согласие, то предельное распределение статистики критерия в данном случае будет отличаться от классического распределения. Таким образом, проверка сложной гипотезы по классическому сценарию также может быть причиной несогласованности полученных результатов.

Также в первой главе обоснован выбор метода максимального правдоподобия, используемый для вычисления параметров теоретических распределений. Выбраны сами непараметрические критерии согласия Колмогорова, Смирнова, -Мизеса, -Мизеса. Если критерии Колмогорова и Смирнова придают одинаковый вес разнице между эмпирическим и теоретическим распределениями при всех значениях случайной величины, то критерии -Мизеса, -Мизеса устроены так, что больший вес придается значениям, расположенным по краям распределений.

Во второй главе проводится сбор экспериментальных значений задержек в стеке протоколов UDP/IP/ETHERNET, а также данных о трафике, генерируемом как в ходе монолога, так и в ходе диалога.

С помощью двух небольших программ, реализованных на языке C++, проведен сбор значений задержки, возникающей при передаче блоков как вверх, так и вниз по стеку, при разном количестве блоков, содержащихся в одном пакете. Первая программа, использующая стандартные сокеты платформы Win32 API, отвечает за прием и отправку пакетов на вершине стека. Вторая программа, отвечающая за прием и отправку пакетов в основании стека, использует архитектуру WinPcap. В состав данной архитектуры входит драйвер, работающий на уровне ядра ОС, который непосредственно и взаимодействует с драйвером сетевого устройства.

Эксперимент продолжительностью три минуты проводился как для разных направлений движения пакетов по стеку протоколов, так и для разного количества блоков, содержащихся в одном пакете. Опыт был проведен десять раз. Полученные данные были записаны в файлы для дальнейшего анализа. При этом использовались компьютеры под управлением операционных систем Windows XP и Windows 98 с тактовой частотой центрального процессора 1, 1.7, 2.5 МГц и объемом оперативной памяти 128, 256, 512 Мбайт соответственно.

Сбор экспериментальных данных о трафике, генерируемом при монологе и диалоге, производился с помощью сетевого анализатора пакетов CommView и приложения IP-телефонии NetMeeting. Продолжительность каждого монолога составила от 5 до 7 минут. Пакеты, генерируемые в течение монолога, перехватывались и записывались в файл для дальнейшего анализа. Общее время сбора экспериментальных данных при монологе составило более десяти часов.

Для сбора информации о трафике, генерируемом в ходе диалога, были организованы два рабочих места, соединенных с помощью концентратора. Продолжительность каждого диалога составила около шестидесяти минут. Всего было проведено шесть диалогов.

В третьей главе диссертации проводится анализ собранных экспериментальных данных и на их основе разрабатываются статистические модели источников трафика IP-телефонии.

Анализ файлов со значениями задержки в стеке протоколов UDP/IP/ETHERNET показал, что максимальное значение данной задержки во всех рассмотренных случаях не превышает 0.5 мс. Таким образом, проводить дальнейший анализ характера ее изменения, как и учет ее при построении модели трафика не имеет смысла.

Были получены предельные распределения статистик рассматриваемых критериев в условиях проверяемых сложных гипотез, которые далее были использованы при проверке согласия эмпирических и теоретических распределений.



Pages:   || 2 |
 

Похожие работы:










 
© 2013 www.dislib.ru - «Авторефераты диссертаций - бесплатно»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.