авторефераты диссертаций БЕСПЛАТНАЯ РОССИЙСКАЯ БИБЛИОТЕКА - WWW.DISLIB.RU

АВТОРЕФЕРАТЫ, ДИССЕРТАЦИИ, МОНОГРАФИИ, НАУЧНЫЕ СТАТЬИ, КНИГИ

 
<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ

Pages:   || 2 | 3 | 4 | 5 |   ...   | 7 |

Оглы речевые технологии в автоматизированных системах массового обслуживания

-- [ Страница 1 ] --

УЧРЕЖДЕНИЕ РОССИЙСКОЙ АКАДЕМИИ НАУК

ИНСТИТУТ ПРОБЛЕМ УПРАВЛЕНИЯ

им. В.А. ТРАПЕЗНИКОВА

(ИПУ РАН)

На правах рукописи

УДК: 681.3:519.2:519:51-74:004-52

ФАРХАДОВ Маис Паша оглы

РЕЧЕВЫЕ ТЕХНОЛОГИИ

В АВТОМАТИЗИРОВАННЫХ СИСТЕМАХ

МАССОВОГО ОБСЛУЖИВАНИЯ

Специальность 05.13.15 –

Вычислительные машины, комплексы и компьютерные сети

АВТОРЕФЕРАТ

диссертации на соискание ученой степени

доктора технических наук

Москва — 2012

Работа выполнена в Учреждении Российской академии наук

Институте проблем управления им. В.А.Трапезникова РАН

Научный консультант:

доктор технических наук, профессор

Жожикашвили Владимир Александрович

Официальные оппоненты:

доктор технических наук, профессор

Трахтенгерц Эдуард Анатольевич

доктор технических наук, доцент

Ронжин Андрей Леонидович

доктор технических наук, доцент

Шаврин Сергей Сергеевич

Ведущая организация:

Институт проблем передачи информации им. А.А. Харкевича РАН (ИППИ РАН)

Защита состоится «____» __________ 2012 г. в ___ часов на заседании Диссертационного совета №3 Д 002.226.03 ИПУ РАН по адресу:

117997, Москва, ул. Профсоюзная, д. 65.

Телефон диссертационного совета: (495)334-93-29.

С диссертацией можно ознакомиться в библиотеке Института проблем управления им. В.А.Трапезникова РАН.

Автореферат разослан «_____» ______________ 2012 г.

Ученый секретарь

Диссертационного Совета

кандидат технических наук, с.н.с. Кулинич Александр Алексеевич

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Диссертационная работа посвящена разработке теоретических основ и выработке практических решений проблемы применения речевых технологий в автоматизированных системах массового обслуживания (АСМО) с целью повышения открытости этих систем и облегчения доступа населения к информации и услугам. Актуальность проблемы доступа людей к информации на переходном этапе продвижения страны и мира к информационному обществу не вызывает сомнений. Быстро развивающиеся информационные и телекоммуникационные технологии проникают во все сектора экономики: в производство, в сферу услуг, в образование, в государственное управление, банковскую сферу, в частный бизнес и др. Наблюдается тенденция к социализации информации – нарастанию количества информации, которая необходима людям в их повседневной жизни. Помимо наличия знаний и информации, для развития информационного общества необходимо создание условий для того, чтобы члены общества имели доступ к информации и могли ее использовать. Бурное развитие технологий обостряет существующую во всем мире проблему информационного неравенства. Для России сложилась ситуация, когда темпы роста информатизации оказались выше, чем темпы развития компьютеризации и коммуникаций. Это привело к обострению проблемы неравного доступа граждан к информации, особенно малообеспеченных людей и населения отдаленных регионов. В качестве одного из средств смягчения этой трудной проблемы в диссертации рассматриваются речевые технологии, достигшие за последние годы достаточно высокого уровня качества и способные обеспечить гражданам дополнительный, а иногда и единственный, канал доступа к информационным и сервисным системам. Создание телефонных сервисов самообслуживания, речевых порталов и речевых браузеров повышает эффективность и открытость АСМО и решает актуальную народнохозяйственную и социальную задачу облегчения доступа населения к информации и услугам и обуславливает важность и необходимость выполнения исследований в данной области.



Цель работы состоит в разработке теоретических основ и практически значимых решений фундаментальных проблем использования речевых технологий в сетевых и телефонных системах массового обслуживания.

Были поставлены и решены следующие задачи:

- анализ современного состояния и тенденций развития автоматизированных систем массового обслуживания населения;

- анализ качества функционирования существующих распознавателей речи для создания речевого доступа к АСМО и экспериментальное исследование их свойств;

- разработка эффективного по затратам времени и по результативности речевого человеко-машинного интерфейса к АСМО как разновидности человеко-машинного взаимодействия;

- разработка и реализация метода автоматизированного накопления статистических данных об ошибках распознавания и методов и алгоритмов коррекции результатов распознавания на основе накопленных данных и знаний об ошибках;

- разработка системы оценок и аналитических моделей для сравнительного анализа и оптимизации сценариев речевого диалога с различными процедурами обнаружения и коррекции ошибок;

- разработка математических моделей для расчета вероятностно-временных характеристик обслуживания вызовов и оптимизации функционирования контакт центров с сервисами самообслуживания на базе речевых технологий;

- внедрение полученных результатов в практических системах с речевым интерфейсом.

Методы исследования. В диссертационной работе применены методы теории систем массового обслуживания, теории вероятностей, математической статистики, математического моделирования, теории цепей Маркова, теории управления.

Научная новизна. Новизна диссертации состоит в том, что впервые разносторонне исследованы русскоязычные речевые технологии, пригодные для организации интерактивного речевого взаимодействия клиентов с системами массового обслуживания, и разработаны теоретические основы и практические решения проблем, относящихся к использованию речевых технологий в АСМО с целью повышения доступности информации и услуг этих систем населению.

К основным научным результатам, полученным в диссертационной работе, относятся:

- выполнен теоретический анализ и экспериментальное исследование характеристик дикторонезависимых распознавателей русской речи с целью определения свойств машинной стороны интерактивного речевого интерфейса. Разработан аппаратно-программный комплекс для автоматизации исследований характеристик распознавателей речи и диалоговых взаимодействий в многоканальном режиме;

- исследован относительно малоизученный и трудный для реализации речевой человеко-машинный интерфейс, разработаны новые методы повышения эффективности диалогового взаимодействия и созданы практические рекомендации для разработчиков речевых приложений АСМО;

- разработаны новые методы и алгоритмы повышения устойчивости и надежности систем массового обслуживания с речевым интерфейсом;

- разработан и программно реализован метод автоматизированного накопления статистических данных об ошибках распознавания речи;

- разработан метод и алгоритм коррекции результатов распознавания на основе использования накопленных данных и знаний об ошибках;

- решена задача определения оптимальной величины порога показателя уверенности распознавателя в предлагаемой гипотезе для вызова процедуры подтверждения, позволяющая своевременно обнаруживать ошибки распознавания и сокращать среднюю продолжительность диалогов;

- разработана классификация сценариев речевого диалога и система вероятностных и временных оценок и аналитических моделей для сравнительного анализа сценариев с различными процедурами обнаружения и коррекции ошибок. Решена задача выбора оптимального сценария диалога на основе минимизации оценок продолжительности диалога с обеспечением заданной вероятности его успешного завершения;

- разработан комплекс математических моделей для расчета вероятностно-временных характеристик обслуживания заявок и оптимизации функционирования центров обработки вызовов с сервисами самообслуживания на базе речевых технологий.

Практическая ценность.

Показана возможность и целесообразность применения речевых технологий в системах массового обслуживания. Разработаны практические рекомендации по речевому человеко-машинному интерфейсу и создана методология проектирования систем с речевыми технологиями. Разработанные принципы, модели и методы применены в первых в России прикладных системах телефонного самообслуживания различного профиля и в системах с нетрадиционным применением речевых технологий: веб приложение «Звуковой тренажер» и система речевого управления электронной картой г. Баку, для которой разработана методика адаптации турецкого языкового пакета для распознавания азербайджанского языка. Созданы универсальные блоки распознавания русской и азербайджанской речи, включающие словари и грамматики, и соответствующая им база аудио-файлов.

Применение результатов работы позволяет существенно расширить круг пользователей систем массового обслуживания, предоставив им удобный дополнительный, а иногда и единственный, канал доступа к услугам этих систем. Это обеспечит новый уровень информационных услуг, предоставляемых населению и организациям в режиме самообслуживания, а также повысит эффективность использования систем массового обслуживания.

Разработанные математические модели, алгоритмы и программы могут быть использованы для дальнейшего развития и совершенствования автоматизированных систем массового обслуживания.

Достоверность. Научные положения, выводы диссертации обоснованы с использованием теории массового обслуживания, теории вероятностей и математической статистики, теоретических основ программирования, а также проверены в процессе вычислительного эксперимента и подтверждены испытаниями на научно-исследовательском полигоне ИПУ РАН, актами внедрений, практическим применением в нескольких компаниях.

Связь с планом. Исследования по теме диссертационной работы проводились в соответствии с плановой тематикой работ Учреждения Российской академии наук Института проблем управления им. В.А. Трапезникова РАН, а также при поддержке РФФИ (гранты 05-08-18075-а, 08-08-01022-а, 09-08-01168-а).

Апробация работы. Основные результаты диссертационной работы докладывались и обсуждались на Международной конференции «Distributed Computer Communication Networks. Theory and Application» (Тель-Авив, 1999 г., София, 2009 г., Москва, 2010 г.); Международной конференции «Математические методы исследования систем и сетей массового обслуживания» (Минск, 1998 г.); XIV международном симпозиуме по управлению большими системами «CONTROL’2000» (Тбилиси, 2000 г.); 8-ой Международной конференции «Проблемы управления безопасностью сложных систем» (Москва, 2000 г.); 16-ой Белорусской школе по теории массового обслуживания (Минск, 2001 г.); 9-ой Международной конференции «Речь и компьютер» (SPECOM’2004) (Санкт-Петербург, 2004 г.); Научной сессии Отделения информационных технологий и вычислительных систем РАН «Распознавание речи» (Москва, 2003 г.); II, III, IV Конференциях «Интеллектуальные услуги в телефонных сетях. Мобильный контент. Технологии и бизнес» (Виноградово, 2005 г., 2006 г., 2007 г.); IV, V, VIII, IX, X Международных форумах «Высокие технологии XXI века» (Москва, 2004 г., 2005 г., 2007 г., 2008 г., 2010 г.); Международной научной конференции «Проблемы кибернетики и информатики» (Баку, 2006 г.); Научно-практической конференции «Современные технические и программные средства обеспечения АСУ и АСУ ТП» (Москва, 2005 г.); Конференции «Перспективы развития робототехники для экстремальных ситуаций» (Москва, 2006 г.); Конференции «ИНФОТЕХ-2007» (Севастополь. 2007 г.); XII International Conference Speech and Computer (SPECOM'2007) (2007, Москва); International Workshop on Multiple Access and Queuing Systems MACOM-2008 (Saint-Petersburg, 2008); International Conference «Problems of Cybernetics and Informatics», 2008, 2010 Baku; I, II и III Международных конференциях «Управление развитием крупномасштабных систем MLSD», (Москва, 2007 г., 2008 г., 2010 г.); Российской конференции с международным участием «Технические и программные средства систем управления, контроля и измерения» (Москва, 2008 г., 2010 г.); IV Международной конференции по проблемам управления (МКПУ-IV) (Москва, 2009 г.); Международной конференции «Современные математические методы анализа и оптимизации информационно-телекоммуникационных сетей» BWWQT-2009 (Минск, 2009 г.), IX Международной конференции по финансово-актуарной математике и эвентоконвергенции технологий, Красноярск, 2010.





Результаты работы демонстрировались на 12 выставках (2003-2011 гг.) и неоднократно награждались медалями и дипломами.

Публикации. Результаты проведенных автором научных исследований опубликованы в 53 работах, среди которых 19 статей в ведущих рецензируемых журналах из списка ВАК России и 4 монографии.

Структура и объем работы. Диссертационная работа состоит из введения, 6 глав, заключения и приложения и содержит 324 страниц машинописного текста, включая 65 рисунков, 17 таблиц, а также список литературы (238 наименований).

СОДЕРЖАНИЕ ДИССЕРТАЦИИ

Во введении обоснована важность и актуальность темы диссертации, ее новизна, сформулированы цели исследований и основные задачи, которые необходимо решить для их достижения, определена практическая ценность и кратко излагаются основные результаты работы.

В первой главе проанализированы тенденции развития систем массового обслуживания населения с позиций повышения доступности информации и услуг широким слоям населения в условиях формирования информационного общества и рассмотрены современные речевые технологии как инструмент для создания новых интерфейсов к информационным и сервисным системам.

Анализируются два класса систем массового обслуживания населения: сетевые и телефонные. Сетевые системы обслуживания прошли эволюцию от моноцентральных систем бронирования мест с корпоративной сетью и специализированными терминалами до современных информационных порталов и интернет-магазинов с веб доступом к ним с компьютеров разного типа. Анализируя эволюцию сетевых систем, можно заметить, что с точки зрения населения наиболее важным моментом явилось исключение из цепочки «конечный потребитель» – «посредник» – «система» среднего звена – посредника и предоставление конечному потребителю возможности получения данных и услуг в режиме самообслуживания. Этот режим стал настолько популярен, что провайдеры информации и услуг начали сокращать число агентов-посредников, что стало затруднять доступ к системам той части населения, которая компьютеров не имеет или не имеет доступа в сеть, а это, как правило, наиболее бедная часть населения: пожилые люди, инвалиды, жители отдаленных регионов.

Телефонные системы обслуживания являются традиционным средством предоставления информации населению по телефону. Они также прошли путь от автоматизированных телефонных станций с простейшими механизмами распределения вызовов между операторами до современных контакт-центров, обслуживающих разнотипные вызовы и имеющих сложную систему контроля и управления работой персонала. Анализируя эволюцию телефонных систем обслуживания вызовов, можно отметить, что с точки зрения пользователя безусловным новшеством стало внедрение интерактивного голосового ответа (IVR – Interactive Voice Response) для автоматизации функций донесения абонентам ответов на часто задаваемые вопросы, позволившее получать часть информации в режиме самообслуживания, без участия оператора. Получение информации через автомат должно обходиться пользователю дешевле, что также может быть привлекательным для населения, особенно для беднейшего.

Дальнейшее расширение возможностей получения информации и услуг в режиме самообслуживания лежит на пути использования речевых технологий. Выполнен анализ современных речевых технологий и показаны области их применения. На Западе телефонные сервисы самообслуживания на базе речевых технологий получили довольно широкое распространение, и этот рынок успешно развивается. Так, по данным компании BCC Research, специализирующейся на исследовании рынков и прогнозе успешности внедрения новых технологий [http://www.bccresearch.com], рынок технологии распознавания речи будет ежегодно расти на 8,8% между 2010 и 2015 годом. Объем рынка в 2015 году оценивается в 58,4 миллиардов долларов США.

В нашей стране речевые технологии до сих пор не получили широкого распространения. Наиболее существенными причинами для объяснения такого отставания является отсутствие на рынке вплоть до последнего времени надежных распознавателей для русского языка и низкое качество передачи речи в телефонных сетях старого поколения. Не последнюю роль играет также недоверие потенциальных потребителей систем с распознаванием речи к новой технологии, которое объясняется опасением, что ошибки распознавания будут вызывать раздражение клиентов и нанесут вред имиджу компании.

Однако ситуация к настоящему времени существенно изменилась. Появились доступные для приобретения и использования русскоязычные распознаватели компаний Nuance, США, [http://nuance.com] и Loguendo, Италия, [http://loguendo.com], находятся на стадии тестирования продукты отечественных компаний Vocative [http://vocative.ru] и «Центр речевых технологий» [http://www.speechpro.ru/technologies/recognition]. Качество передачи речи по сети также улучшилось благодаря изменениям в сетевой инфраструктуре: происходит модернизация магистральных сетей, внедряются цифровые технологии, оптические кабели, высокоскоростной цифровой абонентский доступ. Надежность распознавателей заметно повышается.

Таким образом, при современных тенденциях в развитии коммуникационной техники и речевых технологий в нашей стране и при возрастании значимости доступа к информационным ресурсам и сервисам условия для использования речевых технологий для доступа населения к системам массового обслуживания населения имеются. Предлагаемые решения предоставят населению возможность более широко использовать телефон для получения информации и услуг. Эти решения могут использоваться как в сетевых информационных системах, дополняя традиционный Интернет браузер голосовым браузером, так и в центрах телефонного обслуживания, значительно расширяя функции IVR. Сервисы самообслуживания дешевле, чем услуги операторов, они могут функционировать круглосуточно и на разных языках. Помимо этого, услуги и данные могут быть предоставлены комплексно, из разных систем, путем организации интеллектуального диалога с сервером самообслуживания и взаимодействия этого сервера с разнообразными прикладными системами, что также выгодно и удобно для пользователей. Одновременно, поставщики услуг, контакт центры и контент провайдеры могут повысить свою эффективность путем внедрения у себя сервисов самообслуживания, что позволит им сократить число операторов, сгладить пиковые нагрузки, снизить расходы на организацию инфраструктуры.

Отдельную область применений речевых технологий составляют нужды людей с ограниченными возможностями. Для таких людей речевые технологии позволяют создать сервисы, которые помогут им получать информацию, образование, профессиональные знания и успешно включаться в общественную и трудовую жизнь.



Pages:   || 2 | 3 | 4 | 5 |   ...   | 7 |
 

Похожие работы:







 
© 2013 www.dislib.ru - «Авторефераты диссертаций - бесплатно»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.