авторефераты диссертаций БЕСПЛАТНАЯ РОССИЙСКАЯ БИБЛИОТЕКА - WWW.DISLIB.RU

АВТОРЕФЕРАТЫ, ДИССЕРТАЦИИ, МОНОГРАФИИ, НАУЧНЫЕ СТАТЬИ, КНИГИ

 
<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ

Pages:   || 2 | 3 |

Исследование инвариантов нелинейной динамики речи и принципы построения системы аудиоанализа психофизиологического состояния

-- [ Страница 1 ] --

На правах рукописи










Перервенко Юлия Сергеевна

Исследование инвариантов нелинейной динамики речи и принципы построения системы аудиоанализа психофизиологического состояния

Специальность: 05.11.17 «Приборы, системы и изделия медицинского назначения»

АВТОРЕФЕРАТ

диссертации на соискание ученой степени

кандидата технических наук

Таганрог 2009

Работа выполнена в Технологическом институте Южного федерального университета федерального государственного образовательного учреждения высшего профессионального образования «ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ» в г. Таганроге на кафедре электрогидроакустической и медицинской техники

Научный руководитель: доктор технических наук, профессор И.Б. СтарчеНко (ТТИ ЮФУ, г. Таганрог)
Официальные оппоненты: доктор технических наук, профессор, И.М. ЧЕКРЫГИНА (ТТИ ЮФУ, г. Таганрог)
кандидат технических наук А.Я. Черчаго (ЗАО ОКБ «Ритм», г. Таганрог)
Ведущая организация: Ростовский государственный медицинский университет, г. Ростов-на-Дону

Защита состоится « 27 » августа 2009 г. в 1420 часов на заседании диссертационного совета Д 212.208.23 при Южном федеральном университете по адресу:

Ростовская обл., г. Таганрог, ул. Шевченко, 2, ауд. Е-306

С диссертацией можно ознакомиться в зональной библиотеке Южного федерального университета.

Автореферат разослан « » июля 2009 г.

Ученый секретарь диссертационного совета И.Б. Старченко

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ


Актуальность темы диссертации


Труд человека в системах управления техникой (деятельность человека-оператора) связан с периодическим, иногда довольно длительным и интенсивным воздействием (или ожиданием воздействия) экстремальных значений профессиональных, социальных, экологических факторов, которое сопровождается негативными эмоциями, перенапряжением физических и психических функций, деструкцией деятельности. Наиболее характерным психическим состоянием, развивающимся под влиянием указанных факторов у человека-оператора, является психологический стресс.



Анализ состояния человека в процессе его трудовой деятельности предполагает оперативное получение информации. Для мониторинга психофизиологического состояния оператора существует множество способов, как правило, они заключаются в замере физиологических показателей (ЧСС, кровяного пульсонаполнения, КГР и т.д.), однако все эти методы нуждаются в установке контактных датчиков. Таким образом, в последние годы усилился интерес к анализу голоса как объективного показателя эмоционального состояния человека, выполняющего ответственную деятельность. В связи с этим создание системы непрерывного слежения за эмоциональным состоянием человека-оператора, использующей в качестве диагностического критерия изменения в структуре и динамике его речевых сигналов, является наиболее перспективным. Подобный анализ является неконтактным и при необходимости скрытым от проверяемого, что дает преимущество для оценки психофизиологического состояния человека по его речи в комфортной для него обстановке и во избежание возможности маскировки эмоциональных реакций.

Большой вклад в развитие науки в области речевой акустики внесли ученые Г. Фант, Дж. Фланаган, М.А. Сапожков, В.Н. Сорокин, В.И. Галунов, Б.М. Лобанов, Т.К. Винцюк, Л.В. Златоустова, А.В. Аграновский, Н.Г. Загоруйко, Р.К. Потапова, Ю.А. Косарев, А.Л. Ронжин, М.В. Хитров, С.Л. Коваль, В.Г. Михайлов, В.П. Бондаренко, Л.Н. Балацкая, Е.Л. Чойнзонов и др.

Основы исследования динамических систем с позиций детерминированного хаоса были заложены Ляпуновым А.М., Колмогоровым А.Н., Пригожиным И.Р., Анищенко В.С., Ж.А. Пуанкаре и др. Значительный прорыв в исследовании стохастических и детерминистских нелинейных временных рядов и их моделировании был достигнут за последние десятилетия (Ф. Такенс, А. Вольф, П. Грассберг, И. Прокаччиа и др.). Изучение речевых сигналов с помощью методов нелинейной динамики проводились многими исследователями и организациями. Наибольший вклад в теорию анализа одномерных временных рядов внесли А.М. Фрайзер, Н.Х. Паккард, Д.С. Брумхэд, Г.П. Кинг, А. Реньи и др.

На кафедре электрогидроакустической и медицинской техники ТТИ ЮФУ совместно с ЗАО «ОКБ «Ритм» в течение последних лет проводятся совместные исследования по выявлению возможности анализа психофизиологического состояния человека-оператора (на примере диспетчеров Северо-кавказской железной дороги (СКЖД)) с помощью его речи (Хроматиди А.Ф., 2005 г.). В рамках этих работ были получены новые научные и практические результаты, которые легли в основу данной диссертации.

Речь и речеобразование представляют собой нелинейный процесс, обусловленный нелинейностями речевого тракта человека, что дает возможность применять методы нелинейного анализа к речевому сигналу. Несмотря на то, что как показал проведенный обзор, методы нелинейного анализа неоднократно применялись для анализа речи, каких либо практических применений данного анализа не было выявлено, и рассматривался речевой сигнал безотносительно эмоции. В данной работе предлагается применить методы теории динамического хаоса для выявления количественных и визуальных характеристик нелинейной динамики речи человека-оператора с целью оценки его психофизиологического состояния и возможности выполнять свои профессиональные обязанности.

Цели и задачи работы


Целью диссертационной работы является количественная оценка психофизиологического состояния человека-оператора с использованием аппарата нелинейной динамики для анализа речевого сигнала.

Для достижения поставленной цели необходимо решить следующие задачи диссертационной работы:

  1. Определить и численно исследовать критерии хаотичности и стационарности выделенных участков речи.
  2. Рассчитать и проанализировать инварианты нелинейной динамики речи человека-оператора.
  3. Разработать алгоритм анализа в производственных условиях речи человека-оператора методами нелинейной динамики.
  4. Разработать принципы построения системы анализа речи человека-оператора в условиях профессиональной деятельности.
  5. Провести экспериментальные исследования речи человека-оператора в реальных условиях работы с использованием разработанного программного обеспечения с целью определения его психофизиологического состояния.


Методика исследования


В работе использованы методы анализа психофизиологического состояния человека, основанные на нелинейном анализе участков речевого сигнала, полученного при различных эмоциональных состояниях, соответствующих ударному гласному и обнаруживающих хаотическую динамику. Использовались следующие виды анализа: фазо-пространственная реконструкция речевого сигнала, отображение Пуанкаре, рекуррентный график; были рассчитаны следующие инварианты нелинейной динамики: корреляционная размерность, максимальный характеристический показатель Ляпунова, динамическая энтропия второго порядка. Для экспертной оценки эмоционального состояния применялись видеозаписи работы диспетчера в течение смены. Основные выводы и положения сравнивались с известными результатами и были теоретически обоснованы. Эксперименты проводились с участием диспетчеров СКЖД непосредственно в условиях профессиональной деятельности. Достоверность вычислений проверялась статистической значимостью, а также сравнением с результатами, полученными другими методами и средствами.


Научная новизна диссертационной работы


Научная новизна проведенных исследований заключается в рассмотрении как теоретически, так и экспериментально, одномерного продукта системы речевого тракта человека – речевого сигнала – при определенных эмоциональных состояниях с применением аппарата нелинейной динамики.

Основные научные результаты работы:

  1. Рассчитаны инварианты нелинейной динамики эмоциональной речи, ранее не применявшиеся для анализа психофизиологического состояния человека-оператора.
  2. Предложена оригинальная методика анализа речи методами нелинейной динамики, позволяющая получить количественную и качественную оценку эмоциональной речи.
  3. Разработаны принципы построения системы анализа речи человека-оператора в условиях профессиональной деятельности, позволяющей с точностью до 72% (по экспертной оценке) определить его психофизиологическое состояние.

Практическая значимость работы


Практическая ценность данной диссертационной работы заключается в разработанных алгоритмах обработки речевых сигналов методами нелинейной динамики с априорной оценкой их «хаотичности», а так же рассчитанных показателях (инвариантах) нелинейной динамики эмоциональной речи, которые можно применять для количественной оценки психофизиологического состояния человека-оператора в процессе профессиональной деятельности.

Внедрение результатов работы


Разработанные алгоритмы и программное обеспечение для количественного определения эмоционального состояния человека-оператора были использованы в ЗАО «ОКБ «Ритм», г. Таганрог для оценки психофизиологического состояния диспетчеров СКЖД.

В ООО «ПРОТОН-ССС», г. Таганрог результаты данной диссертационной работы были использованы для анализа психофизиологического состояния человека-оператора (служба технической поддержки), для изучения стрессовых ситуаций в рабочей обстановке и выданы рекомендации по определению стрессовой ситуации на основе количественного и качественного анализа речевого сигнала оператора с использованием инвариантов нелинейной динамики.

Методы и алгоритмы расчета нелинейных инвариантов речевого сигнала, были использованы в учебном процессе кафедры ЭГА и МТ ТТИ ЮФУ для студентов специальности 200401 в рамках курсов «Моделирование и управление в медицинских и биологических системах», «Теория биотехнических систем», «Системный анализ и принятие решений».


Апробация работы

Основные результаты работы обсуждались на следующих конференциях и семинарах:

    1. XIX сессия Российского акустического общества. Нижний Новгород, 2007 г.
    2. 11-ый международный молодежный форум «Радиоэлектроника и молодежь в XXI веке». Харьков, 2007 г.
    3. Всероссийская научно-техническая конференция студентов, молодых ученых и специалистов «Новые информационные технологии в научных исследованиях и в образовании». Рязань, 2007 г.
    4. Всероссийская научно-практическая конференция студентов, аспирантов и молодых ученых «Молодежь и современные информационные технологии». Томск, 2008 г.
    5. Всероссийская научно-техническая конференция «Медицинские информационные системы». Таганрог, 2008 г.
    6. Всероссийская научно-техническая конференция студентов, молодых ученых и специалистов «Биотехнические, медицинские и экологические системы и комплексы (БИОМЕДСИСТЕМЫ-2008)». Рязань, 2008 г.
    7. Международная молодежная научная конференция «XXXV Гагаринские чтения». Москва, 2009 г.
    8. Научно-технические конференции профессорско-преподавательского состава, аспирантов и сотрудников ТТИ ЮФУ. Таганрог, 2007-2009 гг.

Работа была обсуждена на совместном заседании кафедр электрогидроакустической и медицинской техники (ЭГА и МТ), физики, автоматизированных систем научных исследований и экспериментов (АСНИ и Э), технологии микро- и наноэлектронной аппаратуры (ТМ и НА) от 8 июня 2009 г.






Публикации


По материалам диссертационной работы опубликовано 8 печатных работ, среди которых 2 работы в журналах из Перечня ВАК.

Структура и объем диссертации


Диссертационная работа состоит из введения, четырех глав, заключения, библиографического списка, включающего 139 наименований, приложений. Содержание диссертационной работы изложено на 171 страниц.

Научные положения, выносимые на защиту


  1. В известных методиках анализа речи отсутствует учет эмоциональной составляющей, в связи с чем количественная оценка психофизиологического состояния человека-оператора по речевому сигналу является актуальной научно-технической задачей, решение которой с применением методов нелинейной динамики имеет существенное значение для создания медицинской техники профилактического и реабилитационного назначения.
  2. Критерии выделения участков речи, пригодных для анализа методами нелинейной динамики, позволяющие провести предварительный анализ сигнала на хаотичность.
  3. Инварианты нелинейной динамики речи, впервые предложенные в качестве визуальных и количественных оценок психофизиологического состояния человека-оператора.
  4. Принципы построения системы аудиоанализа психофизиологического состояния человека-оператора в условиях профессиональной деятельности.

Содержание диссертационной работы

Во введении обосновывается актуальность темы исследования, кратко изложено содержание диссертации, сформулированы основные научные положения, выносимые на защиту.

В первой главе на основе выполненного обзора сформулированы цель и задачи работы.

Показано, что эмоция есть свойство, присущее человеку и некоторым высшим животным. Связь эмоции с психофизиологическим состоянием доказана и обоснована. Поэтому эмоциональную речь можно считать диагностическим сигналом.

Было обосновано, что речь человека представляет собой нелинейный процесс, обусловленный физиологическими нелинейностями речевого тракта, что дает возможность применять методы нелинейной динамики к речевому сигналу.

Показано, что анализ эмоционального состояния человека может быть применен во многих сферах деловой, трудовой, производственной деятельности, и приобретает все большую популярность. Анализ речи является неконтактным и при необходимости скрытым от проверяемого, что дает преимущество для оценки психофизиологического состояния человека в комфортной для него обстановке и во избежание возможности маскировки эмоциональных реакций.

Как показал проведенный обзор, методы нелинейной динамики неоднократно применялись для анализа речи безотносительно эмоции. В данной работе применены методы теории динамического хаоса для исследования количественных и визуальных характеристик речи человека-оператора с целью оценки его психофизиологического состояния и возможности выполнять свои профессиональные обязанности.

Во второй главе исследованы теоретические методы нелинейной динамики применительно к анализу речи на предмет выявления в ней различных эмоций. В качестве исходных сигналов были взяты образцы речи пяти профессиональных актеров, записанные многократно в условиях звукозаглушенной камеры.

Предварительно выделенные участки речевого сигнала (ударные гласные) были исследованы на наличие хаотической динамики и, как следствие, возможности применения методов нелинейной динамики к их анализу. Были выявлены критерии выделения участков речевого сигнала, пригодных для анализа методами нелинейной динамики. Рекуррентный график должен содержать диагональные структуры, что свидетельствует о хаотичности процесса. Корреляционный интеграл должен сходится при некотором значении размерности внедренного пространства m, что дает оценку размерности вложенного пространства и корреляционную размерность. Максимальный характеристический показатель Ляпунова должен принимать положительное значение, что свидетельствует о расхождении близких в пространстве состояний траекторий и, следовательно, хаотичности процесса. Отображение Пуанкаре должно содержать равномерные или неравномерные подковообразные скопления точек. Энтропия второго порядка должна принимать положительное значение, которое для фонем базы составило 2,5 бит/с.

Был реализован качественный (графический) и количественный анализ речевого сигнала методами нелинейной динамики.

Речевой сигнал был исследован с точки зрения двух динамических инвариантов, а именно, максимального характеристического показателя Ляпунова и корреляционной размерности. Речевой сигнал рассматривается как вектор, являющийся продуктом многомерной системы голосового тракта человека. Динамические характеристики, оцененные из наблюдаемого временного ряда основной динамической системы во время устойчивого пространственного развития посредством теоремы Такенса, могут служить количественными показателями при условии использования кардинальных фонем. Они используются в построении нелинейных детерминированных фазово-пространственных моделей аттракторов наблюдаемого временного ряда.

Подробно рассмотрена проблема фазово-пространственной реконструкции из скалярных наблюдений эволюционирующей динамической системы, которая является центральной относительно проблемы оценки ее динамических инвариантов. Восстановленная траектория дает ценную предварительную информацию, наглядно отображая особенности динамической системы.



Pages:   || 2 | 3 |
 

Похожие работы:







 
© 2013 www.dislib.ru - «Авторефераты диссертаций - бесплатно»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.