авторефераты диссертаций БЕСПЛАТНАЯ РОССИЙСКАЯ БИБЛИОТЕКА - WWW.DISLIB.RU

АВТОРЕФЕРАТЫ, ДИССЕРТАЦИИ, МОНОГРАФИИ, НАУЧНЫЕ СТАТЬИ, КНИГИ

 
<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ

Pages:   || 2 | 3 | 4 |

Технология интеграции данных в гетерогенных корпоративных программных комплексах

-- [ Страница 1 ] --

На правах рукописи

ЗЫКОВ Сергей Викторович

Технология интеграции данных

в гетерогенных корпоративных

программных комплексах

Специальность: 05.13.11

Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

АВТОРЕФЕРАТ

диссертации на соискание ученой степени

доктора технических наук

Уфа 2012

Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования Национальном исследовательском ядерном университете «Московский инженерно-физический институт»

Научный консультант доктор технических наук, профессор

Вольфенгаген Вячеслав Эрнстович

Научно-исследовательский ядерный университет «Московский инженерно-физический институт», кафедра кибернетики

Официальные оппоненты доктор технических наук, профессор

Павлов Сергей Владимирович

Уфимский государственный авиационный технический университет, кафедра геоинформационных систем

доктор технических наук, профессор

Райков Александр Николаевич

Российская академия государственной службы при Президенте РФ, кафедра информационных технологий в управлении

доктор технических наук, профессор

Саксонов Евгений Александрович

Московский государственный институт электроники и математики (МИЭМ), кафедра вычислительных систем и сетей

Ведущая организация Институт проблем управления РАН, г. Москва

Защита состоится «____» _________ 2012 г. в ____ часов

на заседании диссертационного совета Д-212.288.07

Уфимского государственного авиационного технического университета

по адресу: 450000, г. Уфа, ул. К. Маркса, 12

С диссертацией можно ознакомиться в библиотеке университета

Автореферат разослан «____» _________ 2012 г.

Ученый секретарь

диссертационного совета

д-р техн. наук, проф. С. С. Валеев

Актуальность темы. К настоящему времени вследствие ускоренного развития информационных технологий в корпорациях – крупных, территориально (а зачастую – глобально) распределенных организациях с едиными производственными задачами и ресурсами – накоплены и продолжают быстро расти весьма значительные (достигающие петабайт, т.е. 1015 байт) объемы данных. Унификация представления таких данных и манипулирование ими представляет собой существенную проблему в силу гетерогенности объединяющих их информационных систем (ИС), образующих корпоративные программные комплексы (КПК). Специфика гетерогенности проявляется как в архитектурном многообразии компонент КПК (файл-сервер, клиент-сервер, Интернет, «унаследованные» и др.), так и в различной степени структурированности образующих их объектов данных (реляционные таблицы, аудио-, видео- и фотоинформация, отсканированные документы, фрагменты офисных приложений и т.п.). КПК состоят из распределенных компонент – программных систем, которые объединяются посредством Интернет-порталов. Варианты среды взаимодействия программных систем включают как глобально открытый Интернет, так и внутрикорпоративный Интранет.



При этом, традиционно применяемые методологии проектирования КПК (Microsoft MSF, IBM RUP, Oracle CDM и др.) ориентированы преимущественно на инструментальные средства конкретных производителей (Microsoft Visual Studio, IBM Rational, Oracle Designer и т.д.) с трудно формализуемой семантикой и в этой связи не позволяют обеспечить в должной степени эффективного проектирования гетерогенных программных комплексов.

В настоящее время научные исследования подходов к интеграции крупных распределенных гетерогенных программных систем поддерживаются рядом международных и федеральных целевых программ: «Электронная Россия» (РФ), Network of the Future (ЕС), Future Internet Design (США), «Глобальная инициатива по политике Интернет» (ООН), «Информация для всех» (ЮНЕСКО) и др. Только ежегодные расходы на НИОКР по первым двум программам в последние годы составили в нашей стране свыше 400 млн. рублей 1

, а в ЕС – около 100 млн. евро2.

Прогрессирующее влияние информационных технологий на функционирование и развитие корпораций требует разработки  технологической основы построения гетерогенных КПК на основе интеграции данных, поддерживающей весь жизненный цикл их проектирования – от математической модели до программной реализации.

Проблема разработки и унификации такой комплексной интеграционной технологии, включающей как математические модели, так и программно-инструментальные средства для поддержки гетерогенных КПК, непосредственно связана с производственно-экономической эффективностью корпораций. Хотя эта проблема находится в центре внимания крупнейших компаний-разработчиков программного обеспечения (ПО) и ведущих научных коллективов, она еще далека от удовлетворительного решения. Рассматриваемая проблема объединяет следующие взаимосвязанные аспекты:

  • трудности управления обработкой большими, быстро растущими объемами данных в гетерогенных КПК, во многом обусловленные недостаточно формализуемой семантикой языковых и инструментальных средств проектирования ПО (в т.ч. на основе языка UML);
  • сложность интеграции теоретически перспективных математических моделей данных с узконаправленными, эмпирическими программно-инструментальными средствами, поддерживающими «промышленные» методологии проектирования КПК, приводящая к неадекватным срокам, стоимости или эксплуатационным характеристикам внедрения;
  • недостаточная унификация моделей, методов и программных средств для представления и управления контентом – гетерогенными данными и метаданными – компонент КПК.

Отмеченные технологические проблемы проектирования гетерогенных КПК носят принципиальный характер, что неоднократно отмечалось в работах таких отечественных исследователей, как А.П.Ершов, А.А.Ляпунов, В.М.Глушков, Г.И.Марчук, И.А.Мизин, Э.Х.Тыугу, Л.Т.Кузин, Г.С.Поспелов, Д.А.Поспелов, С.С.Лавров, В.Л.Арлазаров, И.В.Романовский, В.В.Липаев, Л.Н.Сумароков, Е.Л.Ющенко, А.С.Нариньяни, В.Э.Вольфенгаген, Б.А.Щукин, В.М.Ветошкин, Г.В.Рыбина, А.Н.Терехов, Е.А.Саксонов, Л.А.Калиниченко, А.С.Клещев, В.А.Серебряков, С.Д.Кузнецов и др.

Среди зарубежных исследователей рассматриваемую проблематику разрабатывали Э.Кодд, К.Дейт, Д.Мейер, Х.Дарвен, Дж.Ульман, Дж.Уидом, П.Чен, Э.Дейкстра, Д.Скотт, Ч.Хоар, М.Стоунбрейкер, Д.Девитт, Г.Гарсиа-Молина, Д.Флореску, Й.Камбаяши, К.Стрейчи, Н.Руссопулос, Дж.Хиндли, М.Гордон, Л.Карделли, П.Лендин, Д.Тернер, Дж.Хьюс, С.Пейтон-Джоунс, П.-Л.Кюрьен, Дж.Рейнолдс, К.Баркер, Р.Снодграсс, С.Абитебуль, Г.Плоткин, Р.Милнер, М.Броди и др.

В этих условиях весьма существенной проблемой становится разработка функционально полной, «сквозной» технологической схемы интеграции данных в гетерогенных КПК, поддержанной многоуровневыми моделями данных и инструментальными средствами.

Систематический анализ трудов перечисленных исследователей привел к формированию основных положений и проведению комплекса исследований по созданию технологии интеграции данных в гетерогенных КПК, представляющей собой крупную научную проблему с важным народнохозяйственным значением.

Актуальность работы подтверждается также поддержкой, оказанной Microsoft Research Ltd. (договор №83-3-042-024), РФФИ (гранты №96-01-01923, №99-01-01229, №01-07-90309, №02-01-00616, №03-01-06339, №04-07-90156, №07-07-08017) и НИУ ВШЭ.

Цель диссертационного исследования состоит в разработке технологии интеграции данных в гетерогенных КПК, направленной на повышение эффективности (в смысле сокращения сроков и снижения стоимости) проектирования, реализации и последующего расширения программных систем рассматриваемого класса и масштаба.

При этом основными задачами, решаемыми в работе, являются:

  • создание концептуальной схемы технологии интеграции данных в гетерогенных КПК с реинжинирингом;
  • построение математических объектных моделей для представления, интеграции (на базе семантических сетей с фреймовой визуализацией) и манипулирования контентом (на основе абстрактной машины) гетерогенных КПК;
  • создание семантически ориентированного инструментально-технологического программного комплекса, поддерживающего интегрированное представление (ИС ConceptModeller) и манипулирование контентом (ИС управления контентом) КПК;
  • реализация, внедрение и апробация прототипов и полномасштабных КПК.

Необходимость разработки перечисленных моделей и поддерживающих их инструментальных средств вызывается, в частности, такими специфическими характеристиками КПК, как их гетерогенность и различная степень структурированности их компонент, которым не в полной мере отвечают существующие методологии проектирования ПО (MSF, RUP, CDM и др.) и инструментальные средства на их основе.

Методы исследования, примененные для решения поставленных задач, основаны на синтезе фундаментальных положений теории конечных последовательностей, теории переменных областей Д.Скотта, теории семантических сетей и теории фреймов.

Научная новизна результатов работы. В результате анализа динамических взаимосвязей важнейших факторов, влияющих на развитие исследуемого класса программных систем, сделан вывод о необходимости создания новой технологии интеграции данных в КПК и разработана ее общая схема. В отличие от существующих схем проектирования ИС для Интернет-среды, основанных на стандартах и подходах XML, OMG, MDC, WfMC, ISO/IEC и др., созданная в настоящей работе технологическая схема интеграции поддержана как инструментальными средствами, так и математическими моделями, что обеспечивает ее методологическую неразрывность и формализуемость, в т.ч. на семантическом уровне.

Разработанный технологический подход к интеграции данных в КПК приводит к практически приемлемым для крупных и сложных ИС значениям важнейших эксплуатационных характеристик, которые до настоящего времени не были достигнуты посредством теоретически важных подходов, предложенных зарубежными коллективами OASIS, OMG, OGC, W3C и др., а также отечественными научными группами (Л.А.Калиниченко, А.С.Клещев и др.), направленных на онтологическое моделирование, интероперабельность и интеграцию гетерогенных компонент. Таким образом, в условиях неоднородности подходов и стандартов интеграции данных в КПК, предложена унифицирующая их целостная технологическая основа, включающая достаточно универсальные математические модели и поддерживающие инструментальные средства и позволяющая адекватно реализовать схему интеграции данных таких программных систем.

Разработаны модели как для представления объектов данных (на основе переменных доменов) и инструментальных средств так и для манипулирования такими объектами (на основе абстрактных машин), которые в более полной мере, чем традиционные (например, ER-модель), учитывают особенности гетерогенных КПК с компонентами различной степени структурированности.

При этом модель манипулирования объектами данных, основанная на управлении состояниями контента, расширяет спектр исследуемых объектов данных до практически произвольных хранилищ информации (включая базы данных и метаданных), поддерживающих как современные архитектуры КПК, так и программные системы промежуточных и «унаследованных» типов.

Математические модели интеграции данных в КПК поддержаны новыми инструментальными средствами для предметно-ориентированного представления объектов данных при помощи семантических сетей с фреймовой визуализацией (ConceptModeller), а также для управления контентом на основе абстрактной машины (ИСУК).

Целостный, интегрированный подход к интеграции данных в КПК, объединяющий семейство математических моделей с программным комплексом поддерживающих инструментальных средств, значительно сокращает сроки и стоимость внедрения гетерогенных КПК по сравнению с существующими аналогами.

На защиту выносятся следующие положения:





  • общая технологическая схема интеграции данных в КПК;
  • семейство моделей сценарного представления и ситуативного манипулирования объектами данных КПК;
  • семейство предметно-ориентированных инструментальных средств для интеграции данных в гетерогенных КПК и управления их контентом;
  • архитектурно-интерфейсная схема корпоративного портала как метанадстройки над гетерогенными компонентами КПК, манипулирующей их контентом;
  • архитектурно-технологические схемы разработки прототипов и полномасштабных прикладных гетерогенных КПК на основе Интернет- и Интранет-порталов.

Практическая значимость проведенных исследований и полученных результатов заключается в создании эффективных моделей, методов и инструментальных средств, поддерживающих технологию интеграции данных в КПК, содержащих гетерогенные компоненты. Данный тип программных комплексов является одним из наиболее сложных прикладных информационных систем, критических для деятельности крупных организаций. Разработанная технология для гетерогенных компонент позволяет существенно (в среднем – на 30-40%) сократить сроки и стоимость разработки интегрированных КПК в таких индустриальных сферах, как учет и планирование корпоративных ресурсов, управление производственными процессами, электронная коммерция и др.

На протяжении ряда лет разработанная технология, включающая комплекс инструментальных средств компонентной интеграции данных в гетерогенных КПК и управления их контентом (ConceptModeller, ИСУК) экспериментально проверялась, развивалась и апробировалась. Опыт внедрения и эксплуатации реализованных на ее основе полномасштабных прикладных КПК для учета и управления производственными ресурсами на крупных предприятиях различных направлений нефтегазовой отрасли, лесной промышленности, логистики, производства мультимедийной продукции и др., программ и курсов подготовки специалистов по проектированию ПО в ведущих образовательных учреждениях (МИФИ, МФТИ, МГУПИ, КГТУ, ЛАНИТ, Softline, ИНТУИТ, ТЕКАМА и др.) подтвердил практическую значимость основных положений диссертации.

Достоверность. Достоверность разработанных в диссертации моделей, методов, инструментальных средств, архитектурно-интерфейсных схем, составляющих технологию интеграции данных в гетерогенных КПК, а также программных прототипов и реализаций, подтверждается актами о внедрении, результатами научных семинаров в МИФИ, МИЭМ, ИПУ РАН, ИМАШ РАН и УГАТУ (2005-2011), а также призами и дипломами научных конференций «Технологии Microsoft в теории и практике программирования» (Москва, МГУ, 2004), «Международная Интернет-конференция по современным проблемам машиноведения» (Москва, ИМАШ РАН, 2005) и “International Multi-Conference on Complexity, Informatics and Cybernetics” (Орландо, США, 2011).

Апробация работы. Развитые в работе модели, методы и средства – событийно-ориентированная модель данных с абстрактными машинами (АМ) на состояниях, инструментальные средства (ConceptModeller, ИСУК) для корпоративных программных комплексов,– положены в основу внедрения гетерогенного КПК в Международной Группе Компаний (МГК) "ИТЕРА" с численностью персонала около 10 тыс. человек. Промышленная эксплуатация КПК приносит значительную (в среднем около 30-40% по сравнению с аналогами) экономию по срокам и стоимости внедрения, при этом существенно повышается эффективность организации управления контентом.

Результаты диссертационного исследования докладывались и обсуждались на III-XI Международных конференциях "Computer Science and Information Technologies" (Уфа, 2001, 2003, 2005, 2010; Патрас (Греция), 2002; Будапешт (Венгрия), 2004; Карлсруэ (Германия), 2006; Красноусольск, 2007; Анталия (Турция), 2008; Ретимнон (Греция), 2009), V Международной конференции "Computer Science and Information Technology" (Ереван (Армения), 2005), I и II Международных конференциях "Web Information Systems and Technologies" (Майами (США); 2005, Сетубал (Португалия), 2006), I Международном симпозиуме "Knowledge Communication and Conferences" (Орландо (США), 2006), I и III Международных конференциях "Enterprise Information Systems and Web Technologies" (Орландо (США), 2007, 2009), XI, XIII, XIV и XV Международных мультиконференциях "International World Multi-Conference on Systemics, Cybernetics and Informatics" (Орландо (США), 2007, 2009-2011), II Международной конференции "International Conference on Information Society" (Мерриллвилл, (США), 2007), XIII Международной конференции "International Conference on Enterprise Information Systems" (Пекин (Китай), 2011), XVII Международной конференции "International Conference on Conceptual Structures" (Москва, НИУ ВШЭ, 2009), VIII Международном симпозиуме "Technomat and Infotel" (Бургас (Болгария), 2006), IV Международном российско-германском научном семинаре "Инновации в ИТ: теория и практика" (Уфа, 2011), XXXV-XXXVIII Международных конференциях «Информационные технологии в науке, образовании, телекоммуникации и бизнесе» (Гурзуф, Украина, 2008-2011), ХV Международном научно-техническом семинаре «Современные технологии в задачах управления, автоматики и обработки информации» (Алушта (Украина), 2006), I Международной конференции "International Conference on Computer Science and Information Technologies" (Львов (Украина), 2006), I и II научных конференциях "Аппликативные вычислительные системы" (Москва, 2009, 2010), Международной нефтегазовой технической конференции и выставке «Мир технологий для уникальных ресурсов» (Москва, 2006), Ежегодной научной конференции «Ломоносовские чтения» (Москва, 2006), VIII, X-XII Международных конференциях «Корпоративные системы» (Москва, 2003, 2005-2007), I-VI Международных конференциях "Software Engineering Conference" (Москва, 2005-2010), II-III Всероссийских научных конференциях с международным участием «Технологии информатизации профессиональной деятельности» (Ижевск, 2008, 2011), I Международной научно-практической конференции «Современные информационные технологии и IT-образование» (Москва, 2005), II-IV Международных конференциях «Управление развитием крупномасштабных систем» (Москва, ИПУ РАН, 2008-2010), I Международной конференции «Технологии Microsoft в научных исследованиях и высшем образовании» (Москва, 2003), XI, XII, XIV, XVI Всероссийских конференциях «Проблемы информационной безопасности в высшей школе» (Москва, 2004, 2005, 2007, 2009), IX Всероссийской объединенной конференции «Интернет и современное общество» (С.-Петербург, 2006), I Всероссийской конференции «Инфокоммуникации XXI века – будущее за тобой!» (Москва, 2006), VI-VIII Всероссийских научных конференциях с международным участием «Информация, инновации, инвестиции» (Пермь, 2005-2007), Международных научно-практических Интернет-конференциях «Информационные технологии в науке и образовании» (Шахты, 2005, 2006; Железноводск, 2007) и др.

Публикации. Автором опубликовано свыше 100 печатных работ, в т.ч. по основным результатам исследования – свыше 80 работ (основные из которых, [1-46], приведены ниже), включая 4 монографии [1-4] и более 15 работ в изданиях из перечня ведущих рецензируемых научных изданий, рекомендованного ВАК РФ для публикации основных результатов диссертаций [5-19]. Общий объем публикаций по теме исследования – около 90 п.л.

Все результаты, которые включены в диссертацию, получены лично автором.



Pages:   || 2 | 3 | 4 |
 

Похожие работы:







 
© 2013 www.dislib.ru - «Авторефераты диссертаций - бесплатно»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.