zhChinese    enEnglish
  ПМ-ПУ  » Образование  » Программы курсов » Управление сложными информационными системами

Управление сложными информационными системами

Общий курс

Составители: доктор физ.-мат. наук, профессор Андрианов С. Н.
доктор физ.-мат. наук, профессор Овсянников Д.А.

Содержание дисциплины

ЧАСТЬ 1. МОДЕЛИРОВАНИЕ И УПРАВЛЕНИЕ СЛОЖНЫМИ СИСТЕМАМИ (НА ПРИМЕРЕ IT-ИНФРАСТРУКТУРЫ ОРГАНИЗАЦИИ)

РАЗДЕЛ 1. IT-ИНФРАСТРУКТУРА ОРГАНИЗАЦИИ, КАК СЛОЖНАЯ ДИНАМИЧЕСКАЯ СИСТЕМА
Информация и управление ею, как объекты исследования. Повышение качества принятых решений (на уровне корпорации) как основная цель управления. Формализация задачи построения ИТ-инфраструктуры. Пошаговый подход к строительству ИТ-инфраструктуры. Понятие динамической системы с управлением. Построение математической модели ИТ-системы.
РАЗДЕЛ 2. ЗАДАЧИ УПРАВЛЕНИЯ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
Методы исследования устойчивости динамических систем, устойчивость линейных систем и нелинейных систем. Постановки задач управления динамическими системами. Критерии качества функционирования динамической системы. Проблемы верификации и идентификации управляемой системы. "Контроль исполнения" как один из основных факторов жизнеспособности корпоративной информационной системы (КИС).
РАЗДЕЛ 3. НЕПРЕРЫВНЫЕ И ДИСКРЕТНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ
Задачи управления. Анализ структурных особенностей управляемых систем. Принципы оптимальности. Оптимальный выбор параметров систем управления. Интегральные критерии качества. Минимаксное оценивание динамики управляемых систем. Динамические системы с импульсным воздействием. Необходимые условия оптимальности в задаче программного управления. О достаточных условиях оптимальности. Методы последовательных приближений. Многокритериальная оптимизация и мультиметодные алгоритмы. Синтезирующие управления. Системы с распределенными параметрами. Фильтры случайных процессов. Интеллектуальное и адаптивное управление. Методы нейросетевого управления.
РАЗДЕЛ 4. УПРАВЛЕНИЕ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ
Классические и информационные задачи управления. Стохастическое управление и фильтрация. Управление и наблюдение в условиях неопределенности. Задача стабилизации ансамбля траекторий. Программные и синтезирующие управления по неполным данным. Интегральные критерии качества. Совместная оптимизация динамики программной траектории и ансамбля возмущенных движений. Управление ансамблем траекторий в импульсных и дискретных системах. Минимаксные задачи оптимального управления пучком движений. Управление распределенными ансамблями траекторий.
РАЗДЕЛ 5. МОДЕЛИРОВАНИЕ СЛОЖНЫХ ИНФОРМАЦИОННЫХ СИСТЕМ

Формирование корпоративных стандартов управления ИТ-ресурсами предприятия необходимое условие создания полноценной системы управления корпорацией с помощью информационных технологий.

Первый этап: формализация проблемы. Формирование функционально-организационной структуры ИТ-службы корпорации; разработка оптимальной модели бизнес-сервисов управления информационными ресурсами компании; формирование предложений по совершенствованию функционально-организационной структуры предприятия с определением зон ответственности по направлениям организационной ИТ-службы компании; проведение консультаций и обучения при использовании библиотеки мирового опыта ITIL для повышения эффективности функционирования ИТ-службы корпорации; регламентация организации управления информационно-вычислительными ресурсами в компании с формированием корпоративных стандартов управления ИТ-ресурсами; разработка технического задания на внедрение автоматизированной системы управления ИТ-инфраструктурой.

Второй этап: моделирование. Методики моделирования информационных систем. Системное проектирование и SADT-методологии. Средства автоматизации, ориентированные на анализ предметной области. Инструментальные средства автоматизации создания ИС - CASE- средства (Computer Aided Software Engineering).

Разбиение задачи построения ИС на подзадачи в зависимости от применяемого подхода. Сбор информации и моделирование бизнеса. Построение архитектуры информационной системы. Три основных аспекта процесса моделирования: бизнес-объекты (информационный тип моделирования); исполняемые процессы (информационный тип моделирования); события, управляющие изменениями процессов и объектов (событийное моделирование).

Методики моделирования ИТ-систем и их соответствие методикам моделирования бизнес-процессов (подход Р.Баркера). Реорганизация структуры функционирования предметной области (бизнес-прецессов) как следствие внедрения информационной системы. Независимость от информационных технологий, реализующих функционирование КИС (что надо делать и зачем, а не, как и какими средствами это делать).

Основные методики моделирования: функциональная иерархия, анализ состояний, диаграммы потоков данных, событийное моделирование, функциональная логика. Основные уровни моделирования: уровень бизнеса, системный уровень, программно-процедурный уровень.

Архитектура информационной системы. Три картины описания: представление заказчика, представление проектировщика, представление разработчика. Построение архитектуры КИС по Захману. Диаграммы Захмана. Понятие полноты схемы.

РАЗДЕЛ 6. ПРОБЛЕМЫ УПРАВЛЕНИЯ И ОПТИМИЗАЦИИ

Управление: непрерывное и дискретное. Формализация целей функционирования объекта моделирования (формулирование критериев оптимальности).

Формализация ограничительных условий. Редукция управляющих воздействий. Иерархия оптимизационных задач. Параметрическое и функциональное управление.

Необходимость пересмотра стратегии и тактики управления в процессе тестирования и функционирования ИТ-системы. Использование технологий реинжиниринга и проектно-ориентированного подхода к управлению для повышения эффективности деятельности корпорации. Современные технологии инжиниринга и реорганизации бизнес-процессов, методы управления проектами, включающие методики календарного планирования проектов, прогнозирования необходимых ресурсов и затрат, анализа и корректировки выполнения проекта, создания необходимой информационной и организационной инфраструктуры. Использование инструментальных средств, имеющих в своей структуре базы знаний, для построения технологий и методик.

РАЗДЕЛ 7. ЗАДАЧИ УПРАВЛЕНИЯ ИТ-ИНФРАСТРУКТУРОЙ

Основные положения инфраструктуры корпоративной информационной системы (КИС). Соответствие ИТ-инфраструктуры и реальной КИС. Формализация целей управления в процессе функционирования ИТ-инфраструктуры: эффективность, доступность, живучесть, безопасность, непрерывность и т.п.

Математическое моделирование целей управления и методы реализации.

Использование стандартизованных приложений (например, IT Infrastructure Library - ITIL), предоставляющих интегрированные службы автоматизации деятельности персонала эксплуатационных служб по развертыванию и поддержке ИТ-сервисов, в том числе задачи:
  • управления инцидентами (инцидент - частный (одиночный) случай нештатной работы ИТ-системы);
  • управления проблемами (проблема - причина, лежащая в основе одного или нескольких инцидентов),
  • управления изменениями (изменение - согласованное и утвержденное добавление, модификация или утилизация аппаратного, программного обеспечения, сетевой инфраструктуры, рабочих мест пользователей или эксплуатационной документации);
  • управления конфигурациями (конфигурационная единица - компонент инфраструктуры, находящийся на контроле в Управлении конфигурациями - в зависимости от системы конфигурационные единицы могут существенно различаться по типу и масштабам);
  • управления уровнем сервиса (соглашение об уровне сервиса определяется как утвержденное соглашение между компанией поставщиком ИТ-сервиса и Клиентами, об уровне предоставляемого сервиса).
РАЗДЕЛ 8. СОСТАВНЫЕ ЧАСТИ ИТ-ИНФРАСТРУКТУРЫ
Сервисы как составные части КИС. Основные типы сервисов: управление сетями, управление операционными системами и приложениями, управление производительностью, управление данными, управление сервисами и веб-услугами.
РАЗДЕЛ 8. СПОСОБЫ ОЦЕНКИ ИТ-ИНФРАСТРУКТУРЫ

Формирование критериев качества функционирования ИТ-инфраструктуры на основе анализа бизнес-структуры корпорации. Многокритериальность задачи управления корпорацией. Выделение антагонистических критериев. Построение взвешенных критериев. Текущие и терминальные оценки.

Оценки производительности сложных информационно-вычислительных систем на основе аналитических моделей в виде замкнутых большой размерности:
  • использование методов сравнительного анализа стратегий доступа к критическим ресурсам многопроцессорных систем, используемых для синхронизации параллельных процессов. Определение на основе проведенного анализа оптимального соотношения фазы ожидания и фазы блокирования для конкретных систем;
  • анализ стратегий доступа к распределенной общей памяти в кластерах многопроцессорных иерархических систем с целью разработки методов выбора оптимальной функции обратной связи (периода между последовательными попытками доступа к занятому модулю памяти в зависимости от числа безуспешных попыток);
  • оценки производительности информационно-вычислительной системы архитектуры "клиент-сервер" со множеством неоднородных клиентов, обслуживаемыми разнообразными серверами на основе разработки эффективных методов оценки пропускной способности ИТ-системы, позволяющих определять ее узкие места.
РАЗДЕЛ 9. СОВРЕМЕННЫЕ ТЕОРИИ ПОСТРОЕНИЯ СЛОЖНЫХ ИНФОРМАЦИОННО-ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ
Основные положения, лежащие в основе теории построения сложных информационно-вычислительных систем (ИВС). Основные этапы предварительного ситуационного анализа:
  • формирование функционально-организационной структуры ИТ-службы корпорации; разработка оптимальной модели бизнес-сервисов управления информационными ресурсами корпорации;
  • формирование предложений по совершенствованию функционально-организационной структуры корпорации; определение зон ответственности по направлениям организационной ИТ-службы корпорации;
  • регламентация организации управления информационно-вычислительными ресурсами в корпорации с формированием корпоративных стандартов управления ИТ-ресурсами;
  • разработка технического задания на внедрение автоматизированной системы управления ИТ-инфраструктурой.

Методологии разработки корпоративных программных приложений для последующего применения полученных знаний с использованием соответствующих CASE-инструментов. UML - унифицированный язык моделирования для описания, визуализации и документирования объектно-ориентированных систем и бизнес-процессов в ходе разработки программных приложений. Применение UML для построения объектно-ориентированной модели системы с использованием графической нотации. Использование при разработке диаграмм, которые необходимы для представления информационной модели системы.

РАЗДЕЛ 10. ПОСТРОЕНИЕ АДАПТИВНОЙ ГЕТЕРОГЕННОЙ ИНФОРМАЦИОННОЙ СРЕДЫ ПРЕДПРИЯТИЯ НА БАЗЕ КОНЦЕПЦИИ E-BUSINESS ON DEMAND
Концепция e-бизнеса по требованию (е-business on demand). Развитие информационных технологий, приведшее к созданию этой концепции.

Развитие электронного рынка (внешней интеграции) привело к созданию концепции е-бизнеса по требованию. Е-бизнес по требованию как интегрированный бизнес, гибко реагирующий на динамические изменения потребностей заказчиков, партнеров, поставщиков. Бизнес-процессы предприятий, внедряющих е-бизнес по требованию, тесно связаны с бизнес-процессами ключевых партнеров, поставщиков и покупателей.

Основные преимущества новых технологий:
  • получение новых возможностей;
  • снижение стоимости;
  • эффективность (скорость реагирования);
  • безопасность и устойчивость;
  • продуктивность работы.
Основные проблемы, препятствующие внедрению технологий е-бизнеса по требованию:
  • неправильная оценка эффективности, времени и стоимости;
  • возврат инвестиций;
  • утилизация существующих ресурсов;
  • сложность в управлении и интеграции;
  • ограничения на ресурсы.

Интегрированность: Рабочая среда е-бизнеса по требованию объединяет гетерогенные ресурсы и приложения от разных поставщиков. Гетерогенность среды как объективное качество: интегрированная информационная система создается на базе изолированных информационных систем разных отделов одного предприятия или разных предприятий.

Смешение значимости с вертикальной интеграции (между уровнями аппаратного и программного обеспечения или между организационными уровнями предприятия) на горизонтальную интеграцию - обеспечение согласованной совместной работы аппаратных и программных компонентов, лежащих на одном уровне технологической и/или организационной структуры.

Технологии middleware (промежуточное или связующее программное обеспечение). Представители семейства middleware, развиваесых IBM: WebSphere, Lotus, DB2 и Tivoli.

Открытость: Рабочая среда е-бизнеса по требованию базируется на открытых стандартах. Открытость дает возможность бизнес-системе быть модульной, т.е. допускать изменения и расширения, а также выбирать модули от лучших в отрасли производителей. Открытость гарантирует, что предприятие не станет заложником несовместимых технологий. IBM поддерживает и участвует в разработке более сотни стандартов: доставка и представление информации (TCP/IP и HTML), бизнес-логика (Java, J2EE), данные (XML), Web-сервисы (WSDL, SOAP, UDDI). Современное направление стандартизации операционной системы, в качестве стандарта выступает операционная система Linux, обеспечивающая надежность доступность с широкой поддержкой в мире.

Виртуализация: Гетерогенные и рассредоточенные (в локальной или глобальной сети) ресурсы и операционные средства рабочей среды - единый виртуальный компьютер, содержащий все необходимые ресурсы и средства для оперирования ими. Концепция портала как средства интеграции представления - сведения на одну страницу ресурсов и средств разнородных и реально размещенных в совершенно разных местах.

Автономность: Сосредоточение внимания корпорации на ключевых бизнес-процессах, а не на конфигурировании, настройке, защите и восстановлении своей информационной системы. Информационные системы сами заботятся о балансировании своей загрузке, безопасности, модификации программного обеспечения, предупреждении сбоев и восстановлении после них.

РАЗДЕЛ 11. AUTONOMIC COMPUTING - ПОСТРОЕНИЕ САМООРГАНИЗУЮЩИХСЯ ИНФОРМАЦИОННЫХ СИСТЕМ
Инструментарий разработки средств автоматического управления в рамках ИТ-среды - Autonomic Computing Toolkit (ACT), созданный фирмой IBM на основе технологий Eclipse и предназначенный для интегрирования самонастраивающихся функций в свои приложения. ACT предназначен для совместной работы с платформой IBM Software Development Platform - набором инструментов, обеспечивающих создание, интеграцию, расширение, модернизацию и развертывание приложений. Встраиваемые компоненты, инструменты, сценарии использования и документацию, совместимые с типовой архитектурой IBM для самонастраивающихся вычислительных систем (проект IBM Autonomic Computing Blueprint). Поддерживаемые платформы: IBM AIX, Linux для систем на базе процессоров Intel и Windows2000.
Основные положения:
  • Система autonomic computing обладает представлением о самой себе, а каждый из компонентов обладает способностью к самоидентификации.
  • Обладает способностью к изменению конфигурации при изменении непредсказуемых внешних условий.
  • Не имеет постоянного устойчивого состояния, она всегда анализирует внешние условия и оптимизирует свою работу.
  • Обладает способностью к самовосстановлению.
  • Обладает способностью к самозащите.
  • Существует в открытой среде.
  • Постоянно анализирует состояние окружающей среды.
  • Самостоятельно распоряжается ресурсами, необходимыми для оптимизации своей работы, и сохраняет сложность, скрытую от пользователя.
Состав ACT:
  • Autonomic Management Engine (AME) - ядро мониторинга и анализа событий и автоматического управления ресурсами;
  • Integrated Solutions Console - основанный на Web-технологиях набор средств для разработки систем администрирования;
  • Solution Installation and Deployment - платформа для создания решений, позволяющих осуществлять автоматизированное внедрение ПО;
  • Problem Determination - набор технологий для автоматического обнаружения, анализа и устранения проблем в вычислительных средах;
  • средства поддержки формата Common Base Event;
  • Generic Log Adapter for Autonomic Computing - утилита для преобразования журнальных файлов в формат Common Base Event;
  • Log and Trace Analyzer for Autonomic Computing - программа для сопоставления и анализа содержимого журнальных файлов в формате Common Base Event.
РАЗДЕЛ 12. КОНЦЕПЦИИ МЕТАКОМПЬЮТИНГОВЫХ СИСТЕМ. GRID АРХИТЕКТУРА

GRID - инфраструктура, объединяющая региональные и национальные вычислительные компьютерные инфраструктуры для создания всеобщего ресурса. Концепция глобальной инфраструктуры, интегрирующей мировые компьютерные ресурсы для реализации крупномасштабных информационно-вычислительных проектов - концепция GRID. GRID технологии - технологии управления ресурсами распределенных систем. Основные определения. Сообщества, испытывающие потребность в использовании высокопроизводительных сетей.

Технологические основания для создания GRID-инфраструктур: волоконно-оптические сети, высокопроизводительные процессоры, параллельные архитектуры, протоколы связи, математическое обеспечение распределенных структур, механизмы обеспечения безопасности.

Основные направления использования GRID:
  • распределенные супервычисления (решение очень крупных задач, требующих огромных процессорных ресурсов, памяти и т.д.);
  • "высокопоточные" вычисления (High-Throughput Computing), позволяющие организовать эффективное использование ресурсов для небольших задач, утилизируя временно простаивающие компьютерные ресурсы; вычисления "по требованию" (On-Demand Computing), крупные разовые расчеты;
  • вычисления с привлечением больших объемов распределенных данных (Data-Intensive Computing), например, в метеорологии, астрономии, физике высоких энергий;
  • коллективные вычисления (Collaborative Computing).

Средства управления данными - многоуровневая система служб. Службы верхнего уровня: управление тиражированием (Replica Management), оптимизация запросов и управление шаблоном доступа (Query Optimization & Access Pattern Management). Службы промежуточного слоя - организация пересылки, поиска и доступа к данным. Нижележащие службы - системы управления хранением данных (Castor, HPSS или локальные файловые системы) и системы управления метаданными, в частности, создание распределенного иерархического кэша. Обеспечение необходимых механизмов безопасности. Основная проблема управления данными в инфраструктуре Data GRID - гетерогенность репозиториев данных.

Тиражирование данных как процесс управления копиями. Стратегия кэширования, при которой идентичные файлы доступны в нескольких местах GRID-инфраструктуры (uлавная цель тиражирования - достижение более быстрого доступа к данным за счет их местонахождения в локальном кэше или в ближайшей копии). Синхронизация реплик с другими репликами. Зависимость качества реплики от протоколов обновления и сетевых параметров GRID-инфраструктуры. Стратегия обновления и создания реплик.

Использование механизма связи на каждом GRID-узле для тиражирования метаданных. Возможности инструментального набора средств Globus (сокеты и коммуникационная библиотека Nexus). Реализация различных протоколов тиражирования (синхронные и асинхронные методы обновления). Обеспечение службы доступа высокого уровня и оптимизация глобальной пропускной способности с использованием GRID-кэшей - Replica Manager. Осуществление глобального кэширования с помощью Replica Manager и создание локальных кэшей на основе систем массовой памяти.

Вычислительная GRID-инфраструктура - распределенная программно-аппаратная компьютерная среда, в которой организован функционально надежный (предоставление пользователю гарантий получения им длительного предсказуемого доступа к ресурсам всех компонентов GRID), согласованный (согласованность предполагает стандартизацию всех GRID-служб, интерфейсов, а также способов работы пользователей), устойчивый (устойчивость доступа как возможность постоянного взаимодействия к ресурсам) и недорогой доступ к конечным вычислительным ресурсам.

Базовые функции GRID. Базовые компоненты архитектуры. Конечные системы. Кластеры. Кластеризация как физическое соединение и интеграция двух и более серверов с целью обеспечения высокого коэффициента готовности (обеспечение работы критических для бизнеса приложений на протяжении максимально продолжительного промежутка времени) и масштабируемости системы. Для клиентов из остальной сети кластер виден и доступен как единое целое. Основные характеристики специального программного и аппаратного обеспечения, обеспечивающие работу кластера.

ЧАСТЬ 2. УПРАВЛЕНИЕ IT-ИНФРАСТРУКТУРОЙ ОРГАНИЗАЦИИ (НА ПРИМЕРЕ IBM TIVOLI SOFTWARE)

РАЗДЕЛ 1. ЗАДАЧИ УПРАВЛЕНИЯ IT-ИНФРАСТРУКТУРОЙ ОРГАНИЗАЦИИ
Основные принципы создания интегрированной системы управления информационными ресурсами независимо от масштаба предприятия, используемых платформ и приложений. Цели и задачи комплексного управления всеми аспектами корпоративной информационной системы. Формирование распределенной среды, обеспечивающей интеграцию всех уровней информационной системы в единую систему управления. Управление информационной системой как совокупность операционных систем, приложений, распределенных сетей и сетевых сервисов.
РАЗДЕЛ 2. АРХИТЕКТУРА СРЕДЫ УПРАВЛЕНИЯ

Основные задачи среды управления Tivoli Management Framework (TMF): управление развертыванием информационной системы, конфигурированием и отслеживанием изменений.

Обзор архитектуры Tivoli Management Framework (TMF): структурные компоненты TMF и схема их взаимодействия. Аутентификация и авторизация, policy regions, управляемые ресурсы (типы, объекты), задания и способы управления ими, планировщик задач, организация хранения данных RDBMS, защита данных.

Профайлы настройки: структура, виды профайлов, иерархия профайлов, распространение профайлов.

Шлюзы и конечные станции: отказоустойчивость и настройка взаимодействия.

Принципы составления плана развёртывания TMF: сетевое и аппаратное обеспечение, топология, отказоустойчивость.

Автоматизация обработки событий сложных информационно-сетевых систем (Tivoli Enterprise Console).

Архитектура TEC: компоненты, связь с TMF.

Автоматизация работы с TEC: создание правил, настройка автоматической реакции на события и их корреляции, настройка уведомлений.

Трехуровневая архитектура TMF: Tivoli Management Region Server, Managed Nodes\Endpoint Gateway, Endpoints. Независимость от операционных систем, числа серверов и рабочих станций.

Обеспечение работы системы управления, поддержка внутренней базы данных, координация коммуникаций с Managed Nodes, предоставление пользовательского интерфейса - Tivoli Management Region Server.

Обеспечение масштабируемости системы управления - Managed Node.

Обеспечение управляемости систем - Endpoint.

Поддержка коммуникаций с endpoint'ами - Endpoint Gateway.

РАЗДЕЛ 2. УПРАВЛЕНИЕ КОНФИГУРАЦИЕЙ И ОПЕРАЦИОННАЯ ПОДДЕРЖКА IT- ИНФРАСТРУКТУРЫ
Задачи управления конфигурацией и операционной поддержки. Архитектура CM: TMF, предоставление средств для контролируемого изменения конфигураций в гетерогенной распределенной среде - Software Distribution, осуществление инвентаризации программного и аппаратного обеспечения - Tivoli Inventory. Activity Planner, Change Manager, Resource Manager. Примеры использования CM: распространение и установка ПО, инвентаризация ресурсов, автоматизация процессов установки и инвентаризации, управление конфигурацией сети с помощью "типовых моделей".
РАЗДЕЛ 3. УПРАВЛЕНИЕ ПРОИЗВОДИТЕЛЬНОСТЬЮ И ДОСТУПНОСТЬЮ СЕРВИСОВ ИТ-ИНФРАСТРУКТУРЫ

Архитектура Tivoli NetView и принципы работы. Задачи управления сетью. Работа основных демонов NetView. Принципы работы сервисов NetView. Мониторинг сети.

Основы протокола SNMP. Архитектура SNMP. Функционирование SNMP. Информационная база MIB. Примеры МIB-объектов.

Обработка событий в NetView. Поток событий в NetView. Типы событий. Реализация событий при помощи SNMP-trap. Обработка событий, отображение и фильтрация в NetView.

Автоматическая обработка событий - Rulesets. Определение автоматической обработки событий. Разработка правил (Rulesets). Активизация Rulesets.

Управление сетевыми ресурсами с применением правил - SmartSets. Правила определения сетевых ресурсов в группы. Группирование сетевых ресурсов.

Интеграция с продуктами Tivoli Enterprise . Интеграция с Tivoli Enterprise Console, Tivoli Inventory, с базой данных DB2.

Мониторинг программных сервисов. Архитектура Tivoli Monitoring. Мониторинг СУБД, почтовых систем, WEB сервисов, прикладных программных систем. Мониторинг уровня обслуживания пользователей IT-инфраструктуры (Tivoli Service Level Advisor).

РАЗДЕЛ 4. УПРАВЛЕНИЕ БЕЗОПАСНОСТЬЮ
Аспекты управления безопасностью. Создание безопасной среды для функционирования информационной системы. Возможности Tivoli: построение интегрированного и комплексного решения. Основная задача определения стратегии безопасности: определение уровня доступа пользователей или группы пользователей. Определение политики и ее реализация как необходимое требование к системе управления безопасностью. Группа продуктов Tivoli SecureWay. Создание централизованных каталогов пользователей с помощью Tivoli SecureWay Security Manager и Tivoli SecureWay User Administrator. Права доступа пользователей к операционным системам и информационным ресурсам корпорации. Предоставление возможности создания глобального каталога прав доступа к данным с помощью Tivoli SecureWay Policy Director. Комплексная защита от несанкционированного проникновения в сеть. Tivoli SecureWay Risk Manager - компонент, предназначенный для получения информации от источников в информационной системе, отвечающих за безопасность (firewall'ы, антивирусная защита, WEB сервера, журналы операционных систем, и т.п.), анализа сетевого трафика и определения факта вторжения в сеть извне\изнутри.
РАЗДЕЛ 5. УПРАВЛЕНИЕ ХРАНЕНИЕМ ДАННЫХ

Надежное хранение и обслуживание критически важных данных надежное средство резервного копирования и восстановления - Tivoli Data Protection for R/3 в сочетании с Tivoli Storage Manager (это инструмент резервного копирования и восстановления, надежно защищающий важнейшие данные SAP R/3). Основные требования - надежность при обслуживании больших объемов данных, минимизация времени простоя и стоимости обслуживания, а также способность адаптации к изменяющейся инфраструктуре.

Tivoli Data Protection for R/3 в сочетании с Tivoli Storage Manager обеспечивает следующие возможности:
  • Снижение стоимости за счет эффективного использования ресурсов памяти и автоматического управления памятью.
  • Адаптация к изменениям в процессе без перенастройки процедур.
  • Использование имеющихся ресурсов систем SAP R/3.
  • Минимизация времени простоя системы.
  • Защита от потери данных R/3 и рабочих данных благодаря тщательно разработанным, надежным и быстрым процедурам автоматического резервного копирования и восстановления.
Дополнительная функция Administration Assistant для настройки и контроля производительности Tivoli Data Protection for R/3.

ЧАСТЬ 3. СИСТЕМЫ УПРАВЛЕНИЯ БАЗАМИ ДАННЫХ (НА ПРИМЕРЕ IBM DB2 UNIVERSAL DATABASE)

РАЗДЕЛ 1. ОСНОВЫ ТЕОРИИ БАЗ ДАННЫХ (ОПЦИОНАЛЬНО: ЧИТАЕТСЯ ДЛЯ НЕДОСТАТОЧНО ПОДГОТОВЛЕННОЙ АУДИТОРИИ)

Модели данных. Понятие сущности и атрибута. Обзор основных моделей данных: иерархическая, сетевая, реляционная. Примеры применения различных моделей при организации баз данных. Основные рекомендации.

Требования к реляционной модели. Понятия кортежа и отношения. Таблица (отношение), запись (кортеж), поле (атрибут). Требования к таблице в реляционной модели.

Ключи. Связывание таблиц. Понятие ключа. Возможный ключ. Первичный ключ. Внешний ключ. Правило ссылочной целостности для реляционной модели.

Нормализация. Цель нормализации. Универсальное отношение. I, II, III нормальные формы, нормальная форма Бойса-Кодда. Пример.

Связи между таблицами. Главная и зависимая таблицы. Типы связей между таблицами: один к одному, один к многим, многие к многим.

Понятие СУБД. Основные функции СУБД. Требование безопасности данных. Требование обеспечения целостности данных: понятие целостности, способы обеспечения целостности.

Транзакции. Понятие транзакции. Завершение и откат транзакции. Требования ACID. Журнал транзакций.

SQL как язык реляционных баз данных. История создания и развития SQL. Стандарты SQL. Версии SQL.

РАЗДЕЛ 2. АРХИТЕКТУРА БАЗ ДАННЫХ

Логическая архитектура баз данных. Обзор основных логических объектов, составляющих БД DB2.

Экземпляры. Понятие экземпляра (менеджера баз данных) как единого объекта, управляющего всей деятельностью БД и взаимодействием с ней.

Системный каталог. Системный каталог БД (словарь данных, системные таблицы) - сведения о логической и физической структуре БД.

Схемы. Понятие схемы как группирующего объекта БД. Связь между схемой и ее владельцем.

Таблицы. Таблицы как единственный объект для хранения данных. Таблицы системного каталога.

Представления. Виртуальные таблицы. Вертикальный и горизонтальный фильтры. Ограничения на создание представлений.

Индексы. Необходимость индексирования данных. Оптимизатор запросов.

Ограничения целостности. Обзор объектов, обеспечивающих взаимную согласованность и корректность данных. Ограничение NOT NULL. Ограничение Unique. Ограничение Check. Ограничение Primary Key. Ограничение Foreign Key. Правила для удаления и изменения строк таблиц, связанных по внешнему ключу: RESTRICT, NO ACTION, CASCADE, SET NULL.

Хранимые процедуры. Удобство использования хранимых процедур как единого регулярно выполняемого блока команд. Стандартные (SQL) и Java процедуры.

Функции. Системные и пользовательские функции. Типы функций: скалярные, агрегатные (функции столбца), табличные.

Триггеры. Понятие триггера как специальной хранимой процедуры, автоматически выполняемой при вставке, изменении, удалении данных. Выполнение BEFORE и AFTER. Триггеры как средство обеспечения целостности. Рекомендации по применению триггеров.

Определяемые пользователем типы данных (Distinct Types). Системные типы. Примитивные и структурированные типы. Функции преобразования. Методы структурированных типов.

ФИЗИЧЕСКАЯ АРХИТЕКТУРА БАЗ ДАННЫХ (рассмотрение основных объектов, описывающих физическую структуру БД DB2).

Группы разделов (Database partition groups). Понятие раздела базы данных. Группа разделов - набор из одного или нескольких разделов.

Табличные пространства. Табличные пространства SMS (System Managed Space). Табличные пространства DMS (Database Managed Space). Обычные, временные и длинные табличные пространства. Табличное пространство SYSCATSPACE.

Контейнеры. Понятие контейнера как произвольного источника для хранения информации БД. Типы контейнеров: файл, каталог, диск. Назначение контейнеров для табличных пространств SMS (каталог) и DMS (файл, диск). Параллельная запись во все контейнеры табличного пространства. Рекомендации по размещению контейнеров.

Страницы. Понятие страницы как минимального блока для операции чтения-записи. Размер страниц. Рекомендации по заданию размера страниц.

Экстенты. Экстент как группа последовательных страниц, выделяемая для хранения данных. Размер экстента, выбор размера экстента. Хранение объектов в экстенте (принадлежность только одному объекту). Служебные экстенты: SMP, EMP.

Файлы журнала транзакций. Необходимость регистрировать зафиксированные и активные транзакции. Использование журнала транзакций для восстановления данных.

Сравнение с другими СУБД. Сравнение физической архитектуры БД DB2 с другими СУБД: MS SQL Server, Oracle.

РАЗДЕЛ 3. РАБОТА С БАЗАМИ ДАННЫХ (DDL)

Создание, изменение и удаление БД. Планирование конфигурации БД (планирование создания контейнеров, размещения файлов; планирование создания табличных областей). Команды SQL для работы с БД: CREATE DATABASE, ALTER DATABASE, DROP DATABASE.

Работа с таблицами. Выбор типов данных для столбцов таблицы, возможность использования составных столбцов. Выбор ограничений целостности, задание связей между таблицами. Создание триггеров. Команды SQL для работы с таблицами: CREATE TABLE, ALTER TABLE, DROP TABLE.

Использование представлений. Ограничения на создание представлений. Представления "только для чтения". Команды SQL для работы с представлениями: CREATE VIEW, ALTER VIEW, DROP VIEW.

Использование индексов. B-дерево. Рекомендации по созданию индексов. Индексный ключ. RID. Использование индексов при выполнении запросов, оптимизатор запросов. Команды SQL для работы с индексами: CREATE INDEX, REORG, DROP INDEX.

РАЗДЕЛ 4. РАБОТА С ДАННЫМИ (DML)

Данный раздел предполагает практическое изучение средств SQL для работы с данными.

Выборка данных (команда SELECT). Разделы команды SELECT. Использование команды SELECT в распределенных БД. Вычисление агрегатных функций на выборке данных. Группировка.

Вставка данных (команда INSERT). Использование команды INSERT: для вставки 1 строки данных, для вставки из результатов выборки.

Изменение данных (команда UPDATE).

Удаление данных (команда DELETE).

Хранимые процедуры. Написание хранимых процедур на SQL и Java.

Определяемые пользователем функции (UDF). Создание скалярных функций. Создание функций на Java.

РАЗДЕЛ 5. ПРОИЗВОДИТЕЛЬНОСТЬ

Буферный пул. Назначение буферного пула, его роль для повышения производительности. Связь с табличным пространством. Данные, хранящиеся в буферном пуле. "Чистые" и "грязные" страницы. Запись страниц буферного пула на диск. Агенты очистки страниц.

Оптимизатор запросов. Оптимизатор SQL запросов как интеллектуальный механизм исполнения запросов. План запроса. Automatic summary tables (AST). Оценка стоимости запросов. Возможность преобразования запроса к эквивалентной, но более эффективной форме. Визуализация в Visual Explain.

Параллелизм. Обзор архитектуры аппаратных сред, поддерживающих параллелизм: многопроцессорные машины (SMP, symmetric multi-processor). Кластеры: кластеры однопроцессорных машин (MPP) и кластеры многопроцессорных машин (SMP-кластеры).

Типы параллелизма: параллелизм ввода/вывода, внешний параллелизм, внутренний параллелизм (внутрираздельный и межраздельный параллелизм).

Пути достижения параллелизма: использование нескольких контейнеров в табличном пространстве (параллелизм ввода/вывода), увеличение числа процессоров, либо узлов в кластере, разделение БД.

РАЗДЕЛ 6. АДМИНИСТРИРОВАНИЕ

Система безопасности DB2. Аутентификация пользователя. Полномочия (authority) - действия над БД. Полномочия SYSADM, SYSCTRL, SYSMAINT, DBADM, CONNECT. Привилегии (privilege) - действия над объектами БД. Привилегии CONTROL, ALTER, INSERT, DELETE, UPDATE, SELECT, REFERENCES, INDEX, BIND, EXECUTE. Полномочия и привилегии по умолчанию. Принцип наименьших привилегий. Пользователи и группы. Предоставление и отзыв привилегий. Команды GRANT и REVOKE.

Резервное копирование и восстановление данных. Важность резервного копирования данных. Способы восстановления БД: восстановление версии, восстановление с повтором транзакций. Рекомендации по совместному применению способов восстановления. Резервное копирование отдельных табличных областей. Резервное копирование и восстановление распределенных БД (параллелизм).

Мониторинг. Цель мониторинга - выявление проблемных/сбойных мест в работе системы и их устранение. Оптимизация работы системы. Краткий обзор объектов и средств мониторинга. Health Monitor, Health Center, Web Health Center. Tivoli Manager for DB2. Возможность записи данных мониторинга в таблицы БД. Анализ SQL-запросов. Visual Explain.

АЗДЕЛ 7. ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ IBM DB2 UNIVERSAL DATABASE

DB2 Net Search Extender. Расширение для полнотекстового поиска любой текстовой информации. Возможность поиска в любых внешних источниках данных (от реляционных СУБД до слабоструктурированных текстовых документов). Встроенные средства SQL для поисковых запросов. Морфологический анализ с использованием словарей. XML Extender. Возможность работы с XML-данными. Преобразование выборки в XML. Сохранение XML-данных в полях таблиц. XML-шаблоны.

Image Extender. Импорт и экспорт изображений. Поддерживаемые форматы. Атрибуты изображений. Поиск изображений по атрибутам и связанным данным.

Audio Extender. Импорт и экспорт аудиоданных. Поддерживаемые форматы. Работа с атрибутами аудиофрагментов. Поиск по атрибутам и связанным данным.

Video Extender. Поддержка импорта и экспорта видеоданных. Возможные форматы. Атрибуты видеоинформации. Поиск по атрибутам и связанным данным.

Net.Data. Компонента для Web-сервера для доступа к DB2 из Internet. Основы разработки Web-приложений с помощью Net.Data. Возможность доступа к другим СУБД.

РАЗДЕЛ 8. УПРАВЛЕНИЕ РАСПРЕДЕЛЕННЫМИ И ГЕТЕРОГЕННЫМИ БД

(Обзор средств DB2, обеспечивающих масштабируемость при организации распределенных и гетерогенных БД)

Группы разделов (Database partition groups). Необходимость разделения БД. Ключ разделения. Хеширование. Карты разделения. Рекомендации по разделению крупных таблиц. Добавление разделов. Перераспределение данных между разделами.

DB2 Data Links. Доступ к данным в файловой системе. Интеграция с внешними данными средствами SQL. Обеспечение целостности. Включение в транзакции.

DB2 Relational Connect. Возможность непосредственно взаимодействовать с другими реляционными СУБД: Oracle, MS SQL Server, Sybase. Организация гетерогенных БД. Повышение производительности при извлечении информации из других БД.

Система репликации данных. Репликация - совокупность механизмов, обеспечивающих отображение изменений данных, сделанных на одном сервере БД, на другие взаимосвязанные серверы. Возможность выполнять репликацию в гетерогенной среде. Отслеживание изменений для репликации. Регистрация таблиц и столбцов для автоматического отслеживания изменений (row-capture rule). Программы Capture и Apply. Replication Center.

Основная литература

  1. G. Baklarz, B. Wong DB2 Universal Database v7.1 for UNIX, Linux, Windows and OS/2 Database Administration Certification Guide. Prentice Hall, October 30, 2000.
  2. T. Connolly, C. Begg, Database Systems: A Practical Approach to Design, Implementation, and Management. Pearson Addison Wesley, 2001.
  3. D. Chamberlin M. Kaufmann A Complete Guide to DB2 Universal Database, 1998. www.ibm.com.
  4. Дополнительная информация о самонастраивающихся вычислительных технологиях размещена на сайте www.ibm.com/autonomic.
  5. Набор средств - Autonomic Computing - размещен на сайте IBM для разработчиков по адресу: www.ibm.com/developerWorks/autonomic.