zhChinese    enEnglish
  ПМ-ПУ  » Образование  » Программы курсов » Алгоритмы и технологии анализа данных

Алгоритмы и технологии анализа данных

Курс по выбору

Составитель: Сергеев С.Л., Севрюков С.Ю.

I. Организационно-методический раздел

Дисциплина изучается студентами направления «Информационные технологии» (магистратура) в 11 семестре, итоговой формой контроля является экзамен. Контроль самостоятельной работы студентов осуществляется в виде тестирования, опросов и проверки домашней работы.

Цель и задачи изучения дисциплины

Цель дисциплины «Алгоритмы и технологии анализа данных» - освоение студентами базовых принципов и современных подходов к анализу данных, моделями и работы с инструментами по обработке и анализу данных. Задачами курса являются получение навыков построение информационных моделей и структур данных, их последующего анализа и получение выводов.

Место дисциплины в профессиональной подготовке выпускника

Является специальной дисциплиной магистра и развивает тематику дисциплин, посвященных информационным технологиям. Для изучения необходимы знания в области основ информационных технологий, реляционной алгебры, математической статистики и принципов функционирования СУБД.

Требования к уровню освоения материала дисциплины

После изучения курса студенты должны:

II. Содержание дисциплины

1. Особенности архитектуры современных СУБД
Роль современных СУБД в вычислительных системах. Разновидности архитектур, построенных на основе СУБД. Кластерные системы. Настройка производительности сервера баз данных.
2. Обзор технологий анализ данных
Анализ данных с использованием современных СУБД. Обзор технологий, классификация и решаемые задачи. Схема решения аналитических задач. Математический подход к анализу данных - от моделей к данным. Физический подход к анализу данных - от данных к моделям.
3. Data Warehouse (хранилища данных)
Архитектура многомерного хранилища. Создание хранилища данных. Загрузка и извлечение данных из хранилища. Работа с локальным и сетевым хранилищем данных.
4. Структура хранилищ данных
Предметная ориентация. Интеграция. Поддержка хронологии. Неизменяемость данных. Категории данных.
5. Data Mining (добыча данных)
Описание классов решаемых задач. Кластеризация. Классификация. Регрессия. Ассоциация. Последовательность. Анализ отклонений.
6. OLAP технологии
Анализ проблемы интеграции данных, знакомство с OLTP и OLAP- технологиями. Принципы построения систем на основе хранилищ данных. Методы аналитической обработки многомерных данных с использованием OLAP-технологий. Изучение методов принятия решений на основе анализа данных с использованием OLAP-технологий.