Программа государственного экзамена по основной образовательной программе «Технологии баз данных» по направлению подготовки 010300 «Фундаментальные информатика и информационные технологии» (магистратура)
Рассмотрена и одобрена на заседании методической комиссии факультета ПМ-ПУ 06 ноября 2012 года (протокол №6 от 06.11.2012г.) Председатель учебно-методической комиссии В.В. Евстафьева |
Утверждена на заседании Ученого Совета факультета ПМ-ПУ 22 ноября 2012 года (протокол №1 от 22.11.2012г.) Председатель Ученого Совета профессор Л.А.Петросян. |
- Документ ориентированные и key-value базы данных. Особенности реализации и применения. Анализ преимуществ и недостатков по сравнению с промышленными реляционными СУБД.
- Типы блокировок в промышленных СУБД. Блокировки на примере СУБД MS SQL Server. Инструменты для анализа данных о блокировках на примере распространённых СУБД.
- Производительность СУБД. Факторы, влияющие на производительность. Классификация методов измерения и анализа производительности. Методы повышения производительности.
- Поддержка пространственных данных в СУБД. Возможности применения пространственных данных и их применение в информационных системах. Примеры функций для работы с пространственными данными.
- Статистическая оценка параметров генеральной совокупности. Построение доверительных интервалов для моментов генеральной совокупности в случае больших и в случае малых выборок.
- Статистические гипотезы. Проверка гипотезы о виде распределения по критерию хи-квадрат и по критерию Колмогорова. Критерий хи-квадрат для проверки сложной гипотезы.
- Статистическая оценка параметров многомерного распределения. Линейная и нелинейная регрессия.
- Веб-пространство, его особенности и свойства. Модель Веб-пространства Брёдера. Статистические и динамические части Веб-пространства, процесс старения информации, модель Бартона-Кеблера.
- Информационно-поисковые системы в Веб-пространстве (ИПС). Классификация ИПС в Веб-пространстве: ИПС типа каталог, поисковые машины, мета-поисковые системы.
- Веб-краулеры (поисковые роботы), как система автоматизированного сбора и обработки информации в сети Веб. Основные задачи, решаемые поисковыми роботами. Типы поисковых роботов: классические и специализированные. Задача обновления поисковым роботом Веб-страниц в индексе ИПС (понятия возраста и свежести Веб-страниц).
- Модель документа на множестве слов. Проблемы выделения слов в документе (особенности алфавитов и языков, кодировка текста, форматы представления документа). Алгоритм поиска и обработки текстовой информации TF - IDF и его разновидности.
- Задача ранжирования документов. Сравнение алгоритма Клейнберга HITS и PageRank алгоритма.
- Наивный байесовский классификатор.
- Метод кластеризации К-средних.
- Семантический поиск - латентное семантическое индексирование.
- Файловые системы и базы данных: основные сходства и отличия, необходимость перехода от файловой системы к базам данным
- СУБД: архитектура, основные функции, производительность
- Иерархическая и сетевая модели организации баз данных: принципы организации, основные свойства, достоинства, недостатки
- Реляционная модель организации баз данных: принципы организации, основные свойства, достоинства, недостатки. Объектно-ориентированная модель.
- Язык SQL: причины разработки, стандарты, уровни, процедурные расширения
- Распределенные базы данных: цели и правила распределенных систем, распределенные запросы, фрагментация, репликация.
- IP-адресация: идентификация сетевых интерфейсов, маска подсети и маршрутизация.
- Основные свойства TCP/IP и UDP протоколов
- Основные функции API интерфейса сокетов.
- Применение и виды графических изображений. Цветовосприятие. Цветные изображения. Теоретические основы оцифровки. Технические средства компьютерной графики.
- Методы обработки точечных изображений. Особенности обработки точечных изображений. Метод трасс. Квазикорелляционные, корелляционные и зонно-комбинаторные методы.
- Системы признаков при распознавании объектов. Задача обучения машин распознавать объекты. Вероятностные методы распознавания объектов.
- Основные этапы процесса разработки ПО. Водопадная модель разработки.
- Гибкие методологии. SCRUM, Kanban, SCRUMban. XP.
- Системы контроля версий. Тестирование. Виды, организация. Системы отслеживания ошибок.
- Структура файла с исходным текстом на Java, пакеты, классы, методы, поля, переменные. Объектно-ориентированное программирование.
- Апплеты. Особенности, отличия от оконных приложений. Графический интерфейс.
- Сервлеты. Общая организация/структура Java servlets. Огранизация контейнеров для поддержки Java servlets. Основные классы Java servlets development kit, обработка динамической информации в Java servlets.
- Логическая и физическая архитектура реляционных баз данных. Основные объекты. Файлы данных. Страницы. Группы страниц.
- Индексирование. Индекс B-дерева. Типы индексов. Фактор заполнения и перестроение индексов. Дополнительные способы индексирования: индекс битовой карты, кластеры данных.
- Средства повышения производительности СУБД. Разделение данных. Разделение таблиц. Разделение индексов. Оптимизация структуры и запросов. Экземпляр БД. Его составляющие.
- Основные средства для обеспечения надежности системы. Резервное копирование. Типы резервных копий базы данных. Репликация данных. Архитектура системы репликации MS SQL Server. Типы репликации.
- OLAP: назначение, требования к функциональности (FASMI), терминология. MOLAP. ROLAP.