zhChinese    enEnglish
  ПМ-ПУ  » Образование  » Магистратура » Магистерские диссертации 2011 г.

Магистерские диссертации 2011 г.

Направление «Информационные технологии»

Ван Ячжо «Исследование и применение алгоритмов кластеризации потоков данных»
В работе рассматриваются традиционные методы кластеризации данных и так называемый «двухслойный» метод кластеризации потоков данных. Составлен алгоритм QuickClus в системе двухуровнего кластерного анализа. Алгоритм состоит из двух уровней обработки — алгоритм онлайн обработает на данные грубо, но быстро, и сохраняет средние результаты; алгоритм оффлайн точно и сложно анализирует на основе средних результатов, и в итоге получаем конечные результаты.
Анализ проведенных экспериментов показывает, что алгоритм QuickClus обладает хорошими показателями кластеризациии и эффективно обрабатывает данные.
Отзыв Рецензия Презентация
Бодрашева М. А. «Система распознавания эмоционального состояния человека с использоваанием алгоритмов нечеткой логики»
Данная работа посвящена распознаванию мимики человека путем компьютерного анализа видео или фото изображения рельефа мимиогенных зон лица. В качестве инструмента распознавания используется система нечеткого вывода, которая предварительно обучается изображениями-эталонами. Результатом работы является отношение входного изображения к одному из классов основных эмоциональных состояний. В ходе статистического анализа эмпирических данных с целью ускорения работы программы и улучшения качества распознавания, разработаны методы предварительной обработки изображения и выбора необходимых параметров аппарата нечеткого вывода.
Отзыв Рецензия Презентация
Довгополый Д. С. «Метод оценки качества перевода текста в существующих информационных системах»
В данной работе решается задача построения метода качества перевода текста в существующих информационных системах. Разработана система оценки естественности текстов, специально адаптированная для русского языка. За основу взят метод, используемый для создания статистической модели языка, модифицированный таким образом, чтобы отражать такую особенность русского языка, как свободный порядок слов. Проведена оценка работы предложенного метода.
Отзыв Рецензия Презентация
Ершов В. Д. «Задача распознавания семантических ссылок в заданной предметной области»
Данная работа посвящена решению задачи нахождения семантических ссылок для текстовой коллекции портала «Юридическая Россия». Построенное решение опирается на выделение общей структуры присущей спискам используемой литературы, составление регулярных выражений, описывающих подобные структуры, для извлечения семантических ссылок и применение различных алгоритмов нечеткого сравнения строк. Особое внимание уделяется анализу полученных результатов и методам их проверки.
Отзыв Рецензия Презентация
Загидулин Д. З. «Измерение влияния системы мониторинга на компоненты распределенной информационной системы»
В данной работе рассматривается влияние системы мониторинга на компоненты распределенной информационной системы. Построены тестовая информационная система и имитационная система мониторинга, на базе которых проведены эксперименты и получены исходные данные. Сделаны расчеты вероятностной пропускной способности сети. На основе полученных результатов даны оценки целесообразности внесения системы мониторинга. Проведены практические испытания на базе рабочей распределенной информационной системы и даны рекомендации по улучшению производительности работы сети и ее компонентов.
Отзыв Рецензия Презентация
Лобов А. Л. «Идентификация модели морского судна в частотной области»
В данной работе решается задача идентификации модели морского судна в частотной области. Рассматриваются различные подходы к идентификации, исследуются особенности частотных методов и основные факторы, влияющие на качество полученных оценок. Для проведения анализа работы выбранного алгоритма идентификации в частотной области создан пакет программ в рамках интегрированной математической среды MATLAB-Simulink. Сформирована компьютерная имитационная модель судна для проверки полученных результатов. На основе проведенного анализа определяется структура процесса идентификации в частотной области, соответствующая наибольшей точности полученных значений искомых параметров.
Отзыв Рецензия Презентация
Нестеренко О. И. «Анализ эффективности применения концепции MapReduce для обработки больших объемов данных»
В данной магистерской диссертации рассматриваются подходы к обработке больших объемов данных и проводится анализ применения концепции параллельных вычислений MapReduce к такого рода задачам. В ходе исследования рассмотрены понятия списочного гомоморфизма и свертки, которые лежат в основе концепции MapReduce, их взаимосвязь и вытекающие из этого свойства. Приведена общая схема работы концепции MapReduce и рассмотрены ее практические реализации, в том числе свободная программная платформа Apache Hadoop. На основе проведенного исследования выделены основные типы задач в области обработки больших объемов данных, в том числе те, для которых применение концепции MapReduce не эффективно.
Отзыв Рецензия Презентация
Сун Цунхуэй «Выбор и настройка алгоритмов поиска неблагонадежных налоговых дел для системы налогообложения Китая»

Налогообложение – это основной финансовый ресурс государства. Работа по инспекции сбора налогов является важным сегментом всей работы по контролю в сфере налогообложения. Выбор дел является первым этапом работы налоговых служб. Но существующие в настоящее время системы выбора дел использует метод случайного выбора имен. Результативность такого метода очень низкая.

Цель работ. Выбор и настройка алгоритмов поиска неблагонадежных налоговых дел для системы налогообложения Китая.

Предполагаемое решение.
1. Создание хранилищ данных,интеграция необходимых данных в хранилище
2. С помощью алгоритмом кластерного анализа K-medoids проанализировать налогообложение однопрофильных предприятий, выделить предприятия с большими отклонениями от средних показателей.
3. Затем, используя Алгоритм дерева принятия решений, создать модуль честных предоставленных данных о налогах, на основании данных о ежегодной уплате налогов, создать дифференцированный отчет, проверить честность заявленных данных.
4. Для предотвращения ошибок при сборе данных, в конце осуществляется оперативная аналитическая обработка данных, создается список подозреваемых в уклонении от уплаты налогов, сравниваются старые файлы, имеет функцию помощи инспекторам при принятии решения.

Ожидаемый результат. С помощью использования хранилищ данных, добычи данных и так далее, соответствующих теорий и технологий, на основании существующих в отделах налоговых органов в настоящее время информационных систем и баз данных, разрабатывается тема (проблема, объект), интегрируются данные, создаются хранилища данных. Используется добыча данных и аналитическая обработка(OLAP), данные об анализе ежегодных налоговых поступлений, автоматически выбираются дела, выделяются налогоплательщики, подозреваемые в уклонении от уплаты налогов.

Отзыв Рецензия Презентация
Хакимьянова Ю. А. «Применение методологии Behave-Driven-Development к разработке трейдинговых систем»
В магистерской диссертации рассматриваются технологии разработки финансовых приложений. В ходе исследования выбран BDD-подход, позволяющий использовать описание поведения системы на естественном языке. Этот подход упрощает документирование, вовлекая заказчика в процесс разработки и гарантируя корректное поведение системы. Разработан модуль, позволяющий использовать концепцию BDD-тестирования и имеющий в своей основе протокол Financial Information eXchange (FIX), который поддерживается большим классом финансовых систем.
Отзыв Рецензия Презентация
Хуан Аньу «Применение метода Apriori при анализе баз данных»
Целью работы является анализ применения алгоритма Apriori и исследование эффективности трех алгоритмов: Apriori, AprioriTid, AprioriHybrid при анализе баз данных.
В диссертационной работе рассматривается анализ времени работы алгоритмов Apriori и AprioriTid показано, что в более ранних проходах Apriori добивается большего успеха, чем AprioriTid, однако AprioriTid работает лучше Apriori в более поздних проходах. Кроме того, они используют одну и ту же процедуру формирования наборов-кандидатов. На основании этого наблюдения алгоритм AprioriHybrid предложен, чтобы объединить лучшие свойства алгоритмов Apriori и AprioriTid.
При анализе результатов экспериментов установлено, что алгоритм AprioriTid показывает свое превосходство над алгоритмом Apriori при анализе базы данных, и работает гораздо быстрее, чем Apriori. Алгоритм AprioriHybrid сочетает алгоритм Apriori и AprioriTid.
Отзыв Рецензия Презентация
Чжао Шугуан «Классификация текстов электронных писем для упрощения поиска»
В данной работе рассматривается классификация текстов электронных писем для английского текста с помощью кластеризации документов.
В процессе выполнения, сначала спроектирует базу данных таким образом, чтобы отразить название и текст сообщения в записи базы данных, выполнение предварительной обработки с помощью TF-IDF, меняться данных текстов на весовые матрицы ключевых слов. Потом вычисление текстового сходства с помощью Cosine similarity, порождение кластеризации. Наконец показание результата с помощью Tag Cloud.
В экспериментальном анализе показывает, что структура ''TF/IDF + кластеризация Cosine similarity'' имеет хорошее качество классификации для английского текста, наглядна покажется рузультат кластеризации с помощью Tag Cloud.
Отзыв Рецензия Презентация
Шарлай А. С. «Распознавание математических выражений в документах»
В данной магистерской диссертации рассматривается задача выделения блоков математических выражений на изображениях отсканированного текста. Предложены алгоритм для идентификации выделенных математических выражений, основанный на легко вычисляемых характеристиках блоков, таких как высота блока, отступы, и не использующий распознавание символов, и алгоритм для выделения в тексте встроенных математических выражений. Разработан программный комплекс для MATLAB, предназначенный для проведения исследований по оптическому распознаванию текста.
Отзыв Рецензия Презентация
Щекалёв А. С. «Эффективная параллельная реализация методов машинного обучения с использованием графического процессора»
Данная работа посвящена применению высокопараллельных вычислений для реализации методов машинного обучения. Основное внимание уделяется двум популярным методам — методу опорных векторов и бустингу деревьев решений. Для обоих методов проведено исследование, результатом которого стали эффективные реализации, использующие стандарт OpenCL. Предложенная реализация метода бустинга была использована для решения задачи перекрёстной проверки и сравнения производительности одной машины, использующей четыре видеокарты, и кластера из нескольких десятков машин.
Отзыв Рецензия Презентация