Онлайн поддержка
Все операторы заняты. Пожалуйста, оставьте свои контакты и ваш вопрос, мы с вами свяжемся!
ВАШЕ ИМЯ
ВАШ EMAIL
СООБЩЕНИЕ
* Пожалуйста, указывайте в сообщении номер вашего заказа (если есть)

Войти в мой кабинет
Регистрация
ГОТОВЫЕ РАБОТЫ / ДИССЕРТАЦИЯ, РАЗНОЕ

КЛАССИФИКАЦИЯ СОСТОЯНИЙ БУРОВОЙ УСТАНОВКИ МЕТО-ДАМИ МАШИННОГО ОБУЧЕНИЯ

Workhard 670 руб. КУПИТЬ ЭТУ РАБОТУ
Страниц: 55 Заказ написания работы может стоить дешевле
Оригинальность: неизвестно После покупки вы можете повысить уникальность этой работы до 80-100% с помощью сервиса
Размещено: 02.07.2022
Введение Одним из способов, которым компании могут минимизировать риск незапланированных простоев и связанных с ними убытков, является мони-торинг состояния объекта. Мониторинг производства включает сбор данных о параметрах работы объекта. Мониторинг требует точных и непрерывных входных данных из самых разных датчиков. Такие данные позволяют информировать и идентифицировать про-цессы, происходящие на производственном объекте, включающие также сбои или отклонения объекта. Тем самым помогает предсказывать необхо-димость технического обслуживания данного объекта. Идентификация со-стояний объекта определяется с помощью сочетания определенных парамет-ров. Каждому состоянию объекта соответствует рабочие диапазоны пара-метров, полученные с помощью системы контроля. Данную задачу можно свести к задаче классификации состояний производственного объекта на основе данных систем контроля.Задача классификации с учителем включа-ет предсказание категории объекта и разделение объектов согласно опреде-ленным и заданным заранее признакам. Применяя методы машинного обучения, возможно разработать алго-ритмы для автоматической классификации состояний производственного объекта на основе размеченных данных. Алгоритмы машинного обучения показывают хорошие результаты на реальных задачах, поэтому нашли част-ное применение для решения производственных задач. В данной работе будут рассмотрены такие методы, как линейный дискриминантный анализ и алгоритм градиентного бустинга. Дискрими-нантный анализ – это метод статистического анализа, который? направлен на решение проблемы классификации объекта по заранее известным группам. Сегодня методы дискриминантного анализа применяются даже в распозна-вании образов и машинном обучении, а самих методов стало больше, по-этому применение и реализация данного метода статистического анализа представляет научно–практический интерес. На сегодняшний день градиентный бустинг считается одним из са-мых эффективных инструментов для решения задач машинного обучения. Поэтому для решения задачи классификации будет рассмотрен более про-двинутый метод машинного обучения. В данной выпускной работе объектом исследования является реаль-ные данные с производственного объекта. Таким образом, актуальность ма-гистерской работы обусловлена анализом ранее не исследованных данных с применением методов машинного обучения. Предметом исследования являются методы машинного обучения дис-криминантного анализа и градиентного бустинга. Целью выпускной? квалификационной? работы является решение зада-чи классификации с применением методов программирования по работе с большими объемами данных. Для достижения поставленной? цели необходимо решить следующие задачи: ? изучить теоретический? материал о дискриминантном анализе; ? разработать алгоритм для решения задачи классификации; ? выполнить программную реализацию разработанного в предыдущей? зада-че алгоритма; ? провести исследование эффективности алгоритма, реализованного в предыдущей? задаче. Выпускная квалификационная работа состоит из введения, трех раз-делов, заключения, списка используемых источников. В разделе 1 рассмат-ривается общая постановка задачи классификации методом дискриминант-ного анализа. В разделе 2 описываются входные данные для анализа и раз-рабатывается программное обеспечение для решения задачи дискриминант-ного анализа. В разделе 3 рассмотрены теоретические основы метода гради-ентного бустинга. В разделе 4 показана реализация алгоритма градиентного бустинга.
Введение

Введение Одним из способов, которым компании могут минимизировать риск незапланированных простоев и связанных с ними убытков, является мони-торинг состояния объекта. Мониторинг производства включает сбор данных о параметрах работы объекта. Мониторинг требует точных и непрерывных входных данных из самых разных датчиков. Такие данные позволяют информировать и идентифицировать про-цессы, происходящие на производственном объекте, включающие также сбои или отклонения объекта. Тем самым помогает предсказывать необхо-димость технического обслуживания данного объекта. Идентификация со-стояний объекта определяется с помощью сочетания определенных парамет-ров. Каждому состоянию объекта соответствует рабочие диапазоны пара-метров, полученные с помощью системы контроля. Данную задачу можно свести к задаче классификации состояний производственного объекта на основе данных систем контроля.Задача классификации с учителем включа-ет предсказание категории объекта и разделение объектов согласно опреде-ленным и заданным заранее признакам. Применяя методы машинного обучения, возможно разработать алго-ритмы для автоматической классификации состояний производственного объекта на основе размеченных данных. Алгоритмы машинного обучения показывают хорошие результаты на реальных задачах, поэтому нашли част-ное применение для решения производственных задач. В данной работе будут рассмотрены такие методы, как линейный дискриминантный анализ и алгоритм градиентного бустинга. Дискрими-нантный анализ – это метод статистического анализа, который? направлен на решение проблемы классификации объекта по заранее известным группам. Сегодня методы дискриминантного анализа применяются даже в распозна-вании образов и машинном обучении, а самих методов стало больше, по-этому применение и реализация данного метода статистического анализа представляет научно–практический интерес. На сегодняшний день градиентный бустинг считается одним из са-мых эффективных инструментов для решения задач машинного обучения. Поэтому для решения задачи классификации будет рассмотрен более про-двинутый метод машинного обучения. В данной выпускной работе объектом исследования является реаль-ные данные с производственного объекта. Таким образом, актуальность ма-гистерской работы обусловлена анализом ранее не исследованных данных с применением методов машинного обучения. Предметом исследования являются методы машинного обучения дис-криминантного анализа и градиентного бустинга. Целью выпускной? квалификационной? работы является решение зада-чи классификации с применением методов программирования по работе с большими объемами данных. Для достижения поставленной? цели необходимо решить следующие задачи: ? изучить теоретический? материал о дискриминантном анализе; ? разработать алгоритм для решения задачи классификации; ? выполнить программную реализацию разработанного в предыдущей? зада-че алгоритма; ? провести исследование эффективности алгоритма, реализованного в предыдущей? задаче. Выпускная квалификационная работа состоит из введения, трех раз-делов, заключения, списка используемых источников. В разделе 1 рассмат-ривается общая постановка задачи классификации методом дискриминант-ного анализа. В разделе 2 описываются входные данные для анализа и раз-рабатывается программное обеспечение для решения задачи дискриминант-ного анализа. В разделе 3 рассмотрены теоретические основы метода гради-ентного бустинга. В разделе 4 показана реализация алгоритма градиентного бустинга.
Содержание

Оглавление Введение 2 1Теория дискриминантного анализа и статистика 4 1.1 Постановка задачи 4 1.2 Дискриминантный анализ 5 1.2.1 Основа дискриминантного анализа 5 1.2.2 Линейный дискриминантный анализ 5 1.3 Проверка нормальности распределения выполнения условия покритериию Шапиро–Уилкса 8 1.4 Отбор признаков 9 1.5 Методы определения величины ошибки 10 1.5.1 Ошибка обученной модели 10 1.5.2 Метрики качества обученной модели 11 1.5.3 Bootstrap 0.632 12 1.5.4 Bootstrap 0.632+ 12 2. Программная реализация алгоритмов дискриминантного анализа 13 2.1 Разведочный анализ данных. Обзор исходных данных 13 2.1.1 Тест на нормальность данных 21 2.1.2 Отбор переменных 27 2.2 Разработка приложения 28 2.2.1 Выбор технологий 28 2.2.2 Реализация метода дискриминантного анализа на языке Python 29 2.2.3Реализация метода дискриминантного анализа с исключением класса 33 2.2.4Реализация метода дискриминантного анализа на синтетических данных 36 3 Метод градиентного бустинга 42 3.1 Дерево решений 47 3.2 Численная оптимизация с помощью градиентного бустинга 49 4 Реализация алгоритма градиентного бустинга в Python с помощью библиотеки Scikit-Learn 51
Список литературы

Список использованных источников 1. Амирова C., Мильчесвский Ю. Дискриминантный анализ и структура белка. – М.: LAP Lambert Academic Publishing, 2014. – 104 с. 2. Брюс, П. Практическая статистика для специалистов Data Science: Пер. с англ. / П. Брюс, Э. Брюс. — СПб.: БХВ-Петербург, 2018. — 304 с. 3. Дж О. Ким Факторный, дискриминантный и кластерный анализ; Книга по Требованию - Москва, 2012. - 216 c. 4. Кобзарь А. И. Прикладная математическая статистика. Для ин-женеров и научных работников. М.: ФИЗМАТЛИТ, 2006. 816 с. 5. Маккини У. Python и анализ данных / пер. с анг. А. А. Слинки-на. – М.: ДМК Пресс, 2020. - 540 с. 6. Саммерфилд, Марк. Программирование на Python 3. Подробное руководство. - СПб.: Символ-Плюс, 2017 7. Солонин С.И. Метод гистограмм [Электронный ресурс] : учеб-ное пособие : для студентов, изучающих дисципли-ну"Статистические методы контроля и управления качеством" / С. И. Солонин; М-во образования и науки Рос. Федерации, УрФУ им. первого Президента России Б.Н. Ельцина. - Екатеринбург: УрФУ, 2014 8. Тюрин, В. В. Дискриминантный анализ в биологии: монография / В. В. Тюрин, С. Н. Щеглов. – Краснодар: Кубанский гос. ун-т, 2015. – 123 с. 9. Hastie T, Tibshirani R, Friedman J. The Elements of Statistical Learn-ing. Data Mining, Inference, and Prediction. 2-nd Edition. Springer. 2009 10. Lachenbruch P.A. Some unsolved practical problems in discriminant analysis. (ChapelHill: UniversityofNorthCarolina, 1975) p.10 11. Mark E. Fenner Machine Learning with Python for Everyone. – Pear-son Education, 2020. – 555 c. 12. Mark Lutz. Programming Python 4e. – М.: , 2011. – 1632 с. 13. Mohammad Samsul Alam and Syed Shahadat Hossain. Design Sensi-tivity of Bootstrap Methods in Variance Estimation. – М.: LAP Lambert Academ-ic Publishing, 2013. – 72 с. 14. Rencher A. C. Methods of Multivariate Analysis. 2nd Ed. New York: John Wiley & Sons, Inc., 2002. - 738 p. 15. Shapiro, S. S. & Wilk, M.B (1965). An analysis of variance test for normality (complete samples), Biometrika, Vol. 52, pp. 591-611.
Отрывок из работы

1Теория дискриминантного анализа и статистика 1.1 Постановка задачи Сформулируем математически задачу классификации. Положим, что имеется объект наблюдения ??, определяющийся вектором данных из признаков: x=(x_1,x_2,…,x_p )?X (1) где,X– некоторое множество значений. Пусть множество разбито на некоторое количество не пересекающихся между собой классов : Y={1,…,k}(2) U_(j=1)^k W_j=X,W_j?W_i=?(i,j ?Y,i?j) (3) Тогда требуется создать классификатор, способный устанавливать принадлежность ?? к одному из доступных классов[8]. 1.2 Дискриминантный анализ 1.2.1 Основа дискриминантного анализа Положим, что исходные данные из некоторого множества нормально распределены: x?W_j-x~N(?_j,?_j),j=(1,k) ? (4) Определяется класс через минимизацию величины вероятности ошибочной классификации: ?_(j=1)^k-?p_(j ) (?_(i=1,j?i)^k-?P(i¦x) (5??) P(j¦x)=(p_(j ) f_j (x))/(?_(j=1)^k-?p_(j ) f_j (x)?) (6) где,pj– вероятность принадлежности объекта к множеству; P(i|??) – вероятность ошибки определения элемента. В результате, ?? будет относиться к классу, который имеет наибольшую апостериорную вероятность [3]. 1.2.2 Линейный дискриминантный анализ В основе линейного дискриминантного анализа лежит функция различия, которая строится на основе параметров – признаков, со своими коэффициентами значимости. F=a_1 x_1+a_2 x_2+?+a_i x_i (1.2.2.1) где, F – значение дискриминантной функции; a – коэффициент вклада признака xi. Данная функция, представленная в канонической форме, строится для каждой группы. Основными её параметрами являются коэффициенты вклада признака. Поэтому чем больше различие средних значений соответствующего коэффициента в группах, тем более точной будет функция различия. Также, при построении других функций, их значения должны быть некоррелированными со всеми предыдущими. Количество самих функций различия зависит от числа групп и признаков. Если количество признаков меньше числа групп, то числом функций будет являться количество признаков, в противном случае, когда количество признаков класса больше числа групп, функций различия следует построить по числу групп без единицы. Рассмотрим, как получают коэффициенты функции различия. Таблица значений групповых средних и стандартных отклонений не будет достаточным. Данные параметры не учитывает зависимости между переменными. Матричные преобразования сумм квадратов и попарных произведений Т помогут учесть степень разности между объектами, который заложен в основе статического метода. Для получения матрицы Т вводятся следующие обозначения: g– количество классов;
Условия покупки ?
Не смогли найти подходящую работу?
Вы можете заказать учебную работу от 100 рублей у наших авторов.
Оформите заказ и авторы начнут откликаться уже через 5 мин!
Служба поддержки сервиса
+7 (499) 346-70-XX
Принимаем к оплате
Способы оплаты
© «Препод24»

Все права защищены

/slider/1.jpg /slider/2.jpg /slider/3.jpg /slider/4.jpg /slider/5.jpg