На данный момент искусственные нейронные сети являются популярной темой, интерес к которой растёт с каждым днём. Искусственные нейронные сети многими рассматривается как шаг к созданию искусственного интеллекта. Данная тема развивается благодаря созданным предпосылкам таким как: научно-техническое развитие технологий и интернет. Изначально развитие данной темы началось ещё в двадцатом веке, но больших результатов она не достигла. Данная тема пережила много периодов подъёма и спада. Всегда было несколько основных проблем: через чур большие ожидания, недостаток вычислительных мощностей и данных для обучения. В текущий момент данная тема на подъёме. Ведётся множество разработок, как от крупных университетов (устраиваются соревнований на лучшую искусственную нейронную сеть, проводятся конференции и т.д.), так и от крупных корпораций (например, Google Inc.). Создаются новые сложные архитектуры, которые способны решать уже поставленные задачи на достаточно высоком уровне.
Всё изложение строится на основе теоретического и практического материала, представленного в различных источниках, начиная с книг заканчивая электронными энциклопедиями и интернет ресурсами.
Объектом исследования является процесс распознавания образов нейронными сетями.
Предмет исследования – распознавание медицинских изображений грудной клетки при помощи нейронной сети.
Свёрточные нейронные сети используются для решения многих задач машинного обучения. Для эффективного использования данных нейронных сетей исследователям приходится решать ряд проблем, которые связаны с переобучением моделей. Для решения проблем с переобучением используются следующие подходы: усложнение архитектуры модели, увеличение количества обучающих данных и применение регуляризаторов.
Применение искусственных нейронных сетей в медицинской сфере является одним из самых перспективных и полезных направлений на сегодняшний день. Крупные организации (например, Google, IBM, Nvdia и т.д.) в содействии с западными медицинскими учреждениями активно работают во многих областях медицины, в которых может помочь машинное обучение. Одним из таких направлений является анализ рентген снимков пациентов. Врачам-рентгенологам приходится анализировать множество снимков и по ним ставить различные диагнозы. Иногда это может требовать больших человеческих ресурсов (большие затраты времени), а также требовать должной квалификации. Для решения данной проблемы применяются нейронные сети, которые способны хорошо справляться с задачей классификации.
В данной работе рассматривается применение свёрточных нейронных сетей для решения задачи классификации изображений грудной клетки. Данная задача включает в себя 15 различных классов (14 классов-болезней и 1 класс с отсутствием заболеваний).
Объём работы составляет 100 страниц. В работе использовано 35 рисунков, 23 таблицы. Список использованных источников состоит из 40 источников.
Выпускная квалификационная работа состоит из четырёх разделов.
Первый раздел состоит из пяти подразделов: основные понятия и определения, принципы работы нейрона, основные типы архитектур искусственных нейронных сетей, обучение искусственных нейронных сетей, обзор программных продуктов для реализации нейросетевых технологий.
В первом подразделе рассматриваются основные понятия, связанные с искусственными нейронными сетями. Ключевым понятием там выступает само понятие искусственных нейронных сетей, которое рассмотрено с различных точек зрения (искусственный интеллект, машинное обучение, математика, кибернетика и программирование).
Во втором подразделе рассматриваются биологический нейрон и искусственный. Данный подраздел состоит из двух подразделов. Рассмотрена структура биологического нейрона и выявлены его основные составные части, такие как: синапс, аксон и дендрит. После проведения параллелей между биологическим и искусственным нейроном была рассмотрена типовая архитектура искусственного нейрона, которая включает в себя: набор входных сигналов, сумматора и функции активации.
В третьем подразделе рассматриваются три основных типа архитектур искусственных нейронных сетей. Данный раздел состоит из трёх подразделов. Рассмотрены сети прямого распространения: однослойный и многослойный персептрон, свёрточные нейронные сети. Рассмотрены основные недостатки и преимущества данных архитектур. А также рассмотрена архитектура рекуррентной нейронной сети.
В четвёртом подразделе рассматривается обучение нейронных сетей. Данный раздел состоит из четырёх подразделов, в которых рассматриваются основные парадигмы обучения, а также алгоритмы, которые используются при обучении. Рассмотрены следующие парадигмы обучения: обучение с учителем, обучение без учителя и смешанное обучение. Представлен прямой и обратной проход по сети во время обучения.
В пятом подразделе рассматриваются три программных продукта для построения и проектирования искусственных нейронных сетей. Данный раздел состоит из трёх частей. Рассматриваемые продукты: STATISTICA Automated Neural Networks, Neural Network Toolbox и TensorFlow.
Во втором разделе рассматриваются методы, которые используются при обучении свёрточных нейронных сетей. Раздел состоит из шести подразделов: Dropout, L2-regularization, Weight Initialization, Batch Normalization, Data Augmentation и ранняя остановка обучения.
Третий раздел посвящён оценке эффективности методов, которые были изложены во втором разделе. Оценка производится на различных архитектурах и с использованием различных модификаций на наборе данных CIFAR-10. Данный раздел состоит из следующих подразделов: CIFAR-10, базовые модели, модификация 1 (Dropout, L2-regularization и Weight Initialization), модификация 2 (Weight Initialization и Batch Normalization), модификация 3 (Dropout, L2-regularization, Weight Initialization и Batch Normalization) и применение Data Augmentation к базовым моделям и модификациям.
В первом разделе рассматривается набор данных NIH Chest X-rays, используемый при обучении нейронных сетей.
Во втором разделе рассмотрена архитектура свёрточной нейронной сети, которая используется для решения данной задачи, рассмотрена точность работы и стадии обучения.
В третьей главе рассмотрено создание графического интерфейса для взаимодействия со свёрточной нейронной сетью.?