Глава 1. Понятие искусственной нейронной сети
1.1. Искусственные нейронные сети для решения плохо формализованных задач и методы их представления
Нейронная сеть – состоит из искусственных нейронов [9]. Одно из направлений искусственного интеллекта, цель которого смоделировать аналитические механизмы, осуществляемые человеческим мозгом. Задачи, которые решает типичная нейронная сеть – классификация, предсказание и распознавание. Нейронные сети способны самостоятельно обучаться и развиваться, строя свой опыт на совершенных ошибках.
Термин «нейронная сеть» появился в середине XX века. Первые работы, в которых были получены основные результаты в данном направлении, были проделаны Мак-Каллоком и У. Питтсом. В 1943 году ими была разработана модель нейронной сети на основе математических алгоритмов и теории деятельности головного мозга. Давайте почитаем, как они описывают деятельность головного мозга. Многое из этого актуально и сейчас.[7]
Математическая модель искусственного нейрона была предложена У. Мак-Калоком и У. Питтсом вместе с моделью сети, состоящей из этих нейронов. Авторы показали, что сеть на таких элементах может выполнять числовые и логические операции. Практически сеть была реализована Фрэнком Розенблаттом в 1958 году как компьютерная программа, а впоследствии как электронное устройство — персептрон. Первоначально нейрон мог оперировать только с сигналами логического нуля и логической единицы, поскольку был построен на основе биологического прототипа, который может пребывать только в двух состояниях — возбужденном или невозбужденном [8]. Работа нейронной сети устроена, как набор нейронов, которые получают сигнал, обрабатывают и передают дальше. У каждого нейрона есть свой набор
входных связей и свой выходной сигнал, который может передавать сигнал дальше.
Искусственный нейрон – упрощенная модель биологического нейрона
[5].
Благодаря развитию технологий, появилась возможность создавать
сложные искусственные нейронные сети для решения задач из разных областей науки. Специалисты из таких далеких областей, как техническое конструирование, философия, физиология и психология, заинтересовались возможностями, предоставляемыми этой технологией, и ищут их применение внутри своих дисциплин.
Лучшее понимание функционирования нейрона и картины его связей позволило исследователям создать математические модели для проверки своих теорий. Это позволило проводить эксперименты на компьютерах без привлечения людей или животных, что решает как практические, так и морально-этические проблемы.
Одной из целей изучения нейронных сетей стала создание искусственных нейронных сетей для выполнения функций схожих с функциями настоящего мозга.
Перед тем как перейти к видам и принципам распространения алгоритма искусственных нейронных сетей, рассмотрим определение термина ИНС.
Искусственные нейронные сети – математическая модель, а также её программное или аппаратное воплощение, построенная по принципу организации и функционирования биологических нейронных сетей.
Есть и другое определение данного термина, основанного на понятии термина искусственного нейрона, из которых и состоит ИНС.
Искусственные нейронные сети – совокупность взаимодействующих между собой искусственных нейронов. То есть некая упрощённая модель человеческого мозга, состоящая из искусственных нейронов.
Нейронные сети можно поделит на два вида, которые разделяются по свое структуре:
• Однослойная нейронная сеть;
• Многослойная нейронная сеть.
Однослойная НС представляет собой структуру взаимодействия нейронов, в которой сигналы с входного слоя сразу направляются на выходной слой, который, собственно говоря, не только преобразует сигнал, но и сразу же выдаёт ответ. Входные нейроны являются объединёнными с основным слоем с помощью синапсов с разными весами, обеспечивающими качество связей.
Многослойная НС, помимо выходного и входного слоёв, имеются ещё несколько скрытых промежуточных слоёв. Число этих слоёв зависит от степени сложности нейронной сети. Она в большей степени напоминает структуру биологической нейронной сети. Такие виды были разработаны совсем недавно, до этого все процессы были реализованы с помощью однослойных нейронных сетей. Соответствующие решение обладает большими возможностями, если сравнивать с однослойными, ведь в процессе обработки данных каждый промежуточный слой — это промежуточный этап, на котором осуществляется обработка и распределение информации [16].
Если рассматривать сети со стороны распространения сигнала, то выделяются два типа распространения:
• Сети прямого распространения;
• Сети с обратными связями.
В ИНС с прямым распространением, сигнал проходит путь строго от входного слоя, к выходному. В ИНС с обратными связями, выход нейрона может вновь подать сигнал на его вход, тем самым создавая эффект кратковременной памяти.