1. ОПИСАНИЕ ОСНОВНЫХ ПРИНЦИПОВ ПОСТРОЕНИЯ ИИ
1.1. Введение в машинное обучение
Машинное обучение – это обширный подраздел искусственного интеллекта, характерной чертой, которой является построения алгоритмов, способных обучаться. Для построения таких методов используются строгая математическая дисциплина, использующая разделы математической статистики, методов оптимизации и вероятности, но также и собственную специфику, связанную с проблемами вычислительной эффективности и переобучения.
Существует два типа машинного обучения: обучение по прецедентам (индуктивное обучение), основанное на эмпирических закономерностях в данных, и дедуктивное обучение, предполагающее формализацию знаний и формирование базы знаний.
Раздел машинного обучения, с одной стороны, образовался в результате разделения науки о нейронных сетях на методы обучения сетей и виды топологий их архитектуры, вобрал в себя методы математической статистики.
Существует множество моделей для машинного обучения, но они, как правило, относятся к одному из трех типов:
• обучение с учителем (supervised learning) – для каждого прецедента существует пара «ситуация, требуемое решение»;
• обучение без учителя, или самообучение (unsupervised learning) –ответы не задаются, и требуется искать зависимости между объектами;
• обучение с подкреплением (reinforcement learning) – представляет собой смесь первых двух. Обычно он используется для решения более сложных задач и требует взаимодействия с окружающей средой.
?
Существуют также другие, менее распространённые способы обучения, такие как: частичное обучение (semi-supervised learning), трансдуктивное обучение (transductive learning), динамическое обучение (online learning), активное обучение (active learning), метаобучение (meta-learning или learning-to-learn)
Все приведенные методы возможно применять для классификации традиционных методов машинного обучения и для классификации алгоритмов обучения нейронных сетей, реализующих любой из них.
1.2. Введение в компьютерное зрение
Компьютерное зрение как наука направлена на создания машин, которые могут производить обнаружение, отслеживание и классификацию объектов. Работа компьютерного зрения заключается в сложной технологической последовательности, включающую получение изображения, обработку с целью получения необходимых данных и анализ изображения для дальнейшего решения задачи. Также компьютерное зрение тесно связано с машинным обучением и теорией распознавания образов, но относится к более специализированной сфере теории и технологий создания искусственных систем, получающих информацию непосредственно с изображений.
Подсистемы компьютерного зрения на основе автоматического планирования или принятия решений занимает важную роль в области ИИ, поскольку автономные системы достаточно сложного уровня организации, выполняющие некоторые механические действия (например, перемещение робота через некоторую среду), нуждаются в высокоточных данных, представляющих информацию о среде, в которой они функционируют.
Также компьютерное зрение, как и распознавание образов, тесно связано с обработкой сигналов, ведь многие методы обработки одномерных сигналов могут быть расширены естественным путём для обработки двумерных или многомерных сигналов в рамках теории компьютерного зрения.
Компьютерное зрение также тесно связано с областями обработки изображений и машинного зрения. Область обработки изображений в основном направлены на работу с двухмерными изображениями, то есть, как преобразовать одно изображение в другое. Область машинного зрения направлена на технологии промышленного применения. Существуют также и другие более узкие области, связанные или возникшие на основе теории компьютерного зрения, такие как, область визуализации, сосредоточенная на процессе создания изображений, их обработкой и анализом.
Однако на реализацию систем компьютерного зрения влияют такие факторы как, среда применения, платформа на которой она была реализована и вычислительные ресурсы. Связанно это с тем, что некоторые системы являются автономными и решают специфические проблемы детектирования и измерения, тогда как другие системы составляют подсистемы более крупных систем, которые уже могут содержать подсистемы контроля механических манипуляторов (роботы), информационные базы данных (поисковые системы), интерфейсы человек-машина (компьютерные игры) и т. д.
1.3. Введение в искусственные нейронные сети
Искусственная нейронная сеть является концептуальной моделью биологической нейронной сети смоделированной взаимосвязанной группой естественных или искусственных нейронов, которая использует математические и вычислительные модели для обработки информации на основе коннективисткого подхода к вычислению, образуя общую активную структуру и функционально влияющих на работу друг друга. В большинстве случаев ИНС является адаптивной системой, которая изменяет свою структуру под влиянием внешней среды. Другими словами, нейронные сети не программируются, а они обучаются, что дает им преимущество сетей перед традиционными алгоритмами. В процессе обучения нейронная сеть способна выявлять сложные зависимости между входными данными и выходными, что позволяет ей в случае успешного обучения сеть возвращать верный результат на основании данных, которые отсутствовали в обучающей выборке.
С момента своего зарождения технологии искусственных нейронных сетей не раз кардинально изменялась в корне меняя представление о теории машинного обучения и распознавания образов оказывая значительное влияние на теоретические, терминологические аппараты этих дисциплин. С этого времени в научном сообществе произошло несколько спадов и подъёмов интереса к этому направлению, но, благодаря некоторым прорывам в теории ИНС, широкое практическое применение нейросетевые технологии получили сравнительно недавно.
Спустя некоторое время после развития базовых моделей ИНС, произошло принципиальное разделение объемлющей науки о нейросетях на виды топологий архитектуры сетей и методы обучения сетей.