1. Основные понятия
Используя понятие «агент», каждый автор или сообщество определяют своего агента с конкретным набором свойств в зависимости от целей разработки, решаемых задач, техники реализации и т. п. критериев. Как следствие, в рамках данного направления появилось множество типов агентов, например: автономные агенты, мобильные агенты, персональные ассистенты, интеллектуальные агенты, социальные агенты и т.д., а вместо единственного определения базового агента – множество определений произвольных типов.
Учитывая вышесказанное, понятие агента целесообразно трактовать как метаимя или класс, который включает множество подклассов. Далее будем придерживаться следующей концепции по этому поводу:
Агент — это развитие известного понятия объект, представляющего абстракцию множества экземпляров предметов реального мира, имеющих одни и те же свойства и правила поведения. Свойства объекта описываются исходной системой, а правила поведения — порождающей системой, чаще всего структурированной (рис. 1). Состояние объекта определяется перечнем его свойств с текущими значениями. Объект со значениями всех его свойств определяет экземпляр, моделью которого является кортеж соответствующего реляционного отношения из системы данных. В число свойств объекта включаются его идентификатор, а также указывающие, описывающие и вспомогательные атрибуты. Последние два типа атрибутов делятся по отношению к методу объекта на входные и выходные (рис. 6). Описательные атрибуты определяют свойства, внутренне присущие объекту, а вспомогательные — его структурные связи с экземплярами других объектов.
Рис. 1. Модель интеллектуального агента
Интеллектуальным является объект, поведение которого определяет база знаний. Активный объект, или агент, — это объект, способный изменять свое состояние, используя информацию о состоянии смежных объектов. Для этого агенты объединяются в структурированную исходную систему, называемую мультиагентной. Носителем модели такой системы являются объекты и их свойства, а сигнатурой — семантическая сеть, используемая операционной средой для передачи информации, активизирующей поведение агентов. В результате этого формируется некоторое множество экземпляров агентов, являющееся целью всего процесса.
Агент – это аппаратная или программная сущность, способная действовать в интересах достижения целей, поставленных перед ним владельцем и/или пользователем.
Типы агентов
1. Интеллектуальные агенты в языковой среде,
2. Агенты, созданные с помощью логического программирования,
3. Агенты, использующие онтологии для поиска информации в интернет
Использование агентов
• моделирование действий группы беспилотных летательных аппаратов,
• планирование решения связной задачи на кластере,
• администрирование и мониторинг информационной системы и распределенной БД,
• виртуальные игры (в частности, виртуальный футбол).
• в составе мультиагентных систем.
Таким образом, программные агенты рассматриваются как автономные компоненты, действующие от лица пользователя.
Разработана теория использования мультиагентных систем (МАС), предназначенных для поиска и анализа информации. Одним из факторов интереса к мультиагентным системам является развитие технологий в сети Интернет и соответствующих технологий (GRID), Интернет стал подходящей средой исполнения для распределенных автономных программных систем. Для успешного функционирования в такой среде агенты должны быть способны решить две основные задачи: агенты должны уметь находить друг друга и уметь взаимодействовать между собой. Построенные агенты обладают набором из следующих свойств:
• способность к обучению: агент настраивается на тренировочных этапах;
• автономность: агент работает как самостоятельная программа, ставя себе цели и выполняя действия для достижения этих целей;
• коллаборативность: агент может взаимодействовать с другими агентами несколькими способами, например, играя роль поставщика/потребителя информации или одновременно обе эти роли;
• способность к рассуждениям: агенты могут обладать механизмами вывода, например, как приводить данные из различных источников к одному виду. Агенты могут специализироваться на конкретной предметной области.
• коммуникативность: агенты могут общаться с другими агентами;
• мобильность: способность к передаче кода агента с одного специализированного сервера на другой.
В основу организации МАС положен принцип ассоциативного подхода, который имеет преимущество с точки зрения удобства символьного представления знаний, сосредоточенных в словарях-тезаурусах. Традиционные подходы работы с распределенной информацией одновременно используют данные и вычисления необходимые для получения их путем привнесения данных в вычисления. Этот подход требует от агента значительного уровня интеллекта для принятия решений и фильтрации информации. Адаптационные алгоритмы наделяют мобильных агентов способностью подстраиваться под окружающую обстановку. Мобильные агенты представляют хороший пример реализации распределенных приложений. Первое, перемещаясь к месту расположения электронного ресурса, агент может получить доступ к нему локально и исключить дорогостоящую передачу данных по перегруженным сетям. Это сокращает сетевой трафик, потому что зачастую дешевле послать небольшого агента к источнику данных, чем пересылать все промежуточные данные в определенное место. Второе, агент не нуждается в постоянном соединении с основной машиной (т.е. машиной, откуда агент был запущен). Третье, способности сетевого опознавания дают возможность агентам самостоятельно находить основной компьютер, даже если он изменил свое географическое местоположение. И, наконец, агенты имеют независимость в принятии решений: используя возможность возврата, они могут самостоятельно менять план работы или неправильно поставленные запросы.
В зависимости от концепции, выбранной для организации МАС (мультиагентная система), обычно выделяются три базовых класса архитектур:
• архитектуры, которые базируются на принципах и методах работы со знаниями;
• архитектуры, основанные на поведенческих моделях типа «стимул – реакция»;
• гибридные архитектуры.
В первом случае мы имеем дело с «разумными» агентами и архитектурами, имеющими в качестве основы проектирования и реализации модели, методы и средства искусственного интеллекта.
Первоначально идея интеллектуальных агентов связывалась практически полностью с классической логической парадигмой ИИ. Однако по мере развития исследований в этой области стало ясно, что такие «ментальные» свойства агентов, как, например, убеждения, желания, намерения, обязательства по отношению к другим агентам и т. п., невыразимы в терминах исчисления предикатов первого порядка. Поэтому для представления знаний агентов в рамках данной архитектуры были использованы специальные расширения соответствующих логических исчислений, а также разработаны новые архитектуры.
Принципы реактивной архитектуры возникли как альтернативный подход к архитектуре интеллектуальных агентов. Идея реактивных агентов впервые возникла в работах Брукса, выдвинувшего тезис, что интеллектуальное поведение может быть реализовано без символьного представления знаний, принятого в классическом ИИ.
Реактивными называются агенты и архитектуры, где нет эксплицитно представленной модели мира, а функционирование отдельных агентов и всей системы осуществляется по правилам типа ситуация – действие. При этом под ситуацией понимается потенциально сложная комбинация внутренних и внешних состояний.
Данный подход ведет свое начало с работ по планированию поведения роботов, которые активно велись в ИИ в 70-х годах. Простым примером реализации реактивных архитектур в этом контексте можно считать системы, где реакции агентов на внешние события генерируются соответствующими конечными автоматами.
Многие исследователи считают, что ни первый, ни второй подходы не дают оптимального результата при разработке агентов и МАС. Поэтому попытки их объединения предпринимаются постоянно и уже привели к появлению разнообразных гибридных архитектур. По сути дела, именно гибридные архитектуры и используются в настоящее время во всех, сколько-нибудь значимых проектах и системах.
2. Рациональный агент
Здесь будет описана проблема принятия оптимального решения. Это означает, что агенту на каждом шаге следует выбрать наилучшее действие, исходя из того, что ему известно об окружающем мире. Вводится мера полезности действий агента, которую он постоянно пытается оптимизировать. Рационального агента также называют разумным. В дальнейшем мы главным образом будем рассматривать только вычислительных агентов, т.е. тех, что созданы для решения специальных задач и приводятся в исполнение на вычислительных устройствах.
Принятие решения агентом
Предположим, что на каждом временном шагеt = 1, 2,…, ?агент может из конечного набора возможных действийAвыбрать какое-то действиеat. Интуитивно понятно, что, чтобы действовать рационально, агент должен оценивать и прошлое, и будущее при выборе дальнейших действий. Под прошлым подразумевается то, что агент воспринял и какие действия предпринял до момента времениt, а под будущим - что он ожидает и что собирается потом делать. Обозначимo?наблюдение агента в момент времени?, тогда для выбора оптимального действия в момент времениtв общем случае необходимо использовать всю историю наблюдений o?и историю действийa?, предшествующую моменту времениt.
Функция?(o1, a1, o2, a2,…, ot) = at, которая отображает набор пар «наблюдение–действие» до момента времениt в оптимальное действие atназываетсястратегией агента.
Если сможем найти функцию?, осуществляющую данное отображение, то часть задачи об отыскании оптимального решения на основе прошлого будет решена. Однако, определение и реализация такой функции весьма проблематичны; сложная история может содержать большое количество пар наблюдений, которые могут меняться от одной задачи к другой. Более того, сохранение всех наблюдений требует очень большого объема памяти и, соответственно, приводит к росту сложности вычислений. Этот факт приводит к необходимости использования более простых стратегий. Например, агент может игнорировать всю историю наблюдений, за исключением последнего. В этом случае стратегия принимает вид?(ot) = at, который отображает текущее восприятие агента в действие.
Агент, который отображает текущее восприятиеotв новое действиеat, называетсярефлексивным, а его стратегию называют реактивнойили стратегией без памяти.
Возникает естественный вопрос: насколько хорошим может быть такой рефлексивный агент? Как мы увидим дальше, он может быть довольно неплохим.
Окружение и свойство Маркова
Из сказанного выше следует, что понятия окружения и агента являются спаренными, так что одно понятие не может быть определено без другого. Фактически, различие между агентом и его окружением не всегда отчетливо, и это иногда осложняет проведению четкой границы между ними. Для простоты предположим, что существует мир, в котором есть один или более агентов, в котором они воспринимают, думают и действуют.
Коллективная информация, которая содержится в окружающем мире в момент времениt и которая важна для исполняемой задачи, называется состоянием мираи обозначаетсяst. Множество состояний мира обозначим черезS.
В зависимости от природы задачи, мир может быть дискретным или непрерывным. Дискретный мир характеризуется конечным числом состояний. Примером может служить игра в шахматы. С другой стороны примером непрерывного мира может служить мобильный робот, который может свободно передвигаться в декартовой системе координат. Большинство из существующих технологий искусственного интеллекта созданы для дискретного мира, поэтому мы будем в дальнейшем рассматривать именно его.