Адаптивные
механизмы безопасности
В.В. Цыганов,
вед. научн. сотр., д.т.н.,
И.В.Гурлев,
научн. конс.,
ИПУ РАН, г. Москва
В
работе рассматривается проблема адаптации субъекта и объекта управления
безопасностью в условиях изменений. Концепция безопасности объекта при изменениях
предполагает использование адаптивных процедур
и механизмов. Проблема заключается в построении адаптивных механизмов
функционирования, нормативов, ресурсов и стимулов, обеспечивающих безопасность
объекта. Цель работы – создание теоретического и методологического подхода к
управлению процессами обеспечения безопасности объекта. Основными задачами
являются: разработка адаптивных механизмов функционирования подразделений
безопасности и механизмов адаптации их членов. Рассматриваются механизмы
безопасности, в которых используются формальные рекуррентные вероятностные
процедуры обучения и указания учителя. Такие механизмы безопасности назовем
учебными.
Рассмотрим обучаемую
дальновидную систему безопасности, как двухуровневую систему, в которой Центр
осуществляет оценивание на основе некоторой процедуры обучения, использующей
указания Учителя-эксперта, а также стимулирование на основе сопоставления
оценки аt с фактическим
результатом дальновидного элемента безопасности (кратко - ДЭБ) уt. Учебный механизм безопасности (УМБ) использует указания эксперта S(yt). Здесь - рекуррентная
вероятностная процедура прогнозирования с использованием указаний эксперта - процедура
стимулирования ДЭБ за обеспечение безопасности.
Рассмотрим задачу
синтеза УМБ с использованием стохастической процедуры опознавания образов возникающих
ситуаций. Будем предполагать, что потенциал безопасности в периоде t
есть случайная величина с ограниченной
плотностью распределения . Эта величина принадлежит, с условной плотностью распределения
и априорной
вероятностью , к одному из двух неизвестных заранее классов - компакт.
Рассмотрим вначале
случай отсутствия дальновидности элемента безопасности (). При классификации,
т.е. отнесении ситуации безопасности к одному из двух
указанных классов , Центр принимает решение, связанное с некоторым риском
безопасности. Проблема заключается в определении разбиения, минимизирующего
средний риск, связанный с
классификацией. Рассмотрим задачу выделения указанных классов с помощью
решающего правила безопасности на основе процедуры обучения с учителем.
Обозначим через некоторое разбиение
множества на два подмножества , через - потери, возникающие при отнесении ситуации
безопасности класса к классу (или, иначе, при попадании
ситуации класса в подмножество ). Предполагается, что . Минимизируется средний риск безопасности, оценивающий
качество классификации и связанных с ним
решений:
(1)
(1)
Уравнение для
определения точки , разделяющей области и , при условии минимизации среднего риска безопасности, имеет
вид
(2)
(2)
Оптимальное решающее
правило безопасности имеет вид: , если < 0 и в противном случае.
Предположим теперь,
что априорные вероятности Qk, неизвестны. Для определения
разделяющей функции можно воспользоваться
указаниями эксперта о принадлежности любой ситуации безопасности двум непересекающимся
классам и
Заметим, что это
эквивалентно существованию такого, что и . В связи с этим выражение для может быть записано в
виде
Если бы были известны , и путем решения (2)
удалось найти , то оптимальное решающее правило безопасности имело бы вид . Однако это невозможно, поскольку неизвестны соответствующие
априорные вероятности. В связи с этим рассмотрим стохастическую аппроксимацию в виде:
(3)
(3)
Содержательно это означает, что используется
следующее решающее правило: при ситуация относится к
классу безопасности 1 в противном случае - к
классу 2 . Здесь - параметр, настраиваемый таким образом, чтобы минимизировать
критерий качества стохастической аппроксимации . С учетом (1) - (3), нетрудно показать, что условие минимума
имеет вид
(4)
(4)
- символ математического ожидания. Для решения уравнения (4)
можно использовать следующий алгоритм стохастической аппроксимации:
(5)
(5)
(6)
Заметим, что при этом
в явном виде используются указания эксперта
о том, какому классу
принадлежит наблюдаемая ситуация xt.
При выводе (5)
предполагалось отсутствие дальновидности элемента безопасности нижнего уровня: yt
= . Пусть теперь в
УМБ , использующем указания учителя-эксперта , управляющие воздействия формируются на основе прогнозных
оценок параметра, получаемых посредством процедуры стохастической аппроксимации
(5):
(7)
(6)
Здесь
- наблюдаемый Центром результат, не обязательно совпадающий с
потенциалом ДЭБ . В соответствии с вышесказанным предполагается, что
учитель-эксперт может установить, к какому классу ( или ) относится наблюдаемый результат . Однако величина потенциала ДЭБ ему неизвестна (в
противном случае задача сводится к опознаванию образов безопасности в
отсутствие дальновидности). При этом Центр не в состоянии выявить случаи неполного
использования ДЭБ своего потенциала (т.е. ситуации безопасности , в которых ).
В момент выбора в
каждом периоде результата. ДЭБ известно текущее значение потенциала безопасности и плотность его
распределения на весь период дальновидности . Ожидаемое поощрение ДЭБ при состоянии , как математическое ожидание его стимулов в периоде t,
имеет вид:
Будем говорить, что
УМБ, использующий указания эксперта , оптимален, если оценки параметра, получаемые на основе
стохастической процедуры (6), сходятся к оптимальной оценке c*.
Согласно (6), чем
выше показатели ДЭБ (), там ниже норматив его оценки на следующий период (xt+1). Поэтому УМБ прогрессивен по
оценке, что соответствует дополнительным стимулам для раскрытия потенциала
безопасности: при повышении результата ДЭБ получает не только более высокое
поощрение, но и «планка оценки» для него в будущем понижается. Таким образом,
справедливо
Утверждение 1. Для оптимальности УМБ с опознаванием образов
в дальновидной системе безопасности на основе процедуры (6) достаточно использовать
процедуру стимулирования безопасности (ПСБ):
(7)
Утверждение 1
допускает простую интерпретацию. Центр-ученик использует указания
эксперта-учителя , характеризующие эффективность ДЭБ в периоде где - его неизвестный
случайный потенциал безопасности. На основе этого он формирует оценки
параметров решающего правила безопасности (2).
УМБ, использующий
процедуру оценки параметров с указаниями эксперта (6) и ПСБ, определяемую согласно
(7), широко применяются в практике безопасности. Их достоинствами являются
простота и надежность. Величина имеет смысл оптимального
задания, с точки зрения минимизации риска безопасности (1). Величина - это текущее задание.
Выполнение или перевыполнение задания - необходимое условие
поощрения ДЭБ.
Очевидно, что
назначение того или иного задания
связано с определенным риском. При заниженном задании поощрение незаслуженно и приводит к
необоснованным наградам, материальным затратам на поощрение и т.п. Формально
это соответствует отнесению ситуации безопасности класса 1 («неудача») к
ситуации безопасности класса 2 («успех»). И наоборот, при завышенном задании
поощрение - редкость, что вызывает недовольство и уход кадров. Утверждение 1
обосновывает использование процедур обучения опознаванию образов безопасности в
условиях неопределенности, когда Центр не может определить оптимальное задание
и использует процесс стохастической аппроксимации с подсказкой Учителя-эксперта.
Для решения
прикладных проблем управления сложными системами безопасности необходимы
иерархические человеко-машинные механизмы с такими интеллектуальными
возможностями, как многоуровневое обучение и принятие решений в условиях
нечетких или качественных команд. В связи с этим УМБ можно рассматривать как
механизмы функционирования систем безопасности, предназначенные для воспроизведения
простых поведенческих функций человека. В этом смысле их можно считать
специальными подклассами механизмов безопасности с элементами искусственного
интеллекта, или, кратко, интеллектуальных механизмов безопасности (ИМБ). Важным
принципом построения ИМБ является иерархичность. Она обусловлена необходимостью
поддержки принятия решений различной
степени сложности, способных использовать все менее определенные и точные команды и другую информацию. На нижнем уровне
ИМБ находится адаптивный механизм безопасности (АМБ), использующий адаптивные
алгоритмы идентификации, фильтрации, оценивания, прогнозирования и другие
формальные процедуры обучения. Результатами его функционирования являются
количественные оценки, показатели заданий
и т.д.
На верхнем уровне
применяется эвристический механизм безопасности (ЭМБ), использующий в основном
знания лиц, принимающих решения (экспертов), их язык (как правило, слабо
формализованный) и сформулированные на этом языке правила. Прототипом ЭМБ можно
считать, например, механизм матричных сверток в задачах многокритериальной
оптимизации, основанный на дихотомии признаков.
Промежуточное
положение занимает механизм-переводчик, реализующий взаимодействие эксперта
(руководителя) с АМБ на основе соответствующего информационного языка. Его
моделью можно считать УМБ. Удобным средством проектирования ИМБ являются
экспертные системы организационного управления, основанные как на формальных
(количественных), так и на неформальных (эвристических) знаниях. Их многоуровневая
база знаний включает АМБ, УМБ и ЭМБ, а в качестве формальных процедур
пополнения баз знаний используются процедуры обучения.
Необходимые свойства
оптимальности ИМБ (такие как прогрессивность, правильность, состоятельность
оценок и другие) обеспечиваются путем проектирования составляющих их АМБ, УМБ и
ЭМБ. В свою очередь, проектирование УМБ
производится на основе результатов их оптимального синтеза.
Методология
построения ИМБ основывается на комбинировании базовых и более сложных
адаптивных механизмов безопасности. ИМБ строится, исходя из принципа
композиции: комплексный механизм безопасности, состоящий из нескольких механизмов,
будет прогрессивен, если прогрессивен каждый механизм. В свою очередь, его
прогрессивность может быть обеспечена путем соответствующего выбора составляющих
его процедур оценки и ранжирования.
Рассмотренные учебные механизмы безопасности объекта
включают процедуры планирования и контроля, основанные на алгоритмах адаптивного
прогнозирования, обучения классификации и опознаванию образов. Они обеспечивают
теоретическое обоснование и методологию управления подразделениями безопасности
в условиях быстрых изменений. Прогрессивные учебные механизмы используют
потенциал подразделений безопасности. Сформулированы достаточные условия
прогрессивности учебных механизмов безопасности. Практическая ценность результатов
работы состоит в создании целостной системы методов повышения обоснованности
решений, принимаемых службами безопасности.