Адаптивные механизмы безопасности

В.В. Цыганов,
вед. научн. сотр., д.т.н.,

И.В.Гурлев,

научн. конс.,

ИПУ РАН, г. Москва

В работе рассматривается проблема адаптации субъекта и объекта управления безопасностью в условиях изменений. Концепция безопасности объекта при изменениях предполагает использование адаптивных процедур и механизмов. Проблема заключается в построении адаптивных механизмов функционирования, нормативов, ресурсов и стимулов, обеспечивающих безопасность объекта. Цель работы – создание теоретического и методологического подхода к управлению процессами обеспечения безопасности объекта. Основными задачами являются: разработка адаптивных механизмов функционирования подразделений безопасности и механизмов адаптации их членов. Рассматриваются механизмы безопасности, в которых используются формальные рекуррентные вероятностные процедуры обучения и указания учителя. Такие механизмы безопасности назовем учебными.

Рассмотрим обучаемую дальновидную систему безопасности, как двухуровневую систему, в которой Центр осуществляет оценивание на основе некоторой процедуры обучения, использующей указания Учителя-эксперта, а также стимулирование на основе сопоставления оценки аt с фактическим результатом дальновидного элемента безопасности (кратко - ДЭБ) уt. Учебный механизм безопасности (УМБ) использует указания эксперта S(yt). Здесь  - рекуррентная вероятностная процедура прогнозирования с использованием указаний эксперта   - процедура стимулирования ДЭБ за обеспечение безопасности.

Рассмотрим задачу синтеза УМБ с использованием стохастической процедуры опознавания образов возникающих ситуаций. Будем предполагать, что потенциал безопасности в периоде t есть случайная величина  с ограниченной плотностью распределения . Эта величина принадлежит, с условной плотностью распределения  и априорной вероятностью , к одному из двух неизвестных заранее классов  - компакт.

Рассмотрим вначале случай отсутствия дальновидности элемента безопасности (). При  классификации, т.е. отнесении ситуации безопасности  к одному из двух указанных классов , Центр принимает решение, связанное с некоторым риском безопасности. Проблема заключается в определении разбиения, минимизирующего средний риск, связанный с  классификацией. Рассмотрим задачу выделения указанных классов с помощью решающего правила безопасности на основе процедуры обучения с учителем. Обозначим через  некоторое разбиение множества  на два подмножества , через  -  потери, возникающие при отнесении ситуации безопасности класса  к классу  (или, иначе, при попадании ситуации класса  в подмножество ). Предполагается, что . Минимизируется средний риск безопасности, оценивающий качество  классификации и связанных с ним решений:

(1)

 

 
       (1)

Уравнение для определения точки , разделяющей области  и , при условии минимизации среднего риска безопасности, имеет вид

(2)

 

 
                (2)

Оптимальное решающее правило безопасности имеет вид: , если < 0 и  в противном случае.

Предположим теперь, что априорные вероятности Qk,  неизвестны. Для определения разделяющей функции  можно воспользоваться указаниями эксперта о принадлежности любой ситуации безопасности  двум непересекающимся классам  и  

Заметим, что это эквивалентно существованию  такого, что  и . В связи с этим выражение для  может быть записано в виде

Если бы были известны ,  и путем решения (2) удалось найти , то оптимальное решающее правило безопасности имело бы вид . Однако это невозможно, поскольку неизвестны соответствующие априорные вероятности. В связи с этим рассмотрим стохастическую аппроксимацию  в виде:

(3)

 

 
                                       (3)

Содержательно это означает, что используется следующее решающее правило: при  ситуация относится к классу безопасности 1  в противном случае - к классу 2 . Здесь  - параметр, настраиваемый таким образом, чтобы минимизировать критерий качества стохастической аппроксимации . С учетом (1) - (3), нетрудно показать, что условие минимума имеет вид

(4)

 

 
         (4)

- символ математического ожидания. Для решения уравнения (4) можно использовать следующий алгоритм стохастической аппроксимации:

(5)

 

 
                 (5)

(6)

 

 

Заметим, что при этом в явном виде используются указания эксперта   о том, какому классу принадлежит наблюдаемая ситуация xt.

При выводе (5) предполагалось отсутствие дальновидности элемента безопасности нижнего уровня: yt = . Пусть теперь в УМБ , использующем указания учителя-эксперта , управляющие воздействия формируются на основе прогнозных оценок параметра, получаемых посредством процедуры стохастической аппроксимации (5):

(7)

 

 
                        (6)

Здесь - наблюдаемый Центром результат, не обязательно совпадающий с потенциалом ДЭБ . В соответствии с вышесказанным предполагается, что учитель-эксперт может установить, к какому классу ( или ) относится наблюдаемый результат . Однако величина потенциала ДЭБ  ему неизвестна (в противном случае задача сводится к опознаванию образов безопасности в отсутствие дальновидности). При этом Центр не в состоянии выявить случаи неполного использования ДЭБ своего потенциала (т.е. ситуации безопасности , в которых ).

В момент выбора в каждом периоде результата. ДЭБ известно текущее значение потенциала безопасности  и плотность его распределения на весь период дальновидности . Ожидаемое поощрение ДЭБ при состоянии , как математическое ожидание его стимулов в периоде t, имеет вид:

Будем говорить, что УМБ, использующий указания эксперта , оптимален, если оценки параметра, получаемые на основе стохастической процедуры (6), сходятся к оптимальной оценке c*.

Согласно (6), чем выше показатели ДЭБ (), там ниже норматив его оценки на следующий период (xt+1). Поэтому УМБ  прогрессивен по оценке, что соответствует дополнительным стимулам для раскрытия потенциала безопасности: при повышении результата ДЭБ получает не только более высокое поощрение, но и «планка оценки» для него в будущем понижается. Таким образом, справедливо

Утверждение 1. Для оптимальности УМБ  с опознаванием образов в дальновидной системе безопасности на основе процедуры (6) достаточно использовать процедуру стимулирования безопасности (ПСБ):

                       (7)

Утверждение 1 допускает простую интерпретацию. Центр-ученик использует указания эксперта-учителя , характеризующие эффективность ДЭБ в периоде  где  - его неизвестный случайный потенциал безопасности. На основе этого он формирует оценки параметров решающего правила безопасности (2).

УМБ, использующий процедуру оценки параметров с указаниями эксперта (6) и ПСБ, определяемую согласно (7), широко применяются в практике безопасности. Их достоинствами являются простота и надежность. Величина  имеет смысл оптимального задания, с точки зрения минимизации риска безопасности (1). Величина  - это текущее задание. Выполнение или перевыполнение задания  - необходимое условие поощрения ДЭБ.

Очевидно, что назначение того или иного задания  связано с определенным риском. При заниженном задании  поощрение незаслуженно и приводит к необоснованным наградам, материальным затратам на поощрение и т.п. Формально это соответствует отнесению ситуации безопасности класса 1 («неудача») к ситуации безопасности класса 2 («успех»). И наоборот, при завышенном задании поощрение - редкость, что вызывает недовольство и уход кадров. Утверждение 1 обосновывает использование процедур обучения опознаванию образов безопасности в условиях неопределенности, когда Центр не может определить оптимальное задание и использует процесс стохастической аппроксимации с подсказкой Учителя-эксперта.

Для решения прикладных проблем управления сложными системами безопасности необходимы иерархические человеко-машинные механизмы с такими интеллектуальными возможностями, как многоуровневое обучение и принятие решений в условиях нечетких или качественных команд. В связи с этим УМБ можно рассматривать как механизмы функционирования систем безопасности, предназначенные для воспроизведения простых поведенческих функций человека. В этом смысле их можно считать специальными подклассами механизмов безопасности с элементами искусственного интеллекта, или, кратко, интеллектуальных механизмов безопасности (ИМБ). Важным принципом построения ИМБ является иерархичность. Она обусловлена необходимостью поддержки принятия  решений различной степени сложности, способных использовать все менее определенные и точные  команды и другую информацию. На нижнем уровне ИМБ находится адаптивный механизм безопасности (АМБ), использующий адаптивные алгоритмы идентификации, фильтрации, оценивания, прогнозирования и другие формальные процедуры обучения. Результатами его функционирования являются количественные оценки, показатели заданий  и т.д.

На верхнем уровне применяется эвристический механизм безопасности (ЭМБ), использующий в основном знания лиц, принимающих решения (экспертов), их язык (как правило, слабо формализованный) и сформулированные на этом языке правила. Прототипом ЭМБ можно считать, например, механизм матричных сверток в задачах многокритериальной оптимизации, основанный на дихотомии признаков.

Промежуточное положение занимает механизм-переводчик, реализующий взаимодействие эксперта (руководителя) с АМБ на основе соответствующего информационного языка. Его моделью можно считать УМБ. Удобным средством проектирования ИМБ являются экспертные системы организационного управления, основанные как на формальных (количественных), так и на неформальных (эвристических) знаниях. Их многоуровневая база знаний включает АМБ, УМБ и ЭМБ, а в качестве формальных процедур пополнения баз знаний используются процедуры обучения.

Необходимые свойства оптимальности ИМБ (такие как прогрессивность, правильность, состоятельность оценок и другие) обеспечиваются путем проектирования составляющих их АМБ, УМБ и ЭМБ. В свою очередь, проектирование УМБ производится на основе результатов их оптимального синтеза.

Методология построения ИМБ основывается на комбинировании базовых и более сложных адаптивных механизмов безопасности. ИМБ строится, исходя из принципа композиции: комплексный механизм безопасности, состоящий из нескольких механизмов, будет прогрессивен, если прогрессивен каждый механизм. В свою очередь, его прогрессивность может быть обеспечена путем соответствующего выбора составляющих его процедур оценки и ранжирования.

Рассмотренные учебные механизмы безопасности объекта включают процедуры планирования и контроля, основанные на алгоритмах адаптивного прогнозирования, обучения классификации и опознаванию образов. Они обеспечивают теоретическое обоснование и методологию управления подразделениями безопасности в условиях быстрых изменений. Прогрессивные учебные механизмы используют потенциал подразделений безопасности. Сформулированы достаточные условия прогрессивности учебных механизмов безопасности. Практическая ценность результатов работы состоит в создании целостной системы методов повышения обоснованности решений, принимаемых службами безопасности.