Надёжность технических систем. Обеспечение и анализ

В.С. Викторова,

зав. лаб., д.т.н., с.н.с., ray@ipu.ru,

Н.В. Лубков,

в.н.с., к.т.н., с.н.с., lflbk@ipu.ru,

А.С. Степанянц,

с.н.с., lfvrk@ipu.ru,

ИПУ РАН, г. Москва

Рассматриваются вопросы обеспечения и анализа надёжности как ключевые моменты надёжностного проектирования технических систем. Показано, что высокий эффект резервирования достижим только в сочетании с использованием развитых средств контроля работоспособности и стратегий обслуживания. Анализ надёжности сложных систем может потребовать применения многоуровневых моделей работоспособности и развитых методов расчета надёжностных показателей. Обзор программных продуктов для расчетов надёжности и реализованных в них методов подтверждает их применимость для выполнения проектной оценки надёжности технических систем.

 

In this paper we discuss the issues of reliability assurance and analysis as key moments of designing of dependable technical systems. It is shown that high effect of redundancy is achievable only in conjunction with the use of advanced means of operational controls and various maintenance strategies. Reliability analysis of complex systems may require the use of multilevel models of efficiency and advanced methods for calculating reliability measures. Overview of methods of reliability analysis implemented in specialized software confirms their suitability for project reliability evaluation of the technical systems.

Введение

Надёжность технических систем является одной из важных характеристик качества. Она в конечном итоге определяет безопасность функционирования и эксплуатационные (экономические) характеристики систем – характеристики эффективности. Обеспечение надёжности – комплексная проблема, решение которой сопряжено с учетом возможных ограничений на выбор технических средств, весогабаритных и стоимостных ограничений, и с учетом условий (или режимов) эксплуатации. Закладываемые на этапах проектирования и разработки систем технические возможности реализуются при их эксплуатации. Именно поэтому программы обеспечения надёжности (т.н. ПОН) разрабатываются для каждого этапа жизненного цикла.

Можно указать основные способы обеспечения требований по надёжности:

Ø выбор надежных технических средств для построения системы,

Ø резервирование (структурное, функциональное, по производительности),

Ø восстановление работоспособности после отказов и техническое обслуживание.

Выбор технических средств зачастую может быть ограничен доступной номенклатурой изделий. Входной контроль комплектующих изделий, а в случае необходимости, и тренировка – технологический прогон изделий позволяют выявить значительную часть дефектных изделий, и тем самым, повысить общую надёжность.

Резервирование предоставляет широкие возможности для повышения надёжности. В наибольшей степени это относится к структурному резервированию. Следует сразу заметить, что эффект структурного резервирования тем больше, чем выше надёжность элементов резервированного звена.

При выборе варианта резервирования необходимо учитывать характер отказов элементов системы, возможные потери при отказе, временной режим использования системы по назначению, вид заданного показателя надёжности.

Характеристики отказов представлены следующими группами:

ú  Вид отказа – внезапный, постепенный, сбой, перемежающийся отказ.

ú  Тип отказа – скрытый, явный, тип «несрабатывание» и «ложное срабатывание».

ú  Характеристики восстанавливаемости –восстанавливаемый/невосстанавливаемый элемент.

ú  Характеристики контролируемости – контролируемый/неконтролируемый элемент.

Резервирование дает принципиальную возможность сделать процесс деградации технического состояния системы от исправного состояния до ее неработоспособности постепенным, что дает дополнительные возможности для восстановления (пусть и частичного) уровня работоспособности системы, или принятия решений по дальнейшему использованию и, тем самым, минимизировать возможные потери при отказе системы.

Естественно, что для реализации указанных выше возможностей процесс деградации технического состояния необходимо сделать наблюдаемым. Реализуется это использованием развитых средств контроля – встроенных или внешних, а также средств диагностирования.

Процесс деградации технического состояния сопровождается снижением уровня работоспособности системы, и снижение до критического уровня может квалифицироваться как отказ системы.

Таким образом, современная высоконадежная система ответственного назначения – это резервированная система, в которой наряду с функциональными подсистемами имеются также и подсистемы контроля. При техническом обслуживании для более углубленной проверки технического состояния используются также и внешние средства контроля и диагностирования.

Для подтверждения требуемого (или определения достигнутого) уровня надёжности используется совокупность различных методов, которые условно можно представить тремя группами:

1.  Методы анализа надёжности на этапе проектирования - аналитические и вероятностного моделирования для получения априорных оценок показателей надёжности,

2.  Экспериментальные методы (контрольные и определительные испытания) и расчетно-экспериментальные методы на этапе разработки и изготовления,

3.  Статистические методы оценки показателей надёжности по результатам эксплуатации.

1. Многоуровневые модели работоспособности. Показатели надёжности

Для описания надёжностного поведения сложных систем наиболее подходят многоуровневые модели работоспособности, в которых могут быть представлены, по сути, все факторы, влияющие на надёжность: разные виды отказов элементов и их последствия в зависимости от последовательности возникновения отказов, восстановление элементов после отказа, полнота контроля работоспособности системы и ее элементов, реконфигурация структуры системы по результатам контроля, техническое обслуживание.

Классическая теория надёжности, в основном, оперировала двухуровневыми моделями систем, то есть моделями, в которых всё множество состояний было представлено подмножествами состояний работоспособности и неработоспособности системы. Но к традиционным способам обеспечения и повышения надёжности систем (выбор более надежной элементной базы, резервирование, обоснованное техническое обслуживание), о чем говорилось выше, можно добавить еще проектные решения по обеспечению многоуровневого функционирования. Системы с многоуровневым характером функционирования при отказах снижают эффективность функционирования - производительность, качество управления, число выполняемых функций и т.п. Обычно реализовывается несколько уровней эффективности. При надёжностном анализе все состояния работоспособности системы разбиваются на классы, эквивалентные по эффективности. Состояния неработоспособности системы также могут быть разбиты на классы, соответствующие уровням критичности отказов, что позволяет строить надёжностные модели для анализа безопасности (опасностей).

Для оценки влияния отказов сложных систем в конце 70-х прошлого века в техническую и нормативную и документацию был введен показатель коэффициент сохранения эффективности Ксф.(t), который определяется как отношение математического ожидания значения показателя эффективности использования объекта по назначению за определенную продолжительность эксплуатации к номинальному значению ЕН этого показателя, вычисленному при условии, что отказы объекта в течение того же периода не возникают

             (1)

Конкретизация понятия эффективности осуществляется исходя из существа задачи анализа надёжности, назначения системы, характера полезного выхода (потерь) при функционировании системы.

Наиболее наглядно и удобно в плане построения математической расчетной модели является представление многоуровневой надёжностной модели в виде графа переходов. На основе информации о структуре и принципах функционирования исследуемой системы, отказах и восстановлении элементов системы формируется множество возможных состояний системы и граф переходов между состояниями [1]. Каждое состояние характеризуется набором отказавших элементов с учетом дополнительных признаков, которые необходимо отразить в модели (контролируемый либо неконтролируемый отказ, вид отказа, последовательность возникновения отказов и т.п.). Ребра графа переходов отображают причины переходов процесса в пространстве состояний из одного состояния в другое – иными словами, события в системе, отображаемые в модели - отказы, восстановления элементов системы, проведение сеанса контроля и другие причины, вызывающие переходы между состояниями. Множество состояний системы S разбивается на ряд подмножеств Si, эквивалентных по эффективности функционирования системы в каждом из этих состояний: Æ, при  i¹j, и  по всем i. Для каждого класса состояний задается некоторая величина Ei, характеризующая эффективность (эффект за единицу времени) от пребывания системы в данном классе (т.е. всем состояниям i-го класса присваивается значение Ei). Кроме того, каждому переходу в пространстве состояний также может быть сопоставлена некоторая числовая характеристика. Она может иметь ту же размерность, что и единица измерения эффекта, или представлять абстрактное число, например, такое, как индикатор данного перехода.

Аналогично тому, как по графу переходов строится матрица связей, для «размеченного» графа формируется матрица доходов.

Построение надёжностной модели завершается после задания временных характеристик процесса переходов системы в пространстве состояний. В плане практического применения возможно использование марковских и полумарковских процессов. Однако аналитическое решение, в общем случае, возможно получить только при использовании более простого марковского процесса (МП) с дискретным пространством состояний и непрерывным временем. Соответственно, надёжностная модель будет эквивалентна модели марковского процесса (МП-модели). для задания которого достаточно сформировать матрицу интенсивностей переходов.

Математическое описание МП представлено уравнениями Колмогорова-Чепмена

                              (2)

начальные условия: П(0) = П0,

Λ – матрица интенсивностей переходов.

П(t) – вектор строка распределения вероятностей пребывания процесса (модели) по состояниям в времени t.

По вектору П(t) уже определяются вероятностные характеристики для любого подмножества состояний.

Надёжностная многоуровневая модель будет эквивалентна модели марковского процесса с доходами (МПД-модели), для задания которого кроме матрицы интенсивностей переходов и необходимо сформировать матрицу доходов.

Математическое описание МПД задается уравнениями вида

                                                       (3)

начальные условия: М(0) = 0,

Λ – матрица интенсивностей переходов.

М(t) -  вектор столбец математического ожидания дохода в момент времени t,

wij – элементы матрицы доходов W.

R – вектор-столбец свободных членов, числовые значения которых определяется структурой дохода, задаваемого в виде матрицы доходов W, в соответствии с видом показателя надёжности.

Возможности МПД - метода фактически покрывают возможности МП - метода. Однако различия в математическом виде получаемых результатов при совместном их использовании позволяет реализовать более эффективные вычислительные схемы, в частности, при вычислении комбинированных показателей, например, коэффициента оперативной готовности.

Ниже рассмотрено вычисление ряда показателей, характеризующих эффективность функционирования систем, оставаясь в рамках марковских процессов с непрерывным временем. Для вычисления показателей эффективности необходимо все множество состояний системы S (марковской модели системы) разделить, как указано выше, на k подмножества Si эквивалентных по эффективности функционирования состояний (включая состояния неработоспособности). Каждое подмножество Si включает ni элементов. Элементы подмножеств также пронумерованы (индекс j). Таким образом, .

Определяемые ниже показатели позволяют охарактеризовать классы состояний эффективности в момент времени t или в произвольный момент времени на стационарном участке функционирования (эти показатели можно назвать дифференциальными). Показатели эффективности интегрального типа вычисляются в марковских процессах с доходами. Показатели надёжности определяются следующим образом.

1.  Распределение k готовностей КГ Si(t) (вероятностей пребывания системы в момент времени t) по классам состояний Si (в том числе для стационарных готовностей, не зависящих от t),

, где                                         (4)

2.  Параметр потока переходов в класс состояний Si, (в том числе стационарный, не зависящий от t)

            (5)

3.  Среднее время пребывания в классе состояний Si (на стационарном участке функционирования)

                          (6)

4.  Среднее значение эффективности в момент времени t (в том числе стационарное, не зависящее от t)

                 (7)

5.  Коэффициент сохранения эффективности (в момент времени t и/или стационарный)

                          (8)

Показателями интегрального типа, вычисляемыми в МПД являются, в частности, среднее суммарное время пребывания на интервале (0,t) в классе состояний Si, среднее число переходов на (0,t) в заданный класс состояний (в том числе, отказов), средняя интегральная эффективность (выработка) на (0,t) и другие. Полный список показателей можно посмотреть в [2].

2. Контроль работоспособности и восстановление

Эффективность мероприятий по повышению надёжности напрямую зависит от знания реального технического состояния системы, будь то восстановление отказавших элементов, подключение резервных элементов, реконфигурация структуры системы, или техническое обслуживание, объем и затраты на которое зависят от точности диагностирования технического состояния. Технические средства контроля и диагностирования характеризуются конечной разрешающей способностью, и кроме того, как и любая техническая (подистема подвержена воздействию отказов собственных элементов, что в конечном итоге может привести к полной потере функции контроля. Неприятность подобной ситуации усугубляется в том случае, если отказ самой системы контроля является скрытым. Из сказанного следует вывод, что система контроля и ее характеристики должны быть представлены в надёжностной модели системы непосредственно, или опосредствованно, характеристиками контролепригодности основных (функциональных) элементов системы [3].

Основными характеристиками контроля, регламентированными нормативной документацией [4], в том числе зарубежной, являются:

ú  полнота контроля (fault detection),

ú  глубина контроля (fault isolation).

Полнота контроля характеризует долю отказов объекта контроля, обнаруживаемых при контроле работоспособности

Глубина контроля характеризует «разрешающую» способность средств контроля.

Важной характеристикой контроля является его достоверность, определяемая как вероятность правильной идентификации технического состояния объекта. Дополнительная к достоверности контроля характеристика недостоверность определяется, в том числе, ошибками контроля первого и второго рода – признание работоспособного объекта неработоспособным и, наоборот, неработоспособного – работоспособным.

На рис. 1 представлены графики зависимости коэффициента оперативной готовности от полноты контроля, а на рис.2 - Зависимость средней наработки до отказа от полноты контроля мажоритарной схемы «2 из 3». Представленные графики иллюстрируют сильную зависимость показателей от полноты контроля. В частности, заметный рост надёжности наблюдается при полноте контроля, равной 0.9 – 0.95. Кроме того, графики на рис.2 показывают сильную зависимость показателя от времени восстановления (параметр ρ), что подтверждает тезис об эффективности сочетания мер по повышению надёжности.

Рис.1. Зависимость коэффициента оперативной готовности от полноты контроля

Рис.2. Зависимость средней наработки до отказа от полноты контроля

3. Методы и программное обеспечение анализа надёжности

Для проведения надёжностного анализа систем на этапе проектирования в распоряжении специалистов имеется широкий арсенал расчетных методов. Их классификация по определенным принципам позволяет выбрать конкретные методы, в наибольшей степени отвечающие постановке задачи. Основные признаки классификации учитывают возможности применения методов:

§  зависимые (независимые) отказы и восстановления элементов;

§  законы распределения – экспоненциальное или произвольное;

§  вид модели – двухуровневые и многоуровневые;

§  вычисляемые показатели – мгновенные, интервальные, произвольные;

§  допустимая размерность – небольшая, большая, произвольная.

Классификация по используемому математическому аппарату и алгоритмам представлена следующими уровнями.

Точные методы, основанные на

-     теории случайных событий и случайных величин – классический метод, логико-вероятностный метод, метод ФСА;

-     теории случайных процессов – МП-метод, МПД-метод, ПМП-метод.

Приближенные методы

ú  асимптотические – метод укрупнения состояний, методы теории восстановления;

ú  методы ограничения перебора – метод усечения графа переходов, логико-вероятностные методы ограничения;

ú  метод статистического моделирования.

Для надёжностного анализа систем с применением многоуровневых моделей наиболее применимы расчетные методы на основе марковских процессов, или вероятностное моделирование. Спектр вычисляемых показателей значительно шире представленного в нормативной документации. Это дает возможность не только подтверждения заданных требований по надёжности, но и, что очень важно, расширить информационную поддержку процесса надёжностного проектирования.

Очевидна сложность и трудоёмкость решения задач надёжностного анализа в рассматриваемой постановке. Поэтому использование специализированного программного обеспечения является практически неизбежным. Известны [1] программные продукты (ПП) для расчётов надёжности, реализующие тот или иной расчетный метод (АРБИТР, Risk Spectrum (Швеция), УНИВЕРСАЛ, АСОНИКА-К), и универсальные, реализующие совокупность методов (RELEX (США), ISOGRAPH (Англия), RAM-Commander (Израиль). Преимущество универсальных ПП, кроме собственно их универсальности, является то обстоятельство, что анализ многоэлементных систем для его упрощения зачастую требует декомпозиции системы на подсистемы. Раздельный анализ их надёжности может требовать использования различных расчетных методов, как, впрочем, и при последующем агрегировании подсистем в систему для получения оценок надёжности системы в целом.

Применимость того или иного ПП определяется его возможностями представления надёжностной модели и реализуемыми расчетными методами. Поэтому для характеристики ПП использованы следующие признаки.

Реализуемые количественные методы расчета показателей

Ø АРБИТР, Risk Spectrum - логико-вероятностные методы;

Ø УНИВЕРСАЛ – полумарковские методы;

Ø АСОНИКА-К – расчет по формулам из справочника, частные случаи статистического моделирования;

Ø RAM-Commander - логико-вероятностные методы, метод статистического моделирования;

Ø RELEX, ISOGRAPH – методы логико-вероятностные, марковские, статистического моделирования;

Особенности моделей отказов, восстановления, резервирования, вычисляемые показатели

§  Risk Spectrum – независимые отказы и восстановления, нагруженное резервирование, мгновенные показатели;

§  АРБИТР - независимые отказы и восстановления, некоторые случаи несовместности отказов, нагруженное резервирование, мгновенные показатели;

§  УНИВЕРСАЛ – практически без ограничений, если не считать сложность (или практическую невозможность) построения ПМП-модели;

§  RELEX, ISOGRAPH – в значительной мере покрывают возможности других ПП и дополнительно позволяют учитывать некоторые виды зависимостей (последовательность возникновения и несовместность отказов, временные зависимости и стратегии восстановления), нагруженность резерва и виды резервирования (скользящее, замещением, с учетом переключателей), характеристики контроля, позволяют формировать МП-модели, позволяют получать оценки широкого спектра показателей, включая показатели эффективности.

Точность расчетов

-     Risk Spectrum – приближенные методы без указания точности оценок/

-     АРБИТР – точные методы для мгновенных показателей, приближенные – для интервальных.

-     RELEX, ISOGRAPH – точные и приближенные методы (некоторые с заданной погрешностью.

Зарубежные ПП в той или иной мере реализуют качественные методы (технологии) анализа и методы получения предварительных количественных оценок надёжности

v FMEA – анализ видов и последствий отказов.

v FMECA - анализ видов, последствий и критичности отказов.

v Оценка риска с построением диаграмм уровней риска и критичности отказов.

v Содержит встроенные базы данных по видам отказов.

В заключение следует охарактеризовать отдельные этапы надёжностного анализа

·      Описание объекта анализа задано на основе технической документации,

·      Формализация описания объекта анализа и построение надёжностной модели – требует привлечения специалистов–разработчиков,

·      Расчеты показателей – с применением соответствующих ПП.

Литература

1.  Викторова В.С., Степанянц А.С. Модели и методы расчета надёжности технических систем. Изд. 2, испр. М.: Издательская группа URSS, ООО «ЛЕНАНД», 2016. – 256 с.

2.  Буянов Б.Б., Злобинский В.И., Лубков Н.В., Степанянц А.С. АСУ ТП. Оценка надёжности и эффективности на основе моделей марковских процессов с доходами (МПД-метод). РМ 25431-87, М.: Минприбор, 1987, с.36.

3.  Лубков Н.В., Спиридонов И.Б., Степанянц А.С. Влияние характеристик контроля на показатели надёжности систем // Труды МАИ. 2016. Выпуск № 85. С. http://www.mai.ru/science/trudy/published.php?ID=67501.

4.  ГОСТ 26656-85 Контролепригодность. Общие требования – М.: Издательство стандартов - 15с.