가용성

신뢰성 공학에서 가용성이라는 용어는 다음과 같은 의미를 갖는다:

임무가 알 수 없는, 즉 무작위의 시점에 요청되었을 때, 해당 임무의 시작 시점에서 시스템, 하위 시스템 또는 장비가 지정된 작동 가능하고 투입 가능한 상태에 있는 정도.
명시된 조건하에서 이상적인 지원 환경에서 사용될 때, 주어진 시점에서 항목이 만족스럽게 작동할 확률.

일반적으로 고가용성 시스템은 99.98%, 99.999% 또는 99.9996%로 명시될 수 있다. 그 반대 개념인 비가용성은 1에서 가용성을 뺀 값이다.

표현

가용성(A)의 가장 간단한 표현은 시스템의 가동 시간 기대값과 가동 및 비가동 시간 기대값의 합(관측 기간의 "총 시간" C에 해당)의 비율이다.

A = \frac{E[\mathrm{uptime}]}{E[\mathrm{uptime}]+E[\mathrm{downtime}]} = \frac{E[\mathrm{uptime}]}{C}

가용성(A)의 또 다른 수식은 평균 고장 시간(MTTF)과 평균 고장 간격(MTBF)의 비율로, 다음과 같다.

A = \frac{MTTF}{MTTF + MTTR} = \frac{MTTF}{MTBF}

상태 함수 X(t)를 다음과 같이 정의하면

X(t)= \begin{cases} 1, & \text{sys functions at time } t\ 0, & \text{maintenance} \end{cases}

따라서, 시간 t > 0에서의 가용성 A(t)는 다음과 같이 표현된다.

A(t)=\Pr[X(t)=1]=E[X(t)]. ,

평균 가용성은 실수선의 구간 위에서 정의되어야 한다. 임의의 상수 c>0를 고려하면, 평균 가용성은 다음과 같이 표현된다.

A_c = \frac{1}{c} \int_0^c A(t),dt.

극한(또는 정상 상태) 가용성은 다음과 같이 표현된다.[^3] A = \lim_{c \rightarrow \infty} A_c.

극한 평균 가용성도 구간 [0,c] 위에서 다음과 같이 정의된다.

A_\infty =\lim_{c \rightarrow \infty} A_c = \lim_{c \rightarrow \infty}\frac{1}{c} \int_0^c A(t),dt,\quad c > 0.

가용성은 임의의 시간에 임무가 요청되었을 때, 해당 항목이 임무 시작 시점에 작동 가능하고 투입 가능한 상태에 있을 확률이며, 일반적으로 가동 시간을 총 시간(가동 시간 + 비가동 시간)으로 나눈 값으로 정의된다.

직렬 구성 요소 vs 병렬 구성 요소

series vs parallel components

직렬 구성 요소가 구성 요소 A, B, C로 이루어져 있다고 가정하자. 그러면 다음 공식이 적용된다:

직렬 구성 요소의 가용성 = (구성 요소 A의 가용성) x (구성 요소 B의 가용성) x (구성 요소 C의 가용성)[^1][^2]

따라서, 직렬로 연결된 여러 구성 요소의 결합 가용성은 항상 개별 구성 요소의 가용성보다 낮다.

반면에, 병렬 구성 요소에는 다음 공식이 적용된다:

병렬 구성 요소의 가용성 = 1 - (1 - 구성 요소 A의 가용성) X (1 - 구성 요소 B의 가용성) X (1 - 구성 요소 C의 가용성)[^1][^2]

각각 50%의 가용성을 가진 10개의 호스트. 그러나 이들을 병렬로 사용하고 독립적으로 장애가 발생한다면, 높은 가용성을 제공할 수 있다.

따름 정리로, 각각 X의 가용성을 가진 N개의 병렬 구성 요소가 있다면:

병렬 구성 요소의 가용성 = 1 - (1 - X)^ N [^2]

병렬 구성 요소를 사용하면 전체 시스템의 가용성을 기하급수적으로 높일 수 있다.[^1] 예를 들어, 각 호스트의 가용성이 50%에 불과하더라도 10개의 호스트를 병렬로 사용하면 99.9023%의 가용성을 달성할 수 있다.[^2]

이중화가 항상 높은 가용성으로 이어지는 것은 아니라는 점에 유의해야 한다. 실제로 이중화는 복잡성을 증가시키고, 이는 오히려 가용성을 낮출 수 있다. Marc Brooker에 따르면, 이중화의 이점을 활용하려면 다음을 보장해야 한다:[^4]

전체 시스템의 가용성에서 순 긍정적 개선을 달성할 것
이중화 구성 요소가 독립적으로 장애를 일으킬 것
시스템이 정상적인 이중화 구성 요소를 안정적으로 감지할 수 있을 것
시스템이 이중화 구성 요소를 안정적으로 확장 및 축소할 수 있을 것

가용성 모델링 방법 및 기법

신뢰성 블록 다이어그램 또는 고장 나무 분석은 다음과 같은 많은 요소를 포함하여 시스템 또는 시스템 내 기능적 고장 조건의 가용성을 계산하기 위해 개발되었다:

신뢰성 모델
정비성 모델
정비 개념
이중화
공통 원인 고장
진단
수리 수준
수리 상태
잠복 고장
시험 범위
활성 운용 시간 / 임무 / 하위 시스템 상태
물류적 측면: 여러 보급소의 예비 부품(재고) 수준, 운송 시간, 여러 수리 라인의 수리 시간, 인력 가용성 등
매개변수의 불확실성

또한, 이러한 방법은 가용성에 영향을 미치는 가장 핵심적인 항목과 고장 모드 또는 사건을 식별할 수 있다.

시스템 공학 내 정의

고유 가용성 (Ai) [^5] 명시된 조건에서 이상적인 지원 환경에서 사용될 때, 특정 시점에서 항목이 만족스럽게 작동할 확률. 여기에는 물류 시간, 대기 또는 행정적 비가동 시간, 예방 정비 비가동 시간이 제외된다. 수정 정비 비가동 시간은 포함된다. 고유 가용성은 일반적으로 엔지니어링 설계 분석에서 도출된다:

수리 가능한 요소(정비/재제조는 수리가 아니라 교체에 해당)가 해당 요소가 운용되는 시스템의 가용성에 미치는 영향은 평균 고장 간격 MTBF/(MTBF + 평균 수리 시간 MTTR)과 같다.
일회용/수리 불가능 요소(정비/재제조는 가능)가 해당 요소가 운용되는 시스템의 가용성에 미치는 영향은 평균 고장 시간(MTTF)/(MTTF + 평균 수리 시간 MTTR)과 같다.

이는 설계자가 통제할 수 있는 수량에 기반한다.

달성 가용성 (Aa) [^6] 명시된 조건에서 이상적인 지원 환경(즉, 인력, 도구, 예비 부품 등이 즉시 이용 가능한 환경)에서 사용될 때, 특정 시점에서 항목이 만족스럽게 작동할 확률. 여기에는 물류 시간과 대기 또는 행정적 비가동 시간이 제외된다. 능동적 예방 및 수정 정비 비가동 시간은 포함된다.

운용 가용성 (Ao) [^7] 실제 또는 현실적인 운용 및 지원 환경에서 사용될 때, 특정 시점에서 항목이 만족스럽게 작동할 확률. 여기에는 물류 시간, 대기 시간, 대기 또는 행정적 비가동 시간, 그리고 예방 및 수정 정비 비가동 시간이 모두 포함된다. 이 값은 평균 고장 간격(MTBF)을 평균 고장 간격과 평균 비가동 시간(MDT)의 합으로 나눈 것과 같다. 이 척도는 가용성의 정의를 예비 부품, 도구 및 인력의 수량과 하드웨어 항목까지의 근접성 등 물류 담당자와 임무 계획자가 통제하는 요소로 확장한다.

자세한 내용은 시스템 공학을 참조하라.

기본 예제

평균 고장 시간(MTTF)이 81.5년이고 평균 수리 시간(MTTR)이 1시간인 장비를 사용하는 경우:

시간 단위 MTTF = (이것은 신뢰성 매개변수이며 종종 높은 수준의 불확실성을 가진다!)

고유 가용성 (Ai)

고유 비가용성

연간 장비로 인한 중단 시간 = 1/비율 = 1/MTTF = 연간 0.01235시간.

문헌

가용성은 확률 모델링 및 최적 유지보수 문헌에서 잘 확립되어 있다. Barlow와 Proschan [1975]은 수리 가능한 시스템의 가용성을 "특정 시간 t에 시스템이 작동하고 있을 확률"로 정의한다. Blanchard [1998]는 가용성의 정성적 정의를 "임무가 알 수 없는 무작위 시점에 요청되었을 때, 임무 시작 시점에 시스템이 작동 가능하고 투입 가능한 상태에 있는 정도를 나타내는 척도"로 제시한다. 이 정의는 MIL-STD-721에서 유래한다. Lie, Hwang, 그리고 Tillman [1977]은 가용성에 대한 체계적인 분류와 함께 포괄적인 조사를 수행하였다.

가용성 척도는 관심 시간 구간 또는 시스템 정지 시간의 메커니즘에 따라 분류된다. 관심 시간 구간이 주요 관심사인 경우, 순간 가용성, 극한 가용성, 평균 가용성, 극한 평균 가용성을 고려한다. 앞서 언급한 정의들은 Barlow와 Proschan [1975], Lie, Hwang, 그리고 Tillman [1977], Nachlas [1998]에서 개발되었다. 가용성의 두 번째 주요 분류는 고유 가용성, 달성 가용성, 운용 가용성과 같은 다양한 정지 시간 메커니즘에 따른 것이다. (Blanchard [1998], Lie, Hwang, 그리고 Tillman [1977]). Mi [1998]는 고유 가용성을 고려한 가용성의 비교 결과를 제시한다.

유지보수 모델링에서 고려되는 가용성은 Barlow와 Proschan [1975]의 교체 모델, Fawzi와 Hawkes [1991]의 예비품 및 수리가 있는 R-out-of-N 시스템, Fawzi와 Hawkes [1990]의 교체 및 수리가 있는 직렬 시스템, Iyer [1992]의 불완전 수리 모델, Murdock [1995]의 연령 교체 예방 유지보수 모델, Nachlas [1998, 1989]의 예방 유지보수 모델, Wang과 Pham [1996]의 불완전 유지보수 모델에서 찾아볼 수 있다. 매우 포괄적인 최신 저서로는 Trivedi와 Bobbio [2017]의 것이 있다.

응용

가용성 계수는 발전소 공학에서 광범위하게 사용된다. 예를 들어, 북미 전력 신뢰도 공사(North American Electric Reliability Corporation)는 1982년에 발전 가용성 데이터 시스템을 도입하였다.[^8]

같이 보기

신뢰성(Dependability)
신뢰성 공학
안전 공학
시스템 품질 속성 목록
스퓨리어스 트립 레벨
상태 기반 유지보수
결함 보고
고가용성
RAMS

출처

- K. Trivedi and A. Bobbio, 신뢰성 및 가용성 공학: 모델링, 분석 및 응용, Cambridge University Press, 2017.

외부 링크

참고 문헌

[^1]: Sandborn, Peter. System Sustainment: Acquisition And Engineering Processes For The Sustainment Of Critical And Legacy Systems. World Scientific

[^2]: Trivedi, Kishor S.. Reliability and Availability Engineering: Modeling, Analysis, and Applications. Cambridge University Press

[^3]: Elsayed, E., ''Reliability Engineering'', Addison Wesley, Reading, MA,1996

[^4]: Vitillo, Roberto. Understanding Distributed Systems, Second Edition: What every developer should know about large distributed applications. Roberto Vitillo. (23 February 2022)

[^5]: 고유 가용성 (AI). 미국 국방부

[^6]: 달성 가용성 (AI). 미국 국방부

[^7]: 운용 가용성 (AI). 미국 국방부

[^8]: cite web url=http://www.nerc.com/pa/RAPA/gads/Publications/GADS---Mandatory%20Reporting%20of%20Conventional%20Generation%20Performance%20Data%20Final.pdf archive-url= https://ghostarchive.org/archi

표현