신뢰할 수 있고 확장이 가능하며 유지보수하기 쉬운 어플리케이션 (2)

누구나 어떤 것을 신뢰하거나 신뢰하지 않는다는 의미가 무엇인지 직관적인 개념을 가지고 있다

이 모든 것이 "올바르게 동작함" 을 의미하는 경우 무언가 잘못되더라도 지속적으로 올바르게 동작함을 신뢰성의 의미로 이해할 수 있다

잘못될 수 있는 일을 결함(fault) 이라 부른다 그리고 결함을 예측하고 대처할 수 있는 시스템을 내결함성(fault-tolerant)

또는 탄력성(resilent)라고 한다

여기서 내결함성이라는 용어를 살펴보고 가야하는데

모든 종류의 시스템의 결함을 견딜수 있는 시스템을 만들 수 있다는걸 시사하는데 실제로는 실현할 가능성이 있다고 말할 수 있는가?

책에서는 블랙홀이 지구상 모든걸 삼켯을때 웹 호스팅이 가능할까? 없다

따라서 특정 유형의 결함에서 말하는것이 타당하다

또한 결함과 장애는 아예 다르다

결함은 시스템의 한 구성 요소로 정의되지만

장애는 사용자에게 필요한 서비스를 제공하지 못하고 shutdown한 경우다

결함 확률을 0으로 줄이는 것은 불가능하다
그래서 결함으로 인한 장애가 일어나지 않겠끔 내결함성 구조를 설계하는 것이 가장 좋다

시스템 내 체계적 오류(systematic error)가 있다 이 결함은 예상하기가 더 어렵고 노드 간 상관관계 때문에

상관관계가 없는 하드웨어 오류보다는 오히려 시스템 오류를 더욱 많이 유발하는 경향이 있다.

이같이 결함을 유발하는 버그는 특정 상황에 의해 발생하기 전까지 오랫동안 나타나지 않는다

이 특정 상황에 의해 발생 이라는 말이 정말 소름돋는 말이다 마치 암이라고 보면 잠복기와 다름이 없다는것이다..

또한 더욱 더 소름인건 체계적 오류 문제는 신속한 해결책이 없다는것이다 특정상황에서 발생하는 특정 가정이 수없이 많기 때문에

모니터링 요원을 두거나 지속적인 이벤트 체크를 해주는 것 이외는 방법이 없다는것이다 .

시스템이 뭔가를 보장하기 바라면 수행 중에 지속적으로 확인하여 차이가 생기면 경고를 발생하여 빠른 대처를 가능할 수 있게 된다

저장소와 검색 (2) (1)	2024.10.01
저장소와 검색 (1) (0)	2024.09.30
신뢰할 수 있고 확장이 가능하며 유지보수하기 쉬운 어플리케이션 (3) (1)	2024.09.09
신뢰할 수 있고 확장이 가능하며 유지보수하기 쉬운 어플리케이션 (1) (0)	2022.11.10

I AM SKY