Cloud Infra Architecture (AWS)/AWS SAA-C03

AWS Disaster Recovery (DR)

seongduck 2023. 1. 22. 20:41

재해 복구 (DR이란)?

  • Disaster : 비즈니스에 심각한 부정적인 영향을 주는 사건
    • 1) Natural disasters = 지진, 홍수 등
    • 2) Technical Failures = 전원 실패, 네트워크 문제 등
    • 3) Human actions = 부즈의한 조작/설정, 허용하지 않은 사람의 액세스/변경
  • High Availability (고가용성 : 이중화) VS Disaster Recovery(재해 복구)
    • 시스템 관점에서는 비슷하긴 하다.
    • 재해 복구 
      • 전체 워크로드를 별도의 장소에 복사하는 것에 중심 (모든 시스템)
      • 지진, 홍수 등의 재난 이벤트
      • 재해 복구의 목표는 비즈니스의 연속성
    • 고 가용성
      • 일부 워크로드 (구성요소, 특정 앱, 특성 DB, 특정 서버)의 서비스를 지속하는 것에 중심
      • 일부 컴포넌트 실패, 네트워크 문제, 소프트웨어 문제, 시스템 과부하 등의 재해 복구보다 구체적이고 작은 범위
      • 고 가용성의 목표는 시스템의 기능 수행 시간의 최대화이다.

 

Recovery Objectives

출처 : AWS Cretified Soultion Architecture

RPO와 RTO

 

Disaster Recovery Strategies

  • 오른쪽으로 갈 수록 장애 복구 시간은 빠르나 가격이 점점 오른다.
  • 1) EBS, 스냅샷 등이 여기에 속한다.
    • 데이터를 백업 및 장애 발생시 백업으로 복구
  • 2) RDS (Read Replica), S3
    • 코어 시스템만 복제 후 대기(다른사이트 및 다른 장소)
    • Standby를 Active로
  • 3) DB나 애플리케이션
    • 전체 시스템을 작은 스케일로 구성하여 대기
    • 복제 사이트에 (Standby)에 똑같이 구성해 논다.
    • Failover시 수 분이 걸린다.
  • 4) 전체 서버를 똑같이 복사해서 운영하기에 장애시 Downtime이 없다. 
    • 가장 비싼 솔루션
    • 전체 시스템을 동일하게 복제하여 동시 운영
    • 아주 중요한 부분에서만 사용한다.