반응형
반응형
DR(Disaster Recovery) 구축 정의와 실무 사례 정리기업과 공공기관의 시스템 운영 환경이 복잡해짐에 따라, DR(Disaster Recovery, 재해복구)는 선택이 아닌 필수가 되었습니다. 서버 화재, 랜섬웨어 감염, 데이터센터 장애, 클라우드 서비스 중단 등 다양한 위협 상황에서 서비스를 신속히 복구하고 데이터 손실을 최소화하는 것이 핵심 목표입니다. 이 글에서는 DR의 개념 정의, 구축 전략, 실제 사례, 그리고 실무자들이 현장에서 참고할 수 있는 핵심 포인트를 정리했습니다.1. DR의 정의와 목적DR(Disaster Recovery)은 물리적 또는 논리적 재해 발생 시 IT 시스템과 데이터를 신속히 복구하여 비즈니스 연속성을 유지하는 기술적 체계를 의미합니다. 이는 단순한 백업..
국가정보자원관리원 화재와 AWS 장애로 보는 DR의 중요성2025년 10월, 한국의 핵심 행정 데이터센터인 국가정보자원관리원 화재 사고와 글로벌 클라우드 서비스인 AWS(Amazon Web Services) 장애가 연이어 발생하면서, IT 인프라의 ‘재해복구(Disaster Recovery, DR)’ 시스템이 다시금 주목받고 있습니다. 이번 사건들은 단순한 기술적 문제가 아니라, 공공과 민간 모두에게 ‘데이터 복원력(Resilience)’의 필요성을 강하게 일깨워준 사례로 평가됩니다.1. 국가정보자원관리원 화재 – 공공 IT 인프라의 단일 장애점(SPOF)국가정보자원관리원은 행정안전부 산하 기관으로, 중앙정부 및 지방자치단체의 핵심 시스템을 운영하는 국가 데이터 허브 역할을 맡고 있습니다. 그러나 최근 ..
AWS 2025년 10월 20일 대규모 서비스 장애 원인 분석 및 대응 보고서1. 장애 개요2025년 10월 20일, 세계 최대의 클라우드 서비스 제공업체인 AWS(Amazon Web Services)에 대규모 서비스 장애가 발생했습니다. 이로 인해 글로벌 수많은 웹사이트와 애플리케이션, 기업 시스템이 멈추거나 지연되는 현상이 나타났습니다. 이번 장애는 단순한 서버 오류를 넘어, 현대 사회가 클라우드 인프라에 얼마나 의존하고 있는지를 여실히 보여주는 사례로 기록될 것입니다. 본 글에서는 AWS 장애의 원인, 영향, 그리고 향후 대응 방안을 상세히 분석합니다.2. 장애 원인 분석이번 AWS의 대규모 장애는 미국 동부 리전(us-east-1)에서 발생한 네트워크 설정 오류에서 비롯되었습니다. 공식 발표에 따..
Rocky Linux 설치 시 RAID GPT 오류 (PMBR mismatch / Backup GPT corrupt) 완벽 해결 보고서1. 문제 발생 환경 서버 모델: Lenovo ThinkSystem (BIOS RAID 컨트롤러 내장) 기존 OS: CentOS 7.x 신규 OS: Rocky Linux 9.x RAID 구성: BIOS RAID 1 (Intel IMSM 기반, md126 / md127 구조) 디스크: 3TB × 2 (GPT 기반)기존 CentOS에서 RAID를 유지한 채 Rocky Linux를 새로 설치했을 때, 설치는 완료되지만 부팅 시 GPT 관련 오류와 함께 시스템이 중단되었습니다.2. 실제 발생한 오류 메시지GPT PMBR size mismatch (GPT header i..
Oracle ORA-01261, ORA-01262 오류 원인과 복구 절차1. 오류 개요Oracle Database 복구 과정에서 ORA-01261: Parameter string destination string is not a valid destination 또는 ORA-01262: Stat string file is inconsistent with others 오류가 발생하는 경우가 있습니다. 이는 주로 복구 대상 데이터파일의 경로나 상태가 일치하지 않거나, 로그 시퀀스 불일치로 인한 복구 실패를 의미합니다.ORA-01261: Parameter file destination '/u01/app/oracle/oradata/ORCL/system01.dbf' is not a valid destinationO..
Oracle ORA-03113, ORA-03114, ORA-24324 오류 원인과 복구 방법1. 에러 개요Oracle Database를 운영하다 보면 간헐적으로 ORA-03113: end-of-file on communication channel 또는 ORA-03114: not connected to ORACLE 오류를 마주하게 됩니다. 이는 데이터베이스 인스턴스와 세션 간 통신이 비정상적으로 종료되었을 때 발생하는 대표적인 오류입니다.SQL> startupORACLE instance started.Database mounted.ORA-03113: end-of-file on communication channelSQL> alter database open;ORA-03114: not connected to..