인프라 엔지니어 실무교육 (1)
백업 & 아카이브 그 종류와 차이
인프라 엔지니어 교육 1
백업
백업 (backup)은 임시 보관을 일컫는 말로, 정보 기술에서는 데이터 백업(data backup)이라고 하며, 데이터를 미리 임시로 복제하여, 문제가 일어나도 데이터를 복구할 수 있도록 준비해 두는 것을 말한다. 데이터 백업을 수행한 파일은 백업 파일이라고 한다.
아카이브
데이터의 세대 관리를 목적으로 하는 데이터 저장 기법으로, 데이터 보전에 초점을 두기 때문에 아카이브 데이터의 경우 데이터 갱신(update)에 대해 고려하지 않는다. 예를 들어 전자 문서와 같이 데이터의 보관 자체에 중점을 두는 것이다.
아카이브 파일은 보관 목적을 위해 소스 볼륨, 미디어 정보, 파일 디렉터리 구조, 복구 정보 및 메타 데이터가 포함된 파일들을 하나의 파일 형태로 변환한 것으로, 이 아카이브 파일을 생성하는 공정을 아카이버(archiver) 또는 파일 아카이버(file archiver)라고 부른다.
또한 아카이브 파일에서 원본 파일을 추출하는 것을 추출(extract)이라 부른다. 일반적으로 아카이브 파일을 생성함과 동시에 파일을 압축하는 경우가 많으며 .zip과 같이 자동으로 수행되는 방식도 많다.
구분 | 백업(Backup) | 아카이브(Archive) |
---|---|---|
정의 | 데이터 손실 시 복구를 위해 데이터를 복제하여 저장 | 중요하거나 오래된 데이터를 장기 보관 |
목적 | 데이터 복구 및 보호 | 데이터 보존 및 규제 준수 |
데이터 성격 | 주기적으로 변경되는 운영 데이터 | 주로 변경되지 않는 정적 데이터 |
저장 위치 | 운영 시스템과 가까운 위치 (온프레미스, 클라우드 등) | 저렴한 저장소 (오프라인 테이프, 클라우드 장기 저장소 등) |
접근 빈도 | 빈번하거나 즉각적인 액세스 요구 | 낮은 빈도 또는 법적 요구 시에만 접근 |
보관 기간 | 단기 또는 중기 | 장기 (법적 또는 규제 요구 사항에 따라 다름) |
데이터 복구 속도 | 빠른 복구 가능 | 복구가 느리거나 복잡할 수 있음 |
중복 데이터 관리 | 중복 데이터를 허용 (최신 상태 유지) | 중복 없이 단일 복사본만 저장 |
규제 | 컴플라이언스 의 규제에 부적당 | 보관주기 검색, 가용성,데이터의 보호 등 컴플라이언스에 적절 |
사용 예 | 시스템 고장 시 복구, 랜섬웨어 공격 후 복원 | 규제 준수를 위한 금융 기록 보관, 법적 보존 |
요약
- 백업은 데이터 손실에 대비한 즉각적인 복구를 위해 데이터를 복사해두는 방식입니다.
- 아카이브는 오래된 데이터를 장기적으로 보존하기 위한 전략으로, 규제 준수나 법적 요구에 의해 활용됩니다.
데이터 아카이빙의 필요성
백업의 중요성은 아무리 강조해도 지나치지 않다. 문제는 증가하는 데이터의 양이다. 커져가는 데이터는 주기억장치의 성능저하와 비용 증가의 문제를 동시에 초래하며 그 양과 비례해 백업데이터의 양도 많아지게 된다.
문제는 이러한 데이터의 대부분은 생성된 후 다시 쓰이지 않는다는 것이다. 이러한 문제점을 해결하기 위한 기술이 아카이브이다.
데이터 보관 규정을 만족하면서 주기억장치의 부하와 비용을 개선하고 백업데이터의 양을 줄여 백업윈도우(백업소요시간)을 줄여주는 목표를 수행한다.
여기까지만 보면 보관할 데이터를 정해서 보관하는게 백업과 크게 다른 점이 크게 와닿지는 않는다. 하지만 데이터 보관 규정과 이를 위한 아카이브 하드웨어를 보면 아 그래서 이런 방법을 수행하는구나 쉽게 알 수 있다.
다음에는 똑같이 데이터를 저장하는 백업과 달리 아카이브는 어떤 방식을 수행하면 비용의 절감 및 데이터 보관 규정에 더 적합할 수 있는지 알아볼 것입니다.