솔루션 개요
Stratus everRun® SplitSite®
메트로 전역 가용성 보호
자연적이든 인위적이든 모든 재해는 물리적 데이터 센터의 완전한 손실을 초래할 수 있으며 그로 인해 며칠 또는 몇 주까지 비즈니스가 마비될 수 있습니다. 규제 산업에서는 사이트 전반의 문제가 규제 위반의 위험이 따르는 데이터 손실로 이어질 수 있으므로 다운타임 비용이 크게 증가합니다. 바로 이런 이유로 제약, 제조, 금융 서비스 등 규제 업종의 기업들이 everRun SplitSite 보호 기능을 사용해 모든 데이터를 안전하게 복제하여 상시적 가용성을 확보하는 것입니다. 높은 비용과 까다로운 리소스 요구로 인해 복구 솔루션 구현을 여전히 미루고 있는 조직도 이제 더 이상 위험을 감내할 필요가 없습니다.
everRun SplitSite는 지역적 정전 및 건물 내부 문제로부터 고객 비즈니스를 보호할 뿐 아니라 다른 건물이나 데이터 센터에 위치한 물리적 시스템까지 보호합니다. everRun SplitSite를 사용하면 한 위치에서 재해가 발생했을 때 애플리케이션 및 데이터를 즉시 사용할 수 있으며 이를 최신 상태로 유지하고 IT 직원의 개입 없이 다른 위치에서 완전히 운용할 수 있습니다. SplitSite는 지리적으로 떨어진 두 사이트에 있는 두 개의 물리적 컴퓨터(PM)를 연결합니다. SplitSite는 동기 복제를 사용하여 두 사이트에서 애플리케이션 가용성을 제공합니다. everRun의 SplitSite를 통해, everRun 서버가 지리적으로 또는 네트워크 스위치에 의해 분리되어 지연 시간이 길어진 경우에도 고객은 애플리케이션을 효율적으로 실행할 수 있습니다. HA 고가용성(HA)과 내결함성(FT) 지원 수준을 모두 선택할 수 있습니다. 또한 단일 사이트 구성과 마찬가지로, everRun은 디스크 및 네트워크 오류를 자동으로 감지하고 그에 맞추어 작동합니다. FT 지원 가상 시스템(VM)의 경우, PM 또는 사이트애 장애가 발생해도 everRun은 다운타임 없이 VM을 계속 실행합니다. 장애 사이트 또는 PM이 다시 서비스를 재개하는 경우 everRun은 디스크 드라이브와 VM 메모리를 자동으로 다시 동기화합니다.
everRun의 SplitSite는 하드웨어 이중화를 유지하는 재해 방지 시스템을 지원하며, 물리적 전산실 및 해당 컴퓨터가 위치한 건물의 이중화를 지원합니다. 강력한 재해 방지 솔루션으로써 지리적 분리를 지원하고 홍수나 정전 등 치명적 사건이 초래할 수 있는 심각한 다운타임로부터 비즈니스를 추가적으로 보호합니다. everRun SplitSite는 일반적인 반응형 복구 제품처럼 비싸거나 복잡하지 않습니다. 많은 고객이 대규모 캠퍼스나 대도시 환경에서 SplitSite를 다중 사이트 재해 복구의 실시간 대안으로 사용하고 있습니다.
SplitSite 요구 사항 및 라이선스
SplitSite의 거리 제한에는 다양한 요인이 작용할 수 있기 때문에 보편적인 거리 요구 사항은 없습니다. 중간 네트워크 스위치를 사용하면 지연 시간이 늘어나고 노드 간의 연결이 끊어져 '스플릿 브레인' 상태가 될 가능성이 높습니다. 또한 SplitSite 구성은 '스플릿 브레인' 장애 시나리오의 가능성이 더 높으므로 쿼럼 서비스를 사용해야 합니다.
SplitSite 구성은 최대 지연 시간 사양(HA VM의 왕복 A 링크 지연 시간 10m 이하, FT VM의 왕복 A 링크 지연 시간 2ms)을 따라야 합니다. 최대 10km(1Gbps 광케이블사용)의 분리는 지연 시간 요구 사항을 충족하는 일반적인 A 링크 네트워크 토폴로지입니다. 이 지연 시간 사양 하에서도 특정 애플리케이션에 따라 개별 애플리케이션 성능은 달라질 수 있습니다.
Stratus 지원의 유일한 조건은 라이선스 받은 쿼럼의 사용, 지연 시간 요구 사항 준수입니다. 그 외에는 모든 네트워킹 장비와 토폴로지를 수용합니다. 일반적인 주류 네트워크에서 서버 간 안전 거리는 5km~10km입니다. 그러나 Stratus의 일부 고객은 현재 PM이 서로 50km 이상 떨어진 시나리오에서 SplitSite를 성공적으로 사용하고 있습니다.
SplitSite 구성은 구성 요소의 배치를 신중하게 계획함으로써 VM이 종료되는 장애를 최소화하거나 제거해야 합니다. SplitSite를 올바르게 배포하려면 특정 교육이나 전문 서비스 지원이 필요할 것입니다. SplitSite를 사용하는 고객은 라이선스를 구매할 의무가 있습니다. 그러나 Stratus는 기능 활성화에 SplitSite를 강제 적용하지 않습니다. 단, SplitSite 구성에 대한 기술 지원을 받으려면 SplitSite 라이선스가 필요합니다. Stratus는 SplitSite 라이선스가 필요한 합리적 거리 한계로 10m의 물리적 분리를 적용하고 있습니다.
SplitSite 및 쿼럼 서버
보조 everRun PM 또는 사이트가 실패할 경우 데이터 손실(스플릿 브레인으로 인한)을 방지하고 VM을 안전하게 자동 활성화하려면 SplitSite 구성에 쿼럼을 사용해야 합니다. SplitSite 구성에 필요한 쿼럼 서버는 하나 이상이며, 두 개가 최적입니다. 이 서버는 네트워크 장애로 인해 두 everRun 노드 간의 연결이 차단되면서 스플릿 브레인 상태로 작동할 가능성을 방지합니다. 제 3의 위치에 쿼럼 서버를 배치하고 적절한 쿼럼 네트워킹 설계를 구현하면 쿼럼 가용성이 향상되고 강제적인 VM 셧다운 시나리오가 최소화됩니다.
쿼럼 서버가 구성되지 않으면 네트워크 장애로 인해 두 everRun 서버 간의 통신이 모두 끊어집니다. 같은 상황에서 쿼럼 서버가 구성된 경우, 두 노드에 이중화된 VM이 쿼럼 서버에 피어의 상태를 요청하고 응답에 따라 적절한 조치를 취합니다. 쿼럼 서버가 응답하지 않으면 격리된 VM이 자동 종료됩니다. 다른 서버의 피어 VM이 쿼럼 서버와 연결되어 있는 한 이 작업이 계속 실행됩니다. 두 VM 인스턴스는 장애가 발생하기 전에 어느 쿼럼 서버를 사용(선택)할지에 대해 동의합니다. 기본 쿼럼 서버가 실패하는 경우, 노드는 기본 서버가 서비스를 재개할 때까지 대체 쿼럼 서버를 선택하기로 동의합니다. 장애를 적극적으로 관리하는 동안 노드는 쿼럼 서버를 전환할 수 없습니다.
쿼럼 서버는 SplitSite 구성에서 특히 중요합니다. SplitSite의 모범 사례는 기본 쿼럼 서버를 세 번째 시설에, 대체 쿼럼 서버를 네 번째 시설에 배치하는 것입니다. 그러나 대체 쿼럼 서버를 기본 쿼럼 서버와 함께 구성해도 만족스러운 서비스를 유지할 수 있습니다. 쿼럼 서버는 스플릿 브레인 발생 시 VM의 무결성을 보장하고 특정 장애 발생 후 VM의 자동 시작을 허용합니다. 쿼럼 서버 통신은 관리 네트워크를 통해 이루어집니다.
쿼럼 서버는 전용 하드웨어가 필요 없거나 특정 네트워크 지연 시간 요구 사항이 없습니다. Windows 서비스로 실행할 수 있으며 컴퓨터가 하루 24시간 실행되는 한 다른 용도로 사용되는 거의 모든 Windows 워크스테이션 또는 서버에 설치할 수 있습니다. 단, 쿼럼 서비스를 사용하는 동일한 everRun 시스템의 VM에서 쿼럼 서비스를 실행해서는 안 됩니다.
쿼럼 서버에 대한 자세한 정보
쿼럼 서비스는 everRun 시스템과는 별도로 Windows 시스템에 설치하는 Windows OS 기반 서비스입니다. 쿼럼 서버는 everRun 환경의 특정 장애에 대해 데이터 무결성을 보장하고 자동 재시작 기능을 제공합니다. everRun PM 한 쌍에 0, 1 또는 2개의 쿼럼 서버를 구성합니다. Stratus는 2대의 쿼럼 서버를 강력히 권장합니다. 즉, 기본 쿼럼 서버 1대와 특히 SplitSite 운영을 위한 대체 서버 1대로 구성하는 것입니다. 두 사이트만 사용할 수 있는 경우 스플릿 브레인의 위험 없이 사이트 중 하나에 쿼럼을 배치할 수 있습니다. 그러나 한 PM이 다운되고 남아 있는 PM도 쿼럼 서버와 통신할 수 없는 경우(다운된 PM과 동일한 사이트에서 액세스할 수 없기 때문), 남아 있는 사이트의 VM은 스플릿 브레인 시나리오의 가능성을 피하기 위해 자동으로 종료됩니다.
SplitSite 구성에서 쿼럼 구현의 모범 사례는 다음과 같습니다.
- 기본 쿼럼 서버가 세 번째 시설에, 대체 서버가 네 번째 사이트에 위치(또는 세 번째에 신중하게 배치)합니다.
- 쿼럼 서버는 가능한 한 분리하여 구성합니다. 두 서버 모두 공통(세 번째) 사이트에 위치해야 하는 경우, 공통 전원 또는 네트워크 스위치에 연결하지 않도록 합니다.
- everRun PM과 쿼럼 서버 간의 물리적 연결 경로가 다른 PM의 사이트를 통과해서는 안 됩니다.
- everRun PM 중 하나와 같은 사이트에 쿼럼 서버를 배치하면 데이터 무결성을 보장할 수 있습니다. 단, 해당 사이트에 장애가 발생하면 수동으로 복구할 때까지 VM을 종료해야 합니다(스플릿 브레인 방지).
- 관리 네트워크는 PM과 쿼럼 서버를 물리적으로 연결합니다. 각 everRun PM이 서로 다른 게이트웨이를 사용하여 쿼럼 서버에 도달하도록 구성하여 VM의 가용성을 극대화합니다. 두 PM이 동일한 게이트웨이로 쿼럼 서버에 도달하는 경우, 일부 사이트 장애로 인해 게이트웨이가 실패하고 VM은 수동으로 복구될 때까지 자동 종료해야 합니다.
쿼럼 서버 고려 사항
- 쿼럼 서비스 소프트웨어는 Windows Server 2016, Server 2012, Server 2008, Windows 10 또는 Windows 7을 실행하는 모든 범용 컴퓨터나 랩톱에 설치할 수 있으며, 100MB 이상의 디스크 공간 및 관리 네트워크를 통해 everRun 구성과 연결되는 네트워크 카드가 필요합니다.
- 쿼럼 서버를 SplitSite에 구현할 때, PM과 동일 사이트에 있어서는 안 됩니다. 기본 쿼럼 서버와 대체 쿼럼 서버가 공통된 이유로 모두 실패하는 경우, VM은 정상적으로 이중화 기능을 잃은 후 쿼럼 서버 복구를 기다리면서 한 PM만으로 계속 작동합니다. PM 및 선택된 쿼럼 서버가 공통 이유로 실패할 때마다 남아 있는 PM에서 실행 중인 VM 인스턴스는 자동 종료해야 합니다.
- 기본 및 대체 쿼럼 서버를 공통 사이트에 두어야 할 경우 별도의 AC 전원(상)에서 전원을 공급하거나 별도의 UPS 장치를 구성하여, everRun 시스템이 서버에 액세스하기 위해 필요한 공통 네트워킹을 최소화합니다.
A 링크 네트워크 요구 사항
- NIC는 최소 1Gb 이상이어야 하며 완전 이중화되어야 합니다. 가능한 한 10Gb를 사용합니다.
- 전용망에 연결된 스위치 및/또는 광컨버터는 비라우팅(non-routed), 비블로킹(non-blocking) 방식이어야 하며 IPv6을 지원해야 합니다.
- FT 지원 VM을 실행하는 시스템의 경우 A 링크 요구 사항은 다음과 같습니다.
- VM당 최소 대역폭 1Gbps
- 사이트 간 최대 지연 시간* 2ms, 왕복 시간
- HA 지원 VM만 실행하는 시스템의 경우 A 링크 요구 사항은 다음과 같습니다.
- VM당 최소 대역폭 155Mbps
- 사이트 간 최대 지연 시간* 10ms, 왕복 시간
- 다중 A 링크를 위한 공통 카드(멀티포트 NIC)를 사용하지 마십시오.
- A 링크는 전용 포인트-투-포인트 광연결이거나 VLAN에 구현할 수 있습니다. A 링크 포트를 연결하는 데 사용되는 VLAN은 두 everRun 노드 간의 통신을 필터링해서는 안 됩니다.
개인 네트워크 요구 사항
- NIC는 최소 1Gb 이상이어야 하며 완전 이중화되어야 합니다.
- SplitSite 구성을 구현할 때 A 링크와 개인 네트워크를 공유해서는 안 됩니다.
- 개인 네트워크는 전용 포인트-투-포인트 광연결이 될 수 있습니다. 그렇지 않으면, 개인 VLAN에 구성해야 합니다. 개인 네트워크 포트 연결에 사용하는 VLAN은 IPv6을 지원해야 하며 두 everRun 노드 사이의 통신을 필터링해서는 안 됩니다.
비즈니스 네트워크 요구 사항
- everRun 시스템에는 하나 이상의 비즈니스 네트워크가 필요합니다. 동일한 VLAN의 두 노드에 대해 비즈니스 네트워크를 구성합니다.
- 노드는 동일한 계층-2 멀티캐스트 도메인에 있어야 합니다.
- 각 노드의 비즈니스 네트워크를 다른 노드의 스위치와는 별개의 스위치에 연결합니다. 비즈니스 네트워크 포트를 연결하는 VLAN은 IPv6을 지원해야 하며 두 everRun 노드 사이의 통신을 필터링해서는 안 됩니다.
관리 네트워크 요구 사항
- 기본적으로 관리 네트워크는 비즈니스 네트워크와 공유됩니다. 공유되지 않으면, 비즈니스 네트워크의 모든 요구 사항을 그대로 적용합니다.
- 원격 관리를 위해 비즈니스 LAN에 게이트웨이를 구성합니다.
* 파이버 10마일당 1ms 지연 시간 + 비라우팅, 비블로킹 스위치 또는 파이버 컨버터에 의해 추가되는 지연 시간을 계산합니다.