ソリューション概要
Stratus everRun® SplitSite®(スプリットサイト)
地理的に離れたサイト間で可用性を担保(オプション機能)
災害は、自然災害であろうと人為的ミスであろうと物理的なデータセンターの機能停止につながる可能性があり、数日から数週間の間、ビジネスが機能しなくなるリスクがあります。規制対象の業界では、サイト全体の問題がデータ損失につながり、コンプライアンスのリスクが高まり、ダウンタイムのコストが大幅に増加する可能性があります。そのため、医薬品、製造業、金融サービスなどの規制対象業界の企業はeverRun SplitSite を利用して、すべてのデータが安全に複製され、いつでも利用可能な状態を維持できるようにしています。高額なコストとリソース不足のためにリカバリソリューションの導入を先延ばしにし、リスクを抱えている必要はありません。
everRun SplitSiteは、異なる建物やデータセンターにある物理的なマシンを使用して、局所的な停電や建物全体の問題からビジネスを保護します。everRun SplitSiteにより、1 つの場所で災害が発生しても、IT スタッフの介入なしに、別の場所でアプリケーションやデータをすぐに利用でき、最新かつ完全な状態で稼働させることができます。SplitSite構成では、地理的に離れた2つのサイトにある2台の物理マシン(PM)を接続します。everRunの SplitSite 機能により、everRunサーバが地理的に離れている場合やネットワーク スイッチによって離れている場合には、より高いレイテンシが発生しますが、ユーザーはアプリケーションを効率的に実行することができます。HA(高可用性)とFT(フォールトトレラント)保護レベルのどちらでも使用することができ、機能や可用性に制限はありません。シングルサイト構成の場合と同様に、everRun はディスクやネットワークの障害を自動的に検出し、それらを回避します。また、FT 保護機能を持つ仮想マシン(VM)の場合、everRunは、PM やサイトに障害が発生しても、ダウンタイムなしで VM を稼働させ続けます。障害が発生したサイトや PM がサービスに復帰すると、everRun は自動的にディスクドライブと VM のメモリを再同期します。
everRun SplitSiteは、ハードウェアの冗長性を維持し、物理的なマシンルームとそれを含む建物の冗長性を維持する耐障害性の高い導入を支援します。地理的に離れたサイト間をサポートするこの強力な耐障害性ソリューションは、洪水や停電などの大規模なダウンタイムからビジネスを保護します。everRun SplitSite は、一般的なリアクティブ リカバリ製品に関連するコストと複雑さを排除します。お客様は、マルチサイト災害復旧に代わるリアルタイムの代替手段としてeverRun SplitSiteを利用できます。

everRun SplitSiteの要件とライセンス
スプリットサイトには、多くの要因が関係するため、普遍的な距離制限はありません。ネットワーク スイッチが介在すると、待機時間が増加し、ノード間の接続が失われて「スプリット ブレイン」状態が発生する可能性が高くなります。SplitSite の構成では、スプリットブレイン障害のシナリオが追加される可能性が高くなるため、everRun SplitSite のすべて構成において、クォーラム サービスの利用が必要です。
スプリットサイトの構成では、最大遅延の仕様が適用されます。HAモードで稼働するVM の場合は往復 10ms 以下、FT モードで稼働するVM の場合は往復 2ms 以下の A-Link レイテンシが必要です。最大10kmまでの分離(1Gbpsファイバー使用)は、一般的なA-Linkネットワークトポロジーで、レイテンシ要件を満たすことができますが、個々のアプリケーションのパフォーマンスは、特定のアプリケーションに依存する可能性があります。
サポートには、クォーラム のライセンス利用とレイテンシ要件の順守が必要となり、それ以外のどのようなネットワーク機器やトポロジーにも対応します。一般的なネットワークでは、サーバー間の距離は 5km から 10km ですが、高速なネットワーク構成を持ち、物理マシンの距離が 50km 以上離れているサイト間でeverRun SplitSite を使用しているお客様もいます。
SplitSite の構成では、VM をシャットダウンする必要のある障害を最小限に抑え排除するために、コンポーネントの配置を慎重に計画する必要があります。SplitSite を正しく導入するためには、特定のトレーニングまたはプロフェッショナルサービスの支援が必要になる場合があります。ユーザーが SplitSite を使用する場合、また、SplitSite の設定に関するテクニカルサポートを受けるためには、別途ライセンス購入が必要です(アクティベーション機能を通じて SplitSite 構成を強制するものではありません)。SplitSite ライセンスを必要とする合理的な距離の区切りは、10m の物理的な距離と設定しています。
スプリットサイトとクォーラム サーバー
スプリットサイト構成ではクォーラム を使用する必要があります。これは、スプリットブレインによるデータ損失から保護し、2 番目のeverRunの物理マシンまたはサイトに障害が発生した場合に仮想マシンを安全に自動的に起動できるようにするためです。スプリットサイトの構成では、クォーラム サーバーが最低 1 台、最適には 2 台必要になります。これらのクォーラムサーバーは、2 つのeverRun ノードがお互いに通信を失い、スプリットブレインシナリオで動作する可能性のあるネットワーク障害から保護するために動作します。クォーラム サーバーを第 3 の場所に配置し、適切なクォーラム ネットワーキング設計を実装すると、クォーラム の可用性が向上し、物理マシンの強制的なシャットダウン シナリオを最小限に抑えることができます。

クォーラム サーバーが構成されていない場合、ネットワーク障害により、2 つのeverRun サーバーがお互いにすべての通信を失う可能性があります。クォーラム サーバーが構成されていれば、両方のノードで冗長化された VM は、クォーラム サーバーに相手の状態を尋ね、その応答に基づいて適切な処理を行います。クォーラム サーバーが応答しない場合、孤立した VM は自らシャットダウンします。もう一方のサーバー上のピア VM がクォーラム サーバーと接続している場合はいつでも、その VM は実行を継続します。両方の VM インスタンスは、障害が発生する前に、どちらのクォーラム サーバーを使用するか(選択するか)確認します。プライマリクォーラム サーバーが故障した場合、プライマリがサービスに復帰するまで、各ノードは代替のクォーラム サーバに切り替えます。障害のアクティブな管理中は、各ノードはクォーラム サーバーを切り替えることはできません。
クォーラム サーバーは、SplitSite の構成では特に重要です。SplitSite のベスト プラクティスは、第 3 の施設にプライマリ クォーラム サーバーを配置し、第 4 の施設にセカンダリ クォーラム サーバーを配置することを推奨しますが、同じ場所に設置してもサービスの利用は可能です。クォーラム サーバーは、スプリットブレインに対する VM の整合性を担保し、特定の障害発生後に VM を自動で起動できるようにします。 サーバーの通信は、管理ネットワークを介して行われます。
クォーラム サーバーは、専用のハードウェアが不要で、特別なネットワークレイテンシ要件もありません。これらはWindowsサービスとして実行され、24時間稼働しているコンピューターであれば、他の目的で使用されているWindows ワークステーションやサーバにインストールすることができます。ただし、クォーラム サービスを使用するeverRun システムの VM で サービスを実行することはできません。
詳細はこちら
クォーラム サービスは、everRun システムとは別の Windows マシン上に配置された、Windows オペレーティング システムベースのサービスです。クォーラム サーバーは、everRun 環境で特定の障害が発生した場合にデータの整合性を保証し、自動再起動機能を提供します。everRun PM のペアを、0 台、1 台、または 2 台のクォーラム サーバーで構成することができます。ストラタスでは、スプリットサイト運用の場合には、プライマリ クォーラム サーバーを 1 台と、セカンダリ クォーラム サーバーを 1 台設定することを強く推奨します。利用可能なサイトが 2 つ存在する場合、クォーラム はスプリットブレインのリスクを負うことなく、どちらかのサイトに配置することができます。ただし、1 つの PM がダウンし、稼働中の PM がクォーラム サーバーと通信できない場合(ダウンした PM と同じサイトでアクセスできないなど)、稼働中の VM は自動的にシャットダウンされ、スプリットブレインの可能性を回避します。
SplitSite の設定では、クォーラム 構成のベストプラクティスとして以下のようなものがあります。
- 第3の施設にプライマリ クォーラム サーバーを配置、第4のサイトにセカンダリを配置(または慎重に第3に配置)
- クォーラム サーバーは可能な限り隔離し、共通の(第三の)サイトに設置する場合は、共通の電源やネットワークスイッチに依存しないように構成すること。
- everRun PM とクォーラム サーバー間の物理的な接続は、他の PM のサイトを経由しないこと。
- クォーラム サーバーをeverRun PM と同じサイトに配置することで、データの整合性が担保されます。しかし、そのサイトに障害が発生した場合は、手動で復旧するまで VM をシャットダウンする必要があります (スプリットブレインを防止するため)。
- 管理ネットワークは、PM とクォーラム サーバーを物理的に接続します。各everRun PM が異なるゲートウェイを使用してクォーラム サーバーに到達するように設定することで、VM の可用性を最大限に高めることができます。2 つの PM が同じゲートウェイを使用してクォーラム サーバーに到達する場合、サイトの障害によってゲートウェイが故障し、手動で復旧するまで VM をシャットダウンする必要があります。
クォーラム サーバーの考慮事項
- クォーラム everRun サービスソフトウェアは、 Server 2016、Server 2012、Server 2008、 10、 7 を実行している汎用コンピュータまたはラップトップにインストールすることができます。Windows Windows Windows
- スプリットサイトにデプロイする場合、クォーラム サーバーはどちらかの PM と同じサイトに存在してはいけません。優先サーバーと代替クォーラム サーバーの両方が共通の理由で障害が発生した場合、VM は冗長性を優雅にダウングレードし、クォーラム サーバーが回復するまでの間、一方の PM を使用して運用を継続します。PM と選択されたクォーラム サーバーが共通の理由で故障した場合はいつでも、生き残った PM 上で動作している VM インスタンスをシャットダウンする必要があります。
- プライマリとセカンダリ クォーラム サーバーを共通のサイトに設置する必要がある場合は、別々の AC 電源(位相)から電源を供給するか、別々の UPS 装置で構成し、everRun システムがそれらにアクセスするために必要な共通のネットワークを最小限に抑える必要があります。
A-Linkネットワークの要件
- NICは1Gb以上、全て二重化されている必要があります。(10Gbの使用を推奨)
- プライベートネットワークに接続されているスイッチおよび/または光ファイバ・コンバータは、ノンルート、ノンブロッキングで、IPv6をサポートしている必要があります。
- FTモードで保護された仮想マシンを実行しているシステムでは、ノード間をつなぐA-Linkが以下を満たす必要があります。
- VMあたりの最低帯域幅は1Gbps
- 最大サイト間レイテンシー※2ms、往復時間
- HAモードで保護された仮想マシンのみを実行しているシステムでは、ノード間をつなぐA-Linkが以下を満たす必要があります。
- VMあたりの最低帯域幅は155Mbps
- 最大サイト間レイテンシ※10ms、往復時間
- 複数のA-Linkに共通カード(マルチポートNIC)を使用しないでください。
- A-Link は、専用のポイント・ツー・ポイント・ファイバー接続、または VLAN 上での接続が可能です。A-Linkポートの接続に使用するVLANは、2つのeverRun ノード間の通信をフィルタリングしてはいけません。
プライベートネットワークの要件
- NICは1Gb以上、全て二重化されている必要があります。
- スプリットサイト構成を導入する場合、プライベートネットワークをA-Linkと共有することはできません。
- プライベートネットワークは、専用のポイントツーポイントファイバー接続または、プライベート VLAN 上での接続が可能です。プライベートネットワークポートの接続に使用する VLAN は IPv6 をサポートし、2 つのeverRun ノード間の通信をフィルタリングしてはいけません。
ビジネスネットワークの要件
- everRun システムには、少なくとも 1 つのビジネスネットワークが必要です。同一VLAN上の両方のノードにビジネスネットワークを構成します。
- ノードは同じレイヤ2マルチキャストドメイン内にある必要があります。
- 各ノードのビジネスネットワークを、他のノードのスイッチとは別のスイッチに接続します。ビジネスネットワークポートの接続に使用する VLAN は IPv6 をサポートし、2 つのeverRun ノード間の通信をフィルタリングしてはいけません。
管理ネットワークの要件
- デフォルト設定では、管理ネットワークはビジネス ネットワークと共有されます。共有されていない場合は、ビジネス ネットワークのすべての要件が適用されます。
- リモート管理のための業務用LANへのゲートウェイの設定が必要です。
* ファイバーの 100 マイルごとに 1 ms でのレイテンシを計算し、さらに、ルート化されていないノンブロッキング・スイッチまたはファイバー・コンバータによって追加されるレイテンシを計算します。