Amazon EC2 Hpc6aインスタンス
2021年11月18日にBlogで事前予告されていたHPC専用のインスタンスですが、2022年1月10日に一般向けに提供を開始しました。インスタンス名は「Hpc6a」で、数値流体力学・分子動力学・気象シミュレーション・有限要素解析等の計算・分析ワークロードを想定し、最適化されています。 【参考】:Coming soon: dedicated HPC instances and hybrid functionality 【参考】:Amazon EC2 Hpc6a インスタンスのご紹介
ハイパフォーマンスコンピューティングとは
Hpc6aは、ハイパフォーマンスコンピューティング(HPC)向けのインスタンスです。ここで言うHPCとは、数値計算を主とする数理分析の学術分野を指します。現在は汎用プロセッサをベースとした計算クラスタを構成し、利用する形態が増えてきています。そのためAWSにおいても、高速演算主体の用途で用いられるインスタンスが求められていました。
HPCサーバーの性能向上策
一般的にHPCサーバーでは、性能を高め処理の安定性を向上するために多くのチューニングを行い、システム全体の調整を行います。以下は代表的な項目となります。
・仮想化でパフォーマンスを発揮 HPCサーバーにおいても仮想化上に構築することが多く、いかに仮想環境でシステム資源を効率的に割り当てるかが重要です。
・低レイテンシー 極力ワークロードの遅延を抑えて、処理を高速実行するのかが重要です。そのため低レイテンシーでかつ高スループットや優先制御が求められます。
・プロセッサのジッターを制御 プロセッサの性能向上とともに、動作周波数は可変でより高負荷のコアに多く割り当てられることがあります。この調整はマルチコアのHPC環境では処理時間の不確実性(ジッター)を高めてしまい、レイテンシー増加を誘発することがあります。
これは好ましいことではありませんので、むしろ常に一定の周波数で処理が継続できるほうが全体の処理バランス向上につながることがあります。Hpc6aインスタンスにおいても、同時マルチスレッドを無効にし、ジッターの安定性を高めています。
・メモリ・ネットワークの有効活用 HPCクラスタでメモリを有効活用するために、極力ローカルメモリを使用しながら、ノード間共有の場合も、どのノードのメモリを使うか指定することもあります。ノード間通信の場合は、インターコネクトを高速化し対応していきます。その際もネットワーク遅延を最小化し、ジッターを抑えるチューニングがされていきます。
これらのチューニング要素の多くは、新しく提供されるHpc6aインスタンスで安定性と高速性の確保ができるものとして期待されています。
Hpc6aインスタンス概要
Hpc6aインスタンスは、Amazon EC2で指定可能なインスタンスの1つです。Amazon EC2は、AWSのサービスの主軸となるコンピュートサービスです。HPCの場合、多数のコアからなるクラスタリングで処理を分散させます。 【参考】:Amazon EC2 Hpc6a Instances
AWSのクラウドサービスでは、ワークロードの用途に応じた適切なインスタンスを利用することで、運用コストの削減と適正化が期待できます。
Hpc6aインスタンスの提供リージョン
Hpc6aのインスタンスは、米国東部のオハイオと米国西部のAWS GovCloudのリージョンでサービス提供されます。単一のアベイラビリティーゾーンからインスタンスにアクセスします。オンデマンドおよびDedicated Hosting(Savings Plans)で利用できます。
利用するには、インスタンス名で「hpc6a.48xlarge」を指定します。CPU(物理コア)は96、メモリは384GiBです。ネットワーク帯域幅は最大100GbpsのEFAを利用します。アタッチストレージはEBSのみです。
Hpc6aインスタンスの特長
Hpc6aインスタンスは、HPC用途で最高のパフォーマンスが発揮できるようにインスタンスが設定されています。具体的には以下の特長があります。
・AMDプロセッサの採用 Hpc6aインスタンスは、7nmプロセスのAMD EPYC 7003シリーズプロセッサを採用しています。ノード上に構築された2つの48コアから成る合計96コアの384GBのメモリを搭載しています。コアあたり4 GBメモリが搭載されており、高い演算性能が求められるHPC用途に対応できる性能が得られます。
・高性能ネットワーキングとストレージ 最新世代のAWS NitroカードとEFAで、最大100Gbpsのネットワークスループットを実現します。ストレージにおいても、Amazon FSx for Lusterによりミリ秒未満のレイテンシーと秒あたり最大数百ギガバイトのスループットも可能です。 【参考】:Elastic Fabric Adapter 【参考】:AWS Nitro System
Hpc6aインスタンスのメリット
Hpc6aインスタンスは、AWSにおけるHPC利用者に多くのメリットがあります。
・価格パフォーマンスを大幅に向上 AMD EPYC 7003は、「チップレットアーキテクチャ」という最新設計技術を採用しています。高い微細化技術によりチップ当たりの消費電力削減と、低価格化が実現されています。Hpc6aインスタンスではこのAMDプロセッサを採用し、価格パフォーマンスを大幅に向上しました。そのため、コンピューティング用途の一般的なx86のインスタンスと比較して、コストが最大70%低減できます。
・高速ネットワークの対応 Elastic Fabric Adapterとは、AWS EC2で提供される高速ネットワークインターフェイスです。100 Gbps Elastic Fabric Adapter(EFA)の高いネットワークスループットと低遅延(低レイテンシー)の特性が、HPC領域のワークロードに活用できます。MPIが利用可能で、かつOSバイパス機能により高いレイテンシーとスループットが得られます。
データ処理や演算におけるネットワーク転送時間を大幅に短縮し、全体のワークロード処理時間を大幅に短縮できます。
・運用の効率化 HPCクラスター管理ツールであるAWS ParallelClusterを用いることにより、他のインスタンスタイプとHpc6aインスタンスを一緒にプロビジョニングできます。クラスター内のさまざまなワークロードに最適なインスタンスを活用し、全体効率を高めることができます。 【参考】:AWS ParallelCluster
・リソースの占有と効率的利用 Hpc6aインスタンスは 、AWS Nitro System上に構築されています。AWS Nitro Systemでは、専用ハードウェアと軽量ハイパーバイザーの組み合わせで、ホストハードウェアのコンピューティングとメモリリソースをインスタンスに提供します。そのため、ハードウェアの資源を最適にワークロードに割り当てることができます。 【参考】:AWS Nitro Systemに於けるベアメタルインスタンスの性能
Hpc6aインスタンスのベンチマーク結果
AWSのBlogで公開している、「シーメンス Simcenter STAR-CCM+ 車載 CFD シミュレーション」のベンチマーク結果によると、HPC6aがEFAネットワーキングを利用して最大400ノードまで約100%のスケーリングが可能ということです。コア数では約40,000コアで測定されました。
ベンチマークシステムのサービスコストはインテルのインスタンスと比較して、約70%低いコストで実装可能となりました。 【参考】:ハイパフォーマンスコンピューティング向けに最適化された Amazon EC2 HPC6a インスタンス
日本リージョン解禁に向けて事前準備をしましょう
AWSは最大のクラウドサービス事業者で、汎用ワークロードや機械学習・AI・IoT等多岐に渡る用途に対応します。
今回のインスタンス提供開始で、大規模HPCでもAWSの利用者が拡大すると見込まれます。日本リージョン(東京・大阪)でのサービス提供は今しばらく待つことになりますが、この利用拡大が続くAWSを活用するために事前準備をおすすめします。
編集部オススメコンテンツ
アンドエンジニアへの取材依頼、情報提供などはこちらから