60-9609-70 グラフィックカード NVIDIA H100 NVL PCI-e
[NVIDIA]
特徴
- 革新的な機械学習性能・・・H100は第4世代TensorコアとFP8精度で混合エキスパート(MoE)モデルのトレーニングを前世代比で最大9倍高速化するTransformer Engineを備えます。小規模環境から大規模な統合GPUクラスターまで、効率的なスケーラビリティが可能です。
- リアルタイムでのディープラーニング推論・・・第4世代Tensorコアを搭載し、FP64、TF32、FP32、FP16、INT8からFP8まで、あらゆる精度を高速化し、大規模な言語モデルで精度を維持しながら、メモリ消費を削減して性能向上を実現します。
- HPCアプリケーションのパフォーマンスを向上・・・H100は倍精度Tensorコアの演算速度を3倍に向上させ、HPCでは60 teraFLOPSのFP64コンピューティングを実現。AIと統合されたHPCアプリケーションでは、TF32精度を利用し、単精度行列乗算演算で1 petaFLOPのスループットを達成。さらにDPX命令を備え、前世代から飛躍的な高速化を実現しています。
- GPUリソースを効率的に配分・・・第2世代マルチインスタンスGPU(MIG)によって最大7つのインスタンスを分割でき、各GPUの利用率を最大化。コンフィデンシャルコンピューティング対応のH100では、マルチテナントをE2Eで安全に利用可能。クラウドサービスプロバイダー(CSP)環境での利用に適しています。
仕様
- アーキテクチャ:Hopper
- プロセスルール:4nm(TSMC)
- 倍精度性能:FP64:26 teraFLOPS
- 単精度性能:FP64 Tensor Core:51 teraFLOPS
- 半精度性能:FP32:378teraFLOPS
- Bfloat16:756 teraFLOPS | 1、513 teraFLOPS *疎性
- 整数性能:1、513 TOPS | 3、025 TOPS *疎性
- GPUメモリ:80GB HBM3
- メモリ帯域:2.0TB/s
- ECC:有効
- グラフィックスパス:PCI-Express 5.0 x16:128GB/s
- マルチインスタンス:最大7GPU
- 最大消費電力:350W(注)
- 冷却方法:Passive
- NVLink:対応 600GB/s
- 概形寸法:2スロットサイズ