【ベンチマーク(更新)】NVIDIA GeForce RTX 3090 4基 TensorFlow 学習ベンチマーク(ResNet50) ～RTX 3090 vs RTX 2080 Ti vs V100S 比較～

【ベンチマーク(更新)】NVIDIA GeForce RTX 3090 4基　TensorFlow 学習ベンチマーク(ResNet50)　～RTX 3090 vs RTX 2080 Ti vs V100S 比較～

2020.12.17　ベンチマークレポート

【ベンチマーク(更新)】NVIDIA GeForce RTX 3090 4基　TensorFlow 学習ベンチマーク(ResNet50)　～RTX 3090 vs RTX 2080 Ti vs V100S 比較～

前回に続き、NVIDIA GeForce RTX 3090のディープラーニング検証結果を報告します。
Dockerに最新バージョンの20.10.0を利用し、あらためて1基～4基搭載時のベンチマークを測定しました。

[総評]
前世代のRTX 2080 Tiと比較して、非常に優れた性能を発揮します。
また、期待どおりのスケールアウトが得られました。
当社ワークステーションでは、温度超過によるパフォーマンス低下も認められませんでした。

[詳細]

■TensorFlow 学習ベンチマーク（ResNet50）

・OS：Ubuntu 20.04.1 LTS
・GeForce Driver：455.45.01
・CUDA 11.1
・Docker 20.10.0

ResNet50 混合精度トレーニング ON
（fp16 Batch192）

ResNet50 混合精度トレーニング OFF
（fp32 Batch96）

Tensorflowの学習ベンチマーク結果ではRTX 2080Tiの1.3～1.6倍、
Tensorコアの活用次第でV100Sと互角以上のパフォーマンスを発揮しました。
また、RTX 3090を複数搭載した場合の学習効率は、
・2基搭載：1.8倍
・3基搭載：2.6倍
・4基搭載：3.5倍
でした。

WST8100-4【GPU（GeForce RTX 3090）搭載モデル（1CPU）】

WST8200-4【GPU（GeForce RTX 3090）搭載モデル（2CPU）】

『問題解決型』ハードウェアメーカー
ファナティック

FANATIC REPORT ファナティックレポート