FANATIC REPORT ファナティックレポート

【ベンチマーク(更新)】NVIDIA GeForce RTX 3090 4基 TensorFlow 学習ベンチマーク(ResNet50) ~RTX 3090 vs RTX 2080 Ti vs V100S 比較 ~

2020.12.17 ベンチマークレポート


【ベンチマーク(更新)】NVIDIA GeForce RTX 3090 4基 TensorFlow 学習ベンチマーク(ResNet50) ~RTX 3090 vs RTX 2080 Ti vs V100S 比較 ~

前回に続き、NVIDIA GeForce RTX 3090のディープラーニング検証結果を報告します。
Dockerに最新バージョンの20.10.0を利用し、あらためて1基~4基搭載時のベンチマークを測定しました。

[総評]
前世代のRTX 2080 Tiと比較して、非常に優れた性能を発揮します。
また、期待どおりのスケールアウトが得られました。
当社ワークステーションでは、温度超過によるパフォーマンス低下も認められませんでした。

 

[詳細]

■TensorFlow 学習ベンチマーク(ResNet50)

・OS:Ubuntu 20.04.1 LTS
・GeForce Driver:455.45.01
・CUDA 11.1
・Docker 20.10.0

 

ResNet50 混合精度トレーニング ON
(fp16 Batch192)

 

ResNet50 混合精度トレーニング OFF
(fp32 Batch96)


Tensorflowの学習ベンチマーク結果ではRTX 2080Tiの1.3~1.6倍、
Tensorコアの活用次第でV100Sと互角以上のパフォーマンスを発揮しました。
また、RTX 3090を複数搭載した場合の学習効率は、
・2基搭載:1.8倍
・3基搭載:2.6倍
・4基搭載:3.5倍
でした。

 

機械学習 オーダーメイドで応える、NVIDIA® RTX™ A6000搭載 ワークステーション・サーバー

人気レポートランキング

レポートカテゴリ

製品カテゴリ