FANATIC REPORT ファナティックレポート

【速報】 NVIDIA RTX 3090 vs RTX 2080 Ti vs V100S ベンチマーク比較 ~TensorFlow 学習ベンチマーク(ResNet50), OctaneBench ~

2020.10.28 ベンチマークレポート


【速報】 NVIDIA RTX 3090 vs RTX 2080 Ti vs V100S ベンチマーク比較 ~TensorFlow 学習ベンチマーク(ResNet50), OctaneBench ~

NVIDIA RTX 3090の実機によるベンチマーク検証を行ないました。
以下に結果を公表いたします。

[総評]
前世代のRTX 2080 Tiと比較して、非常に優れた性能を発揮します。
当社ワークステーションでは、温度超過によるパフォーマンス低下も認められませんでした。
なおソフトウェア環境のサポートが完全ではないため、ベンチマークの成績は暫定値と判断しております。

※11月2日 RTX 3090 4基搭載時のベンチマーク結果を追加掲載いたしました。

 

[詳細]

■TensorFlow 学習ベンチマーク(ResNet50)

・OS:Ubuntu 20.04.1LTS
・GeForce Driver:455.23.05
・CUDA 11.1
・Docker 19.03.13

 

ResNet50 混合精度トレーニング ON
(fp16 Batch192)

 

ResNet50 混合精度トレーニング OFF
(fp32 Batch96)


Tensorflowの学習ベンチマーク結果ではRTX 2080Tiの1.3~1.6倍、
Tensorコアの活用次第でV100Sと互角以上のパフォーマンスを発揮しました。
RTX 3090を2基搭載することで、学習効率が1.7~1.8倍でした。

 

■OctaneBench

・Octane version:2020.1.5
・OS:Windows10 Pro 64bit DSP (2004)
・GeForce Driver:456.71

 

GPU Score RTX 2080Ti比 GPU消費電力 アーキテクチャ
RTX 3090 x4 2634.272233 7.6 1392 Ampere
RTX 3090 x3 1969.745666 5.7 1044 Ampere
RTX 3090 x2 1305.581235 3.8 700 Ampere
RTX 3090 x1 654.729713 1.9 350 Ampere
RTX 2080Ti x1 346.324501 1 240 Turing
V100S x1(参考) 150.8019643 0.4 Volta

Ampere世代となったRTX 3090ではTDP上限で連続稼働しており、内部コアの実力を十二分に発揮している状態と考えられます。
当社ワークステーションの場合、標準的な環境温度であればTDP上限でもオーバークロック状態を持続し、熱による性能低下は発生いたしませんでした。

RTX 3090は、前世代GPUであるRTX 2080 Tiとの比較においても約2倍の性能を発揮しております。
OctaneBenchでは搭載した枚数の数だけ性能がスケールしており、投資に見合った効果が期待できます。

比較としてV100Sのスコアを掲載しておりますが、RTXコアを活用するベンチマークはVolta世代のGPUにとってはミスマッチであり、GPU本来の性能を発揮できません。参考値としてお考えいただければ幸いです。

後日、4基構成での検証結果を公開予定です。
ご期待ください!

人気レポートランキング

レポートカテゴリ

製品カテゴリ