【速報】 NVIDIA GeForce RTX 3090 vs RTX 2080 Ti vs V100S ベンチマーク比較～TensorFlow 学習ベンチマーク(ResNet50), OctaneBench ～

2020.10.28　ベンチマークレポート

【速報】 NVIDIA GeForce RTX 3090 vs RTX 2080 Ti vs V100S ベンチマーク比較～TensorFlow 学習ベンチマーク(ResNet50), OctaneBench ～

NVIDIA GeForce RTX 3090の実機によるベンチマーク検証を行ないました。
以下に結果を公表いたします。

[総評]
前世代のRTX 2080 Tiと比較して、非常に優れた性能を発揮します。
当社ワークステーションでは、温度超過によるパフォーマンス低下も認められませんでした。
なおソフトウェア環境のサポートが完全ではないため、ベンチマークの成績は暫定値と判断しております。

※2020年11月2日追記：RTX 3090 4基搭載時のベンチマーク結果を追加掲載いたしました。

※2020年12月17日追記：RTX 3090 4基搭載時のディープラーニング検証レポートを掲載しました。大変優れた結果が出ていますのでぜひご覧ください。
【ベンチマーク(更新)】NVIDIA GeForce RTX 3090 4基　TensorFlow 学習ベンチマーク(ResNet50)　～NVIDIA GeForce RTX 3090 vs RTX 2080 Ti vs V100S 比較～

※2021年1月19日追記：RTX 3090 8基搭載時のディープラーニング検証レポートを掲載しました。
【ベンチマーク(完全版)】NVIDIA GeForce RTX 3090 TensorFlow 学習ベンチマーク(ResNet50)　～RTX 3090 8基搭載～

[詳細]

■TensorFlow 学習ベンチマーク（ResNet50）

・OS：Ubuntu 20.04.1LTS
・GeForce Driver：455.23.05
・CUDA 11.1
・Docker 19.03.13

ResNet50 混合精度トレーニング ON
（fp16 Batch192）

ResNet50 混合精度トレーニング OFF
（fp32 Batch96）

Tensorflowの学習ベンチマーク結果ではRTX 2080Tiの1.3～1.6倍、
Tensorコアの活用次第でV100Sと互角以上のパフォーマンスを発揮しました。
RTX 3090を2基搭載することで、学習効率が1.7～1.8倍でした。

■OctaneBench

・Octane version：2020.1.5
・OS：Windows10 Pro 64bit DSP (2004)
・GeForce Driver：456.71

GPU	Score	RTX 2080Ti比	GPU消費電力	アーキテクチャ
RTX 3090 x4	2634.272233	7.6	1392	Ampere
RTX 3090 x3	1969.745666	5.7	1044	Ampere
RTX 3090 x2	1305.581235	3.8	700	Ampere
RTX 3090 x1	654.729713	1.9	350	Ampere
RTX 2080Ti x1	346.324501	1	240	Turing
V100S x1（参考）	150.8019643	0.4	–	Volta

Ampere世代となったRTX 3090ではTDP上限で連続稼働しており、内部コアの実力を十二分に発揮している状態と考えられます。
当社ワークステーションの場合、標準的な環境温度であればTDP上限でもオーバークロック状態を持続し、熱による性能低下は発生いたしませんでした。

RTX 3090は、前世代GPUであるRTX 2080 Tiとの比較においても約2倍の性能を発揮しております。
OctaneBenchでは搭載した枚数の数だけ性能がスケールしており、投資に見合った効果が期待できます。

比較としてV100Sのスコアを掲載しておりますが、RTXコアを活用するベンチマークはVolta世代のGPUにとってはミスマッチであり、GPU本来の性能を発揮できません。参考値としてお考えいただければ幸いです。

後日、4基構成での検証結果を公開予定です。
ご期待ください！

WST8100-4【GPU（GeForce RTX 3090）搭載モデル（1CPU）】

WST8200-4【GPU（GeForce RTX 3090）搭載モデル（2CPU）】

『問題解決型』ハードウェアメーカー
ファナティック

FANATIC REPORT ファナティックレポート