『問題解決型』ハードウェアメーカー
ファナティック
-
- ファナティックの特長 ファナティックの特長
- /
- 製品&ソリューション 製品&ソリューション
- /
- 導入事例 導入事例
- /
- 最新ニュース 最新ニュース
- /
- ファナティックレポート ファナティックレポート
- /
- サポート サポート
- /
- 会社案内 会社案内
- /
- 採用情報 採用情報
2020.10.28 ベンチマークレポート
NVIDIA GeForce RTX 3090の実機によるベンチマーク検証を行ないました。
以下に結果を公表いたします。
[総評]
前世代のRTX 2080 Tiと比較して、非常に優れた性能を発揮します。
当社ワークステーションでは、温度超過によるパフォーマンス低下も認められませんでした。
なおソフトウェア環境のサポートが完全ではないため、ベンチマークの成績は暫定値と判断しております。
※2020年11月2日追記:RTX 3090 4基搭載時のベンチマーク結果を追加掲載いたしました。
※2020年12月17日追記:RTX 3090 4基搭載時のディープラーニング検証レポートを掲載しました。大変優れた結果が出ていますのでぜひご覧ください。
【ベンチマーク(更新)】NVIDIA GeForce RTX 3090 4基 TensorFlow 学習ベンチマーク(ResNet50) ~NVIDIA GeForce RTX 3090 vs RTX 2080 Ti vs V100S 比較 ~
※2021年1月19日追記:RTX 3090 8基搭載時のディープラーニング検証レポートを掲載しました。
【ベンチマーク(完全版)】NVIDIA GeForce RTX 3090 TensorFlow 学習ベンチマーク(ResNet50) ~RTX 3090 8基搭載 ~
[詳細]
・OS:Ubuntu 20.04.1LTS
・GeForce Driver:455.23.05
・CUDA 11.1
・Docker 19.03.13
ResNet50 混合精度トレーニング ON
(fp16 Batch192)
ResNet50 混合精度トレーニング OFF
(fp32 Batch96)
Tensorflowの学習ベンチマーク結果ではRTX 2080Tiの1.3~1.6倍、
Tensorコアの活用次第でV100Sと互角以上のパフォーマンスを発揮しました。
RTX 3090を2基搭載することで、学習効率が1.7~1.8倍でした。
・Octane version:2020.1.5
・OS:Windows10 Pro 64bit DSP (2004)
・GeForce Driver:456.71
GPU | Score | RTX 2080Ti比 | GPU消費電力 | アーキテクチャ |
RTX 3090 x4 | 2634.272233 | 7.6 | 1392 | Ampere |
RTX 3090 x3 | 1969.745666 | 5.7 | 1044 | Ampere |
RTX 3090 x2 | 1305.581235 | 3.8 | 700 | Ampere |
RTX 3090 x1 | 654.729713 | 1.9 | 350 | Ampere |
RTX 2080Ti x1 | 346.324501 | 1 | 240 | Turing |
V100S x1(参考) | 150.8019643 | 0.4 | – | Volta |
Ampere世代となったRTX 3090ではTDP上限で連続稼働しており、内部コアの実力を十二分に発揮している状態と考えられます。
当社ワークステーションの場合、標準的な環境温度であればTDP上限でもオーバークロック状態を持続し、熱による性能低下は発生いたしませんでした。
RTX 3090は、前世代GPUであるRTX 2080 Tiとの比較においても約2倍の性能を発揮しております。
OctaneBenchでは搭載した枚数の数だけ性能がスケールしており、投資に見合った効果が期待できます。
比較としてV100Sのスコアを掲載しておりますが、RTXコアを活用するベンチマークはVolta世代のGPUにとってはミスマッチであり、GPU本来の性能を発揮できません。参考値としてお考えいただければ幸いです。
後日、4基構成での検証結果を公開予定です。
ご期待ください!