『問題解決型』ハードウェアメーカー
ファナティック
-
- ファナティックの特長 ファナティックの特長
- /
- 製品&ソリューション 製品&ソリューション
- /
- 導入事例 導入事例
- /
- 最新ニュース 最新ニュース
- /
- ファナティックレポート ファナティックレポート
- /
- サポート サポート
- /
- 会社案内 会社案内
- /
- 採用情報 採用情報
2020.12.17 ベンチマークレポート
前回に続き、NVIDIA GeForce RTX 3090のディープラーニング検証結果を報告します。
Dockerに最新バージョンの20.10.0を利用し、あらためて1基~4基搭載時のベンチマークを測定しました。
[総評]
前世代のRTX 2080 Tiと比較して、非常に優れた性能を発揮します。
また、期待どおりのスケールアウトが得られました。
当社ワークステーションでは、温度超過によるパフォーマンス低下も認められませんでした。
[詳細]
・OS:Ubuntu 20.04.1 LTS
・GeForce Driver:455.45.01
・CUDA 11.1
・Docker 20.10.0
ResNet50 混合精度トレーニング ON
(fp16 Batch192)
ResNet50 混合精度トレーニング OFF
(fp32 Batch96)
Tensorflowの学習ベンチマーク結果ではRTX 2080Tiの1.3~1.6倍、
Tensorコアの活用次第でV100Sと互角以上のパフォーマンスを発揮しました。
また、RTX 3090を複数搭載した場合の学習効率は、
・2基搭載:1.8倍
・3基搭載:2.6倍
・4基搭載:3.5倍
でした。