FANATIC REPORT ファナティックレポート

【ベンチマーク(完全版)】NVIDIA GeForce RTX 3090 TensorFlow 学習ベンチマーク(ResNet50) ~RTX 3090 8基搭載 ~

2021.01.19 ベンチマークレポート


【ベンチマーク(完全版)】NVIDIA GeForce RTX 3090 TensorFlow 学習ベンチマーク(ResNet50) ~RTX 3090 8基搭載 ~

NVIDIA GeForce RTX 3090を8基搭載可能なモデルのリリースにあわせてディープラーニング検証結果を報告します。1~8まで搭載基数ごとのパフォーマンスをご覧下さい。

[総評]
これまで行ってきたGeForce RTX 3090複数搭載時のベンチレポートと同じくスケールアウトすることが確認できました。また、8基搭載時でバッチサイズを384にしたときには10338.6/sという結果が得られました。

 

[詳細]

■TensorFlow 学習ベンチマーク(ResNet50)

・OS:Ubuntu 20.04.1 LTS
・GeForce Driver:455.45.01
・CUDA 11.1
・Docker 20.11.tf1.py3

 

ResNet50(fp16 Batch192/Batch256/Batch384)
※画像をクリックすると拡大します。
RTX 3090 TensorFlow 学習ベンチマーク グラフ1

 

ResNet50(fp32 Batch192/Batch256/Batch384)
※画像をクリックすると拡大します。
RTX 3090 TensorFlow 学習ベンチマーク グラフ2

 

AI基盤づくりのためのワークステーション・サーバー
生産現場のAI活用 学習用ワークステーションから推論用エッジPCまで
機械学習 オーダーメイドで応える、NVIDIA® RTX™ A6000搭載 ワークステーション・サーバー

人気レポートランキング

レポートカテゴリ

製品カテゴリ