FANATIC REPORT ファナティックレポート

NVIDIA RTX 4090 vs RTX 3090 ベンチマーク比較 ~TensorFlow 学習ベンチマーク(ResNet50)~

2023.03.07 ベンチマークレポート


【速報】 NVIDIA RTX 4090 vs RTX 3090ベンチマーク比較 ~TensorFlow 学習ベンチマーク(ResNet50) ~

NVIDIA RTX 4090の実機によるベンチマーク検証を行ないました。前世代RTX 3090との比較による性能差をご覧ください。

 

[総評]
前世代のRTX 3090と比較して、非常に優れた性能を発揮します。

 

[RTX 4090/RTX 3090仕様]

RTX 4090 RTX 3090
GPUアーキテクチャ Ada Lovelace Ampere
CUDAコア 16,384 10,496
Tensorコア 512(Gen 4) 82(Gen 3)
RTコア 128(Gen 3) 328(Gen 2)
メモリサイズ 24 GB GDDR6X 24 GB GDDR6X
メモリバンド幅 1008 GB/s 936 GB/s
ディスプレイ ポート DisplayPort 1.4a x3 DisplayPort 1.4a x3
最大消費電力 450 W 350 W
グラフィックス バス PCIe Gen 4 x 16 PCIe Gen 4 x 16

 

[詳細]

■TensorFlow 学習ベンチマーク(ResNet50)

●RTX 4090
・OS:Ubuntu 22.04.1LTS
・Driver:525.60.13
・CUDA 11.8
・Docker 20.11.tf1.py3

●RTX 3090
・OS:Ubuntu 20.04.1LTS
・Driver:455.45.01
・CUDA 11.1
・Docker 20.11.tf1.py3

 

ResNet50 混合精度トレーニング ON
(fp16 Batch192)

 

ResNet50 混合精度トレーニング OFF
(fp32 Batch96)

 

Tensorflowの学習ベンチマーク結果では、RTX 4090とRTX 3090各1基搭載時の比較では約1.6~1.7倍、2基搭載時でも約1.6倍のパフォーマンス向上が見られます。
また、RTX 4090を1基搭載した場合と2基搭載した場合の比較では約1.8~1.9倍の性能となり、投資に見合った効果が期待できるものといえます。

なお、NVIDIA RTX 4090の動作は下記の各モデルで検証済です。どうぞお気軽にお問い合わせください。
●インテル Xeon(Ice Lake-SP)/RTX A6000(NVLink)搭載ワークステーション【WST8200-IL4】
●GPU搭載ミドルタワーデスクトップPC(第13世代インテル Core i)【Deep Flex-Rapid】
●AIワークステーション「Deep Flex(ディープ・フレックス)」

引き続き検証を行っておりますのであらたな結果がご報告できるタイミングで随時公開してまいります。どうぞご期待ください!

AI基盤づくりのためのワークステーション・サーバー
生産現場のAI活用 学習用ワークステーションから推論用エッジPCまで
機械学習 オーダーメイドで応える、NVIDIA® RTX™ A6000搭載 ワークステーション・サーバー

人気レポートランキング

レポートカテゴリ

製品カテゴリ