NVIDIA RTX 4090 vs RTX 3090 ベンチマーク比較～TensorFlow 学習ベンチマーク(ResNet50)～

2023.03.07　ベンチマークレポート

【速報】 NVIDIA RTX 4090 vs RTX 3090ベンチマーク比較～TensorFlow 学習ベンチマーク(ResNet50) ～

NVIDIA RTX 4090の実機によるベンチマーク検証を行ないました。前世代RTX 3090との比較による性能差をご覧ください。

[総評]
前世代のRTX 3090と比較して、非常に優れた性能を発揮します。

[RTX 4090／RTX 3090仕様]

	RTX 4090	RTX 3090
GPUアーキテクチャ	Ada Lovelace	Ampere
CUDAコア	16,384	10,496
Tensorコア	512(Gen 4)	82(Gen 3)
RTコア	128(Gen 3)	328(Gen 2)
メモリサイズ	24 GB GDDR6X	24 GB GDDR6X
メモリバンド幅	1008 GB/s	936 GB/s
ディスプレイポート	DisplayPort 1.4a x3	DisplayPort 1.4a x3
最大消費電力	450 W	350 W
グラフィックスバス	PCIe Gen 4 x 16	PCIe Gen 4 x 16

[詳細]

■TensorFlow 学習ベンチマーク（ResNet50）

●RTX 4090
・OS：Ubuntu 22.04.1LTS
・Driver：525.60.13
・CUDA 11.8
・Docker 20.11.tf1.py3

●RTX 3090
・OS：Ubuntu 20.04.1LTS
・Driver：455.45.01
・CUDA 11.1
・Docker 20.11.tf1.py3

ResNet50 混合精度トレーニング ON
（fp16 Batch192）

ResNet50 混合精度トレーニング OFF
（fp32 Batch96）

Tensorflowの学習ベンチマーク結果では、RTX 4090とRTX 3090各1基搭載時の比較では約1.6～1.7倍、2基搭載時でも約1.6倍のパフォーマンス向上が見られます。
また、RTX 4090を1基搭載した場合と2基搭載した場合の比較では約1.8～1.9倍の性能となり、投資に見合った効果が期待できるものといえます。

なお、NVIDIA RTX 4090の動作は下記の各モデルで検証済です。どうぞお気軽にお問い合わせください。
●インテル Xeon(Ice Lake-SP)／RTX A6000(NVLink)搭載ワークステーション【WST8200-IL4】
●GPU搭載ミドルタワーデスクトップPC（第13世代インテル Core i）【Deep Flex-Rapid】
●AIワークステーション「Deep Flex（ディープ・フレックス）」

引き続き検証を行っておりますのであらたな結果がご報告できるタイミングで随時公開してまいります。どうぞご期待ください！