『問題解決型』ハードウェアメーカー
ファナティック
-
- ファナティックの特長 ファナティックの特長
- /
- 製品&ソリューション 製品&ソリューション
- /
- 導入事例 導入事例
- /
- 最新ニュース 最新ニュース
- /
- ファナティックレポート ファナティックレポート
- /
- サポート サポート
- /
- 会社案内 会社案内
- /
- 採用情報 採用情報
2023.03.07 ベンチマークレポート
NVIDIA RTX 4090の実機によるベンチマーク検証を行ないました。前世代RTX 3090との比較による性能差をご覧ください。
[総評]
前世代のRTX 3090と比較して、非常に優れた性能を発揮します。
[RTX 4090/RTX 3090仕様]
RTX 4090 | RTX 3090 | |
GPUアーキテクチャ | Ada Lovelace | Ampere |
CUDAコア | 16,384 | 10,496 |
Tensorコア | 512(Gen 4) | 82(Gen 3) |
RTコア | 128(Gen 3) | 328(Gen 2) |
メモリサイズ | 24 GB GDDR6X | 24 GB GDDR6X |
メモリバンド幅 | 1008 GB/s | 936 GB/s |
ディスプレイ ポート | DisplayPort 1.4a x3 | DisplayPort 1.4a x3 |
最大消費電力 | 450 W | 350 W |
グラフィックス バス | PCIe Gen 4 x 16 | PCIe Gen 4 x 16 |
[詳細]
●RTX 4090
・OS:Ubuntu 22.04.1LTS
・Driver:525.60.13
・CUDA 11.8
・Docker 20.11.tf1.py3
●RTX 3090
・OS:Ubuntu 20.04.1LTS
・Driver:455.45.01
・CUDA 11.1
・Docker 20.11.tf1.py3
ResNet50 混合精度トレーニング ON
(fp16 Batch192)
ResNet50 混合精度トレーニング OFF
(fp32 Batch96)
Tensorflowの学習ベンチマーク結果では、RTX 4090とRTX 3090各1基搭載時の比較では約1.6~1.7倍、2基搭載時でも約1.6倍のパフォーマンス向上が見られます。
また、RTX 4090を1基搭載した場合と2基搭載した場合の比較では約1.8~1.9倍の性能となり、投資に見合った効果が期待できるものといえます。
なお、NVIDIA RTX 4090の動作は下記の各モデルで検証済です。どうぞお気軽にお問い合わせください。
●インテル Xeon(Ice Lake-SP)/RTX A6000(NVLink)搭載ワークステーション【WST8200-IL4】
●GPU搭載ミドルタワーデスクトップPC(第13世代インテル Core i)【Deep Flex-Rapid】
●AIワークステーション「Deep Flex(ディープ・フレックス)」
引き続き検証を行っておりますのであらたな結果がご報告できるタイミングで随時公開してまいります。どうぞご期待ください!