『問題解決型』ハードウェアメーカー
ファナティック
-
- ファナティックの特長 ファナティックの特長
- /
- 製品&ソリューション 製品&ソリューション
- /
- 導入事例 導入事例
- /
- 最新ニュース 最新ニュース
- /
- ファナティックレポート ファナティックレポート
- /
- サポート サポート
- /
- 会社案内 会社案内
- /
- 採用情報 採用情報
2025.03.11 ベンチマークレポート
NVIDIA® GeForce RTX™ 5090(以下5090)を早速ベンチマークを実施する機会がございましたので、以下の通りレポートいたします。
比較として、同じ環境にて、GeForce RTX™ 4090(以下4090)もベンチマークを行っております。
[総評]
TensorFlowの学習では、4090と比較して、5090は約1.4倍性能向上していることがわかりました。
また、4090のベンチマークでは、実行可能な最大バッチサイズが384だったのに対して、5090では、512でも実行可能となっております。4090に対して、搭載されているメモリ容量が増えて(24GB⇒32GB)となっていることが、影響しているとわかる結果となりました。
ただし、消費電力は125W増加しており、推奨電源も1000Wとなっております。
既存環境でご利用される場合はご注意下さい。
[NVIDIA® GeForce RTX™ 5090/4090仕様]
NVIDIA® GeForce RTX™ 5090 | NVIDIA® GeForce RTX™ 4090 | |
アーキテクチャ | Blackwell | Ada Lovelace |
メモリー | 32GB GDDR7 | 24GB GDDR6X |
CUDAコア | 21760 | 16384 |
Tensorコア | 第5世代 | 第4世代 |
TDP | 575W | 450W |
■TensorFlow 学習ベンチマーク(ResNet50)
ベンチマーク環境
バージョン | |
OS | Ubuntu24.04.1 LTS |
NVIDIA Driver | 570.86.16 |
CUDA | 12.8 |
TensorFlow | 2.17.0 |
Dockerコンテナ | TensorFlow:25.01-tf2-py3 |
ResNet50 FP16 Batch 384 ※画像をクリックすると拡大します。
RTX4090: 1682
RTX5090: 2392.6(4090と比較して約1.4倍の向上)
ResNet50 FP16 Batch 384 ※画像をクリックすると拡大します。
RTX4090: 744.7
RTX5090: 1132.2(4090と比較して約1.52倍の向上)
[まとめ]
ECCなどの機能を有しておりませんが、コストを抑えて演算に利用いただけます。
本レポートでご紹介しましたNVIDIA® GeForce RTX™ 5090を搭載したワークステーションは、検証でき次第順次公開しますのでどうぞご期待ください。