『問題解決型』ハードウェアメーカー
ファナティック
-
- ファナティックの特長 ファナティックの特長
- /
- 製品&ソリューション 製品&ソリューション
- /
- 導入事例 導入事例
- /
- 最新ニュース 最新ニュース
- /
- ファナティックレポート ファナティックレポート
- /
- サポート サポート
- /
- 会社案内 会社案内
- /
- 採用情報 採用情報
2023.08.04 ベンチマークレポート
今回は、RTX 4000 SFF Adaの各種ベンチマークを実施しました。
RTX 4000 SFF Adaは最新のNVIDIA Ada Lovelace アーキテクチャであり、48基の第3世代RTコア、192基の第4世代Tensorコア、および6144基のCUDAコアを20GBの大容量メモリで統合し、さらに、コンパクトかつ消費電力70Wという高いワットパフォーマンスを持ちます。
RTX 4000 SFF Adaは学習用途のみならず、小型のボックスPCやラックマウントに搭載し、機械学習等の推論用途でも、大きなアドバンテージが出せると期待しています。
今回は、推論用途に最適な産業用ボックスPCとして提案しているFAS-10100に搭載し評価を行いました。また、同コンピュータに対応しているRTX A2000(12GB)を比較対象としました。
RTX A2000 12GB | RTX 4000 SFF Ada | |
CUDAコア | Ampere 3,328コア | Ada Lovelace 6,144コア |
RTコア | 第2世代 26コア | 第3世代 48コア |
Tensorコア | 第3世代 104コア | 第4世代 192コア |
メモリ | 12GB GDDR6 | 20GB GDDR6 |
メモリバス幅 | 192bit | 160bit |
メモリバス帯域 | 288GB/s | 280GB/s |
消費電力 | 70W | 70W |
サイズ | 2Slot(ロープロファイル対応) | 2Slot(ロープロファイル対応) |
[環境]
・OS:Ubuntu 20.04.2
・GeForce Driver:530.30.02
・Docker:23.03.tf1.py3、23.03.tf2.py3
・CUDA:12.1
※画像をクリックすると拡大します。
Tensorflow v1およびv2の両環境において、約1.3倍の性能向上が見られます。
学習向けの強力なGPUではありませんが、一定の性能は発揮できているのではないかと考えられます。
また、バッチサイズについては、FP16において、RTX A2000が256で実行不可となるのに対し、RTX 4000 SFF Adaは、384まで実行できることを確認しています。
GPUに搭載されているメモリ容量が増えたことにより、RTX A2000と比較してより大きなバッチサイズでも実行可能となっております。
※参考記事:RTX A6000 Adaベンチマーク
[環境]
・OS:Ubuntu 20.04.2
・GeForce Driver:530.30.02
・Docker:11.8.0-cudnn8-devel-ubuntu22.04
・CUDA:11.8
・MLPerf:Inference 2.1
MLPerfについては、チューニングを行わず、同条件での結果をもって比較しております。そのため、以下のオプションでベンチマークを実施いたしました。
・Flamework:Tensorflow
・Dataset:Imagenet
・Model:ResNet50
・Count:1000
・QPS:1(指定なし)
※画像をクリックすると拡大します。
Offlineでの1秒当たりのサンプル処理数(sample/s)では、約1.5倍となり、1秒当たりの処理速度が向上していることを確認できました。
また、StreamでのLatency(ms)では、Single:0.57倍、Multi:0.63倍となり、処理の遅延時間も大きく減少しております。
両GPUの消費電力はPCIeスロットからの給電のみで、70Wと非常に低消費電力となっています。1Wあたりの学習ベンチマークにて、比較をしてみました。
RTX 6000 Ada(消費電力:300W)とRTX 4090(消費電力:450W)を加え、学習結果をおさらいしてみます。
※画像をクリックすると拡大します。
※画像をクリックすると拡大します。
1Wあたりの性能は、RTX 4000 SFF Adaが非常に優秀で、RTX 4090と比較すると約2倍の結果となっています。消費電力を抑えつつ、ある程度性能も確保したいというニーズにお応えできるGPUとなっております。
取り付け環境に制約があるなかで、補助電源が不要な小型タイプのGPUの選択肢として、新たにRTX 4000 SFF Adaが加わりました。順当に性能向上しておりますので、ぜひお問い合わせ下さい。