【ベンチマーク | 性能比較】製造現場向けAI導入：GPUの有無による学習時間の違い

2025.09.04　ベンチマークレポート

【ベンチマーク | 性能比較】製造現場向けAI導入：GPUの有無による学習時間の違い

はじめに

Deep Learningが注目を浴びており、製造業においてもDeep Learningを用いた推論による画像処理の導入を検討されるケースが増えてきております。
しかし、画像処理の性能についてはイメージしにくいところも多いかと思います。
そこで本稿では、カメラ画像から推論してネジの判別を行い、推論学習の学習時間がGPUの有無によりどれほど差が出るのか評価いたしました。

2．画像認識用カメラと検出した物体を表示するディスプレイの外観

1．評価環境

評価に用いた環境は以下の通りです。
GPU以外のハードウェアおよびソフトウェアとGPUに分けて示します。

・ハードウェアおよびソフトウェア構成
評価に用いたPC(GPU以外)の構成を表1に示しします。

表1 ハードウェアおよびソフトウェア構成

CPU	インテル® Xeon® E3-1230 V6
マザーボード	X11SSH-LN4F
メモリ	16GB
SSD	SATA 800GB (OS兼、ホットデータの保存向け)
HDD	SATA 1TB (コールドデータの保存向け)
カメラ	Basler ace acA1920-40GC
画像処理ソフト	HALCON バージョン 24.11
推論学習ソフト	DLTOOL バージョン 24.12

2．画像認識用カメラと検出した物体を表示するディスプレイの外観

画像認識を行う構成の外観を図1に示します。

図1 画像認識を行った構成の外観

3．使用したGPU

評価に使用したGPUおよび主要なスペックを表2に示します。
今回は、NVIDIA® GeForce RTX™ 2080 Ti、RTX™ 4000 Ada世代、RTX™ 6000 Ada世代を使用しました。

表2 評価に使用したGPU および主要なスペック

GPU／スペック	RTX 2080 Ti	RTX 4000 Ada	RTX 6000 Ada
VRAM	GDDR6-11GB	GDDR6-20GB	GDDR6-48GB
Cudaコア	4,352	6,144	18,176
Tensorコア	(第2世代) 544	(第4世代) 192	(第4世代) 568
RTコア	(第1世代) 68	(第3世代) 48	(第3世代) 142

4．推論学習に用いたパラメータ

HALCONで画像処理を行うにあたってDLTOOLで推論学習を行った際のパラメータを以下に示します。
表3 推論学習のパラメータ

学習モデル	ResNet50
画像枚数	100枚～10000枚
画像サイズ	256×256
Batch	5
エポック数	10

・行った画像処理
DLTOOLを用いてネジの種類を推論学習し、カメラで撮影したねじの映像をHALCONで画像処理してネジの種類を推論し、ネジの種類を検出しました。
図2に画像処理中の画面を示します。

図2 ネジを検出している様子

図2ではネジを長方形の枠で認識し、形から向きを見ることができます。また、ネジの種類によって枠の色を変えて表示させています。
次に、この推論学習の学習時間について、ハードウェアごとにどの程度の時間がかかったかをまとめ、性能の違いについて評価します。

5．推論学習に要した時間の結果

今回使用した推論学習をCPU構成と異なる複数のGPU構成で行いました。
推論学習に要した時間は以下の通りです。

表4 推論学習に要した時間(hh:mm:ss)

学習した画像枚数／学習に用いたデバイス	100枚	1000枚	10000枚
CPUのみ(GPUなし)	0:21:50	※3:20:59	※36:24:39
RTX 2080 Ti	0:02:33	0:28:47	※3:43:50
RTX 4000 Ada	0:01:20	0:10:56	1:54:56
RTX 6000 Ada	0:01:20	0:08:57	1:44:58

※は実測値ではなく完了予測時間

推論学習に要した時間から、それぞれのデバイスでの1秒あたりの画像処理枚数を図3に示します。

図3 単位時間当たりの推論学習能力

6．画像処理性能の評価まとめ

画像100枚での推論学習では、CPUで推論学習を行った場合に比べGPUを用いた場合はRTX 2080Tiでは約8.6倍、RTX 6000 Adaでは17.4倍と画像処理能力に差が出ました。
しかし、RTX 4000 AdaとRTX 6000 Adaに差は見られませんでした。GPUの世代(Ada Lovelace)によって差があるといえます。
また、画像10000枚での推論学習ではRTX 4000 AdaとRTX 6000 Adaで約1.1倍の処理能力の差が出ました。

7．最後に

本稿では、画像処理としてカメラを用いたネジの検出を行いました。
ネジの検出に用いた環境はこの検証のために用意した環境であり、この環境も約2か月で構築できたことから画像処理のハードルが下がりつつあると感じられます。

CPUでの画像処理は100枚程度であれば推論学習にかかる所要時間も大きくはならないと思われますが、今回のように10000枚の画像を用いた推論学習を行う場合などでは推論学習の所要時間が大きくなります。改善策としてGPUを使用して推論学習を行う方法が挙げられますが、この規模の推論学習であればRTX 2080 Tiクラスの GPUでも十分対応できる範囲であったと考えられます。

しかし、より大きな画像枚数での推論学習など、高い検出精度を必要とする場合はRTX 6000 Adaをはじめとする高性能GPUの採用を検討する必要があると考えられます。
今後の展開として、ネジ以外の部品への対応や不良品の検出、また、条件の変化による推論学習時間の変化や、推論性能に対する評価をしていきたいと考えております。

『問題解決型』ハードウェアメーカー
ファナティック

FANATIC REPORT ファナティックレポート