『問題解決型』ハードウェアメーカー
ファナティック
-
- ファナティックの特長 ファナティックの特長
- /
- 製品&ソリューション 製品&ソリューション
- /
- 導入事例 導入事例
- /
- 最新ニュース 最新ニュース
- /
- ファナティックレポート ファナティックレポート
- /
- サポート サポート
- /
- 会社案内 会社案内
- /
- 採用情報 採用情報
2025.09.04 ベンチマークレポート
Deep Learningが注目を浴びており、製造業においてもDeep Learningを用いた推論による画像処理の導入を検討されるケースが増えてきております。
しかし、画像処理の性能についてはイメージしにくいところも多いかと思います。
そこで本稿では、カメラ画像から推論してネジの判別を行い、推論学習の学習時間がGPUの有無によりどれほど差が出るのか評価いたしました。
評価に用いた環境は以下の通りです。
GPU以外のハードウェアおよびソフトウェアとGPUに分けて示します。
・ハードウェアおよびソフトウェア構成
評価に用いたPC(GPU以外)の構成を表1に示しします。
表1 ハードウェアおよびソフトウェア構成
CPU | インテル® Xeon® E3-1230 V6 |
---|---|
マザーボード | X11SSH-LN4F |
メモリ | 16GB |
SSD | SATA 800GB (OS兼、ホットデータの保存向け) |
HDD | SATA 1TB (コールドデータの保存向け) |
カメラ | Basler ace acA1920-40GC |
画像処理ソフト | HALCON バージョン 24.11 |
推論学習ソフト | DLTOOL バージョン 24.12 |
画像認識を行う構成の外観を図1に示します。
図1 画像認識を行った構成の外観
評価に使用したGPUおよび主要なスペックを表2に示します。
今回は、NVIDIA® GeForce RTX™ 2080 Ti、RTX™ 4000 Ada世代、RTX™ 6000 Ada世代を使用しました。
表2 評価に使用したGPU および主要なスペック
GPU/スペック | RTX 2080 Ti | RTX 4000 Ada | RTX 6000 Ada |
---|---|---|---|
VRAM | GDDR6-11GB | GDDR6-20GB | GDDR6-48GB |
Cudaコア | 4,352 | 6,144 | 18,176 |
Tensorコア | (第2世代) 544 | (第4世代) 192 | (第4世代) 568 |
RTコア | (第1世代) 68 | (第3世代) 48 | (第3世代) 142 |
HALCONで画像処理を行うにあたってDLTOOLで推論学習を行った際のパラメータを以下に示します。
表3 推論学習のパラメータ
学習モデル | ResNet50 |
---|---|
画像枚数 | 100枚~10000枚 |
画像サイズ | 256×256 |
Batch | 5 |
エポック数 | 10 |
・行った画像処理
DLTOOLを用いてネジの種類を推論学習し、カメラで撮影したねじの映像をHALCONで画像処理してネジの種類を推論し、ネジの種類を検出しました。
図2に画像処理中の画面を示します。
図2 ネジを検出している様子
図2ではネジを長方形の枠で認識し、形から向きを見ることができます。また、ネジの種類によって枠の色を変えて表示させています。
次に、この推論学習の学習時間について、ハードウェアごとにどの程度の時間がかかったかをまとめ、性能の違いについて評価します。
今回使用した推論学習をCPU構成と異なる複数のGPU構成で行いました。
推論学習に要した時間は以下の通りです。
表4 推論学習に要した時間(hh:mm:ss)
学習した画像枚数/学習に用いたデバイス | 100枚 | 1000枚 | 10000枚 |
---|---|---|---|
CPUのみ(GPUなし) | 0:21:50 | ※3:20:59 | ※36:24:39 |
RTX 2080 Ti | 0:02:33 | 0:28:47 | ※3:43:50 |
RTX 4000 Ada | 0:01:20 | 0:10:56 | 1:54:56 |
RTX 6000 Ada | 0:01:20 | 0:08:57 | 1:44:58 |
※は実測値ではなく完了予測時間
推論学習に要した時間から、それぞれのデバイスでの1秒あたりの画像処理枚数を図3に示します。
図3 単位時間当たりの推論学習能力
画像100枚での推論学習では、CPUで推論学習を行った場合に比べGPUを用いた場合はRTX 2080Tiでは約8.6倍、RTX 6000 Adaでは17.4倍と画像処理能力に差が出ました。
しかし、RTX 4000 AdaとRTX 6000 Adaに差は見られませんでした。GPUの世代(Ada Lovelace)によって差があるといえます。
また、画像10000枚での推論学習ではRTX 4000 AdaとRTX 6000 Adaで約1.1倍の処理能力の差が出ました。
本稿では、画像処理としてカメラを用いたネジの検出を行いました。
ネジの検出に用いた環境はこの検証のために用意した環境であり、この環境も約2か月で構築できたことから画像処理のハードルが下がりつつあると感じられます。
CPUでの画像処理は100枚程度であれば推論学習にかかる所要時間も大きくはならないと思われますが、今回のように10000枚の画像を用いた推論学習を行う場合などでは推論学習の所要時間が大きくなります。改善策としてGPUを使用して推論学習を行う方法が挙げられますが、この規模の推論学習であればRTX 2080 Tiクラスの GPUでも十分対応できる範囲であったと考えられます。
しかし、より大きな画像枚数での推論学習など、高い検出精度を必要とする場合はRTX 6000 Adaをはじめとする高性能GPUの採用を検討する必要があると考えられます。
今後の展開として、ネジ以外の部品への対応や不良品の検出、また、条件の変化による推論学習時間の変化や、推論性能に対する評価をしていきたいと考えております。