YOLOで物体検出　その４（GPUの設定、CUDA 12.6）

2025年2月3日 2026年1月31日

管理人

はじめに

　今回はGPUを利用したYOLOの物体検出を試してみました。

　Ultralyticsのドキュメントではオプションで切り替えることができるようでしたが、GPUだとエラーが出ていたのでCPUで実行していました。

　GPUでも実行できるように設定して、処理が速いようであれば活用していこうと思っています。

▼GPUを利用したYOLOv5での物体検出については、NVIDIAの記事がありました。

▼以前の記事はこちら

環境の確認

　PCは最近購入したゲーミングノートPCを使っています。

▼PCは10万円ぐらいで購入したゲーミングノートPCを利用しています。Windows 11の環境です。

【Amazon.co.jp限定】 ASUS ゲーミングノートPC TUF Gaming A15 FA506NCR 15.6インチ RTX 3050 AMD Ryzen 7 7435HS メモリ 16GB SSD 512GB リフレッシュレート144Hz RGB イルミネートキーボード Windows 11 動画編集グラファイトブラック FA506NCR-R7R3050A

ASUS

¥149,800 （2026/02/28 19:12時点 | Amazon調べ）

Amazon

ポチップ

https://amzn.to/4aaSMlT

　CPUはRyzen 7、GPUはRTX 3050 Laptop GPUです。

▼タスクマネージャーで確認できました。

　確認用のコマンドがあったので実行してみました。

▼nvccは認識されていません。

▼nvidia-smiは以下のように表示されました。

CUDAのインストール

　調べていると、PyTorchに対応したCUDAのバージョンがあるようでした。

▼以下のページで確認できました。

https://pytorch.org/get-started/locally

▼CUDAのバージョンによって実行するコマンドが異なるようです。

　最新だとCUDA 12.8を利用できるようですが、PyTorchのページにあったCUDA 12.6をインストールすることにしました。

▼以下のページで利用している環境を選択して、インストーラをダウンロードできました。

https://developer.nvidia.com/cuda-12-6-0-download-archive

▼Windows 11、x86_64で選択して、exe(local)をダウンロードしました。

▼インストーラを実行後、インストールが始まりました。

▼古いバージョンのドライバーをインストールしようとしていると表示されていましたが、続行しました。

　その後は特に問題なくインストールできました。

▼この後nvcc -Vを実行すると、バージョンが表示されました。

▼VS Codeのターミナルは、VS Codeを再起動しないと認識していないままでした。

▼Program Filesを辿っていくとnvcc.exeがあって、直接絶対パスを指定して-Vを実行しても表示されました。まだパスに追加されていないような状態であれば、こちらで指定する方が確実かもしれません。

YOLOの物体検出を試してみる

　CUDAのインストールは完了したので、Pythonの環境を構築して物体検出を試してみました。

▼UltralyticsのYOLOのPredictに関するページはこちら

https://docs.ultralytics.com/ja/modes/predict

▼以前の記事でも試していた、Pythonの物体検出のプログラムをもとに試してみました。

▼Unreal Engineの画面ですが、この画像で物体検出を行ってみました。

　以下のコマンドでPython 3.10の仮想環境を作成し、ultralyticsをインストールしました。

py -3.10 -m venv yolo310
cd yolo310
.\Scripts\activate
pip install ultralytics

　PyTorchのページで確認したコマンドで、必要なパッケージをインストールしました。

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126

▼インストールが完了しました。

　プログラムを実行してみました。

▼画像ファイルから物体検出を行うプログラムはこちら。画像ファイルのパスは変更してください。

from ultralytics import YOLO

model = YOLO("yolov8n.pt")
results = model.predict(source="<画像ファイルの絶対パス>", save=True, device='cuda:0')

▼NotImplementedError: Could not run 'torchvision::nms' with arguments from the 'CUDA' backendというエラーが出ていました。

▼device='cpu'にすると実行できました。

　そもそもtorchが有効なのかを、Pythonの対話モードで確認しておきました。

python
import torch
torch.cuda.is_available()

▼Trueと表示されています。

　なお、対話モードはexit()で終了することができます。

　先程のエラーについてChatGPTに聞いてみたのですが、一度torchvisionをアンインストールしてから再インストールすることを提案されたので試してみました。

　以下のコマンドを実行しました。

pip uninstall torchvision
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126

▼uninstall時に実行するか聞かれました。

　その後、先程のプログラムを実行してみました。

▼実行できました！

▼検出もできています。

▼device='cpu'で実行したときの時間と比較すると、GPUの方が遅い？ようです。

　画像一枚だけなので、枚数を増やしたり、リアルタイムでの検出だと変わってくるかもしれません。

YOLOの学習を試してみる

　今までCPUでデータセットの学習を行っていたのですが、GPUでも試してみました。

　私はYOLOの学習をNode-REDで自動化していて、Pythonのコードではなくyolo.exeを使ったコマンドで学習を行っています。

▼以下のようなフローで学習を行っています。私が開発したpython-venvノードのうち、仮想環境の実行ファイルを実行するvenv-execノードを使っています。

▼学習に必要なデータセットのアノテーションについては、以下の記事でも試しました。

　GPUを指定するためにdevice='cuda:0'にすると、エラーが出ていました。

▼device=0だと実行できるようでした。

　device=0にして以下のようなコマンドで実行してみたのですが、エラーが出ました。

yolo.exe detect train data=<data.yamlのパス> model=<モデルのパス> name=<保存先のパス> device="0"

▼OSErrorが起きています。

　ChatGPTに聞いてみると、workers=0を入れると解決すると返ってきました。

　以下のコマンドであれば問題なく学習できました。

yolo.exe detect train data=<data.yamlのパス> model=<モデルのパス> name=<保存先のパス> device="0" workers=0

▼学習結果の入ったフォルダに、results.csvがあります。

▼学習の累積時間が出てくるので、その時間で比較しました。

　26枚の画像しか入っていない小さいデータセットですが、CPUの場合は523.822、GPUの場合113.324でした。CPUでは8分44秒ぐらい、GPUでは1分53秒ぐらいですね。

　Node-REDのフローで、ボタンを押してから学習が終了するまでにかかった時間を計算して、メールで送信するようにしています。その数字とも大体一致していました。

▼以下のようにメールが届きます。

▼以前学習の順番待ちができるように、queueノードも開発しました。

最後に

　pipでtorchvisionを一度削除してから、再インストールするとうまくいくようでした。WSLのUbuntu環境だと特に問題なく実行できたという話も聞いたので、そちらの方が簡単にできるかもしれません。

　検出時間は画像一枚だとCPUの方が速そうでしたが、学習ではGPUの方が4倍ぐらい速かったです。リアルタイムでの検出でもどういった違いが出るのか試したいなと思っています。

　私はUnreal Engine と併用しているので、GPUの利用率が既に高いとYOLOが遅くなるかもしれません。

カテゴリー: プログラミング

タグ: GPU YOLO

YOLOで物体検出　その４（GPUの設定、CUDA 12.6）

はじめに

NVIDIA の GPU に最適化された YOLOv5 の実装で物体検出アプリケーションを高速化する - NVIDIA 技術ブログ

YOLOで物体検出　その１（Ultralytics、YOLO11）

YOLOで物体検出　その３（ROSとの連携、WSL2 Ubuntu 18.04）

環境の確認

ちょっと買い物：新しいノートPCとSSDの増設（ASUS TUF Gaming A15）

CUDAのインストール

YOLOの物体検出を試してみる

YOLOで物体検出　その２（Python、Node-RED）

Unreal Engine 5を使ってみる　その10（Scaniverse、点群データの取り込み）

YOLOの学習を試してみる

CVATでアノテーション（YOLO v8、Object Detection）

Node-REDのノードを開発してみる　その３（queueノード）

最後に

コメントを残すコメントをキャンセル

Node-RED MCUの環境を構築する（Moddable SDK 5.4.1、ESP-IDF v5.3.1対応版、Windows 11）

Node-REDのノードを開発してみる　その４（dualshock4ノード）

はじめに

環境の確認

CUDAのインストール

YOLOの物体検出を試してみる

YOLOの学習を試してみる

最後に

コメントを残す コメントをキャンセル

Node-RED MCUの環境を構築する（Moddable SDK 5.4.1、ESP-IDF v5.3.1対応版、Windows 11）

Node-REDのノードを開発してみる その４（dualshock4ノード）

コメントを残すコメントをキャンセル

Node-REDのノードを開発してみる　その４（dualshock4ノード）