Jetson Nanoに接続したRealsenseのRGBカメラでYOLOv5を使って物体検出する方法

ポチップ

Jetson Nano 超入門　改訂第2版

著:Jetson Japan User Group, 著:からあげ, 著:北崎恵凡, 著:古瀬勉, 著:鶴長鎮一, 著:中畑隆拓

¥3,058 （2025/07/02 16:08時点 | Amazon調べ）

ポチップ

機械学習モデル　PyTorch+YOLOｖ5

今回、物体検出に使用する機械学習ライブラリはMETA社が公開しているPyTorchです。また、学習済みモデルはYOLOv5を使用します。

Jetson NanoでのPyTorchとYOLOv5のセットアップ方法は以下の記事で解説していますので、事前に済ませておいてください。

あわせて読みたい

Jetson NanoでYOLOv5を使って物体検出する方法今回はJetson NanoでYOLOv5とPyTorchを使って物体検出をする方法を解説したいと思います。Jetson Nanoに対応しているJetPackの最新バージョンで使用できるものとなって…

イメージセンサー　Intel RealSense D435

今回使用するカメラはIntel社が開発、販売しているステレオカメラRealSense D435です。Depthカメラを搭載しており深度計測が可能です。今回はD435のRGBカメラの映像を使用して物体検出を行います。

D435をPythonのプログラムから使用する場合には、Pythonのラッパーライブラリであるlibrealsenseを事前にセットアップしておく必要があります。librealsenseのセットアップ方法については以下の記事で解説していますので、事前に済ませておいてください。

あわせて読みたい

Jetson Nanoでpythonから使えるライブラリlibrealsenseをセットアップする方法今回はIntel社のカメラモジュールRealSense D435をPythonのコードからアクセスする際に必要となるライブラリ、librealsenseをセットアップする方法について解説します。…

intel RealSense™ Depth Camera D435

インテル(Intel)

¥58,800 （2025/07/01 00:34時点 | Amazon調べ）

ポチップ

作成したソースコード

今回使用するソースコードは、先ほど紹介した「REALSENCE D435のカメラ映像でPyTorchとYOLOv5を使ってリアルタイムに物体検出する方法」で掲載しているコードと全く同じものを使用しました。

Jetson NanoでこちらのソースコードをそのままJetson Nano上で実行するだけで動作します。

import pyrealsense2 as rs
import numpy as np
import cv2
import cv2
import torch

# Configure depth and color streams
pipeline = rs.pipeline()
config = rs.config()
config.enable_stream(rs.stream.depth, 640, 480, rs.format.z16, 30)
config.enable_stream(rs.stream.color, 640, 480, rs.format.bgr8, 30)

#YOLOのモデルをロード
model = torch.hub.load('ultralytics/yolov5', 'yolov5s') 

#YOLOを使った物体検出
def predict(img):
    #推論を実行
    result = model(img)
    result.render()

    #戻り値
    return result.ims[0]

#メイン処理
def main():
    # Start streaming
    pipeline.start(config)

    try:
        while True:

            # Wait for a coherent pair of frames: depth and color
            frames = pipeline.wait_for_frames()
            depth_frame = frames.get_depth_frame()
            color_frame = frames.get_color_frame()
            if not depth_frame or not color_frame:
                continue

            # Convert images to numpy arrays
            depth_image = np.asanyarray(depth_frame.get_data())
            color_image = np.asanyarray(color_frame.get_data())

            #推論実行
            color_image = predict(color_image)

            # Apply colormap on depth image (image must be converted to 8-bit per pixel first)
            depth_colormap = cv2.applyColorMap(cv2.convertScaleAbs(depth_image, alpha=0.03), cv2.COLORMAP_JET)

            # Stack both images horizontally
            images = np.hstack((color_image, depth_colormap))

            # Show images
            cv2.namedWindow('RealSense', cv2.WINDOW_AUTOSIZE)
            cv2.imshow('RealSense', images)
            cv2.waitKey(1)

    finally:

        # Stop streaming
        pipeline.stop()


if __name__ == '__main__':

    main()

実行結果

RealSenseをJetson NanoのUSB3.0ポートに接続します。

先ほどのプログラムを実行するとRealSenseのRGBカメラとDepthカメラの映像が表示されます。スマホを手にもってカメラの前にかざすと、スマホの周りにバウンディングボックスが表示され「cell phone」と正しく検出できました。

まとめ

今回はJetson Nanoに接続したRealSense D435のRGBカメラの映像を使って物体検出する方法について解説しました。

librealsenseが動作する環境さえ作ってしまえば非常に簡単に実現することができました。

intel RealSense™ Depth Camera D435

インテル(Intel)

¥58,800 （2025/07/01 00:34時点 | Amazon調べ）