V-Tuber ZERO

【法人向け】WEBカメラのみでAI骨格検出可能な『VisionPose』が新機能をリリース 既存の動画や静止画からも骨格検出が可能に

株式会社ネクストシステムが法人向けに販売中のWEBカメラのみで人間の骨格を検出できるSDK『VisionPose(ビジョンポーズ)』は、新たに下記の新機能をリリース。

1.動画・静止画から骨格検出ができる「VP_Analyzer(仮)」を製品版に付属。(バージョン1.1より)
2.シングルカメラで2次元座標を検出する機能を追加。(バージョン1.2より)
3.精度重視・速度重視の切り替え設定を追加。(バージョン1.2より)

「VisionPose」とは、WEBカメラだけで複数人の骨格座標(30箇所)が検出できる高精度AI骨格検出システム。
従来の深度センサ付きカメラに頼らず、ディープラーニング(深層学習/DeepLearning)を使用し、WEBカメラ(RGBカメラ)のみで人間の骨格や深度情報を検出することが可能。

今回新たに3つの機能が追加され、さらに幅広いシーンでの利用が可能に。
特にリアルタイムだけでなく既存の動画や静止画からの骨格検出が可能な「VP_Analyzer(仮)」が製品版に同梱されたことで、例えば研究用の資料動画や画像から簡単に骨格を検出できるようになりました。

11月19日に製品版を法人向けにリリースし約1カ月、各種スポーツ文化でのフォーム解析、監視カメラなどへの組み込みやVTuber配信への利用など、様々な分野で現在約300件の問い合わせを受けているとのこと。

※現在法人のお客様のみの販売となっております。
※個人のお客様向けには準備が整い次第別途お知らせいたします。

関連記事:WEBカメラのみで骨格検出できるシステム「VisionPose」が法人向けに11月19日より販売開始

以下プレスリリースより引用

■追加機能について

1.動画・静止画から骨格検出ができるアプリ「VP_Analyzer(仮)」

VP_Analyzer(仮)」とは、お手持ちの動画または静止画から骨格を検出できるアプリケーションツールです。VisionPoseバージョン1.1より製品版に付属しました。
バージョン1.0ではリアルタイムで骨格を検出することを想定したSDKであるため、既存の動画や静止画から検出する場合、別途開発をする必要がありました。一方で研究用に撮りためていた動画や静止画からも骨格を検出したいなどのご要望を多くいただいた背景もあり、「VP_Analyzer(仮)」を製品版に付属することで開発の手間なくより簡単にプログラマでなくても動画や静止画から骨格を検出できるようにしました。

この結果、従来の赤外線で骨格を認識するセンサではできなかった動画・静止画の事後検出が可能になりました。リアルタイム性に囚われないため、ご用意いただく素材の解像度が高い場合でも骨格の検出が可能です。
特に『骨格検出にリアルタイム性が必要なく、より精度が高いデータが欲しい場合』にオススメの機能となっています。

<VP_Analyzer(仮)の主な機能>
①動画・静止画から2次元座標で骨格を検出
②動画・静止画から3次元座標で骨格を検出

※②の場合、同じタイミングで撮影された画像・動画素材が2つ必要です。
※②の場合フレームの同期機能はございません。あらかじめ同期された動画をご用意ください。

<VP_Analyzer(仮)の使い方・導入方法>
①VisionPose(バージョン1.1)を当社WEBサイトよりお問い合わせ後、購入する。
②PCの準備をする。
③導入マニュアルに従って実行環境を構築する。
④「VP_Analyzer(仮)」を使って動画・静止画を解析する。

※「VP_Analyzer(仮)」はコマンドラインツールです。
※入力として使える静止画ファイルは、jpeg、png、bmpです。
※入力として使える動画ファイルは、avi、mp4、wmv、movです。
※出力は画像の場合はjpegファイルまたはpngファイル、動画の場合はaviファイルです。

2.シングルカメラで2次元座標を検出する機能

VisionPoseは骨格の検出をする際、2次元座標と3次元座標を検出できます。
3次元の座標をとる場合のみカメラを2台利用しますが、バージョン1.0では2次元でも3次元でもカメラを2台用意する必要がありました。しかし2次元の座標のみ取得したいというお客様のご要望も多くあったため、このたび、カメラ1つでも2次元座標をとることができるように対応しました。
さらにカメラを1台にすることで2台で2次元座標を検出していた時よりも早い骨格検出が可能になりました。

※カメラ1台での3次元座標検出は現在開発中です。

3.精度重視・速度重視の設定項目の追加

isionPoseでは精度と速度はトレードオフの関係にあります。バージョン1.1までは精度重視での骨格検出にのみ対応していました。しかし条件次第では速度を重視する方が都合が良い場合があり、より柔軟にお使いいただけるよう、精度を重視するか、速度を重視するか設定できるようになりました。

・シングルカメラで2次元座標を検出した際の速度検証
GeForce GTX 1080 Ti で検証した場合の処理速度は下表です。

精度重視:16.5 FPS
速度重視:30 FPS (カメラのフレームレートが最大30FPSのため)

■「VisionPose」製品概要

価格:WEBサイトよりお問い合わせください。
WEBサイト:https://www.next-system.com/ai/visionpose

■関連リンク

株式会社ネクストシステム
https://www.next-system.com/

参考株式会社ネクストシステム プレスリリース