MediaPipe Iris : 目のキーポイントを検出する機械学習モデル
ailia SDKで使用できる機械学習モデルである「MediaPipe Iris」のご紹介です。エッジ向け推論フレームワークであるailia SDKとailia MODELSに公開されている機械学習モデルを使用することで、簡単にAIの機能をアプリケーションに実装することができます。
MediaPipe Irisの概要
MediaPipe IrisはGoogleが2020年8月に公開した、画像から目のキーポイントを検出する機械学習モデルです。どこを見ているかの認識や、目のサイズからの距離推定、眠っているかどうかの検出などに使用可能です。

出典:https://ai.googleblog.com/2020/08/mediapipe-iris-real-time-iris-tracking.html
MediaPipe Irisのアーキテクチャ
MediaPipe Irisは下記の3つのモデルで構成されます。
・顔の位置を検出するBlazeFace
・顔のキーポイントを検出するFaceMesh
・目のキーポイントを検出するMediaPipe Iris
まずBlazeFaceを使用して顔の位置を検出し、検出した顔の画像に対してFaceMeshで468のキーポイントを取得、目の位置を検出します。


顔の位置とキーポイントの取得
検出した目の画像に対してMediaPipe Irisで71の目のキーポイントと、5の瞳孔のキーポイントを検出します。

瞳孔のキーポイントを取得
MediaPipe IrisのモデルアーキテクチャはMobileNet系で、ConvlutionとDepthwiseConvolution、PReluの組み合わせになります。

MediaPipe Irisのグラフ
MediaPipe Irisへの入力画像の例です。左目に関しては水平フリップし、右目として入力します。入力画像の解像度は64x64、RGB順です。

入力1

入力2
MediaPipe Irisの使用方法
下記のコマンドでWEBカメラから目を認識することができます。
$ python3 mediapipe_iris.py --video 0
実行例です。
アイリア株式会社はAIを実用化する会社として、クロスプラットフォームでGPUを使用した高速な推論を行うことができるailia SDKを開発しています。アイリア株式会社ではコンサルティングからモデル作成、SDKの提供、AIを利用したアプリ・システム開発、サポートまで、 AIに関するトータルソリューションを提供していますのでお気軽にお問い合わせください。
ailia Tech BLOG