ailia SDK 1.2.6をリリース
クロスプラットフォームで利用できるGPU対応の高速AI推論フレームワークであるailia SDKのバージョン1.2.6のご紹介です。ailia SDKについてはこちらをご覧ください。
ONNXを使用する場合にprototxtを省略できる機能を追加
ONNXを使用する場合に、prototxtを省略できる機能を追加しました。従来、ONNXの場合、下記のようにインスタンスを作成していました。
net = ailia.Net(“a.onnx.prototxt”,”a.onnx”)
ailia SDK 1.2.6以降、prototxtを下記のように省略可能です。
net = ailia.Net(None,”a.onnx”)
Unityの場合は、nullを指定します。
model.OpenFile(null,”a.onnx”)
Cの場合は、ailiaOpenStreamFileを省略します。
レイヤー対応の強化
Softmax、ReduceSum、GatherのND(5次元入力)対応、Deconvolutionの1次元入力対応、macOSにおけるSpace2Depth、3DConvolution、SplitのMetal対応などを行なっています。より幅広いモデルを、より高速に実行可能になります。
Python APIにrun APIを追加
ONNX Runtimeとの一貫性を高めるため、新たにrun APIを追加しました。従来のpredict APIの場合、入力がTensorの場合は出力もTensor、入力がArrayの場合は出力のArrayという仕様だったのですが、run APIでは常に出力がArrayになります。
PoseEstimator APIの高速化
ailia PoseEstimator APIに含まれる前処理と後処理のコードを最適化することで高速化しています。RTX2080環境では、LightWeightHumanPoseEstimationが12ms程度で動くようになり、リアルタイムでの骨格検出を実現します。
新しいモデルへの対応
ailia MODELSに1.2.6対応の下記のモデルを追加しました。ailia SDKが対応するモデルは100種類を超え、110種類となりました。
3dmpe posenet : 3Dの骨格推定

出典:https://github.com/mks0601/3DMPPE_POSENET_RELEASE
Efficient pose : 2Dの骨格推定
Person reid baseline : 同一人物判定

出典:https://github.com/layumi/Person_reID_baseline_pytorch
Source seperation : 音源の分離
ailia-ai/ailia-modelsNoisy speech (audio file) Audio from creative commons youtube videos…github.com
Yet-Another-Anime-Segmenter : アニメ画像のセグメンテーション
EAST : テキスト領域抽出

出典:https://github.com/argman/EAST
Style2paints : 自動彩色

出典:https://github.com/lllyasviel/style2paints
Crnn.pytorch : 英語のOCR
deep-text-recognition-benchmark : 英語のOCR
PointNet.pytorch : 点群のセグメンテーション

出典:https://github.com/fxia22/pointnet.pytorch
Pixel-Link : テキスト領域抽出
Pytorch-dc-tts : 英語の音声合成モデル
アイリア株式会社はAIを実用化する会社として、クロスプラットフォームでGPUを使用した高速な推論を行うことができるailia SDKを開発しています。アイリア株式会社ではコンサルティングからモデル作成、SDKの提供、AIを利用したアプリ・システム開発、サポートまで、 AIに関するトータルソリューションを提供していますのでお気軽にお問い合わせください。
ailia Tech BLOG