Microsoft Cognitive Servicesを試してみる

Posted on

非常に久し振りの投稿になります。
JMT西森です。

 

ある案件でMicrosoft Cognitive Servicesについて色々と調べる機会がありました。
いくつか試してみたものもありますので、何回かに分けて紹介したいと思います。

 

Microsoft のサイトによると、Microsoft Cognitive Services は
“機械ベースのインテリジェンスを活用してユーザー エクスペリエンスを高めるツールにより、やり取りを自然かつ状況に応じて行うことができるようにします。視覚、音声、言語、および知識に関する、現在も拡大中の強力な人工知能アルゴリズムのコレクションを活用してください。”
とあります。

https://azure.microsoft.com/ja-jp/services/cognitive-services/

 

色々な機能を持つREST APIが提供されており、例えば画像やテキストの認識処理、音声認証/音声認識/音声→テキスト変換、テキスト翻訳等の様々な機能を利用することが出来ます。現時点(2017/1/13)ではPreview含め、24ものAPIが公開されています。
https://www.microsoft.com/cognitive-services/en-us/apis

 

例えば以下のような機能を提供しています。

・Computer Vision API
画像から、画像に含まれる情報を取得します。
プールで泳いでいる画像をREST APIにPOSTすると、「水」「人」「男性」「28歳」「泳いでる」「スポーツ」
等といった解析結果をJSON形式で返答します。

・Bing Speech API
音声データをテキストに変換したり、テキストから音声データに変換します。
日本語にも対応しています。

・Text Analytics API
テキストから感情(ポジティブorネガティブ)を読み取ったり、文章からキーフレーズやトピックとなる言葉を読み取ります。
但し感情読み取りに関しては日本語に対応していないようです。

 

また、ほとんどのAPIは(機能制限有り)無償で利用することが可能です。
利用には Cognitive Services Account の登録と、利用するAPIのfree subscription keyの取得が必要です。
https://www.microsoft.com/cognitive-services/en-us/sign-up

20170113_k.nishimori_001

 

 

 

 

 

 

 

 

 

 

上記画面では、既にいくつかのAPIを利用してるため、リストが表示されていますが、
最初にログインした状態では、「My free subscriptions」が(0)になっています。

 

次回から実際に各APIを利用してみたいと思います。

LINEで送る