Androidニュース&アプリ情報メディア

マイクロソフト、AIを活用した日本語の音声リアルタイム翻訳機能をアプリやSkype等で提供開始

マイクロソフトは7日、「Microsoft Translatorアプリ」や「Skype翻訳」などにおいて、日本語を音声翻訳及びテキスト翻訳の双方が可能な10番目のサポート言語として追加したと発表した。

<▲図:1対1だけじゃなくグループ会話も可能>

例えば、Android/iOS/Windows向けのMicrosoft Translatorアプリを使って、外国人とリアルタイム翻訳を使いながら会話をするようなことができる。日本語で話した内容が外国語に翻訳され、音声で出力され、テキストでも翻訳メッセージを表示したり、といったことが可能。また、Skypeでも同様に音声通話中のリアルタイム翻訳機能を利用できる。

冒頭で、サポート言語のうち日本語が10番目と記したが、残りの9言語は下記の通り。

アラビア語、中国語(マンダリン)、英語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語、ロシア語

この9言語に日本語を加えた10言語間でリアルタイム翻訳を使った1対1の会話やグループ会話等ができる。そして、もちろんキチンとした複数回に及ぶ交互会話だけでなく、ちょっとしたシーンでのリアルタイム翻訳の場合は、マイクボタンをタップして話すだけでできる。現在は他の9言語との間の翻訳もできる。

<▲図:1対1会話やグループ会話をする場合は、QRコードを使って参加できる>

マイクロソフトはこうした翻訳技術にこれまで注力してきたが、音声翻訳では、同社の独自技術のTrueTextによって、音声認識用と機械翻訳用の2つの異なるタイプのAIを組み合わせている。TrueTextでは、認識された音声を、機械翻訳で翻訳可能な形に変換してくれる。

例えば、日本語の場合、意味のない繋ぎの言葉「えーと」などが多く会話に入ってくるが、最初のステップでは、そうした言葉を省き、さらには翻訳する際にベストな形として、句読点の追加等、形式的な修正を行い、翻訳しやすいようにする。

あとは機械学習による翻訳用のAIで翻訳され、最終ステップではテキスト読み上げ機能によって、音声で出力される。

ただ、実際に使ってみると、結局のところ最初のステップである音声認識の精度が鍵を握ってくるので、意外と上手い具合に行かない。これは自分自身の滑舌やアクセント、話し方が影響してくる問題で厄介だ。同じく、やはりリアルタイム翻訳ができる「Google翻訳」を使っても同じことで、やはり音声認識が上手く行かないと、当たり前だが会話が進まない。普段、Googleの音声入力をよく使う筆者だが、普段は精度が結構高いと思っていた。しかし、Google翻訳を改めて使うと、完璧ではないと気付かされたし、それはMicrosoft Translatorでも同じだった。

とはいえ、音声認識さえ正確にされれば、それなりに訳してくれることは確かだ。

マイクロソフトのこのリアルタイム翻訳機能は、Microsoft Translatorアプリ、Skype以外でのアプリ/サービスでも利用できる。OutlookやPowerPointなど同社のサービスのほか、他社のサービスでも利用できるようになる。というのも、開発者向けにMicrosoft Translator APIが提供され、他社が自らのアプリやサービスに導入することもできるようにしているからだ。詳しくは参考リンク先をチェックしてほしい。

まだまだ完璧な精度とレスポンスのリアルタイム翻訳はこの世にないが、そこに近づいているのは確か。今後の進化にも期待したい。

ちなみに、Google翻訳だと「バカ」等の悪い意味の言葉も訳してくれるが、Microsoft Translatorだと訳してくれない。こういう部分も、各社で異なる。


Microsoft Translatorアプリは下記のリンク先からダウンロードできる。



【情報元、参考リンク】
Microsoft Translator introduces the world’s first personal universal translator

読者&編集部コメント欄

この記事のコメント:0 件