最近、というほどでもないが、ここ数年のパソコンは本当に「多芸」になったものだと思う。歌声合成ソフトにより歌を歌い、音声合成ソフトによって自然に話をし、翻訳ソフトにより他国語を翻訳してくれる。そして、人間の話した内容を普通に「聞き取り」してくれる「AmiVoiceSP 2」である。「こうした『コンピュータが自動的に何かをしてくれるソフト』は、実際に使ってみるとまだまだ『完璧』というには遠い」ということは、多くの人が実感しているのではないだろうか。翻訳ソフトなどは、あらかじめ原文を人間が「翻訳しやすいように」編集しておかなければ、なかなかよい結果が得られないし、歌声合成ソフトでも、自然に聞こえるようになるまでには、かなりのノウハウが必要となる。
そうしたソフトと比較すると、音声認識ソフトは実力がかなり上がってきたようだ。「AmiVoiceSP 2」を使用してみるとわかるが、まさにソフトの売り文句の通り、「普通に話す」内容をかなり正確に認識してくれる。「かなり」という表現も微妙だが、マイクの調整さえよければ、数個の文章くらいは間違えることなく認識してくれるほど、精度は高い。最終的には目視確認が必要とはいえ、十分に使えるレベルにあると感じた。
あまり知られていないかもしれないが、WindowsではWindows 7でもWindows 8でも、標準で日本語対応の音声認識機能を搭載している。だが、それらと比較しても「AmiVoiceSP 2」の認識精度は、レベルの違いを感じさせるほど。人間が普通に会話する速度に追いつけるほどの文字入力は、日本語の場合、キーボード入力に相当慣れていないと難しい。だが「AmiVoiceSP 2」ならば、誰でも会話に近い速度で文字入力を実現できる可能性がある。
(天野 司)