マイクに向かって話すだけで文字を入力できる、自然言語対応の音声認識ソフト。書き起こしに便利な機能を搭載する。「AmiVoiceSP」は、人間が普通に話した声を文字に変換して、さまざまなアプリケーションに入力できる音声認識ソフト。事前の「話者登録」を必要としない不特定話者対応ながら、高い認識精度を持つことが特徴。新バージョン「2」では、「書起しエディター」が追加され、元の音声ファイルの再生・停止を繰り返しながら、書き起こしを行えるようになった。前バージョン「AmiVoiceSP」と比較して、認識率・操作性ともに向上した。
使い方は簡単。「AmiVoiceSP 2」をインストールしたら、あとはワープロやエディタなどのアプリケーションを起動し、マイクに向かって話しかければよい。話した声が文字に変換され、変換ウィンドウ上に表示される。文章を確認できたら、変換ウィンドウで「転送」ボタンを押すか、音声で「文字を転送」といえば、表示された文字がアプリケーションに入力される仕組み。(基本的に)キーボード入力できるアプリケーションであれば、音声入力を行える。
特徴のひとつが「話者の声を登録・学習する『ディクテーション』が必要ない」こと。ディクテーションを必要とする音声認識ソフトでは、決められた文章や単語の羅列を、話者があらかじめコンピュータに話して聞かせておかねばならず、決して少なくない手間と時間が必要。
「AmiVoiceSP 2」では、ディクテーションのステップが不要で、インストール後、すぐに使いはじめることができる。話者を限定しないため、「喋り疲れたので、ほかの人に代わって入力を続ける」といったことも可能。学習は「AmiVoice2 SP」の使用時に行われ、使えば使うほど認識精度は向上する。
もうひとつの特徴が「自然言語に対応している」こと。話す際には──音声入力ソフトにありがちな、単語同士を区切って話すとか、ゆっくり話すとかいった気を使う必要はなく──人間同士の通常会話のように、自然にマイクに向かって話しかければよい。単語同士を区切った不自然な発音よりも、自然に話した方が認識率は向上する。
音声は、内蔵の日本語辞書で単語認識され、かな漢字交じりの文章に変換される。辞書には「Google」などのIT関連用語なども含まれ、ある程度であれば、日本語と英単語やアルファベットが混在した文章なども変換できる。同音異義語や、発音が似ていて誤認識された単語など、正しく変換されなかった部分にはマウスカーソルを当てるだけでほかの変換候補が表示され、すぐに修正を行うことができる。
標準で搭載される辞書は、標準(小)、標準(大)のほか、政治経済用語辞書、数値認識に特化したものなど。用途に応じて選択できる。必要に応じてユーザが単語を登録することも可能。事前の話者登録は不要だが、単語登録や日本語変換の学習などはユーザごとに行える。