文字起こし(テープ起こし)は、聞き取りやすい音源でも校正・整文などを含めると、10分間に1時間程度かかる大変な作業。市販の音声認識ソフトは、値段も高いし精度も期待できなかったので、これまで使ったことはなかったが、「Googleドキュメント音声入力の性能が大変よくなった」と聞いて、早速、二つの音源で試してみた。
最初は、ある講演会でPA設備にレコーダーをつないで直接録音したもの。文字起こし用としては、かなり高音質の部類だ。
音声編集ソフトで音量を一定にし、再生速度を90~80㌫ほどにするなど若干の加工を施すと、概ね90㌫以上の精度で変換できた。
次に、10人ほどの座談会をマイク4本で録音した音源を試してみたが、こちらはほとんど変換できなかった。音源がよくない場合は、ヘッドフォンで聞きながら自分の声で吹き込むしかなさそうだ。
結論として、「音源がよければ」という条件付きなら、十分、実用になるサービスだ。利用が広がれば、変換精度もどんどんアップするだろう。無料というのもすごい。欠点があるとすれば、変換したデータをクラウド上に保存し始めると、止まってしまう場合があること。通信速度やパソコンの性能も関係しているようなので、使う側にも対応の余地がありそうだ。
さて、こんなソフトがタダで使えるようになっても、校正・整文など文章のプロが必要であることを強調しておきたい。起こした後の作業はやはりプロの領域だし、PA設備から直接、高音質の録音を取ったり、複数のマイクを立てて収録するようなことも、素人にはなかなかむつかしいからだ。
ただ、いろいろな可能性が広がることは間違いない。私達も安価で質の高いサービスを提供できるよう努める必要がある。
Googleドキュメント音声入力の進歩の様子や活用の仕方などを、また報告していきたい。