パナソニックは13日、音声認識技術を活用した文字起こしサービスのベータ版の提供を始めた。これまで放送業界で培ってきた技術などを生かしたもので、報道現場をはじめとした放送業界の働き方改革を支援する仕組みとして訴求していく。パナソニック システムソリューションズ ジャパン・パブリックシステム事業本部システム開発本部・梶井孝洋統括部長は「文字起こしにかけるコストと時間を削減し、業務プロセスを効率化できるようになる」と話す。11月をメドに製品化する計画だ。
提供を始めた文字起こしサービス「P―VoT(ピーボット)」は、ディープニューラルネットワーク技術などのAI(人工知能)を使った高精度な音声認識によって、現行の書き起こし制作を支援する。
サービスは特別な機器の導入を必要とせず、インターネットブラウザ上で利用できる。「様々な業界の文字起こしに対応しているが、特に放送向け辞書が充実している」(梶井統括部長)という。
現場担当者が収録音声をピーボットのサイトにアップロードすれば、クラウド上で自動文字起こしを行う。処理後の編集画面では映像と音声が連動して文字起こし結果を表示するため、すぐに修正ができることも特徴。再生中は音声認識結果にマーキングがつき、発声位置を探し出す作業も効率よく行える。
既に放送キー局と関西の準キー局14社で実証実験を行い、「15分弱のインタビューを5分程度で一次作業を終了できた」「素材アップロードから結果が出るまでが速い」といった声が上がったという。平均して素材の2倍の速度で文字起こしできるため、1時間程度の素材なら30分で文字起こしができる。
サービスは収録音声を現場からアップロードし事務所で即修正するケースや長時間素材をチームで分担するケース、大量の素材をまとめて文字起こしするケースなど幅広く利用ができるため、まずは無料のベータ版を提供し反応を見ていく。
梶井統括部長は「11月にはサービス化したい。価格はベータ版ユーザーからの声をフィードバックし8月頃までに決める」という。価格体系は文字起こし時間に対し課金するメニューなどを検討していく。
パナソニックでは少子高齢化に伴う労働人口の減少が進んできている背景から、過去の技術を生かし放送局向けの業務プロセスの変革に取り組んできた。
これまでスタジオ運用を少人数化するコントローラや生字幕制作システム、ファイルベースシステムの展開を図っている。現在は取材・編集からニュース送出、配信まで総合的支援をしている。ピーボットは取材・編集領域を支援するサービスとして提案していく。