文字起こし

Premiere Proの自動文字起こし機能、かなり優秀でその後も使っているけど、使えば使うほど「これ、そのままでは使えないな(表に出せないな)」という感覚が強まってきている。
というのは、自動起こしのテキストが実際の音声とは反対の意味になっていることが多いように感じるからだ。具体的に数を数えていないので、定量的には示せないけど。
話者は「〜と思います」と言っているのに「〜と思いません」というテキストになっている、とかそういう感じ。もちろん全部じゃない。けど気になるレベルで多い。
私は、Premiere Proの自動起文字こしテキストをもとに自分が聞き直して文字起こしを完全にする、という使い方をしているので、全体的な起こしの精度が一定程度あれば事足りるけど……。

AIか何かで文意を推測して補完しているのかなあと想像している。その補完において、あくまで動画の編集を助ける機能として、正しさよりも「それっぽい」テキストにすることが優先されている、という感じがする。事実をそのまま伝えようと努力する「意思」が感じられない補完、動画に適当な字幕がついていればいいという思想のもとの補完、のように感じる。

これは完全に主観。単純に学習が足りてないとこうなる、というだけかもしれない。
私が今、Premiere Proの当該機能をよく使っているから気になるだけで、ほかの自動文字起こしサービスも同様かもしれない。
PolityLinkでも使われているWhisperも試してみたいんだよな。

そのPolityLink、すごくいい!!

国会の動画のリンクと、Whisperによる自動文字起こしが掲載されている。
テキスト検索もできるし、テキストの1文1文を選択すればその部分の動画の頭出しができる。すごくいい。めちゃくちゃいい。

Whisperの精度を私は体験していないが、AIによる自動文字起こしなので、正確性は保証されない。
なので「このテキストを未確認の状態でそのままコピペして拡散」みたいなことはできない(そもそも権利的な問題はどうなるんだろ、こういう場合)。

それでも、

・今日○○のこと(例えばインボイス制度)をとりあげた議員がいたらしい。検索して確認
・今日はどんな話があったのか、テキストでざっと確認。気になったとこは動画を見る
・ニュースで報じられた首相発言を動画で確認

みたいな使い方には全然問題ないし、むちゃくちゃ便利。
「国会中継を文字起こしと一緒に再生することで、いま国会でどんなことが話題なのか簡単にチェックできます」と書いてあるとおり、「チェック」が「簡単」になる。

こういう仕組み、本当なら公的機関が率先して充実させるべきことだけど、そうでない以上このツールには続いてほしいので、法律面で変ないちゃもんつけられてつぶされたりしないようにと願う。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です