ARTICLE
6.282021
言葉づかい(3、人間しかできない文字起こし)

おととしくらいまで、人間がする音声起こし、文字起こしは、音声認識システムが誤認した部分を修正するという形で残っていく、一からべったり書き起こすというニーズはなくなっていく、というふうに思っていました。
iPhoneのSiriや、Googleアシスタント、スマートスピーカーは随分普及しましたし、Microsoft Wordにも音声入力が実装されていて、昔のような文字起こしはやはり減っていくのは間違いないと思います。
しかし昨今、音声認識が誤認した部分を修正するというシンプルな作業ではなく、編集能力や英語力が必要な作業を求められることが増えたと感じています。
音声認識は行間を読まない
音声認識や機械翻訳のシステムは、行間を読みません。
「行間を読む」とは「文章中、文字で直接表現されていない筆者の意図をくみ取る」ということです。
「行間を読む」にあたり、人間はただなんとなくその場の空気で感じているわけではありません。過去に読んできたさまざまな文章や経験をインプット・アウトプットしてきた脳から情報を引き出して「行間を読む」=「発言者の言いたいことを察知して」います。
文字起こしでも、ある意味「行間を読む」ことが求められます。文字起こしの場合は、書き起こしたときに発言内容が変わることは許されません。「勝手にこう言いたいのだろう」と想像するのはNGです。
自身の知識から「このことを言っているのではないか」と察知し、それが自身の思い込みではなく事実かどうかを調べ、確証が得られた場合に、起こす人間、チェックする人間が文字・文章で補足をします。
(文章を補うのは整文や要約の場合。「逐語起こし」などと呼ばれる、発言を一切いじらずに言い間違いもすべて聞こえたとおりに起こす仕様の場合には例え内容が間違っていても補いません)
察知し、推測し、根拠を調べ、確定するのは人間の仕事
音声認識は、同じ文章内や過去の講演記録、ビッグデータからの学習結果などから正しく変換したり、文章作成を行ったりすることはできます。
しかし、「このことを言っているのだろう」と推測し、その根拠を確実にし、内容を変えずに発言者の意図を補う」ことは現状、人間しかできないようです。
察知し、推測し、根拠を調べ、確定するのは誰でもはできない
そして、この人間の仕事、誰にでもはできません。
特に、「ここは削除していい、ここはまとめないと伝わらない」と判断する必要がある「要約」になりますと、言語能力と調査能力、一般常識以上の知識が必要で、これは編集や紙媒体を複数経験しているレベルのライターでなければ難しそうです。
最近「要約」や「リライト」に近い作業が多くなっており、人間に読ませるだけではなく、機械が読み取れるように文章を整えてあげることもあります。
英語力も必須
AIの発展により、行間の読み方も、仕様も多様化・複雑化していて、文字起こしに求められる技術は高度化しています。
単純に「音を文字化」するのは今後機械がやるので減っていくと思いますが、言語能力が高く、高度な技術を持った人間しかできない文字起こしは、少なくとも弊社では増えてきていています。
さらには、グローバル化によって英語混じりの日本語会話も増えていますので、最低限の英語力も必要です。
逆に言えば、これらの技術があれば文字起こしに限らず、言語能力を使って柔軟に仕事得ていく、仕事を創っていくことができそうです。
コメント
この記事へのトラックバックはありません。
この記事へのコメントはありません。