言語データ

テキストアノテーション(教師データ作成) / 音声起こし

テキストアノテーション

ことの葉舎は、取材執筆、コピーライティング、編集、音声起こし等、言葉を使ったサービスを提供してきました。表現手段としての言葉、データとしての言葉、両面から取り扱ってきた弊社は、ゆらぎのある人の言葉(自然言語)を機械処理に適した教師データに加工するテキストアノテーションも得意としています。システムやサービスにより多用な仕様が考えられるテキストアノテーションを、じっくりとご相談しながら臨機応変に対応いたします。

教師データ作成実績

実績
  • 熊本弁会話生成
  • 標準語会話生成
  • 熊本弁⇔標準語変換
  • 対顧客会話ラベリング(メイン・サブ組み合わせタグ)
  • 対顧客会話ラベリング(複数タグ)
  • 複数人会話タグ付け(書き起こし・タイムコード・タグ付け10種~)

Excel、CSV、JSONファイル、テキストファイル等にも対応。ファイル準備からご相談に応じます。

工程・作業日数例(10,000文の場合)

工程内容必要日数
(概算)
お見積内容をお打合せ後、概算見積5営業日
作業準備弊社にてファイル変換、Excelフォーマット作成等が必要な場合5営業日
仕様検証100単文程度を作業して納品5営業日
仕様調整テスト納品を鑑み仕様の修正5営業日
実作業アノテーターによるタグ付作業20営業日
概ねの工程になります。詳細はご相談ください。
弊社の営業日=平日となります(年末年始・夏季休業を除く)

上記は参考です。料金や納期は仕様やタグの数等で変動しますので、まずはご相談ください。

ことの葉舎は「データ」「表現」の両面から言葉に関する業務を行っており、ゆらぎのある自然言語に対して柔軟な日本語データ・記事の作成が可能です。

仕様に沿った音声起こしやアノテーション、インタビュー記事執筆等を常時行っているため、「データ」と「表現」の中間とも言える発話シナリオの創作・生成や発話の言い換え、文章の書き換えなどにも対応いたします。

音声起こし(文字起こし・テープ起こし)

ICレコーダーやZoomなどのビデオ会議を録音・録画したデータを文字に書き起こします。

ことの葉舎の書き起こしは、音声を文字にするだけではなく、用途に合わせた細かな処理ができること、文章表現力が高く要約やリライト、記事の執筆まで行えることが特長です。

書き起こしの正確さ、調査力も評価をいただいており、品質重視の音声起こしを求める方に継続してご依頼いただいています。

基本の起こし方は【整文】

「あのー、えーと」などの無意味語や単なるあいづちを削除し、「しちゃって」→「してしまって」など崩れた日本語を整えます。発言をほぼそのまま再現しながら文章として読みやすくする、最もご依頼の多い起こし方です。

弊社では基本的に整文で書き起こし、納期によって料金が変わります。480分を越える長時間音声は別途お見積となります。

「逐語起こし」「要約」「ラベリング」等はオプションメニューをご覧ください。

ミニマムチャージとして8,000円をご請求させていただきます(2021年12月~)

動画の場合も同料金です(2021年5月~)

通常納期

単価:300円/1分 ※税別

音声長さ必要納期
120分まで中3~5営業日以上  
240分まで中6~8営業日 以上
480分まで中9~11営業日 以上
特急

単価:380円/1分 ※税別

音声長さ必要納期
120分まで中1~2営業日
240分まで中3営業日
480分まで中6営業日
翌日納品

整文起こしのみ(オプション非対応)・2週間前までに要予約・90分まで

30分430円/1分
60分450円/1分
90分520円/1分

◀受付時間(9:00~17:00)までに音声をお渡しいただければ翌営業日中に納品します
◀スピード重視・ダブルチェックは行いませんのでご了承ください
◀オプションはお受けできません
◀春・秋の繁忙期はお受けできない場合があります

当日納品 

整文起こしのみ(オプション非対応)・2週間前までに要予約・90分まで

30分580円/1分
60分630円/1分
90分670円/1分

◀10時までに音声をいただければ当日中に納品します
◀スピード重視・ダブルチェックは行いませんのでご了承ください
◀オプションはお受けできません
◀春・秋の繁忙期はお受けできない場合があります

オプション
逐語起こし(起こし単価+20円~)
「あのー」「えーと」などのフィラー(無意味語)も書き起こす(あいづちは起こしません)
あいづち挿入 (起こし単価+40円~)
「うん」「ええ」などのあいづちを書き起こす
(通常逐語起こしとセットになります)
要約(起こし単価+300円~)
仕様に沿って簡潔に文章を整理し、語尾を統一
(議事録や機械翻訳で使われます)
リライト・執筆(個別見積)
用途や記事の内容をお伺いの上個別にお見積
ラベリング(個別見積)
用途やタグの数、内容をお伺いの上個別にお見積
文節分割(個別見積)
文節で文章を分割しExcel等に入力し
(テキストアノテーション・ラベリング等に用います)
タイムコード(個別見積)
挿入箇所・タイミングでお見積
専門用語頻出(個別見積)
医師同士など専門性の高い用語が頻出し、資料もない場合

音声起こし・音声データライティングの例をダウンロードしていただけます

「音声起こし・音声データライティングのサンプル」(PDFファイルダウンロード)

お問い合わせ・お見積