AIツールの使い方
音声の文字起こしをAIに任せる使い方
録音を聞き直して打ち込む作業、思ったより夜の時間を食っていませんか。
打ち合わせの録音を、イヤホンで一時停止しながら少しずつ打ち込む。気づくと1時間の音声に2時間かかっている。やっと終わったのに、聞き取れなかった一言が空欄のまま残っている。この時間が副業の作業にそのまま乗っかってくるのが、地味につらいところだと思います。
ここをまるごと手で抱える必要は、もうありません。録音した音声をAIに渡すと、話していた内容を文字にした下書きが返ってきます。あなたがやるのは、ゼロから打つことではなく、返ってきた文を読んで直すことに変わります。
どんな仕事で効くのか
文字起こしが効くのは、声で残したものを後で文章として使いたい場面です。
たとえば、クライアントとの打ち合わせを録音しておいて、終わったあとに議事録を作る。インタビューした内容を、記事や資料の素材にする。動画やセミナーの音声から、台本やまとめを起こす。移動中にスマホへ吹き込んだアイデアを、机に戻ってから整理する。どれも、耳で聞いた言葉を手で打ち直す部分がいちばん時間を食います。そこをAIが肩代わりします。
副業の準備期間だと、まとまった作業時間を取りにくい人ほど効きます。日中の移動や家事のすき間に声でメモを残しておいて、夜にAIへ渡して文字にする。手で打つ作業が減るぶん、限られた時間を考える側に回せます。時間の作り方そのものに悩んでいるなら、文字起こしは入り口の一つになります。
逆に、最初から自分の頭の中だけで完結する短いメモなら、わざわざ録音して起こすより直接書いたほうが速いこともあります。声の素材がすでにある仕事ほど、文字起こしの効き目が大きいと考えるといいです。
渡してから手元に戻るまで
流れはシンプルです。録音した音声ファイルを用意して、対応しているAIに渡します。少し待つと、話していた内容が文章になって返ってきます。そのあと、整えてほしい形を言葉で頼みます。
たとえば「話し言葉のままでいいので、誰が話したか分けて」と頼めば、発言者ごとに区切った形になります。「議事録の体裁で、決まったことと宿題を分けて」と頼めば、要点を拾った形にしてくれます。料理でいえば、AIが下ごしらえまでやってくれて、味つけと盛りつけはあなたが指示する感覚に近いです。
ここでつまずきやすいのが、長い録音をそのまま一度に渡すことです。1時間を超える音声は、途中で精度が落ちたり、後半が雑になったりします。15分や20分くらいに区切って渡すと、最後まで安定しやすいです。区切る手間が惜しいときも、長い1本を出してがっかりするより、最初から分けたほうが結局は早く仕上がります。
もう一つ覚えておくと楽なのが、録音そのものの質です。スマホをポケットに入れたまま録った音声と、机の真ん中に置いて録った音声では、起こしたあとの直しの量がまるで違います。雑音が多いほど、AIは言葉を取りこぼします。カフェのざわめき、エアコンの風、机を叩く音。こうした生活音が混じると、言葉の輪郭がぼやけて別の単語に化けます。録る側で少し気をつけるだけで、あとの作業が軽くなります。
手元でできる工夫はそんなに難しくありません。スマホを話し手のほうへ向けて置く。複数人なら机の真ん中に寄せる。窓を閉めて外の音を減らす。これだけで起こしたあとの空欄が目に見えて減ります。録音の段階で5分手をかけておくと、文字を直す段階で30分得をする、という関係になりがちです。頼み方そのものに迷うときは、AIへのお願いのコツの考え方がそのまま使えます。
返ってきた文字は下書きとして読む
ここがいちばん大事なところです。AIの文字起こしは、聞きまちがえます。
特にあやういのが、人の名前、会社名、専門用語、そして数字です。耳で聞けば一発で分かる固有名詞ほど、文字にすると別の言葉に化けています。日付や金額がずれていると、議事録としては使いものになりません。だから、返ってきた文章は完成品ではなく、あくまで下書きとして読みます。
現場では、こんな直し方をします。まず全体をざっと読んで、流れがおかしい箇所に当たりをつける。名前と数字が出てくる部分だけ、録音の該当箇所を聞き直して確かめる。残りは読みやすさを整える。全部を聞き直すのではなく、まちがえやすい場所を狙って確認するのがコツです。
赤ペンで原稿を直す作業に似ています。下書きが手元にある状態から始めれば、白紙から書くより気持ちはずっと楽です。直す場所もだいたい決まっていて、固有名詞と数字に印をつけながら読んでいけば、抜けが起きにくくなります。この確認をはさむかどうかで、渡した相手の信頼が変わります。聞きまちがいに気づかず議事録を送ってしまうと、あとで訂正のやり取りが増えて、かえって時間を取られます。AIの出力を信じすぎない姿勢については、AIの答えを、うのみにしないコツも合わせて読むと、確認の感覚がつかめます。
渡してよい音声かを、先に考える
時短のうれしさで見落としがちなのが、その音声を外のサービスに渡していいのか、という点です。
録音には、話した人の声と、その人が話した中身がそのまま入っています。本人の許可なく録ったもの、社外に出していない内容、個人が特定できる相談ごと。こうした音声を、内容を確かめないままAIに渡すのは避けたほうがいいです。文字に起こしたあとも、元の音声に何が入っていたかは消えません。一度外に出した情報は、あとから取り消せないと考えておくと判断を誤りにくいです。
手元では、渡す前に一度立ち止まって考えます。これは公開してよい情報か。録音について相手の了解はあるか。会社や職場のルールで、外のツールに上げてよい範囲に収まっているか。ひとつでも引っかかるなら、その音声は渡さず、別の方法を考えます。判断に迷ったら、渡さない側に倒しておくほうが安全です。練習のうちは、自分が話した内容や公開されている素材だけで試せば、こうした不安なく手を動かせます。公務員の方は、職場の情報そのものを練習に使わない前提で、公開情報だけでできるAI練習メニューのような素材から慣れていくのが安全です。可否は所属の規程と許可によります。当サイトはそれを判断しません。
慣れたら、調べものとつなげる
文字起こしに慣れてくると、その先の作業ともつながってきます。
たとえば、インタビューを文字に起こしたあと、その内容を要約させたり、必要な部分を抜き出させたりできます。打ち合わせの起こしから、宿題だけを箇条書きで取り出して、そのままタスクの一覧にする使い方もできます。声で集めた素材を、調べものや資料づくりの入り口として使う流れです。録音を文字にする部分が速くなると、そのあとの工程に手を回す余裕が生まれます。調べもの全体を効率化する進め方は調べもの仕事を、AIで半分の時間にするにまとめてあります。
文字起こしAIは、聞き直して打ち込む時間を下書きづくりに置き換えてくれます。名前と数字は自分の手で確かめる。渡してよい音声かを先に考える。この2つさえ外さなければ、空いた時間を、本来やりたかった仕事に回せます。