こんにちは、HALDATA代表のHALです。
今回は、当社で実際に運用している「議事録の生成フロー」についてご紹介します。
SaaSを開発・運営している会社として、日々のミーティングの量も多く、関係者も多岐にわたるため、議事録の整備と共有は業務効率を大きく左右します。
一方で、「議事録作成に時間をかけすぎたくない」「でも品質は担保したい」というジレンマもありますよね。
当社では、以下のようなシンプルなフローで、議事録を低コスト・高精度・省力化して運用しています。
議事録生成フロー(全体像)
-
Zoom 録音をクラウド保存 → MP4出力
-
ElevenLabs による文字起こし(STT)
-
ChatGPT(GPT-o3 pro)で要約・アクション抽出
この3ステップで、実際の手作業は10分程度。
現在の体制では、これがもっとも「実用的で費用対効果の高い」方法だと考えています。
ステップ1: Zoomクラウド録音 → MP4出力
社内外の打ち合わせは基本的にZoomを使用しています。
ミーティング時には必ず録音をONにし、クラウド保存されるよう設定しています。録音後はZoomの管理画面からMP4形式でダウンロード可能です。
このZoomのクラウド録音契約(月額5,000円程度)は、もともと会社の標準ツールとして導入済みなので、議事録目的に追加コストは発生していません。
ステップ2: ElevenLabsでの音声文字起こし
取得したMP4ファイルは、そのままElevenLabsのSpeech-to-Text機能にアップロードします。
当社では月間25~30時間ほどの会議音声を処理していますが、費用は1.5万円前後に収まります。
文字起こしの精度は非常に高く、日本語はもちろん、ベトナム語にも十分対応している点がありがたいです。当社は海外チームとのやりとりもあるため、言語対応は重要です。
(ただし、消費クレジットを押さえるため、mp4の会議動画を音声m4aファイルに圧縮してから取り込みしてることだけ注釈として書いときます。)
ステップ3: ChatGPTで要約・アクション抽出
ElevenLabsで得られたテキストを、**ChatGPT(GPT-o3 Pro)**に投げ込み、要点の要約と次回アクションを抽出します。
ChatGPTはTeam Plan(約3,000円/月)を契約しており、以下のようなテンプレートで自動整形を行っています:
-
会議の要点(箇条書きで3~5項目)
-
決定事項の整理
-
次回アクションリスト(担当+期限)
これにより、読みやすく・実行につながる議事録がほぼ自動で完成します。
コストの全体感
区分 | サービス | 月額目安 | 備考 |
---|---|---|---|
録音・会議管理 | Zoom Business | 約5,000円 | 既存契約 |
音声認識(STT) | ElevenLabs.io | 約15,000円 | 25時間想定 |
要約処理 | ChatGPT o3 Pro(Team) | 約3,000円 | 月内無制限使用可 |
実質追加コスト | - | 約15,000円 | ElevenLabs分のみ |
実作業時間は「10分以内」
ツールの組み合わせで自動化度合いを高めた結果、実際の人手による処理は以下のとおり、合計10分以内に収まります:
-
ZoomからMP4ダウンロード(1分)
-
ElevenLabsにアップロード(1分)
-
出力されたテキストをChatGPTに入力(2分)
-
ChatGPTの出力をNotionやSlackに転記(3〜4分)
-
最終確認・投稿(2分)
議事録作成ツールは高いと思われがちですが、この組み合わせだと費用を大きく削減できます。
現時点では、当社にとってこの構成が最適だと考えていますが、事業フェーズやチーム構成によってベストな手法は異なるはずです。
みなさんの会社では、どのような運用をされていますか?もっと良い方法があればぜひ!