ElevenLabsの導入
前回の動画で無音カットの編集はできましたが、言い直しカット(同じことを繰り返して言っているところのカット)も行いたいので、今回はElevenLabsを導入していきます。GitHubのリポジトリに書いてあった通りに進めます。
ElevenLabsのアカウント作成手順
- Googleで「ElevenLabs」と検索し、「Free AI Voice Generator」をクリック
- サインアップする
- ダッシュボードで「Developers」を押し、「Creative」を選択
- 名前を入力し、言語は日本語を選択
- 利用目的は個人利用・コンテンツビジネスなどを選択
- やりたいことは「音声からテキスト変換(Speech to Text)」が一番近い
プランの選択については、無料枠がありますのでスキップで最初は大丈夫です。月額22ドルや11ドルで動画編集を全部任せられるなら、非常に安いと思います。
APIキーの発行
APIキーを発行する必要があるので、「Developer」ボタンを押してAPIキーの作成画面に進みます。
- 名前は何でもOK(例:VideoEdit API)
- クレジットの限度額は無制限にしておく(最初30に設定すると制限がかかってしまう)
- アクセス権限はSpeech to Textを選択(それ以外は不要)
セキュリティに関する注意
APIキーは第三者に見せないようにしてください。また、Claude Codeにも直接渡さないようにしましょう。Claude Codeに渡してしまうと履歴として残ってしまうため、セキュリティ的によろしくないという話が最近あります。自分で環境変数に設定するのが一番安全です。
.envファイルを作成して、APIキーを手動で貼り付けていきます。
言い直しカット編集の実行
ElevenLabsの設定ができたので、video-useスキルが全部使えるようになりました。先ほど編集してもらった無音カットの動画に対して、以下の指示を出します。
「言い直ししている箇所があるので、そこを違和感なくカットして動画を生成してください。複数言い直していると思いますが、最後の方を採用して違和感なく編集をしてください。」
ElevenLabsがあれば文字起こしができるので、字幕のテロップなども全部付け加えることができます。
編集結果の確認
修正してもらった結果、言い直した箇所が24.9秒あったとのことで、それらがカットされました。
ただし確認してみると、冒頭部分の最初の一文字がカットされてしまっていて少し違和感がありました。会話の始めにはちゃんとバッファーを設けてほしいなど、さらに指示出しをして品質を上げていく作業が必要です。
ブラッシュアップの繰り返し
Claude Codeと何度も往復して動画の出力結果を見ながら修正していきました。ある程度いい品質の動画が出力されるようになったので、今後の動画編集はこのvideo-useを使って編集していこうと思います。
まだ100%完璧ではないので、いろんな動画を読み込ませて出力結果の品質を見ながらさらに修正を重ねるという作業は必要ですが、とりあえず合格ラインかなと思います。
続いての動画では、動画編集のワークフローを説明して、それをスキルに落とし込み、そのスキルを呼び出すだけで毎回動画を編集してくれるようにしていきます。