ブラッシュアップの過程
裏でいろんな動画をClaude Codeで修正・編集してもらい、出力を見て良かったこと・悪かったことをブラッシュアップしてみました。
ブラッシュアップの方法は、「ここが無音部分が多いです」「最後がちょっと切り取られていません」「『あのー』『えーと』がまだ残っています」というように修正依頼を出していくだけです。要は編集者に対して「ここをもっと修正してください」と伝えるのとほぼ同じです。
動画編集ワークフローの全体像
ある程度ワークフローが確立されたので、その内容を説明します。大きく4〜5ステップあります。
ステップ1:元動画を渡す
元動画をClaude Codeに渡します。
ステップ2:文字起こしとレビュー
最初に無音検出させても良かったのですが、何回か品質チェックしたところ、まず文字起こしをしてからClaude Codeにその文字起こしが問題ないかを判断させ、その後に無音検出させるというフローの方が出力精度が良かったです。
文字起こしはElevenLabsを使っています。文字起こしした内容に誤字がないか、言い直しがないかをClaude Codeに判断してもらいます。Claude Codeを使うのでサブスクのトークンが使えるため、クラウドAPIの従量課金ではなく、ほぼ無料の感覚です。
ステップ3:無音検出とカット
文章のレビューが終わったら、ギャップ(無音部分)の検出です。例えば0.43秒以上無音が続いたらそこをカットするように指示出ししています。この値は皆さんの動画によって全然変わってきますので、どのくらい余白を設けるのかは自分で決めてください。
ステップ3.5:レビュー
ここでレビューを挟んでいます。今までのClaude Codeの修正と無音編集の部分がちゃんと適切かを、技術レビューとコンテンツレビューの2つのサブエージェントを作って、それぞれのコンテキストで第三者目線からレビューしてもらいます。
今回はワークフローが複雑でメインコンテキストを圧迫しそうだったので、レビュー用のサブエージェントを追加しています。基本的に何かしら出力をレビューするときはサブエージェント化したほうが良いです。これはコーディングでも同様で、Evaluatorという評価用のエージェントは作ったほうが良いと思います。
ステップ4:エンコード・動画出力
レビューに合格したら、最後にエンコードして動画を出力します。例えば7デシベルプラスして出力させています。これで最終的に編集済みの動画となります。
現時点の品質について
何回か動画の出力を見てみましたが、これで投げて全部完璧に出力されるかというと、少し微妙な部分がまだ残っています。最終的に人間のレビューはやはり挟まなければいけないと思いました。
ただ、1から自分で全部編集するよりは、1回このvideo-useのスキルを発動してから自身で手直ししたほうが結構効率化になるかなと思います。あとは品質のレビューをするだけという感じです。
スキル化の実施
ワークフローが確認できたので、これをスキル化していきます。「今までやってきたワークフローをスキル化してください」と伝えるだけでOKです。
スキル化した結果、video-editというスキル名で作成されました。先ほど図解で説明したフローをスキル化しただけです。動画編集するときは動画を渡して「動画編集して」と言うだけでスキルが発動するようになります。もしくはスラッシュコマンドで呼び出してもいいと思います。呼び出すと自動的に途中のレビューはサブエージェントが立ち上がります。
サブエージェント化のすすめ
そもそもこの動画編集自体を部署分けしてチーム化して、それをサブエージェントにしても良いと思います。そのほうがメインコンテキストが汚れないのできれいです。
今の仮想組織に関しては動画編集だけじゃなくて、いろんな業務も行っています。例えばXの自動化や請求書作成など、それらはメインコンテキストで使いたいわけです。だから動画編集は別でサブエージェントを起動したほうが、よりスマートに運用できるでしょう。
Claude Code運営を続けていくと、どこでサブエージェントに渡せばいいのかがなんとなく分かってきます。なるべくコンテキストは綺麗な状態に保って、ハーネスを設計してサブエージェントを作ってやっていきましょう。