ハーネスを動かすための準備
前回の動画でMCP接続ができましたので、ハーネスを動かしていきます。ハーネスが動くときは、基本的に自律で数時間動かすことになりますので、一々自分たちが許可を出すということはしません。
そのため、以下のどちらかのモードを選択してください。
- Bypass Permission モード:完全自律モード。Dangerously Skip Permissionsで実行します。
- Auto Run モード:Claude Codeが危険な操作以外は全部走らせてくれます。安全面ではこちらが安全ですが、完全自律ではなくなる可能性があります。
Bypass Permissionでも問題ないケース
個人的にはBypass Permissionでも問題ないと考えています。まだリポジトリも作成していないし、データベースにデータも入っていない初期段階であれば、万が一データが削除されても困りません。
ただし、実際のお客さんのデータが入っている場合はBypass Permissionにすると、万が一データが削除されてしまったら困るので、その場合はAuto Runモードを使いましょう。
Auto Runモードの設定方法
Auto Runモードを使いたい場合は、以下の手順で設定できます。
/configコマンドを実行する- 検索バーに「permission」と入力する
- 「Default Permission Mode」を選択する
- デフォルトの「Accept Edit」から「Automode」に変更する
- Enterキーを押して確定する
設定が見つからない場合は「Claude Autorun」や「Claude 自律的に実行 オートランモード」で検索してみてください。
ジェネレーターエージェントにTurso MCPの使用を指示する
ジェネレーターエージェントにTurso MCPについての言及がされていなかったので、追記が必要です。ジェネレーターエージェントの設定に「Turso MCPを準備したので、データベースを取り扱う場合はTurso MCPを使ってください」という記述を追加しておきましょう。
最初からこの設定をしておくべきでしたが、指定しないとMCPを使ってくれないことがあるので、この追記は重要です。
ハーネスで自律開発を開始する
準備が整ったらエージェントを稼働させて、最後までアプリ開発をやってもらいましょう。ここからは手放しで完成を待つということになります。これがハーネス設計のすごいところです。
エージェントの稼働の流れ
ジェネレーターが起動し、CLAUDE.MDファイルを読み込んでくれます。こうやってガードレールと設計をしっかり準備すれば、人間はただ待つだけでアプリが完成するという時代になりました。
ただし繰り返しになりますが、残りの10〜20%の微調整に関しては人間が適宜レビューをして指示出しをしなければ完成まではたどりつけません。ただ、その80〜90%まではハーネスの数時間の稼働でショートカットできますので、すごい時代になったと思います。
スプリントの進行
ハーネスは以下のような流れで進行します。
- ジェネレーターがコードを実装する
- デザイナーが立ち上がり、デザイントークンと画像を見てUIを仕上げる
- エバリュエーターが起動し、実装結果を評価する
スプリントの合計が6つあるので、1つのスプリントで30〜40分かかるとすると、5〜6時間くらいは自律的に開発させる形になります。
Playwright MCPによるUI自動確認
Playwright MCPが稼働していると、自分でブラウザを立ち上げなくても、AIが自律的にlocalhost:3000番でNext.jsのUIをチェックしてくれます。もちろん自分でブラウザを立ち上げて確認することも可能です。
適宜UIを見たい方はlocalhost:3000にアクセスして確認してみてください。
モデルとツールの進化について
撮影時点ではOpus 4.6を使っていますが、アップデートすればOpus 4.7が使えるようになると思います。モデルはどんどん賢くなっていくので、それに沿って出力品質も上がっていきます。
ただし、モデルの精度に関してはどんぐりの背比べというか、どのモデルも賢いです。今はClaude Codeのモデルがちょっと弱いとか、Codexの方がいいとかいう議論もありますが、結局それは時間の問題です。Anthropicは頭のいい人たちの集団なので、フィードバックをしっかりと改善して新しいモデルや画像生成機能の実装、Claude Code専用のエディタのリリースなどをやってくるはずです。
そういったアップデートに一々気を取られずに、自分なりのスキルやハーネスを構築することが大事だと思います。
Agent Teamsについて
Agent Teamsといって、複数のエージェントを並列で稼働させるという方法もあります。ただし今回の場合は、実装してからデザイン確認、デザインチェックが終わったらレビューという順序があるため、並列で稼働させるのが難しいケースです。
スプリントごとに並列でサブエージェントを起動できれば、より時短で構築できるかもしれません。ただし、Sprint 1が実装できていないとSprint 4や5の実装が難しかったりするので、並列でやると整合性が取れなくなる可能性もあります。
個人的には直列で1つのClaude Codeでやってもらうようにしています。今後Agent Teamsを使って知見を得た場合は共有したいと思います。
トークン使用量について
ハーネスで自律開発を行う場合、トークンの使用量がかなり多くなります。
- Proプラン(20ドル):足りない可能性が高い
- 100ドルプラン:この開発を最後まで終わらせるのは難しい
- 200ドルプラン:一気にやらせたい場合は必須になるかもしれない
コストは高いですが、アプリ開発がここまで時短できるのであれば、安いか高いかは皆さん次第です。最初は20ドルプラン、次に100ドルプラン、それでも足りない場合は200ドルプランというふうに、徐々に上げていけばいいと思います。
待っている間の過ごし方
AIが勝手に働いてくれるので、待っている間は別の作業をしたり、もう一つ別のプロジェクトを同じように稼働させてもいいと思います。ただしその場合はトークン使用量がとんでもないことになるので、レートリミットには気をつけてください。