AIエージェントが「仕様」を超えて「体験」を創る日:uxauditと自律開発の最前線

2026年4月10日に開催された「Claude Code Meetup」において、gota氏より発表された「仕様通り動くの先へ。Claude Codeで『使える』を検証する」というセッションは、AIエージェントによる自律開発の次なるフェーズを鮮烈に示すものでした。
これまでの自律開発は「指示されたコードを書く」「テストをパスさせる」という「機能の充足」に主眼が置かれていました。しかし、本セッションで提示されたのは、AIが人間のようにプロダクトを触り、その「体験(UX)」までを自律的に評価・改善する仕組みです。
4層構造の自律開発ハーネス
セッションで公開された開発体制の中核を成すのは、役割を分担した4つのエージェント層(ハーネス)です。これらすべてに最新の Claude 4.6 Opus が採用されています。

- Planner: 要求を解釈し、実装のロードマップを作成する。
- Builder: 実際にコードを書き、コンパイルや基本的な機能テストを通す。
- Evaluator: 実装されたコードが要求仕様を満たしているかを論理的に検証する。
- UX Reviewer: 今回の白眉。実装されたUIを実際に操作し、人間の感覚に即した評価を行う。
この多層構造により、単一のAIでは見落としがちな「論理的整合性と使い勝手の不一致」を構造的に解消しています。
5つの原則(Credo)
自律開発を成功させるための指針として、以下の5つの原則が提唱されました。
- Core First: 根幹となるロジックを優先し、周辺機能は後回しにする。
- Spec is Law: 仕様書が絶対的な正義であり、曖昧さを排除する。
- No Dead Code: 不要なコードを一切残さない。
- Iterative Refinement: 小さな改善を高速に繰り返す。
- Human in the Loop (Selective): 重要な判断のみ人間に委ねる。
これらは単なる精神論ではなく、エージェントのプロンプトやワークフローに厳格に組み込まれており、開発の「迷走」を防ぐアンカーとして機能しています。
新ツール「uxaudit」によるComputer Useの活用
最も大きな注目を集めたのが、新規開発されたプラグイン uxaudit です。これは Anthropic の Computer Use 機能を活用し、AIエージェントが実際にブラウザを開いて画面を操作、そのプロセスをスコアリングするものです。

従来のCI(継続的インテグレーション)では、ボタンが存在するか、クリック可能かといった「機能的な検証」はできても、そのボタンが押しやすい位置にあるか、操作フローが直感的かといった「体験的な検証」は困難でした。
uxaudit は、AIが「一人のユーザー」としてプロダクトを体験し、
- 操作の迷い(マウスカーソルの不自然な動き)
- 視認性の低さ
- レスポンスの体感速度 などを数値化し、Builder へフィードバックします。これにより、「バグはないが使いにくい」というプロダクトの死角を、開発段階で自動的に潰すことが可能になります。
「使える」をAIが保証する未来
「仕様通りに動く」のは、もはやAI開発における最低条件に過ぎません。これからは「人間にとって本当に使いやすいか」を、AI自身がどこまで責任を持って追求できるかが問われます。
uxaudit と多層化された自律開発ハーネス의 組み合わせは、開発コストの削減だけでなく、プロダクト品質の「底上げ」を非線形に加速させるでしょう。AIエージェントはもはや「コードを書くツール」ではなく、「体験を設計し、保証するパートナー」へと進化しています。
※本記事は Claude Code Meetup (2026.04.10) の発表内容に基づき構成しています。
Next Step
AIエージェント導入、まずは30分の無料相談から
「自社に合うのか?」「何から始めればいい?」
貴社の状況をヒアリングし、最適なAI活用プランをご提案します。


