3-Agent 팀(Architect + Builder + Reviewer)으로 Claude 코딩 워크플로우 정리하기
I replaced chaotic solo Claude coding with a simple 3-agent team (Architect + Builder + Reviewer) — it's stupidly effective and token-efficient
TL;DR Highlight
AI 코딩 에이전트의 Architect→Builder→Reviewer 3역할 분할이 토큰 사용량을 감소시키고 hallucination 발생률을 낮춤.
Who Should Read
Claude Code나 Cursor로 복잡한 기능을 개발하다가 에이전트가 맥락을 잃거나 요청하지 않은 기능을 마음대로 추가하는 문제를 겪는 개발자. 멀티 에이전트 구조를 실제 코딩 워크플로우에 바로 도입하고 싶은 사람.
Core Mechanics
- 단일 에이전트에 모든 작업을 맡기면 컨텍스트가 비대해지면서 drift(의도 벗어남)와 hallucination이 늘어나는데, 역할 분리로 이를 해결.
- Architect는 요청을 분석해 구체적인 작업 브리프(brief)로 쪼개는 역할만 담당. 구현은 일절 하지 않음.
- Builder는 브리프에 적힌 것만 구현. '있으면 좋겠다' 싶은 기능을 임의로 추가하는 행동을 규칙으로 차단.
- Reviewer는 결과물이 브리프 요구사항을 충족하는지만 검토. 승인 없이는 다음 단계로 넘어가지 않음.
- 에이전트 간 인수인계(handoff)는 `handoff/` 폴더의 마크다운 파일로 처리. 불필요한 컨텍스트 재독을 막는 규칙이 내장되어 토큰 절감.
- Claude Code, Cursor, VS Code 등 어느 환경에서나, 어느 LLM과도 사용 가능. 30초 글로벌 설치 지원.
Evidence
- 단일 에이전트 대비 토큰 사용량이 '대폭(massive)' 감소한다고 저자가 명시. 구체적 수치는 논문에 없으나, 불필요한 컨텍스트 재독 차단 규칙이 직접적 원인.
- strict sequence(Architect→Builder→Reviewer 고정 순서) 적용 후 drift와 hallucination이 눈에 띄게 줄었다고 보고. 정량 수치는 미제공.
How to Apply
- 새 기능 개발 시 Architect 에이전트에게 요청사항을 넘기고 브리프 파일을 받은 뒤, Builder에게 그 파일만 주고 구현하게 하면 된다. '브리프에 없는 건 하지 말 것' 규칙을 시스템 프롬프트에 명시하는 게 핵심.
- Reviewer 에이전트에게는 브리프 파일과 구현 결과물만 제공하고 '브리프 기준으로만 판단할 것'을 지시. 코드 스타일이나 개인 선호로 범위를 벗어나지 않도록 제한.
- 에이전트 간 전달 내용은 `handoff/` 폴더의 마크다운 파일로 관리. 채팅 히스토리 전체를 넘기지 않으므로 다음 에이전트의 컨텍스트 창 낭비를 막을 수 있음.
Code Example
# handoff/brief.md 예시 (Architect → Builder)
## Task Brief
**Goal:** 사용자 프로필 수정 API 엔드포인트 추가
**Scope (이것만 구현):**
- `PATCH /api/users/:id` 엔드포인트
- 수정 가능 필드: name, bio (email 제외)
- 입력 유효성 검사 포함
**Out of Scope (절대 추가 금지):**
- 인증 미들웨어 변경
- 다른 엔드포인트 수정
- 리팩토링
**완료 기준:**
- 위 두 필드만 업데이트됨
- 잘못된 입력 시 400 반환
- 기존 테스트 통과
---
# Builder 시스템 프롬프트 예시
"brief.md에 명시된 것만 구현하라.
범위 밖 기능 추가, 리팩토링, 스타일 변경 금지.
완료 후 handoff/review-request.md에 변경 파일 목록 작성."Terminology
관련 논문
adamsreview: Claude Code용 멀티 에이전트 PR 코드 리뷰 파이프라인
Claude Code에서 최대 7개의 병렬 서브 에이전트가 각각 다른 관점으로 PR을 리뷰하고, 자동 수정까지 해주는 오픈소스 플러그인이다. 기존 /review나 CodeRabbit보다 실제 버그를 더 많이 잡는다고 주장하지만 커뮤니티에서는 복잡도와 실효성에 대한 회의론도 나왔다.
Claude를 User Space IP Stack으로 써서 Ping에 응답시키면 얼마나 빠를까?
Claude Code에게 IP 패킷을 직접 파싱하고 ICMP echo reply를 구성하도록 시켜서 실제로 ping에 응답하게 만든 실험으로, 'Markdown이 곧 코드이고 LLM이 프로세서'라는 아이디어를 네트워크 스택 수준까지 밀어붙인 재미있는 사례다.
AI Agent를 위한 Git: re_gent
AI 코딩 에이전트(Claude Code 등)가 수행한 모든 툴 호출을 자동으로 추적하고, 어떤 프롬프트가 어느 코드 줄을 작성했는지 blame까지 가능한 버전 관리 도구다.
Agent-Native CLI를 위한 설계 원칙 10가지
AI 에이전트가 CLI 도구를 더 잘 사용할 수 있도록 설계하는 원칙들을 정리한 글로, 에이전트가 CLI를 도구로 활용하는 빈도가 높아지면서 이 설계 방식이 실용적으로 중요해지고 있다.
Agent-harness-kit: MCP 기반 멀티 에이전트 워크플로우 오케스트레이션 프레임워크
여러 AI 에이전트가 서로 역할을 나눠 협업할 수 있도록 조율하는 scaffolding 도구로, Vite처럼 설정 없이 빠르게 멀티 에이전트 파이프라인을 구성할 수 있다.
Tilde.run – AI Agent를 위한 트랜잭션 기반 버전 관리 파일시스템 샌드박스
AI 에이전트가 실제 프로덕션 데이터를 건드려도 롤백할 수 있는 격리된 샌드박스 환경을 제공하는 도구로, GitHub/S3/Google Drive를 하나의 버전 관리 파일시스템으로 묶어준다.