adamsreview: Claude Code용 멀티 에이전트 PR 코드 리뷰 파이프라인

TL;DR Highlight

Claude Code에서 최대 7개의 병렬 서브 에이전트가 각각 다른 관점으로 PR을 리뷰하고, 자동 수정까지 해주는 오픈소스 플러그인이다. 기존 /review나 CodeRabbit보다 실제 버그를 더 많이 잡는다고 주장하지만 커뮤니티에서는 복잡도와 실효성에 대한 회의론도 나왔다.

Who Should Read

Claude Code(Max 플랜)를 이미 사용 중이고, 기본 /review 명령어보다 더 꼼꼼한 코드 리뷰 자동화를 원하는 개발자. 특히 혼자 또는 소규모 팀에서 PR 품질을 높이고 싶은 상황에 유용하다.

Core Mechanics

adamsreview는 Claude Code의 플러그인으로, `/plugin marketplace add adamjgmiller/adamsreview` 한 줄로 설치할 수 있다. Claude Code의 기본 구독(Max 플랜 권장)으로 실행되며, Extra Usage 크레딧을 소모하는 /ultrareview와 달리 추가 비용이 없다.
핵심 명령어는 `/adamsreview:review`로, 최대 7개의 병렬 서브 에이전트가 각각 correctness(정확성), security(보안), UX 등 서로 다른 관점에서 코드를 분석한다. 이후 중복 제거(dedup) 패스, 저비용→고비용 순서의 검증 게이트, 선택적으로 Claude Opus의 종합 패스까지 거친다.
`--ensemble` 옵션을 붙이면 내부 Claude 렌즈 외에 Codex CLI 패스와 PR 봇 댓글 스크랩까지 추가로 돌린다. 즉, OpenAI Codex와 Claude를 동시에 리뷰어로 쓰는 앙상블 구성이 가능하다.
총 6개의 명령어로 구성된 파이프라인이다: `:review`(메인 리뷰), `:codex-review`(Codex CLI 전용 리뷰), `:fix`(자동 수정 루프), `:add`(외부 소스 findings 주입), `:walkthrough`(인터랙티브 리뷰 안내), `:promote`(승인/커밋). 각 명령어는 공유 JSON 아티팩트를 통해 연결된다.
`:fix` 명령어는 자동 수정 후 재리뷰를 돌려 회귀(regression)가 생기면 자동으로 되돌린다. 즉, 고쳤다가 다른 버그를 만드는 상황을 방지하는 루프가 내장돼 있다.
`:add` 명령어로 외부에서 가져온 findings(예: Claude Cloud /ultrareview 결과 붙여넣기, 팀원 메모 등)를 기존 리뷰 아티팩트에 주입할 수 있다. 이미 발견된 항목과 중복 제거 및 검증 게이트를 동일하게 거쳐서 합쳐진다.
작자 본인의 PR에서 Claude Code 기본 /review, /ultrareview, CodeRabbit, Greptile, Codex 기본 리뷰보다 실제 버그를 더 많이 잡고 false positive는 적었다고 밝혔다. 다만 본인이 직접 인정했듯 'n=본인 1명'의 어닐돌 데이터다.
`:codex-review`는 `:review`와 동일한 아티팩트 형식을 출력해서, `:fix`, `:walkthrough` 등 다운스트림 명령어를 그대로 쓸 수 있다. `--effort low|medium|high|xhigh` 옵션으로 분석 깊이를 조절할 수 있다(기본값 high).

Evidence

멀티 에이전트 리뷰의 실효성에 대한 회의론이 가장 많이 제기됐다. '복잡성을 복잡성으로 싸운다'는 지적이 있었고, '결국 리뷰에 신경 쓰는 사람들만 이런 도구를 쓰는데, 진짜 문제는 Claude가 뱉은 걸 읽지도 않고 accept 누르는 사람들'이라는 날카로운 비판도 나왔다.
실효성을 증명할 방법론에 대한 문제 제기가 있었다. '실제 버그 클래스에 대한 eval 하네스(자동 평가 프레임워크)로 벤치마크를 돌려야 설득력이 있지, /review와 비교한 어닐돌 데이터로는 부족하다'는 댓글이 달렸다.
병렬 에이전트가 실제로 왜 더 잘 잡는지 메커니즘이 불분명하다는 의견이 있었다. '커버리지(각 에이전트가 다른 부분을 보는 것) 때문인지, 동일 부분에 대한 두 번째 의견 효과 때문인지 README만으론 명확하지 않다'는 질문이 달렸고, 작자의 명확한 답변은 없었다.
비슷한 도구를 직접 만들어봤다는 경험담도 공유됐다. TypeScript로 결정론적 멀티 에이전트 오케스트레이션을 구현해봤는데, 티켓 조회 같은 컨텍스트 수집에서 조율 에이전트가 잘 못 했다는 경험과 함께, 리뷰 지침이 너무 모호하면 피상적인 리뷰가, 너무 구체적이면 다른 종류의 PR에 적용이 안 된다는 어려움을 토로했다.
AI가 작성한 코드를 AI가 리뷰하는 것 자체에 대한 철학적 회의론도 나왔다. '나는 Claude를 시켜서 Claude에게 쓸 지침을 쓰고, 그 Claude가 Claude가 짠 코드를 리뷰한다—우리 다들 포기한 건가?'라는 댓글이 공감을 많이 받았다. 반면 사람이 직접 로컬에서 리뷰하고 그 결과를 Claude에 피드백하는 tuicr.dev 같은 도구가 더 낫다는 대안 의견도 있었다.

How to Apply

Claude Code Max 플랜을 쓰고 있고 기본 /review가 너무 피상적이라고 느낀다면, `/plugin marketplace add adamjgmiller/adamsreview` 후 `/adamsreview:review`를 실행해보자. Extra Usage 크레딧 소모 없이 7개 렌즈 리뷰를 테스트할 수 있다.
보안 취약점이나 엣지 케이스가 걱정되는 PR이라면 `--ensemble` 옵션을 붙여 Codex CLI까지 동시에 돌리는 앙상블 구성을 써볼 수 있다. 단, 토큰 소모가 커지므로 중요한 PR에만 선택적으로 적용하는 게 합리적이다.
팀원의 수동 리뷰 코멘트나 /ultrareview 결과를 이미 갖고 있다면 `:add` 명령어로 외부 findings를 기존 리뷰 아티팩트에 합쳐서 중복 없이 통합할 수 있다. 이렇게 하면 여러 소스의 리뷰를 하나의 파이프라인으로 관리할 수 있다.
자동 수정 기능이 걱정된다면 `:fix` 명령어가 수정 후 재리뷰→회귀 시 자동 롤백을 해준다는 점을 활용해서, `:walkthrough`로 수정 사항을 하나씩 확인하며 배치 수락 여부를 결정할 수 있다.

Code Example

snippet

# 설치
/plugin marketplace add adamjgmiller/adamsreview
/plugin install adamsreview@adamsreview

# 기본 멀티렌즈 리뷰 (최대 7개 병렬 에이전트)
/adamsreview:review

# Codex + Claude 앙상블 리뷰
/adamsreview:review --ensemble

# Codex CLI 전용 리뷰 (effort 조절 가능: low|medium|high|xhigh)
/adamsreview:codex-review --effort high

# 자동 수정 루프 실행
/adamsreview:fix

# 외부 findings 주입 (예: ultrareview 결과 붙여넣기)
/adamsreview:add

# 인터랙티브 리뷰 워크스루
/adamsreview:walkthrough

# 승인 및 커밋
/adamsreview:promote

Terminology

sub-agent하나의 큰 작업을 위해 병렬로 동시에 실행되는 독립적인 AI 에이전트. 여기서는 각각 보안, 정확성, UX 등 서로 다른 관점으로 코드를 분석하는 역할을 맡는다.

dedup pass중복 제거 단계. 여러 에이전트가 같은 문제를 각각 발견했을 때 중복된 findings를 하나로 합치는 과정이다.

validation gate리뷰 결과를 두 단계로 검증하는 필터. 먼저 저비용(빠른) 모델로 1차 검증하고, 통과한 것만 고비용(느린) 모델로 2차 검증해서 false positive를 줄인다.

regression수정을 했더니 기존에 잘 되던 다른 부분이 깨지는 현상. adamsreview의 :fix는 수정 후 재리뷰로 이를 감지하면 자동으로 되돌린다.

artifact여기서는 리뷰 결과를 저장하는 JSON 파일. 각 명령어(:fix, :walkthrough, :promote)가 이 파일을 공유해서 파이프라인처럼 연결된다.

ensemble여러 모델의 결과를 합쳐서 단일 모델보다 더 나은 결과를 내는 방식. 여기서는 Claude와 Codex를 동시에 리뷰어로 써서 각자 잡는 버그를 합치는 용도로 쓰인다.