adamsreview: Claude Code용 멀티 에이전트 PR 코드 리뷰 파이프라인
Show HN: adamsreview – better multi-agent PR reviews for Claude Code
TL;DR Highlight
Claude Code에서 최대 7개의 병렬 서브 에이전트가 각각 다른 관점으로 PR을 리뷰하고, 자동 수정까지 해주는 오픈소스 플러그인이다. 기존 /review나 CodeRabbit보다 실제 버그를 더 많이 잡는다고 주장하지만 커뮤니티에서는 복잡도와 실효성에 대한 회의론도 나왔다.
Who Should Read
Claude Code(Max 플랜)를 이미 사용 중이고, 기본 /review 명령어보다 더 꼼꼼한 코드 리뷰 자동화를 원하는 개발자. 특히 혼자 또는 소규모 팀에서 PR 품질을 높이고 싶은 상황에 유용하다.
Core Mechanics
- adamsreview는 Claude Code의 플러그인으로, `/plugin marketplace add adamjgmiller/adamsreview` 한 줄로 설치할 수 있다. Claude Code의 기본 구독(Max 플랜 권장)으로 실행되며, Extra Usage 크레딧을 소모하는 /ultrareview와 달리 추가 비용이 없다.
- 핵심 명령어는 `/adamsreview:review`로, 최대 7개의 병렬 서브 에이전트가 각각 correctness(정확성), security(보안), UX 등 서로 다른 관점에서 코드를 분석한다. 이후 중복 제거(dedup) 패스, 저비용→고비용 순서의 검증 게이트, 선택적으로 Claude Opus의 종합 패스까지 거친다.
- `--ensemble` 옵션을 붙이면 내부 Claude 렌즈 외에 Codex CLI 패스와 PR 봇 댓글 스크랩까지 추가로 돌린다. 즉, OpenAI Codex와 Claude를 동시에 리뷰어로 쓰는 앙상블 구성이 가능하다.
- 총 6개의 명령어로 구성된 파이프라인이다: `:review`(메인 리뷰), `:codex-review`(Codex CLI 전용 리뷰), `:fix`(자동 수정 루프), `:add`(외부 소스 findings 주입), `:walkthrough`(인터랙티브 리뷰 안내), `:promote`(승인/커밋). 각 명령어는 공유 JSON 아티팩트를 통해 연결된다.
- `:fix` 명령어는 자동 수정 후 재리뷰를 돌려 회귀(regression)가 생기면 자동으로 되돌린다. 즉, 고쳤다가 다른 버그를 만드는 상황을 방지하는 루프가 내장돼 있다.
- `:add` 명령어로 외부에서 가져온 findings(예: Claude Cloud /ultrareview 결과 붙여넣기, 팀원 메모 등)를 기존 리뷰 아티팩트에 주입할 수 있다. 이미 발견된 항목과 중복 제거 및 검증 게이트를 동일하게 거쳐서 합쳐진다.
- 작자 본인의 PR에서 Claude Code 기본 /review, /ultrareview, CodeRabbit, Greptile, Codex 기본 리뷰보다 실제 버그를 더 많이 잡고 false positive는 적었다고 밝혔다. 다만 본인이 직접 인정했듯 'n=본인 1명'의 어닐돌 데이터다.
- `:codex-review`는 `:review`와 동일한 아티팩트 형식을 출력해서, `:fix`, `:walkthrough` 등 다운스트림 명령어를 그대로 쓸 수 있다. `--effort low|medium|high|xhigh` 옵션으로 분석 깊이를 조절할 수 있다(기본값 high).
Evidence
- 멀티 에이전트 리뷰의 실효성에 대한 회의론이 가장 많이 제기됐다. '복잡성을 복잡성으로 싸운다'는 지적이 있었고, '결국 리뷰에 신경 쓰는 사람들만 이런 도구를 쓰는데, 진짜 문제는 Claude가 뱉은 걸 읽지도 않고 accept 누르는 사람들'이라는 날카로운 비판도 나왔다.
- 실효성을 증명할 방법론에 대한 문제 제기가 있었다. '실제 버그 클래스에 대한 eval 하네스(자동 평가 프레임워크)로 벤치마크를 돌려야 설득력이 있지, /review와 비교한 어닐돌 데이터로는 부족하다'는 댓글이 달렸다.
- 병렬 에이전트가 실제로 왜 더 잘 잡는지 메커니즘이 불분명하다는 의견이 있었다. '커버리지(각 에이전트가 다른 부분을 보는 것) 때문인지, 동일 부분에 대한 두 번째 의견 효과 때문인지 README만으론 명확하지 않다'는 질문이 달렸고, 작자의 명확한 답변은 없었다.
- 비슷한 도구를 직접 만들어봤다는 경험담도 공유됐다. TypeScript로 결정론적 멀티 에이전트 오케스트레이션을 구현해봤는데, 티켓 조회 같은 컨텍스트 수집에서 조율 에이전트가 잘 못 했다는 경험과 함께, 리뷰 지침이 너무 모호하면 피상적인 리뷰가, 너무 구체적이면 다른 종류의 PR에 적용이 안 된다는 어려움을 토로했다.
- AI가 작성한 코드를 AI가 리뷰하는 것 자체에 대한 철학적 회의론도 나왔다. '나는 Claude를 시켜서 Claude에게 쓸 지침을 쓰고, 그 Claude가 Claude가 짠 코드를 리뷰한다—우리 다들 포기한 건가?'라는 댓글이 공감을 많이 받았다. 반면 사람이 직접 로컬에서 리뷰하고 그 결과를 Claude에 피드백하는 tuicr.dev 같은 도구가 더 낫다는 대안 의견도 있었다.
How to Apply
- Claude Code Max 플랜을 쓰고 있고 기본 /review가 너무 피상적이라고 느낀다면, `/plugin marketplace add adamjgmiller/adamsreview` 후 `/adamsreview:review`를 실행해보자. Extra Usage 크레딧 소모 없이 7개 렌즈 리뷰를 테스트할 수 있다.
- 보안 취약점이나 엣지 케이스가 걱정되는 PR이라면 `--ensemble` 옵션을 붙여 Codex CLI까지 동시에 돌리는 앙상블 구성을 써볼 수 있다. 단, 토큰 소모가 커지므로 중요한 PR에만 선택적으로 적용하는 게 합리적이다.
- 팀원의 수동 리뷰 코멘트나 /ultrareview 결과를 이미 갖고 있다면 `:add` 명령어로 외부 findings를 기존 리뷰 아티팩트에 합쳐서 중복 없이 통합할 수 있다. 이렇게 하면 여러 소스의 리뷰를 하나의 파이프라인으로 관리할 수 있다.
- 자동 수정 기능이 걱정된다면 `:fix` 명령어가 수정 후 재리뷰→회귀 시 자동 롤백을 해준다는 점을 활용해서, `:walkthrough`로 수정 사항을 하나씩 확인하며 배치 수락 여부를 결정할 수 있다.
Code Example
# 설치
/plugin marketplace add adamjgmiller/adamsreview
/plugin install adamsreview@adamsreview
# 기본 멀티렌즈 리뷰 (최대 7개 병렬 에이전트)
/adamsreview:review
# Codex + Claude 앙상블 리뷰
/adamsreview:review --ensemble
# Codex CLI 전용 리뷰 (effort 조절 가능: low|medium|high|xhigh)
/adamsreview:codex-review --effort high
# 자동 수정 루프 실행
/adamsreview:fix
# 외부 findings 주입 (예: ultrareview 결과 붙여넣기)
/adamsreview:add
# 인터랙티브 리뷰 워크스루
/adamsreview:walkthrough
# 승인 및 커밋
/adamsreview:promoteTerminology
관련 논문
ctx – 로컬 머신의 코딩 에이전트 히스토리를 검색하는 CLI 도구
Claude Code, Cursor, Codex 등 코딩 에이전트가 이전 세션의 논의·결정·실패 시도를 잊지 않도록 SQLite로 인덱싱해 재사용할 수 있게 해주는 오픈소스 CLI 도구다.
Micro-Agent: Model API 내부 협업으로 Frontier 모델을 이기는 방법 (vLLM Semantic Router)
vLLM 팀이 단일 모델 API 호출 뒤에서 여러 모델이 협업하는 'Micro-Agent' 개념을 공개했습니다. 별도의 에이전트 코드 없이 라우터 레이어에서 모델 조합을 실행해 GPT-4급 결과를 더 저렴하게 낼 수 있다는 아이디어입니다.
Ornith-1.0: 에이전틱 코딩을 위한 자기 개선형 오픈소스 모델
Gemma 4와 Qwen 3.5를 기반으로 파인튜닝한 코딩 특화 오픈소스 모델로, RL(강화학습)을 통해 스캐폴드(에이전트 실행 구조)까지 함께 최적화하는 방식을 주장하지만, 커뮤니티에서는 벤치마크 과최적화에 불과하다는 의심을 받고 있다.
Tool-Augmented Agent에서의 Entity Binding 실패 분석
AI 에이전트가 올바른 도구를 선택해도 잘못된 대상에 실행하는 'Entity Binding 실패' 문제를 정의하고, 이를 막는 실행 정책을 평가한 논문.
Herdr: 터미널에서 여러 AI Agent를 한 번에 관리하는 Agent Multiplexer
여러 AI 코딩 에이전트(Claude, Codex 등)를 하나의 터미널에서 동시에 실행·관리할 수 있는 Rust 기반 오픈소스 툴로, tmux처럼 세션이 유지되고 SSH로 원격 접속도 가능해 멀티 에이전트 워크플로우를 크게 단순화해준다.
Ornith-1.0: 스스로 Scaffold를 생성하는 Agentic Coding LLM
모델이 문제 풀이 전략(scaffold)을 직접 생성하고 개선하는 자기강화 학습 프레임워크를 적용한 오픈소스 코딩 특화 LLM으로, 9B 소형 모델부터 397B 대형 모델까지 라인업을 갖추고 SWE-Bench 등 주요 벤치마크에서 Claude Opus 4.7을 능가하는 성능을 보여줬다.