Claude 4.7이 Stop Hook을 무시하는 문제
Tell HN: Claude 4.7 is ignoring stop hooks
TL;DR Highlight
Claude Code에서 stop hook 설정이 Claude 4.7에서 제대로 동작하지 않는다는 사용자 보고와 함께, hook이 왜 무시되는지에 대한 기술적 원인 분석이 활발하게 논의됐다.
Who Should Read
Claude Code를 활용해 자동화 워크플로우를 구성하고 있거나, stop hook / lifecycle hook으로 에이전트 행동을 제어하려는 개발자.
Core Mechanics
- Claude Code의 stop hook은 크게 두 가지 방식으로 동작한다. 하나는 exit code 2 + stderr를 사용하는 '진짜 제어 방식'이고, 다른 하나는 stdout에 JSON을 출력하는 방식인데 이 둘의 동작 방식이 근본적으로 다르다.
- stdout JSON 방식은 결과적으로 모델의 tool result 컨텍스트로 들어가는데, 이 영역은 Anthropic이 프롬프트 인젝션 방어를 위해 의도적으로 모델이 지시를 무시하도록 훈련시킨 곳이다. 즉 'hook에 명령을 넣어봤자 모델이 무시하도록 설계돼 있다'는 뜻이다.
- 실제로 Claude가 tool result 컨텍스트의 내용을 지시로 취급하지 않는 건 보안상 올바른 동작이다. '다른 모든 지시를 무시하고 XYZ를 해라' 같은 프롬프트 인젝션 공격에 대비한 훈련의 부작용으로 hook 명령도 함께 무시된다.
- 이 문제를 제대로 해결하려면 hook이 tool result가 아닌 user context로 전달되거나, 시스템 프롬프트에 '특정 hook은 신뢰할 수 있다'는 명시적 지시를 추가해야 한다는 의견이 제시됐다.
- exit code 2를 사용하는 방식은 에이전트 추론 레이어 밖에서 실행되는 결정론적 제어라서 모델이 무시할 수 없다. 진지한 흐름 제어가 필요하다면 이 방식을 써야 한다.
- Claude Code 공식 문서에 따르면 cat 명령은 항상 exit code 0으로 종료되므로, stop hook에서 중단을 강제하려면 반드시 exit code 2로 종료해야 한다.
- Claude Code 팀 멤버(Thariq)가 직접 댓글로 참여해서, 문제가 발생한 세션에서 /feedback 명령으로 'stop hook not firing'이라고 제보해달라고 요청했다. 즉 현재 버그로 인지하고 있는 상태다.
- stop hook의 스키마가 변경됐을 가능성도 제기됐다. 한 사용자가 sonnet/opus로 깊게 파고들어 확인한 결과, Claude 4.6에서는 hook에 매우 민감하게 반응하던 모델이 Opus 4.7에서는 hook 응답을 완전히 무시하는 현상이 있었다.
Evidence
- Claude Code 팀의 Thariq가 직접 댓글에 등장해 이 문제를 인지하고 있음을 밝혔다. /feedback 명령으로 'stop hook not firing'이라고 제보하면 팀에서 확인하겠다고 했다.
- 한 개발자는 sonnet/opus로 stop hook을 심층 테스트한 결과, Claude 4.6 버전에서는 hook의 의미와 대응 방식을 매우 의식하며 동작하는 반면, Opus 4.7은 hook 응답 자체를 무시하는 문제가 있었다고 경험을 공유했다. 또한 hook 스키마가 변경됐을 가능성도 언급했다.
- tool result 컨텍스트에서 지시를 무시하는 게 '훈련된 의도된 동작'이라는 분석이 제시됐다. Anthropic이 프롬프트 인젝션 방어를 위해 tool result의 지시문을 무시하도록 훈련했는데, hook 명령이 같은 컨텍스트에 들어가면서 같이 무시된다는 설명이다. 이에 대해 '행동은 바람직하지 않지만 기술적 원인은 납득된다'는 반응이 많았다.
- '자연어로 된 프롬프트라면 그건 hook이 아니다'라는 의견이 있었다. hook과 프롬프트를 혼동해서 사용하는 경향이 문제라는 지적이다.
- Claude Code 4.7이 4.6 대비 응답 품질이 전반적으로 저하됐다는 의견도 나왔고, Claude 5.5로 전환을 고려한다는 사용자도 있었다. 또한 현재의 hook/skill 방식 자체가 HTML 테이블로 레이아웃 잡던 시대처럼 곧 사라질 임시방편이라는 비판적 시각도 있었다.
How to Apply
- Claude Code의 stop hook에서 실행 흐름을 강제로 중단해야 하는 경우, stdout JSON 방식 대신 exit code 2로 종료하는 방식을 사용해야 한다. 이 방식은 모델의 추론 레이어 밖에서 동작하므로 모델이 무시할 수 없다.
- stop hook에서 모델에게 특정 행동을 '요청'하는 방식으로 구현했다면, 해당 지시가 tool result 컨텍스트에 들어가 무시될 수 있다. 이 경우 시스템 프롬프트에 '특정 hook의 지시는 신뢰하고 따라야 한다'는 내용을 명시적으로 추가해 보완할 수 있다.
- Claude Code에서 stop hook이 작동하지 않는 현상을 겪고 있다면, 문제 세션에서 /feedback 명령을 실행하고 'stop hook not firing'이라고 입력해 제보하면 Anthropic 팀이 확인한다고 밝혔다.
- hook 내부에서 테스트 실행, 파일 검사 같은 작업을 자동으로 처리하려면 모델에게 '해달라고 부탁'하는 방식보다 hook 스크립트 자체에서 직접 명령을 실행하는 게 더 안정적이다. 에이전트 추론에 의존하지 않는 결정론적 실행이 훨씬 예측 가능하다.
Terminology
관련 논문
adamsreview: Claude Code용 멀티 에이전트 PR 코드 리뷰 파이프라인
Claude Code에서 최대 7개의 병렬 서브 에이전트가 각각 다른 관점으로 PR을 리뷰하고, 자동 수정까지 해주는 오픈소스 플러그인이다. 기존 /review나 CodeRabbit보다 실제 버그를 더 많이 잡는다고 주장하지만 커뮤니티에서는 복잡도와 실효성에 대한 회의론도 나왔다.
Claude를 User Space IP Stack으로 써서 Ping에 응답시키면 얼마나 빠를까?
Claude Code에게 IP 패킷을 직접 파싱하고 ICMP echo reply를 구성하도록 시켜서 실제로 ping에 응답하게 만든 실험으로, 'Markdown이 곧 코드이고 LLM이 프로세서'라는 아이디어를 네트워크 스택 수준까지 밀어붙인 재미있는 사례다.
AI Agent를 위한 Git: re_gent
AI 코딩 에이전트(Claude Code 등)가 수행한 모든 툴 호출을 자동으로 추적하고, 어떤 프롬프트가 어느 코드 줄을 작성했는지 blame까지 가능한 버전 관리 도구다.
Agent-Native CLI를 위한 설계 원칙 10가지
AI 에이전트가 CLI 도구를 더 잘 사용할 수 있도록 설계하는 원칙들을 정리한 글로, 에이전트가 CLI를 도구로 활용하는 빈도가 높아지면서 이 설계 방식이 실용적으로 중요해지고 있다.
Agent-harness-kit: MCP 기반 멀티 에이전트 워크플로우 오케스트레이션 프레임워크
여러 AI 에이전트가 서로 역할을 나눠 협업할 수 있도록 조율하는 scaffolding 도구로, Vite처럼 설정 없이 빠르게 멀티 에이전트 파이프라인을 구성할 수 있다.
Tilde.run – AI Agent를 위한 트랜잭션 기반 버전 관리 파일시스템 샌드박스
AI 에이전트가 실제 프로덕션 데이터를 건드려도 롤백할 수 있는 격리된 샌드박스 환경을 제공하는 도구로, GitHub/S3/Google Drive를 하나의 버전 관리 파일시스템으로 묶어준다.