Opus 4.5는 지금까지 경험한 AI 에이전트와 완전히 다르다
Opus 4.5 is not the normal AI agent experience that I have had thus far
TL;DR Highlight
Burke Holland가 Claude Opus 4.5로 Windows 유틸리티, 영상 편집기, SNS 자동 포스팅 앱을 단 몇 시간 만에 혼자 완성하여 기존 AI 에이전트와 질적으로 다른 수준의 개발 능력을 입증했다.
Who Should Read
Claude Code나 GitHub Copilot 에이전트 모드를 실무에 도입해볼까 고민 중인 풀스택 또는 솔로 개발자. AI 코딩 도구가 실제로 얼마나 복잡한 작업까지 커버되는지 궁금한 사람.
Core Mechanics
- 저자는 Opus 4.5 이전의 AI 에이전트 경험을 '스파게티 코드 생성 → 9번의 에러 붙여넣기 → 결국 세션 통째로 버리기'로 묘사했다. Opus 4.5는 첫 시도에 대부분 맞추고, 에러가 나면 dotnet CLI 출력을 읽고 스스로 수정하는 방식으로 이 루프를 끊었다고 한다.
- 첫 번째 프로젝트는 Windows 파일 탐색기 우클릭 메뉴에서 이미지 포맷을 변환하는 유틸리티였다. 원샷(one-shot)에 가깝게 완성했고, GitHub Actions로 릴리즈 자동화, 배포 사이트, PowerShell 인스톨러까지 Opus가 직접 만들었다. XAML 에러 확인만 Visual Studio를 따로 썼다.
- 두 번째 프로젝트는 Mac의 LICEcap 같은 GIF 녹화 유틸리티로 시작했다가, 비디오 캡처·편집, 도형 추가, 크롭, 블러까지 포함한 풀 이미지/비디오 에디터로 확장됐다. 이걸 단 몇 시간 안에 만들었다고 한다.
- 세 번째 프로젝트는 아내가 운영하는 간판 프랜차이즈용 SNS 자동 포스팅 앱이다. React Native로 작년에 시작했다가 Android 완성 직전에 포기했던 프로젝트인데, Opus 4.5로 재도전해 auth, DB, API, 스토리지 연동까지 포함해 완성했다. 'AI 에이전트의 아킬레스건'으로 꼽히던 백엔드 시스템 통합 영역이었다.
- 저자가 사용한 워크플로는 단순하다. VS Code에서 GitHub Copilot 에이전트 모드 + 음성 받아쓰기로 Claude에게 말을 걸고, Context7 MCP 하나만 연결했다. 별도 플래닝 프레임워크나 복잡한 프롬프트 없이 진행했다.
- 저자는 'AI가 개발자를 대체한다'는 의미를 '개발자가 하는 일을 AI가 대신한다'로 한정하며, 오히려 개발자 수는 늘어날 수 있다고 봤다. 누구나 시스템 지식만 있으면 뭔가를 만들 수 있게 되면, 경쟁 우위를 위해 더 많은 기능을 만들어야 하므로 사람이 더 필요해진다는 논리다.
- 커뮤니티에서 공유된 실제 활용 사례로, 한 팀은 Claude Code에 자사 UI 라이브러리 사용법, API 구조, Storybook 작성 규칙 등을 '스킬'로 등록해두고, PR 리뷰 에이전트·티켓 트리아지 에이전트·월간 문서 정합성 검사 에이전트를 GitHub Actions에 연결해 자동 운영 중이라고 밝혔다.
Evidence
- 한 팀은 Claude Code를 에이전트 플랫폼으로 적극 도입해, 사내 UI 라이브러리 사용법과 API 컨벤션을 스킬로 등록하고 PR 리뷰, 티켓 트리아지, 월별 문서 정합성 체크, E2E 커버리지 갭 탐지 등 5개 이상의 GitHub Actions 에이전트를 운영 중이라고 밝혔다. '아직도 왜 다들 안 쓰는지 이해 못 하겠다'는 반응이었다.
- 반론도 만만치 않았다. 한 댓글러는 Opus 4.5를 수주간 복잡한 코드에 사용해봤는데, 코드 분석과 도메인 지식 주입에는 탁월하지만 '틀린 방향으로 깊이 파고드는' 경향이 있고, 자신이 의존성 업그레이드 작업을 하면서 Opus가 안내하는 대로 따라갔다가 나중에 얼마나 깊은 구덩이에 빠졌는지 몰랐다고 했다. '더 비판적으로 방향을 평가했어야 했다'는 회고였다.
- '그린필드(신규 개발) 프로젝트는 잘 하지만, 실제 미드레벨 엔지니어의 업무는 기존 코드베이스에 기능을 확장하고 유지보수 가능하게 짜는 것'이라는 비판이 있었다. Opus에게 기능을 추가시키면 이상한 추상화를 사용하는 경우가 많고, '동작하면 된다'는 식의 접근은 엔지니어링이 아니라는 지적이다.
- 2주 전에 Opus 4.5에게 프로젝트 전체 개선을 맡겼더니 '동작은 했지만 아키텍처 결정이 당혹스럽고 버그가 많았다'는 경험이 공유됐다. 결국 코드 절반을 다시 짰다며, 테스트 작성·버그 찾기·소규모 작업에는 훌륭하지만 전체 아키텍처는 맡기면 후회한다는 결론이었다.
- 사회적 영향에 대한 우려도 제기됐다. 'AI가 개발자를 대체할 수 있다'는 주장이 맞다면, IT 아웃소싱이 경제적으로 무의미해질 때 수백만 인도 IT 종사자는 어떻게 되는지, Accenture가 해산되면 아일랜드 경제는 어떻게 되는지 등 구체적 사례를 들며, 주택난·청년 취업난·외로움 전염병과 연결해 생각해야 한다는 댓글이 있었다.
How to Apply
- Claude Code에 자사 코드 컨벤션(UI 라이브러리 사용법, API 구조, 테스트 패턴)을 '스킬' 파일로 작성해두면, 에이전트가 생성하는 코드가 처음부터 팀 표준을 따른다. 온보딩 비용이 큰 레거시 프로젝트에서 특히 효과적이다.
- 그린필드 앱을 혼자 프로토타이핑할 때 Opus 4.5 + Context7 MCP 조합으로 시작해보자. 복잡한 플래닝 프레임워크 없이 음성 입력으로 대화하듯 지시해도 백엔드 통합(auth, DB, API)까지 포함한 MVP를 빠르게 뽑을 수 있다.
- PR 리뷰, 티켓 분석, 문서 정합성 검사 같은 반복성 유지보수 작업을 GitHub Actions에 Claude Code 에이전트로 연결하면 엔지니어링 팀의 코드 리뷰·QA 부하를 자동화할 수 있다. 먼저 체크리스트 마크다운을 작성하고, 에이전트가 이를 기준으로 리뷰하도록 구성하면 된다.
- Opus에게 아키텍처 설계나 대규모 리팩토링을 통째로 맡기는 건 피하자. 코드 분석, 버그 탐지, 단위 테스트 작성, 특정 기능 구현 등 범위가 명확한 작업에 집중하고, 생성된 코드는 반드시 PR처럼 리뷰하는 습관을 유지해야 기술 부채가 쌓이지 않는다.
Terminology
관련 논문
adamsreview: Claude Code용 멀티 에이전트 PR 코드 리뷰 파이프라인
Claude Code에서 최대 7개의 병렬 서브 에이전트가 각각 다른 관점으로 PR을 리뷰하고, 자동 수정까지 해주는 오픈소스 플러그인이다. 기존 /review나 CodeRabbit보다 실제 버그를 더 많이 잡는다고 주장하지만 커뮤니티에서는 복잡도와 실효성에 대한 회의론도 나왔다.
Claude를 User Space IP Stack으로 써서 Ping에 응답시키면 얼마나 빠를까?
Claude Code에게 IP 패킷을 직접 파싱하고 ICMP echo reply를 구성하도록 시켜서 실제로 ping에 응답하게 만든 실험으로, 'Markdown이 곧 코드이고 LLM이 프로세서'라는 아이디어를 네트워크 스택 수준까지 밀어붙인 재미있는 사례다.
AI Agent를 위한 Git: re_gent
AI 코딩 에이전트(Claude Code 등)가 수행한 모든 툴 호출을 자동으로 추적하고, 어떤 프롬프트가 어느 코드 줄을 작성했는지 blame까지 가능한 버전 관리 도구다.
Agent-Native CLI를 위한 설계 원칙 10가지
AI 에이전트가 CLI 도구를 더 잘 사용할 수 있도록 설계하는 원칙들을 정리한 글로, 에이전트가 CLI를 도구로 활용하는 빈도가 높아지면서 이 설계 방식이 실용적으로 중요해지고 있다.
Agent-harness-kit: MCP 기반 멀티 에이전트 워크플로우 오케스트레이션 프레임워크
여러 AI 에이전트가 서로 역할을 나눠 협업할 수 있도록 조율하는 scaffolding 도구로, Vite처럼 설정 없이 빠르게 멀티 에이전트 파이프라인을 구성할 수 있다.
Tilde.run – AI Agent를 위한 트랜잭션 기반 버전 관리 파일시스템 샌드박스
AI 에이전트가 실제 프로덕션 데이터를 건드려도 롤백할 수 있는 격리된 샌드박스 환경을 제공하는 도구로, GitHub/S3/Google Drive를 하나의 버전 관리 파일시스템으로 묶어준다.