Opus 4.5는 지금까지 경험한 AI 에이전트와 완전히 다르다

TL;DR Highlight

Burke Holland가 Claude Opus 4.5로 Windows 유틸리티, 영상 편집기, SNS 자동 포스팅 앱을 단 몇 시간 만에 혼자 완성하여 기존 AI 에이전트와 질적으로 다른 수준의 개발 능력을 입증했다.

Who Should Read

Claude Code나 GitHub Copilot 에이전트 모드를 실무에 도입해볼까 고민 중인 풀스택 또는 솔로 개발자. AI 코딩 도구가 실제로 얼마나 복잡한 작업까지 커버되는지 궁금한 사람.

Core Mechanics

저자는 Opus 4.5 이전의 AI 에이전트 경험을 '스파게티 코드 생성 → 9번의 에러 붙여넣기 → 결국 세션 통째로 버리기'로 묘사했다. Opus 4.5는 첫 시도에 대부분 맞추고, 에러가 나면 dotnet CLI 출력을 읽고 스스로 수정하는 방식으로 이 루프를 끊었다고 한다.
첫 번째 프로젝트는 Windows 파일 탐색기 우클릭 메뉴에서 이미지 포맷을 변환하는 유틸리티였다. 원샷(one-shot)에 가깝게 완성했고, GitHub Actions로 릴리즈 자동화, 배포 사이트, PowerShell 인스톨러까지 Opus가 직접 만들었다. XAML 에러 확인만 Visual Studio를 따로 썼다.
두 번째 프로젝트는 Mac의 LICEcap 같은 GIF 녹화 유틸리티로 시작했다가, 비디오 캡처·편집, 도형 추가, 크롭, 블러까지 포함한 풀 이미지/비디오 에디터로 확장됐다. 이걸 단 몇 시간 안에 만들었다고 한다.
세 번째 프로젝트는 아내가 운영하는 간판 프랜차이즈용 SNS 자동 포스팅 앱이다. React Native로 작년에 시작했다가 Android 완성 직전에 포기했던 프로젝트인데, Opus 4.5로 재도전해 auth, DB, API, 스토리지 연동까지 포함해 완성했다. 'AI 에이전트의 아킬레스건'으로 꼽히던 백엔드 시스템 통합 영역이었다.
저자가 사용한 워크플로는 단순하다. VS Code에서 GitHub Copilot 에이전트 모드 + 음성 받아쓰기로 Claude에게 말을 걸고, Context7 MCP 하나만 연결했다. 별도 플래닝 프레임워크나 복잡한 프롬프트 없이 진행했다.
저자는 'AI가 개발자를 대체한다'는 의미를 '개발자가 하는 일을 AI가 대신한다'로 한정하며, 오히려 개발자 수는 늘어날 수 있다고 봤다. 누구나 시스템 지식만 있으면 뭔가를 만들 수 있게 되면, 경쟁 우위를 위해 더 많은 기능을 만들어야 하므로 사람이 더 필요해진다는 논리다.
커뮤니티에서 공유된 실제 활용 사례로, 한 팀은 Claude Code에 자사 UI 라이브러리 사용법, API 구조, Storybook 작성 규칙 등을 '스킬'로 등록해두고, PR 리뷰 에이전트·티켓 트리아지 에이전트·월간 문서 정합성 검사 에이전트를 GitHub Actions에 연결해 자동 운영 중이라고 밝혔다.

Evidence

한 팀은 Claude Code를 에이전트 플랫폼으로 적극 도입해, 사내 UI 라이브러리 사용법과 API 컨벤션을 스킬로 등록하고 PR 리뷰, 티켓 트리아지, 월별 문서 정합성 체크, E2E 커버리지 갭 탐지 등 5개 이상의 GitHub Actions 에이전트를 운영 중이라고 밝혔다. '아직도 왜 다들 안 쓰는지 이해 못 하겠다'는 반응이었다.
반론도 만만치 않았다. 한 댓글러는 Opus 4.5를 수주간 복잡한 코드에 사용해봤는데, 코드 분석과 도메인 지식 주입에는 탁월하지만 '틀린 방향으로 깊이 파고드는' 경향이 있고, 자신이 의존성 업그레이드 작업을 하면서 Opus가 안내하는 대로 따라갔다가 나중에 얼마나 깊은 구덩이에 빠졌는지 몰랐다고 했다. '더 비판적으로 방향을 평가했어야 했다'는 회고였다.
'그린필드(신규 개발) 프로젝트는 잘 하지만, 실제 미드레벨 엔지니어의 업무는 기존 코드베이스에 기능을 확장하고 유지보수 가능하게 짜는 것'이라는 비판이 있었다. Opus에게 기능을 추가시키면 이상한 추상화를 사용하는 경우가 많고, '동작하면 된다'는 식의 접근은 엔지니어링이 아니라는 지적이다.
2주 전에 Opus 4.5에게 프로젝트 전체 개선을 맡겼더니 '동작은 했지만 아키텍처 결정이 당혹스럽고 버그가 많았다'는 경험이 공유됐다. 결국 코드 절반을 다시 짰다며, 테스트 작성·버그 찾기·소규모 작업에는 훌륭하지만 전체 아키텍처는 맡기면 후회한다는 결론이었다.
사회적 영향에 대한 우려도 제기됐다. 'AI가 개발자를 대체할 수 있다'는 주장이 맞다면, IT 아웃소싱이 경제적으로 무의미해질 때 수백만 인도 IT 종사자는 어떻게 되는지, Accenture가 해산되면 아일랜드 경제는 어떻게 되는지 등 구체적 사례를 들며, 주택난·청년 취업난·외로움 전염병과 연결해 생각해야 한다는 댓글이 있었다.

How to Apply

Claude Code에 자사 코드 컨벤션(UI 라이브러리 사용법, API 구조, 테스트 패턴)을 '스킬' 파일로 작성해두면, 에이전트가 생성하는 코드가 처음부터 팀 표준을 따른다. 온보딩 비용이 큰 레거시 프로젝트에서 특히 효과적이다.
그린필드 앱을 혼자 프로토타이핑할 때 Opus 4.5 + Context7 MCP 조합으로 시작해보자. 복잡한 플래닝 프레임워크 없이 음성 입력으로 대화하듯 지시해도 백엔드 통합(auth, DB, API)까지 포함한 MVP를 빠르게 뽑을 수 있다.
PR 리뷰, 티켓 분석, 문서 정합성 검사 같은 반복성 유지보수 작업을 GitHub Actions에 Claude Code 에이전트로 연결하면 엔지니어링 팀의 코드 리뷰·QA 부하를 자동화할 수 있다. 먼저 체크리스트 마크다운을 작성하고, 에이전트가 이를 기준으로 리뷰하도록 구성하면 된다.
Opus에게 아키텍처 설계나 대규모 리팩토링을 통째로 맡기는 건 피하자. 코드 분석, 버그 탐지, 단위 테스트 작성, 특정 기능 구현 등 범위가 명확한 작업에 집중하고, 생성된 코드는 반드시 PR처럼 리뷰하는 습관을 유지해야 기술 부채가 쌓이지 않는다.

Terminology

그린필드(Greenfield)기존 코드 없이 처음부터 새로 만드는 프로젝트. 레거시 제약이 없어 AI가 가장 잘 동작하는 환경이다.

MCP(Model Context Protocol)AI 에이전트가 외부 도구나 데이터 소스에 접근할 수 있게 해주는 연결 규약. Context7은 라이브러리 문서를 실시간으로 가져오는 MCP다.

원샷(One-shot)한 번의 프롬프트 입력만으로 원하는 결과물을 완성하는 것. 수정 반복 없이 바로 동작하는 코드가 나오는 상황을 뜻한다.

에이전트 하네스(Agent harness)AI 에이전트가 코드 실행, 파일 수정, 터미널 명령 등을 자율적으로 수행할 수 있도록 묶어주는 실행 환경. VS Code의 Copilot 에이전트 모드가 여기에 해당한다.

티켓 트리아지(Ticket triage)새로 들어온 이슈/버그 티켓을 검토해서 우선순위를 매기고 담당자가 빠르게 착수할 수 있도록 사전 분석해두는 작업이다.

Context7라이브러리의 최신 공식 문서를 AI 컨텍스트에 실시간으로 주입해주는 MCP 서버. 학습 데이터 커트오프 이후 변경된 API 정보를 보완하는 데 쓴다.