Claude Code 월 $100 구독을 Zed + OpenRouter로 대체하기
Reallocating $100/Month Claude Code Spend to Zed and OpenRouter
TL;DR Highlight
Zed($10/월) + OpenRouter(종량제)가 Claude Code Max($100/월)를 대체하여 월간 비용 90% 절감하면서 크레딧 롤오버와 모델 선택 자유도를 제공한다.
Who Should Read
Claude Code Max 구독을 쓰고 있는데 사용량 한도에 자주 막혀서 답답한 개발자, 또는 AI 코딩 도구 비용을 최적화하고 싶은 개발자.
Core Mechanics
- 저자는 Claude Code와 Claude 데스크탑 앱을 합쳐 월 $100를 내고 있는데, 예전보다 한도에 더 빨리 막힌다고 느끼고 있다. 이 현상은 AMD의 AI 시니어 디렉터를 비롯해 Reddit, Twitter에서도 여러 명이 보고하고 있는 공통 불만이다.
- 저자의 사용 패턴은 '버스트(burst)' 형태, 즉 몰아서 사용하는 패턴이라 월간 구독의 사용 창(window)을 효율적으로 소진하지 못한다. 안 쓰는 기간에도 크레딧이 날아가는 구조가 핵심 불만이다.
- 대안으로 제시한 조합은 Zed 에디터($10/월) + OpenRouter(선불 크레딧)다. 총 예산 $100 중 $10은 Zed에, 나머지 $90은 OpenRouter에 매월 충전해서 사용량만큼만 소비하는 방식이다.
- OpenRouter 크레딧은 미사용 시 365일간 유효해서 사용하지 않은 달의 크레딧이 다음 달로 이월된다. Anthropic 구독처럼 리셋 주기를 놓치는 손실이 없다는 점이 핵심 장점이다.
- Zed는 VSCode 및 그 포크들보다 체감상 빠르고 반응성이 좋다고 저자는 평가한다. 내장 Agent harness(LLM에 메시지를 보내고 파일 읽기/쓰기 등 도구 호출을 조율하는 시스템)가 기본 탑재되어 있고, Claude Code 같은 외부 CLI 도구도 ACP(Agent Client Protocol)를 통해 에디터 안에서 직접 실행할 수 있다.
- Zed의 네이티브 통합에서는 Gemini 2.5의 컨텍스트 창이 200k 토큰으로 제한되지만, OpenRouter 통합을 쓰면 전체 1M 토큰을 활용할 수 있다. 이 때문에 저자는 Zed 자체 유료 플랜이 아닌 OpenRouter API 연동을 선호한다.
- OpenRouter는 5.5%의 수수료를 부과한다(글 작성 후 HN 댓글에서 지적받아 업데이트됨). 프라이버시 보호를 위해 저자는 입출력 데이터를 제품 개선에 활용하는 것에 동의하지 않았고(동의하면 1% 할인), Workspace 설정에서 'Zero Data Retention (ZDR) Endpoints Only' 옵션을 활성화했다.
- Zed가 아닌 CLI 도구를 선호한다면 OpenCode + OpenRouter 조합도 대안이다. 저자는 OpenCode가 기존 CLAUDE.md 설정 파일을 바로 인식해 사용하기 편리하다고 언급하며, 다양한 모델(GLM 5.1, Kimi K2 등)을 연결해 쓸 수 있다고 소개한다.
Evidence
- OpenRouter의 5.5% 수수료가 과연 가치 있냐는 논란에 대해, 단일 API 키로 수십 개 모델 접근, 요청별 비용 추적, 동일 요청의 멀티모델 비교, API 키 분리 관리 등의 기능을 고려하면 충분히 가치 있다는 의견이 있었다.
- Claude Max 구독의 가성비가 실제로는 훨씬 높다는 강한 반론이 있었다. 한 댓글 작성자는 'ccusage 도구로 측정해보니 $100 구독으로 월 $600 상당을 쓰고 있다'고 밝혔고, 다른 사람은 'Opus 4.6 high thinking 모드 기준으로 $100에 $1,000+ 치 사용량을 뽑는다'고 주장하며, 구독 해지 후 OpenRouter API로만 쓰면 오히려 더 비싸진다고 반박했다.
- 실제로 비슷한 방식을 시도해봤는데 2~3배 더 비쌌다는 경험담도 나왔다. Sonnet/Gemini/GPT 모델 혼용으로 개발 작업을 해봤더니 Anthropic 구독보다 2~3배 비용이 더 들었고, 구독 가격이 API 원가 대비 상당히 보조(subsidize)되고 있는 것 같다는 분석이었다.
- Zed 자체에 대한 평가는 엇갈렸다. VSCode 대체제로 처음엔 좋았지만 시간이 지날수록 작은 불편함이 쌓인다는 의견이 있었는데, TypeScript 언어 서버 사용 시 메모리 사용량이 심각하고, Linux에서 이모지 렌더링이 안 되는 버그가 아직 있다는 점이 지적됐다. 전반적인 DX(개발자 경험)는 VSCode의 85% 수준이라는 평가였다.
- Claude Code 대신 OpenCode + Kimi K2 조합을 백업으로 쓰고 있다는 실사용 경험이 여러 건 공유됐다. Sonnet 수준에는 미치지 못하지만 빠르고 기본적인 웹 앱 작업에는 충분히 쓸 만하다는 평이었으며, OpenCode가 CLAUDE.md 파일을 즉시 인식해서 환경 전환이 쉬웠다는 점도 언급됐다.
- 또 다른 비용 최적화 대안으로 GitHub Copilot $40 플랜이 언급됐다. GPT-5와 Claude 모델에 접근 가능하고, GitHub가 API를 중개하기 때문에 Claude 직접 구독보다 모델 성능 저하(degradation)가 적을 수 있다는 분석이었다. ChatGPT $20 구독과 병행하면 $60에 꽤 좋은 조합을 구성할 수 있다는 의견이었다.
- 영국의 한 주요 소매 은행이 OpenRouter와의 거래를 거절하고 환불을 강제로 처리했다는 경험담이 있었다. 금융 규제가 강화될수록 AI 모델 접근이 제한될 수 있다는 우려도 함께 제기됐다.
How to Apply
- Claude Code Max 구독($100/월)을 쓰는데 사용량을 몰아 쓰는 패턴이라 한도에 자주 막힌다면, 구독을 해지하고 Zed($10/월) + OpenRouter 선불 충전($90) 조합으로 전환하면 크레딧 이월이 되어 낭비를 줄일 수 있다. 단, ccusage 같은 도구로 현재 구독에서 실제 사용량을 먼저 측정해 API 단가 기준으로 비용이 더 싸지는지 검증하는 것이 선행되어야 한다.
- OpenRouter를 업무에 쓸 때 개인정보 보호가 걱정된다면, OpenRouter 계정 설정에서 '입출력 데이터 제품 개선 동의'를 거부하고 Workspace Guardrail에서 'Zero Data Retention (ZDR) Endpoints Only' 옵션을 켜면 데이터 노출 위험을 최소화할 수 있다. 이 경우 Alibaba Cloud 전용 모델(예: qwen/qwen3-plus) 등 일부 모델은 사용 불가해진다.
- Claude Code 한도를 초과해서 작업을 멈춰야 하는 상황이 반복된다면, OpenCode CLI를 설치하고 OpenRouter에서 GLM 5.1이나 Kimi K2 모델을 연결해 백업 환경으로 구성해두면 된다. OpenCode는 기존 CLAUDE.md 설정 파일을 그대로 읽기 때문에 별도 환경 셋업 없이 바로 작업을 이어갈 수 있다.
- Zed에서 Gemini 2.5를 사용할 때 컨텍스트 창이 200k 토큰으로 막혀 불편하다면, Zed 네이티브 통합 대신 OpenRouter API 키를 Zed에 연결하면 전체 1M 토큰 컨텍스트를 그대로 쓸 수 있다.
Terminology
관련 논문
로컬에서 SOTA LLM 실행하기 완전 가이드 (하드웨어부터 설정까지)
2천 달러짜리 RTX 3090 한 장부터 4만 달러짜리 RTX PRO 6000 4장 셋업까지, 로컬에서 최신 LLM을 직접 돌리는 방법을 하드웨어 선택·구성·실행 설정까지 통째로 정리한 실전 가이드다.
Manticore Search에서 ONNX 경로를 재설계해 임베딩 속도를 14배 높인 방법
Manticore Search가 기존 SentenceTransformers/Candle 백엔드를 ONNX Runtime으로 교체해 텍스트 임베딩 생성 속도를 평균 14배 향상시켰다. 별도 모델 서비스 없이 DB 내부에서 직접 임베딩을 처리하는 구조에서 INSERT 속도가 곧 임베딩 속도이기 때문에 이 개선은 실질적인 ingest 처리량 향상으로 직결된다.
Asymmetric Quantization: 97% 스토리지 절감으로 Late Interaction 검색 품질 유지하기
멀티벡터 검색 모델의 문서 벡터를 1비트 이진값으로 압축하고 쿼리 벡터만 int8로 유지하는 비대칭 양자화 기법으로, 스토리지를 97% 줄이면서 검색 품질 손실을 0.61점(NDCG@10 기준)에 그치게 만든 실제 프로덕션 적용 사례다.
Bash4LLM+ – 의존성 없는 경량 Bash LLM API 래퍼
Python이나 Node.js 없이 순수 Bash만으로 Groq 등 OpenAI 호환 LLM API를 호출할 수 있는 단일 스크립트 도구로, Termux(Android)를 포함한 모든 Unix 환경에서 동작한다.
Wayfinder Router: 로컬과 hosted LLM 간 deterministic 쿼리 라우팅 도구
프롬프트의 복잡도를 모델 호출 없이 오프라인으로 점수화해서 간단한 쿼리는 로컬 모델로, 어려운 쿼리는 유료 모델로 자동 라우팅하는 CLI 도구다. LLM 비용을 줄이면서도 응답 품질을 유지하고 싶은 개발자에게 유용하다.
Apple Neural Engine: 아키텍처, 프로그래밍, 성능 (리버스 엔지니어링 가이드)
Apple 기기에 내장된 AI 전용 칩인 ANE(Apple Neural Engine)를 리버스 엔지니어링으로 분석한 302페이지짜리 기술 문서로, Core ML 아래 숨겨진 내부 구조와 직접 접근 경로를 처음으로 공개한다.