Recall — Claude Code를 위한 완전 로컬 프로젝트 메모리 도구
Show HN: Recall – Local project memory for Claude Code
TL;DR Highlight
Claude Code 세션이 끝날 때마다 프로젝트 컨텍스트를 처음부터 다시 설명해야 하는 문제를 외부 API 없이 로컬에서 해결하는 Python 기반 오픈소스 도구다.
Who Should Read
Claude Code를 구독해서 쓰는데 매 세션마다 프로젝트 배경을 다시 설명하느라 토큰을 낭비하고 있는 개발자. 특히 여러 프로젝트를 컨텍스트 스위칭하며 작업하는 경우에 유용하다.
Core Mechanics
- Claude Code는 세션 간 메모리가 없어서 매번 '콜드 스타트' 상태로 시작한다. Recall은 이 문제를 해결하기 위해 세션 로그를 로컬에 저장하고, 파이썬 기반 알고리즘으로 요약해 다음 세션에 주입한다.
- 요약 과정에 LLM을 전혀 사용하지 않는다. 'classical Python summarizer'로 로컬에서만 처리하기 때문에 요약 자체에 토큰이 소모되지 않는다.
- 프로젝트 루트 아래 .recall/ 디렉토리에 두 파일을 생성한다: history.md(세션 로그 누적)와 context.md(압축 요약본, 약 1~2K 토큰 분량).
- context.md는 약 1~2K 토큰 수준으로 압축되기 때문에, 세션마다 프로젝트를 처음부터 설명하는 것보다 훨씬 적은 토큰으로 컨텍스트를 복원할 수 있다.
- 외부 API 키나 로컬 모델 설치가 전혀 필요 없다. pip install도 필요 없고, 오프라인 환경에서도 동작하며 플러그인이 로드되는 순간 바로 작동한다.
- 코드 경로, 파일 내용, 경우에 따라 시크릿 등 민감한 정보가 포함될 수 있는 세션 트랜스크립트가 외부로 전송되지 않는다. 대부분의 '메모리' 도구들이 컨텍스트를 외부 API 엔드포인트로 전송하는 것과 대비된다.
- Claude Code 플러그인 형태로 동작하며 .claude-plugin 설정 파일을 통해 프로젝트에 통합된다. GitHub 저장소에는 벤치마크, 테스트, 훅 스크립트 등이 포함되어 있다.
Evidence
- 많은 댓글 참여자들이 'CLAUDE.md나 AGENTS.md가 이미 같은 역할을 한다'는 의견을 냈다. 실제로 Claude.md 파일에 프로젝트 컨텍스트를 정리해두고 에이전트가 작업 완료 시 자동으로 업데이트하게 하면 충분하다는 경험담이 여럿 공유됐다.
- 한 유저는 status_docs/ 폴더에 날짜별 마크다운 파일(예: 2026_06_21_status.md)을 만들어 LLM이 직접 작성하고 업데이트하게 하는 방식을 1년 이상 써왔다고 공유했다. 새 세션에서 가장 최근 상태 파일을 가리키면 빠르게 컨텍스트를 복원할 수 있어 여러 프로젝트를 오가는 상황에서 특히 효과적이라고 했다.
- '프로젝트 메모리에서 진짜 어려운 건 더 많이 저장하는 게 아니라 나중에 무엇을 믿지 말아야 할지 판단하는 것'이라는 날카로운 지적이 있었다. 오래된 계획이나 실패한 디버깅 시도가 조용히 에이전트를 오염시킬 수 있다는 우려다.
- PC가 완전히 망가진 경험을 가진 유저는 코드가 GitHub와 OneDrive에 있었음에도 새 PC에서 Claude를 다시 세팅하는 데 상당한 시간이 걸렸다며, 이런 도구의 필요성에 공감했다.
- Deepseek를 쓰는 유저는 마일스톤마다 직접 state.md를 생성하고 편집하는 방식을 쓰고 있다며, Recall의 접근법에 대해 '프라이버시 우선, 비용 최소화, 객관적 시맨틱 마커로 핵심 내용을 추려내는 점이 흥미롭다'고 평가했다. 다만 막다른 골목에 들어갔다 되돌아온 시도들이 요약에 포함될 경우 오히려 노이즈가 될 수 있다는 우려도 함께 제기했다.
How to Apply
- 매일 여러 프로젝트를 오가며 Claude Code를 쓰고 있다면, Recall을 도입하기 전에 먼저 CLAUDE.md 파일에 프로젝트 핵심 컨텍스트를 정리하고 에이전트에게 작업 완료 시 해당 파일을 업데이트하도록 지시하는 방식을 먼저 시도해볼 수 있다. 이것만으로도 Recall이 해결하려는 문제의 상당 부분을 커버할 수 있다.
- 외부 API로 컨텍스트를 보내는 게 부담스러운 보안 민감 프로젝트(내부 코드베이스, 환경 변수 포함 설정 파일 등)에서 세션 메모리가 필요하다면, Recall을 적용하면 데이터가 외부로 나가지 않으면서도 세션 간 컨텍스트를 유지할 수 있다.
- Recall 없이 수동으로 비슷한 효과를 내고 싶다면, status_docs/ 같은 폴더에 날짜별 상태 파일을 만들고 세션 종료 전 LLM에게 해당 파일을 업데이트하게 하는 워크플로우를 적용할 수 있다. 다음 세션 시작 시 최신 상태 파일을 컨텍스트로 주입하면 된다.
- Obsidian 기반 문서 볼트를 프로젝트 레포 안에 두고 obsidian-cli로 Claude가 읽고 쓸 수 있게 연결하면, 새 세션에서 빈 컨텍스트로 시작해도 몇 문장만으로 LLM이 필요한 정보를 스스로 찾아오는 수준의 메모리 시스템을 구축할 수 있다.
Terminology
관련 논문
ctx – 로컬 머신의 코딩 에이전트 히스토리를 검색하는 CLI 도구
Claude Code, Cursor, Codex 등 코딩 에이전트가 이전 세션의 논의·결정·실패 시도를 잊지 않도록 SQLite로 인덱싱해 재사용할 수 있게 해주는 오픈소스 CLI 도구다.
Micro-Agent: Model API 내부 협업으로 Frontier 모델을 이기는 방법 (vLLM Semantic Router)
vLLM 팀이 단일 모델 API 호출 뒤에서 여러 모델이 협업하는 'Micro-Agent' 개념을 공개했습니다. 별도의 에이전트 코드 없이 라우터 레이어에서 모델 조합을 실행해 GPT-4급 결과를 더 저렴하게 낼 수 있다는 아이디어입니다.
Ornith-1.0: 에이전틱 코딩을 위한 자기 개선형 오픈소스 모델
Gemma 4와 Qwen 3.5를 기반으로 파인튜닝한 코딩 특화 오픈소스 모델로, RL(강화학습)을 통해 스캐폴드(에이전트 실행 구조)까지 함께 최적화하는 방식을 주장하지만, 커뮤니티에서는 벤치마크 과최적화에 불과하다는 의심을 받고 있다.
Tool-Augmented Agent에서의 Entity Binding 실패 분석
AI 에이전트가 올바른 도구를 선택해도 잘못된 대상에 실행하는 'Entity Binding 실패' 문제를 정의하고, 이를 막는 실행 정책을 평가한 논문.
Herdr: 터미널에서 여러 AI Agent를 한 번에 관리하는 Agent Multiplexer
여러 AI 코딩 에이전트(Claude, Codex 등)를 하나의 터미널에서 동시에 실행·관리할 수 있는 Rust 기반 오픈소스 툴로, tmux처럼 세션이 유지되고 SSH로 원격 접속도 가능해 멀티 에이전트 워크플로우를 크게 단순화해준다.
Ornith-1.0: 스스로 Scaffold를 생성하는 Agentic Coding LLM
모델이 문제 풀이 전략(scaffold)을 직접 생성하고 개선하는 자기강화 학습 프레임워크를 적용한 오픈소스 코딩 특화 LLM으로, 9B 소형 모델부터 397B 대형 모델까지 라인업을 갖추고 SWE-Bench 등 주요 벤치마크에서 Claude Opus 4.7을 능가하는 성능을 보여줬다.