Recall — Claude Code를 위한 완전 로컬 프로젝트 메모리 도구 | AI Paper Digest

TL;DR Highlight

Claude Code 세션이 끝날 때마다 프로젝트 컨텍스트를 처음부터 다시 설명해야 하는 문제를 외부 API 없이 로컬에서 해결하는 Python 기반 오픈소스 도구다.

Who Should Read

Claude Code를 구독해서 쓰는데 매 세션마다 프로젝트 배경을 다시 설명하느라 토큰을 낭비하고 있는 개발자. 특히 여러 프로젝트를 컨텍스트 스위칭하며 작업하는 경우에 유용하다.

Core Mechanics

Claude Code는 세션 간 메모리가 없어서 매번 '콜드 스타트' 상태로 시작한다. Recall은 이 문제를 해결하기 위해 세션 로그를 로컬에 저장하고, 파이썬 기반 알고리즘으로 요약해 다음 세션에 주입한다.
요약 과정에 LLM을 전혀 사용하지 않는다. 'classical Python summarizer'로 로컬에서만 처리하기 때문에 요약 자체에 토큰이 소모되지 않는다.
프로젝트 루트 아래 .recall/ 디렉토리에 두 파일을 생성한다: history.md(세션 로그 누적)와 context.md(압축 요약본, 약 1~2K 토큰 분량).
context.md는 약 1~2K 토큰 수준으로 압축되기 때문에, 세션마다 프로젝트를 처음부터 설명하는 것보다 훨씬 적은 토큰으로 컨텍스트를 복원할 수 있다.
외부 API 키나 로컬 모델 설치가 전혀 필요 없다. pip install도 필요 없고, 오프라인 환경에서도 동작하며 플러그인이 로드되는 순간 바로 작동한다.
코드 경로, 파일 내용, 경우에 따라 시크릿 등 민감한 정보가 포함될 수 있는 세션 트랜스크립트가 외부로 전송되지 않는다. 대부분의 '메모리' 도구들이 컨텍스트를 외부 API 엔드포인트로 전송하는 것과 대비된다.
Claude Code 플러그인 형태로 동작하며 .claude-plugin 설정 파일을 통해 프로젝트에 통합된다. GitHub 저장소에는 벤치마크, 테스트, 훅 스크립트 등이 포함되어 있다.

Evidence

많은 댓글 참여자들이 'CLAUDE.md나 AGENTS.md가 이미 같은 역할을 한다'는 의견을 냈다. 실제로 Claude.md 파일에 프로젝트 컨텍스트를 정리해두고 에이전트가 작업 완료 시 자동으로 업데이트하게 하면 충분하다는 경험담이 여럿 공유됐다.
한 유저는 status_docs/ 폴더에 날짜별 마크다운 파일(예: 2026_06_21_status.md)을 만들어 LLM이 직접 작성하고 업데이트하게 하는 방식을 1년 이상 써왔다고 공유했다. 새 세션에서 가장 최근 상태 파일을 가리키면 빠르게 컨텍스트를 복원할 수 있어 여러 프로젝트를 오가는 상황에서 특히 효과적이라고 했다.
'프로젝트 메모리에서 진짜 어려운 건 더 많이 저장하는 게 아니라 나중에 무엇을 믿지 말아야 할지 판단하는 것'이라는 날카로운 지적이 있었다. 오래된 계획이나 실패한 디버깅 시도가 조용히 에이전트를 오염시킬 수 있다는 우려다.
PC가 완전히 망가진 경험을 가진 유저는 코드가 GitHub와 OneDrive에 있었음에도 새 PC에서 Claude를 다시 세팅하는 데 상당한 시간이 걸렸다며, 이런 도구의 필요성에 공감했다.
Deepseek를 쓰는 유저는 마일스톤마다 직접 state.md를 생성하고 편집하는 방식을 쓰고 있다며, Recall의 접근법에 대해 '프라이버시 우선, 비용 최소화, 객관적 시맨틱 마커로 핵심 내용을 추려내는 점이 흥미롭다'고 평가했다. 다만 막다른 골목에 들어갔다 되돌아온 시도들이 요약에 포함될 경우 오히려 노이즈가 될 수 있다는 우려도 함께 제기했다.

How to Apply

매일 여러 프로젝트를 오가며 Claude Code를 쓰고 있다면, Recall을 도입하기 전에 먼저 CLAUDE.md 파일에 프로젝트 핵심 컨텍스트를 정리하고 에이전트에게 작업 완료 시 해당 파일을 업데이트하도록 지시하는 방식을 먼저 시도해볼 수 있다. 이것만으로도 Recall이 해결하려는 문제의 상당 부분을 커버할 수 있다.
외부 API로 컨텍스트를 보내는 게 부담스러운 보안 민감 프로젝트(내부 코드베이스, 환경 변수 포함 설정 파일 등)에서 세션 메모리가 필요하다면, Recall을 적용하면 데이터가 외부로 나가지 않으면서도 세션 간 컨텍스트를 유지할 수 있다.
Recall 없이 수동으로 비슷한 효과를 내고 싶다면, status_docs/ 같은 폴더에 날짜별 상태 파일을 만들고 세션 종료 전 LLM에게 해당 파일을 업데이트하게 하는 워크플로우를 적용할 수 있다. 다음 세션 시작 시 최신 상태 파일을 컨텍스트로 주입하면 된다.
Obsidian 기반 문서 볼트를 프로젝트 레포 안에 두고 obsidian-cli로 Claude가 읽고 쓸 수 있게 연결하면, 새 세션에서 빈 컨텍스트로 시작해도 몇 문장만으로 LLM이 필요한 정보를 스스로 찾아오는 수준의 메모리 시스템을 구축할 수 있다.

Terminology

cold-startAI 세션이 시작할 때 이전 대화나 프로젝트 정보를 전혀 모르는 상태. 매번 처음 만난 사람한테 프로젝트를 설명해야 하는 것과 같다.

context windowLLM이 한 번에 처리할 수 있는 텍스트의 최대 길이. 이 한도를 넘으면 오래된 내용이 잘려나가거나 새 세션을 시작해야 한다.

CLAUDE.mdClaude Code가 프로젝트를 시작할 때 자동으로 읽는 설정 파일. 프로젝트 규칙, 코딩 스타일, 컨텍스트 등을 미리 적어두면 매 세션마다 설명 없이 바로 작업할 수 있다.

classical Python summarizerLLM을 사용하지 않고 전통적인 자연어 처리 알고리즘(텍스트 랭크, TF-IDF 등)으로 긴 텍스트를 요약하는 방식. API 비용이 들지 않는다.

컨텍스트 압축(compaction)컨텍스트 윈도우 한도에 가까워졌을 때 LLM이 이전 내용을 요약해 토큰을 줄이는 과정. Claude Code에는 이 기능이 내장되어 있다.

Recall — Claude Code를 위한 완전 로컬 프로젝트 메모리 도구