Hippo: 생물학적 기억 메커니즘을 모방한 AI 에이전트용 메모리 라이브러리
Show HN: Hippo, biologically inspired memory for AI agents
TL;DR Highlight
오픈소스 메모리 레이어가 뇌의 기억 소멸·강화·통합 메커니즘을 코드로 구현해 Claude Code, Cursor, Codex 등 여러 AI 에이전트 간 세션 기억 공유를 가능하게 한다.
Who Should Read
Claude Code, Cursor, Codex 등 여러 AI 코딩 에이전트를 번갈아 쓰면서 매번 컨텍스트를 다시 설명해야 하는 번거로움을 겪고 있는 개발자. 또는 AI 에이전트가 같은 실수를 반복하는 문제를 해결하고 싶은 팀.
Core Mechanics
- AI 에이전트는 세션이 끊기면 모든 걸 잊어버리는데, 기존 해결책들은 그냥 모든 걸 저장하고 나중에 검색하는 '파일 캐비닛' 방식이다. Hippo는 이걸 뇌처럼 동작하게 만들자는 발상에서 출발했다.
- 핵심 기능은 세 가지다. 시간이 지나면 기억이 흐릿해지는 decay(소멸), 자주 꺼내쓰는 기억은 더 선명해지는 retrieval strengthening(인출 강화), 중요한 기억은 장기 기억으로 굳히는 consolidation(통합)이다.
- Claude Code, Cursor, Codex, OpenClaw 등 다양한 CLI 에이전트와 함께 쓸 수 있고, ChatGPT나 Claude의 CLAUDE.md, Cursor의 .cursorrules 파일에서 기억을 불러오는 import 기능도 있다.
- 저장 방식은 SQLite를 백본으로 쓰고, 사람이 읽을 수 있는 마크다운/YAML 파일로도 미러링된다. Git으로 추적 가능하고, 벤더 종속 없이 폴더를 복사하는 것만으로 export할 수 있다.
- 런타임 의존성이 전혀 없고(zero deps), Node.js 22.5 이상만 있으면 된다. 임베딩 기반 유사도 검색을 쓰고 싶으면 @xenova/transformers를 선택적으로 붙일 수 있다.
- 설치는 `npm install -g hippo-memory`로 전역 설치 후 `hippo init`으로 초기화한다. 기억 저장은 `hippo remember '...'` 명령어로 한다.
- 기억에는 태그와 confidence level(신뢰도)이 붙어서 400줄짜리 CLAUDE.md처럼 뒤죽박죽 커진 규칙 파일 문제를 구조적으로 해결해준다. 오래된 정보는 자동으로 decay된다.
- v0.10.0에서 커뮤니티 피드백을 대거 반영했다고 저자가 직접 답변했다.
Evidence
- decay 기반 망각이 실제로 효과적인지에 대한 회의론이 있었다. 한 댓글에서 '지수적 decay는 PR 머지처럼 sharp하게 발생하는 변경을 잡아낼 수 없다. 생물학적 학습은 비슷한 패턴을 반복 관찰할 때 의미 있는데, 코드베이스의 커밋을 학습하는 데 그게 맞는 비유인지 모르겠다'는 지적이 나왔다.
- '무엇을 잊을지 아는 것'이 AGI-complete 문제라는 날카로운 지적도 있었다. 미래에 무엇이 중요할지 판단하려면 미래 모델과 현재 자신의 상태 모델이 필요한데, 현재 에이전트들은 자기 자신의 능력조차 제대로 모델링 못 한다는 주장이다.
- 비슷한 문제를 반대 방향에서 접근한 프로젝트 소개도 있었다. ccrider(github.com/neilberkman/ccrider)는 별도 메모리 레이어를 두는 대신, Claude Code와 Codex가 이미 저장하는 세션 트랜스크립트를 SQLite FTS5로 인덱싱해서 MCP 서버로 검색할 수 있게 만든 방식이다.
- decay 시간의 기준으로 클럭 시간(wall clock time) 대신 에이전트의 '활성 시간(active time)'을 써야 한다는 의견이 여럿 나왔다. 간헐적으로 실행되는 에이전트는 클럭 기준으로 하면 실제 사용 빈도와 관계없이 기억이 사라진다는 문제 제기다.
- 위치(location) 기반 기억 트리거 아이디어도 제안됐다. 에이전트가 작업 중인 파일 경로나 프로젝트 경로를 기억 트리거로 삼으면, 관련 컨텍스트가 자동으로 활성화되고 더 자연스럽게 recall이 된다는 것이다. 스포츠나 GUI에서 물리적 위치가 procedural memory를 강하게 트리거하는 것과 같은 원리라는 설명도 붙었다.
- HippoRAG(arxiv.org/abs/2405.14831)라는 유사한 이름과 기법을 가진 논문이 이미 있는데 README에 언급이 없다는 지적이 나왔다. 의도적으로 관련이 없는 건지, 아니면 놓친 건지 커뮤니티에서 궁금해했다.
How to Apply
- Claude Code로 작업하다가 Cursor로 전환하거나, 여러 AI 코딩 툴을 번갈아 쓰는 개발자라면 `npm install -g hippo-memory && hippo init`으로 설치한 뒤, 각 툴에서 발견한 중요한 설정이나 에러 해결책을 `hippo remember '...'`로 저장해두면 다음 툴 전환 시에도 컨텍스트가 유지된다.
- AI 에이전트가 같은 배포 버그나 설정 실수를 반복하는 팀이라면, 에러가 발생할 때마다 Hippo에 에러 메모리를 저장해두는 습관을 들이면 된다. decay 메커니즘 덕분에 오래되고 해결된 문제는 자연스럽게 희미해지고, 반복되는 실수는 강화돼서 에이전트 컨텍스트에 더 잘 떠오른다.
- ChatGPT나 Claude에 이미 쌓아둔 맥락이 있다면, Hippo의 import 기능으로 ChatGPT 대화 내용이나 CLAUDE.md, .cursorrules 파일을 한 번에 가져와서 중립적인 포맷으로 통합 관리할 수 있다. 이후에는 마크다운 파일을 Git 리포에 커밋해두면 팀원과도 공유 가능하다.
- 임베딩 기반 의미 검색이 필요한 경우에는 `@xenova/transformers`를 추가 설치해서 쓰면 된다. 단순 키워드 매칭이 아닌 의미적으로 유사한 과거 기억을 찾아주므로, 기억 양이 많아질수록 효과적이다.
Code Example
# 설치 및 초기화
npm install -g hippo-memory
hippo init
# 기억 저장
hippo remember "FRED cache silently drops the t flag — always pass --no-cache explicitly"
# ChatGPT나 Claude 등 기존 툴에서 import
hippo import --from claude ./CLAUDE.md
hippo import --from cursor ./.cursorrules
# 기억 검색 (임베딩 사용 시 @xenova/transformers 필요)
hippo recall "cache 관련 배포 이슈"Terminology
관련 논문
ctx – 로컬 머신의 코딩 에이전트 히스토리를 검색하는 CLI 도구
Claude Code, Cursor, Codex 등 코딩 에이전트가 이전 세션의 논의·결정·실패 시도를 잊지 않도록 SQLite로 인덱싱해 재사용할 수 있게 해주는 오픈소스 CLI 도구다.
Micro-Agent: Model API 내부 협업으로 Frontier 모델을 이기는 방법 (vLLM Semantic Router)
vLLM 팀이 단일 모델 API 호출 뒤에서 여러 모델이 협업하는 'Micro-Agent' 개념을 공개했습니다. 별도의 에이전트 코드 없이 라우터 레이어에서 모델 조합을 실행해 GPT-4급 결과를 더 저렴하게 낼 수 있다는 아이디어입니다.
Ornith-1.0: 에이전틱 코딩을 위한 자기 개선형 오픈소스 모델
Gemma 4와 Qwen 3.5를 기반으로 파인튜닝한 코딩 특화 오픈소스 모델로, RL(강화학습)을 통해 스캐폴드(에이전트 실행 구조)까지 함께 최적화하는 방식을 주장하지만, 커뮤니티에서는 벤치마크 과최적화에 불과하다는 의심을 받고 있다.
Tool-Augmented Agent에서의 Entity Binding 실패 분석
AI 에이전트가 올바른 도구를 선택해도 잘못된 대상에 실행하는 'Entity Binding 실패' 문제를 정의하고, 이를 막는 실행 정책을 평가한 논문.
Herdr: 터미널에서 여러 AI Agent를 한 번에 관리하는 Agent Multiplexer
여러 AI 코딩 에이전트(Claude, Codex 등)를 하나의 터미널에서 동시에 실행·관리할 수 있는 Rust 기반 오픈소스 툴로, tmux처럼 세션이 유지되고 SSH로 원격 접속도 가능해 멀티 에이전트 워크플로우를 크게 단순화해준다.
Ornith-1.0: 스스로 Scaffold를 생성하는 Agentic Coding LLM
모델이 문제 풀이 전략(scaffold)을 직접 생성하고 개선하는 자기강화 학습 프레임워크를 적용한 오픈소스 코딩 특화 LLM으로, 9B 소형 모델부터 397B 대형 모델까지 라인업을 갖추고 SWE-Bench 등 주요 벤치마크에서 Claude Opus 4.7을 능가하는 성능을 보여줬다.