Principles for agent-native CLIs

TL;DR Highlight

AI 에이전트가 CLI 도구를 더 잘 사용할 수 있도록 설계하는 원칙들을 정리한 글로, 에이전트가 CLI를 도구로 활용하는 빈도가 높아지면서 이 설계 방식이 실용적으로 중요해지고 있다.

Who Should Read

CLI 도구를 개발하거나 AI 에이전트 워크플로우에 기존 CLI를 연동하려는 백엔드/DevOps 개발자. 특히 MCP 대신 CLI 기반으로 에이전트 도구를 구성하려는 사람에게 유용하다.

Core Mechanics

원문은 트위터/X에서 공유된 글로 직접 접근이 안 되지만, 커뮤니티 댓글과 비X 링크(trevinsays.com)를 통해 내용을 파악할 수 있다. 핵심 주제는 에이전트가 사용하기 좋은 CLI를 어떻게 설계할 것인가다.
ANSI 컬러 테이블 같은 인간 친화적 출력 포맷이 에이전트에겐 방해가 되므로, 에이전트용으로는 JSON 같은 구조화된 출력을 써야 한다는 주장이 원문에 담겨 있다.
비동기 작업(async tasks) 처리에 대한 설계 원칙도 포함되어 있으며, 댓글에서도 '이 부분이 특히 유용했다'는 반응이 나왔다. 에이전트가 오래 걸리는 작업을 다루는 방식이 인간 사용자와 다르기 때문이다.
isatty(터미널에 연결된 상태인지 확인하는 시스템 콜) 감지를 통해 자동화/에이전트 환경과 인간 사용자 환경을 구분해서 다른 출력을 제공하는 방식을 권장한다.
에이전트가 인터랙티브한 프롬프트(y/n 확인 등)를 건너뛸 수 있도록 `--force` 또는 `--yes` 같은 플래그를 제공하라는 원칙이 있다.
CLI가 자신의 사용 방법을 LLM에게 설명하는 '스킬 파일(skill file)'을 출력하는 기능을 제공하자는 아이디어도 포함된다. `skill mytool` 같은 명령으로 에이전트가 도구 사용법을 빠르게 파악할 수 있게 하는 것이다.
원문은 API 대신 CLI를 에이전트 도구로 쓰는 것이 실제로 더 효과적인 경우가 많다고 주장하며, API나 MCP보다 CLI가 에이전트 연동에 유리한 이유를 설명한다.

Evidence

LLM에게는 JSON보다 자연어 출력이 더 낫다는 반론이 있었다. LLM의 학습 데이터 자체가 JSON보다 자연어가 훨씬 많기 때문에, 소량의 데이터는 순수 텍스트로 출력하는 게 오히려 더 잘 파싱된다는 주장이다. 대량 데이터는 기계가 읽을 수 있는 포맷이 낫다는 점에는 동의했다.
`--force` 플래그를 에이전트에게 주는 건 위험하다는 의견이 있었다. `--force`는 원래 '실패한 작업을 강제 실행'하는 의미인데, 에이전트가 이걸 습관적으로 쓰게 되면 예상치 못한 사이드이펙트가 생길 수 있으니 `--yes` 또는 `--yes-do-the-dangerous-thing` 같은 명시적 플래그가 더 낫다는 제안이었다.
에이전트가 기존 CLI를 예상 밖의 방식으로 활용한 실사용 사례가 공유됐다. Adaptive라는 DB 접근 관리 플랫폼의 개발자가 Claude로 `adaptive connect <db-name>` CLI를 연동해봤는데, Claude가 Python으로 pseudo 셸을 만들어서 쿼리를 넘기는 방식으로 스스로 해결했다고 했다. 인간이라면 리스크를 고민하느라 시도조차 안 했을 방법이라고 했다.
에이전트가 셸 명령어인지 LLM으로 보낼지 판단하는 감지 휴리스틱(heuristic)이 플래그 설계보다 훨씬 중요하다는 실전 경험이 공유됐다. `git push --force`가 실수로 LLM에 전달되면 사용자 신뢰가 즉시 무너진다며, 보수적인 휴리스틱을 채택했다고 했다. 또한 '이 입력이 셸로 가는지 에이전트로 가는지'를 타이핑하는 동안 실시간으로 색깔로 보여주는 시각적 인디케이터가 사용자 행동을 가장 크게 바꿨다고 했다.
agent-native CLI 설계 전체 개념에 회의적인 시각도 있었다. UNIX 원칙을 따르는 인간/자동화 친화적 CLI를 잘 만들고, 거기에 LLM용 매뉴얼 역할의 정적 스킬 파일만 추가하면 충분하다는 주장이었다. Git의 porcelain(사용자용 고수준 명령)과 plumbing(내부 저수준 명령) 구조처럼, 에이전트용 레이어를 별도로 만들 게 아니라 문서 레이어만 분리하자는 접근이다.

How to Apply

CLI 도구를 에이전트 워크플로우에 연동할 계획이라면, `isatty()` 체크를 통해 터미널 직접 실행과 파이프/에이전트 실행을 구분하고, 에이전트 환경에서는 JSON 또는 파싱하기 쉬운 플레인 텍스트를 출력하도록 분기 처리하면 에이전트가 결과를 훨씬 안정적으로 처리할 수 있다.
CLI에 인터랙티브 확인 프롬프트(y/n)가 있다면 `--yes` 또는 `--non-interactive` 플래그를 추가해두면 에이전트가 중간에 멈추지 않고 작업을 완료할 수 있다. `--force`보다는 의도가 명확한 이름을 쓰는 게 안전하다.
CLI 사용법을 에이전트가 빠르게 파악할 수 있도록 `mytool --skill` 또는 `skill mytool` 같은 명령으로 LLM 최적화 사용 가이드를 출력하는 기능을 추가하면, 에이전트가 help 텍스트나 man 페이지 전체를 파싱하는 것보다 토큰 비용을 줄이고 정확도를 높일 수 있다.
API나 MCP 서버를 만들기 전에 CLI 래퍼를 먼저 제공하는 방식을 고려해볼 수 있다. 댓글 사례처럼 Claude 같은 코딩 에이전트는 CLI를 직접 실행하고 결과를 파싱하는 데 이미 능숙하기 때문에, 복잡한 API 연동 없이도 에이전트가 DB 조회나 빌드 트리거 같은 작업을 수행하게 할 수 있다.

Terminology

isatty프로그램이 현재 실제 터미널에 연결되어 실행 중인지, 아니면 파이프나 스크립트를 통해 실행 중인지 확인하는 시스템 함수. 이걸 써서 '사람이 직접 쓰는 중'인지 '자동화 스크립트나 에이전트가 쓰는 중'인지 구분할 수 있다.

MCPModel Context Protocol의 약자로, AI 에이전트가 외부 도구/서비스와 표준화된 방식으로 통신하기 위한 Anthropic의 프로토콜. API를 직접 호출하는 것보다 에이전트 연동에 특화된 인터페이스를 제공한다.

porcelain/plumbingGit에서 나온 개념으로, plumbing은 내부적으로 쓰이는 저수준 명령들, porcelain은 사람이 직접 쓰기 좋게 감싼 고수준 명령들을 뜻한다. 여기서는 에이전트용 저수준 인터페이스와 사람용 고수준 인터페이스를 분리하는 설계 패턴의 비유로 쓰였다.

skill fileCLI가 자신의 사용 방법을 LLM에게 설명하기 위해 출력하는 구조화된 텍스트 파일. man 페이지가 인간을 위한 매뉴얼이라면, skill file은 AI 에이전트를 위한 매뉴얼이라고 볼 수 있다.

heredoc셸에서 여러 줄의 텍스트를 입력으로 전달하는 문법(`<< EOF ... EOF`). 에이전트가 파일 생성 없이 긴 텍스트를 명령에 넘기려 할 때 사용하는데, 토큰을 낭비하며 재시도하는 경우가 있다고 언급됐다.

휴리스틱(heuristic)정확한 답 대신 '충분히 좋은' 판단을 빠르게 내리기 위한 경험 기반 규칙. 여기서는 사용자 입력이 셸 명령인지 LLM에 보낼 자연어인지 판단하는 로직을 뜻한다.