Launch HN: Runtime (YC P26) – Sandboxed coding agents for everyone on a team
TL;DR Highlight
엔지니어링팀뿐 아니라 마케팅, 영업, 지원팀까지 누구나 샌드박스 환경에서 coding agent를 안전하게 쓸 수 있게 해주는 인프라 플랫폼으로, YC P26 배치 스타트업이 런치했다.
Who Should Read
팀 전체에 coding agent를 도입하고 싶은데 보안, 비용 통제, 환경 관리가 걱정인 플랫폼 엔지니어 또는 개발 팀 리더. Claude Code, Cursor, Codex 같은 AI 코딩 도구를 조직 차원에서 관리하고 싶은 사람.
Core Mechanics
- Runtime은 팀의 모든 coding agent가 실행되는 샌드박스 인프라 플랫폼으로, Claude Code, Cursor, Codex, Copilot, Gemini CLI, Devin, OpenCode 등 주요 AI 코딩 도구를 모두 지원한다.
- 각 세션마다 pre-warmed(미리 준비된) 격리 환경이 뜨기 때문에, mise/npm/brew/GitHub에서 설치한 도구들과 Datadog, Salesforce, Stripe, NetSuite 같은 외부 서비스 연동, MCP 서버, 커스텀 지시사항을 스냅샷으로 저장해두면 매번 설정 없이 수 초 안에 부팅된다.
- 엔지니어링팀뿐 아니라 제품, 디자인, 마케팅, 영업, 지원, 재무, 인사팀 등 각 팀별로 해당 팀에 맞는 데이터, 연동, 가드레일을 갖춘 전용 agent를 구성할 수 있다.
- Slack, Linear, GitHub, Jira에서 agent를 태그(@mention)해서 호출하면, agent가 백그라운드에서 조사·PR 작성·답장 초안·티켓 생성 등을 자동으로 처리하고 완료 시 자동 일시 정지된다.
- 가드레일(Guardrails) 기능으로 지출 한도, 파일 접근 허용 목록, 승인 게이트를 설정할 수 있고, 대시보드에서 세션별·사용자별·팀별 비용(예: 세션당 $0.04~$0.21)과 tool call, chain of thought, 파일 변경 내역을 실시간으로 모니터링할 수 있다.
- Mission Control 대시보드, CLI, API 세 가지 방식으로 사용할 수 있으며, 자체 AI API 키를 사용하는 BYOK(Bring Your Own Key) 방식을 지원한다.
- MIT, Apache 2.0, AGPL v3 등 다양한 라이선스로 일부 컴포넌트가 오픈소스로 제공되며, 자체 클라우드와 모델로 self-hosting도 가능하다.
- 여러 사람이 같은 agent 세션에 실시간으로 참여해 협업할 수 있고, 결과물을 PR, 배포, 메시지, 티켓, 리포트 등 원하는 형태로 내보낼 수 있다.
Evidence
- 마케팅팀이 agent를 통해 생성한 코드가 PR로 올라왔을 때 엔지니어가 마음에 들지 않으면 수정 흐름이 어떻게 되는지 묻는 질문이 있었다. 즉, 비엔지니어 팀이 올린 코드의 리뷰·수정 워크플로우가 명확히 설명되지 않았다는 지적이다.
- 정적 분석(Static Analysis)과 런타임 샌드박싱은 서로 보완적이지 경쟁 관계가 아니라는 의견이 있었다. 샌드박스 실행 중 안전하더라도 생성된 코드가 머지되기 전에 별도 보안 정책 검사가 필요하다는 점을 강조했다.
- 각 팀별로 가드레일을 다르게 설정할 수 있는지 묻는 댓글이 있었다. 예를 들어 마케팅팀과 데이터팀에 서로 다른 설정을 적용하고 싶다는 구체적인 사용 시나리오를 제시했다.
- 에이전트 초기 세팅을 도와주는 assistant나 템플릿 기반 온보딩 플로우를 추가해달라는 제안이 있었다. 폼 작성보다 챗봇 인터페이스로 설정하는 게 더 많은 비엔지니어 사용자를 끌어들일 수 있다는 의견이었다.
- 라이선스 관련 우려가 제기됐다. 일부 사용자가 라이선스를 확인했는데 'copyrighted'라고 명시된 부분이 있어 사용 불가 판단을 내렸으며, 완전한 FOSS(자유 오픈소스 소프트웨어) 대비 어떤 장점이 있는지 물었다. 또한 Claude의 Max 플랜이 여기서 사용 가능한지, Anthropic 정책과 충돌하지 않는지에 대한 의문도 있었다.
How to Apply
- 팀 전체에 Claude Code나 Codex를 도입하려는데 환경 설정 관리와 비용 통제가 어려운 경우, Runtime의 스냅샷 환경과 지출 한도 기능을 활용하면 매 세션마다 동일한 환경을 수 초 안에 부팅하고 사용자별·팀별 비용을 한눈에 파악할 수 있다.
- Slack이나 Linear를 주로 쓰는 팀에서 반복적인 조사 작업(예: 장애 분석, 문서 업데이트)을 자동화하고 싶다면, Runtime에서 전용 agent를 만들고 Slack 채널에 통합해 @태그만으로 백그라운드 작업을 트리거하는 방식을 적용할 수 있다.
- 엔지니어링 리소스 없이 마케팅·재무·지원팀이 직접 데이터 조회나 콘텐츠 수정 작업을 하고 싶다면, 팀별 가드레일(파일 접근 범위, 승인 게이트)을 별도로 설정해 안전하게 권한을 위임하는 구조를 만들 수 있다.
- 자체 보안 정책 때문에 SaaS 방식이 어려운 경우, MIT/Apache 라이선스로 공개된 CLI 및 공유 라이브러리를 활용해 자체 클라우드에 self-hosting하고, 내부 모델이나 API 키를 연결해 폐쇄망 환경에서 운영할 수 있다.
Terminology
Related Papers
Show HN: ctx – Search the coding agent history already on your machine
Claude Code, Cursor, Codex 등 코딩 에이전트가 이전 세션의 논의·결정·실패 시도를 잊지 않도록 SQLite로 인덱싱해 재사용할 수 있게 해주는 오픈소스 CLI 도구다.
Micro-Agent: Beat Frontier Models with Collaboration Inside Model API
vLLM 팀이 단일 모델 API 호출 뒤에서 여러 모델이 협업하는 'Micro-Agent' 개념을 공개했습니다. 별도의 에이전트 코드 없이 라우터 레이어에서 모델 조합을 실행해 GPT-4급 결과를 더 저렴하게 낼 수 있다는 아이디어입니다.
Ornith-1.0: self-improving open-source models for agentic coding
Gemma 4와 Qwen 3.5를 기반으로 파인튜닝한 코딩 특화 오픈소스 모델로, RL(강화학습)을 통해 스캐폴드(에이전트 실행 구조)까지 함께 최적화하는 방식을 주장하지만, 커뮤니티에서는 벤치마크 과최적화에 불과하다는 의심을 받고 있다.
Entity Binding Failures in Tool-Augmented Agents
AI 에이전트가 올바른 도구를 선택해도 잘못된 대상에 실행하는 'Entity Binding 실패' 문제를 정의하고, 이를 막는 실행 정책을 평가한 논문.
Herdr: Agent multiplexer that lives in your terminal
여러 AI 코딩 에이전트(Claude, Codex 등)를 하나의 터미널에서 동시에 실행·관리할 수 있는 Rust 기반 오픈소스 툴로, tmux처럼 세션이 유지되고 SSH로 원격 접속도 가능해 멀티 에이전트 워크플로우를 크게 단순화해준다.
Ornith-1.0: Self-scaffolding LLMs for agentic coding
모델이 문제 풀이 전략(scaffold)을 직접 생성하고 개선하는 자기강화 학습 프레임워크를 적용한 오픈소스 코딩 특화 LLM으로, 9B 소형 모델부터 397B 대형 모델까지 라인업을 갖추고 SWE-Bench 등 주요 벤치마크에서 Claude Opus 4.7을 능가하는 성능을 보여줬다.