Epoch AI: GPT-5.4 Pro가 프론티어 수학 난제를 최초로 해결
Epoch confirms GPT5.4 Pro solved a frontier math open problem
TL;DR Highlight
FrontierMath 미해결 문제(라므지 스타일 하이퍼그래프)를 GPT-5.4 Pro가 최초 해결 — Opus 4.6·Gemini 3.1 Pro도 후속 검증에서 풀어냄
Who Should Read
AI 능력 발전 추이를 추적하는 연구자, 수학 AI 벤치마크에 관심 있는 ML 엔지니어
Core Mechanics
- GPT-5.4 Pro가 Epoch AI FrontierMath의 "중간 정도로 흥미로운" 카테고리 오픈 문제를 최초 해결 — 문제 기여자 교수가 공식 확인 및 학술 출판 예정
- 이후 일반 스캐폴드 적용 시 Opus 4.6 (max), Gemini 3.1 Pro, GPT-5.4 (xhigh)도 동일 문제 해결 — 프론티어 모델들의 광범위한 수학 능력 향상 확인
- HN 토론: "LLM은 훈련 데이터 리믹서라 새 아이디어 불가" 주장에 대해 댓글들이 구체적 반례 제시 — 노벨티 여부 논쟁 여전히 진행 중
Evidence
- Epoch AI 공식 확인: 문제 기여자 Will Brian(UNC Charlotte 교수)이 해결 유효성 검증, 학술 출판 계획
- Opus 4.6은 약 250K 토큰 소비 — 토큰 소비량이 문제 난이도 프록시로 기능할 가능성
How to Apply
- AI 모델 수학 능력 벤치마킹 시 FrontierMath Open Problems 참고 (epoch.ai/frontiermath/open-problems)
- 프론티어 모델들의 실제 능력 한계를 파악할 때 단순 벤치마크보다 미해결 문제 도전 방식 활용
Terminology
FrontierMath전문 수학자도 어려워하는 극도로 어려운 수학 문제 벤치마크 (Epoch AI 제작)
라므지 문제(Ramsey Problem)특정 조건을 만족하지 않는 가장 큰 그래프를 구성하는 조합론 문제