여러분, Claude를 사용하다가 대화가 한창 재미있을 때 갑자기 끊겨서 당황한 경험 있으신가요? 그런 분들에게 반가운 소식을 전해드립니다. Anthropic이 오늘 공개한 새로운 Opus 4.5 모델에서 바로 그 문제를 해결했습니다.
제가 7년간 테크 섹터를 분석해오면서 본 AI 시장의 가장 큰 과제 중 하나가 바로 이런 사용자 경험 문제였습니다. Opus 4.5는 이제 대화가 길어지면 자동으로 핵심 내용을 요약해서 기억하도록 개선되었습니다. 기술적으로 설명드리자면, 기존에는 20만 토큰 제한에 도달하면 대화를 강제 종료했지만, 이제는 중요한 내용은 유지하면서 불필요한 부분을 정리하는 방식으로 작동합니다.
성능 면에서는 정말 인상적인 수치를 보여주고 있습니다. SWE-Bench Verified 벤치마크에서 80.9% 정확도를 기록하며 OpenAI의 GPT-5.1-Codex-Max(77.9%)와 Google의 Gemini 3 Pro(76.2%)를 제쳤습니다. 특히 에이전트 코딩과 도구 사용 벤치마크에서 강점을 보이는데, 이는 실제 개발 작업에 더 유용하게 활용될 수 있음을 의미합니다.
그런데 여러분, 정말 주목할 점은 효율성 개선입니다. 중간 effort level에서 Opus 4.5는 Sonnet 4.5와 동일한 성능을 보이면서 출력 토큰을 76%나 절약합니다. 최고 effort level에서는 성능을 4.3% 포인트 높이면서 토큰 사용량을 48% 줄였습니다. 이런 효율성 향상은 곧바로 비용 절감으로 이어집니다.
말씀드린 대로 비용 측면에서도 혁신적인 변화가 있었습니다. API 가격이 입력 100만 토큰당 5달러, 출력 25달러로 기존 대비 3분의 1 수준으로 낮아졌습니다. 이는 기업들이 더 많은 실험과 도입을 할 수 있는 환경을 만들어줄 것입니다.
개발자들을 위한 새로운 ‘effort’ 파라미터도 눈에 띕니다. 효과와 토큰 사용량 사이의 균형을 정밀하게 조정할 수 있게 되면서, 각 프로젝트의 특성에 맞춰 최적의 비용 효율을 달성할 수 있게 되었습니다.
시장 관점에서 보면, Anthropic의 이번 발표는 AI 경쟁 구도에 중요한 변수가 될 것입니다. 특히 프롬프트 인젝션 공격에 대한 저항성이 크게 개선되었다는 점은 엔터프라이즈 시장에서의 경쟁력을 한층 강화해줄 것입니다.
결론적으로 말씀드리자면, Opus 4.5는 단순한 성능 업그레이드를 넘어 사용자 경험과 경제성까지 고려한 종합적인 개선이라고 평가할 수 있습니다. 이제 AI 시장은 성능 경쟁에서 효율성과 사용성 경쟁으로 무게중심이 옮겨가고 있음을 보여주는 사례라고 생각합니다.
—
원문: [Ars Technica](https://arstechnica.com/ai/2025/11/anthropic-introduces-opus-4-5-cuts-api-pricing-and-enables-much-longer-claude-chats/)
네이버클라우드가 코스포, 네이버아라비아와 손잡고 독자 AI 모델 기반 스타트업 육성에 나섭니다. 핵심은 국산 AI 기술의…
오픈AI가 한 달 만에 새로운 AI 모델 GPT-5.2를 공개했어요. 전문 업무에 특화된 이 모델은 코딩,…
예측시장이 '의견을 금융상품으로' 바꾸는 혁신적인 플랫폼으로 떠오르고 있어요. 하지만 실제 투자 경험을 해보면, 그 속에…
미국 상품선물거래위원회(CFTC)로부터 예측시장 운영 허가를 획득한 제미니의 주가는 급등했습니다. 이는 암호화폐 거래소가 단순 거래 플랫폼을…
최근 분석에 따르면, 비트코인의 다음 주요 가격 바닥은 2026년에 도달할 수 있다고 합니다. 거래소 거래량이…
미국 연준의 금리 인하가 예상대로 단행되며 암호화폐 시장이 반등했습니다. 전문가들은 단기 변동성 뒤에 찾아올 본격적인…