애널리스트가 바라본 Anthropic Opus 4.5, 이제 AI 대화가 더 자연스러워졌습니다

여러분, Claude를 사용하다가 대화가 한창 재미있을 때 갑자기 끊겨서 당황한 경험 있으신가요? 그런 분들에게 반가운 소식을 전해드립니다. Anthropic이 오늘 공개한 새로운 Opus 4.5 모델에서 바로 그 문제를 해결했습니다.

제가 7년간 테크 섹터를 분석해오면서 본 AI 시장의 가장 큰 과제 중 하나가 바로 이런 사용자 경험 문제였습니다. Opus 4.5는 이제 대화가 길어지면 자동으로 핵심 내용을 요약해서 기억하도록 개선되었습니다. 기술적으로 설명드리자면, 기존에는 20만 토큰 제한에 도달하면 대화를 강제 종료했지만, 이제는 중요한 내용은 유지하면서 불필요한 부분을 정리하는 방식으로 작동합니다.

성능 면에서는 정말 인상적인 수치를 보여주고 있습니다. SWE-Bench Verified 벤치마크에서 80.9% 정확도를 기록하며 OpenAI의 GPT-5.1-Codex-Max(77.9%)와 Google의 Gemini 3 Pro(76.2%)를 제쳤습니다. 특히 에이전트 코딩과 도구 사용 벤치마크에서 강점을 보이는데, 이는 실제 개발 작업에 더 유용하게 활용될 수 있음을 의미합니다.

그런데 여러분, 정말 주목할 점은 효율성 개선입니다. 중간 effort level에서 Opus 4.5는 Sonnet 4.5와 동일한 성능을 보이면서 출력 토큰을 76%나 절약합니다. 최고 effort level에서는 성능을 4.3% 포인트 높이면서 토큰 사용량을 48% 줄였습니다. 이런 효율성 향상은 곧바로 비용 절감으로 이어집니다.

말씀드린 대로 비용 측면에서도 혁신적인 변화가 있었습니다. API 가격이 입력 100만 토큰당 5달러, 출력 25달러로 기존 대비 3분의 1 수준으로 낮아졌습니다. 이는 기업들이 더 많은 실험과 도입을 할 수 있는 환경을 만들어줄 것입니다.

개발자들을 위한 새로운 ‘effort’ 파라미터도 눈에 띕니다. 효과와 토큰 사용량 사이의 균형을 정밀하게 조정할 수 있게 되면서, 각 프로젝트의 특성에 맞춰 최적의 비용 효율을 달성할 수 있게 되었습니다.

시장 관점에서 보면, Anthropic의 이번 발표는 AI 경쟁 구도에 중요한 변수가 될 것입니다. 특히 프롬프트 인젝션 공격에 대한 저항성이 크게 개선되었다는 점은 엔터프라이즈 시장에서의 경쟁력을 한층 강화해줄 것입니다.

결론적으로 말씀드리자면, Opus 4.5는 단순한 성능 업그레이드를 넘어 사용자 경험과 경제성까지 고려한 종합적인 개선이라고 평가할 수 있습니다. 이제 AI 시장은 성능 경쟁에서 효율성과 사용성 경쟁으로 무게중심이 옮겨가고 있음을 보여주는 사례라고 생각합니다.

원문: [Ars Technica](https://arstechnica.com/ai/2025/11/anthropic-introduces-opus-4-5-cuts-api-pricing-and-enables-much-longer-claude-chats/)

위로 스크롤