얼마 전에야 GPT-5.1이 나왔다는 소식이 들리더니, 벌써 새 버전이 나왔네요. 오픈AI가 ‘GPT-5.2’를 공개했답니다. 한 달 간격으로 주요 업데이트를 내놓는 건 처음인데, 이걸 보면 AI 업계의 경쟁이 ‘코드 레드’ 수준으로 치열해졌다는 걸 실감하게 돼요. 구글의 제미나이, 앤트로픽의 클로드와의 경쟁에서 다시 한번 우위를 잡으려는 전략 같은 느낌이죠.
이번 GPT-5.2는 뭔가 달라요. 일상적인 대화보다는 ‘전문적인 업무’에 더 특화되었다고 해요. 예를 들어 회사에서 스프레드시트를 만들거나, 프레젠테이션 자료를 구성하고, 복잡한 코드를 작성하는 일들을 더 잘할 수 있도록 설계되었다고 하네요. 인스턴트, 씽킹, 프로라는 세 가지 모드로 나뉘어서, 간단한 질문부터 수학 문제 풀이, 긴 문서 분석까지 용도에 맞게 골라 쓸 수 있다는 점도 매력적이에요.
그런데 성능이 얼마나 좋아졌냐면요, 숫자로 보면 확 와닿아요. 전문가 수준의 업무 능력을 평가하는 테스트에서 이전 GPT-5보다 성능이 거의 두 배 가까이 향상됐다고 해요. 특히 소프트웨어 엔지니어링 능력 테스트에서는 80%라는 점수를 받았는데, 구글 제미나이3 프로보다 높고, 코딩으로 유명한 앤트로픽의 클로드와도 겨우 1% 차이밖에 안 난다니 완전 박빙이죠.
가장 반가운 소식은 ‘환각’ 현상, 즉 AI가 거짓말을 하는 비율이 크게 줄었다는 거예요. 내부 테스트에서 오류율이 약 30%나 감소했다고 하니, 결과를 믿고 활용할 수 있는 정도가 훨씬 높아졌겠죠? 그리고 긴 글의 맥락을 이해하거나 그림을 인식하는 능력도 좋아졌다고 하니, 활용 범위가 훨씬 넓어질 것 같아요.
한편으로는 보안과 안전에도 신경을 썼더라고요. 미성년자 보호 기능을 강화하고, 민감한 주제(예를 들어 정신건강 상담 같은)에 대한 응답 방식도 개선했다고 설명하네요. 기술이 발전할수록 이런 윤리적 고민도 함께 깊어지는 게 당연한 순서인 것 같아요.
이 모델은 유료 챗GPT 플랜 구독자에게 바로 제공되기 시작했고, 개발자들도 API로 사용할 수 있어요. 반면, 저번 버전인 GPT-5.1은 3개월 후면 서비스가 종료된다고 하니, 업데이트 속도에 맞춰 우리의 사용 습관도 빠르게 바꿔야 할 것 같아요.
제 생각엔 이번 발표는 단순한 업데이트 이상이에요. AI가 이제 본격적으로 ‘생산성 도구’로서 자리를 잡아가고 있다는 강력한 신호 같아요. 하지만 그만큼 주요 플레이어들 간의 경쟁은 더욱 뜨거워질 테고, 우리 소비자 입장에서는 더 좋고 강력한 도구를 빠르게 만날 수 있다는 게 가장 큰 장점이 아닐까 싶네요. 다음 달에 또 새로운 모델이 나온다는 소문도 있던데, 이 속도라면 정말 AI 시대의 ‘스마트폰 업데이트 주기’를 경험하게 될지도 모르겠어요.
—
원문: [전자신문](https://www.etnews.com/20251212000007)
리안 존슨 감독의 새 베누아 블랑 미스터리, '웨이크 업 데드 맨'은 고딕 풍의 작은 마을을…
첨단 의수는 기능이 뛰어나지만, 사용자의 절반이 포기한다는 충격적인 데이터가 있습니다. 그 이유는 '직접 조종해야 하는…
스마트TV가 오히려 '덤(dumb)'해 보일 때가 있죠. 끝없는 광고와 사용자 추적으로부터 벗어나고 싶다면요. 이 글에서는 스마트TV…
완전 자율주행차 시대가 오면 차를 어떻게 활용할까요? 카셰어링 업체 Zevo는 신생 로보택시 회사 Tensor에 100대를…
호주가 시행한 만 16세 미만 소셜미디어 사용 금지법에 대해 레딧이 법적 도전장을 내밀었습니다. 레딧은 자사가…
친구 중심의 사진 공유 앱 '레트로'가 '리와인드' 기능을 추가하며, 우리가 잊고 있던 카메라롤 속 추억을…