프랑스 AI 스타트업 미스트랄 AI가 화요일 새로운 코딩 모델을 공개했어요. ‘데브스트랄 2’라는 이 모델은 파라미터가 1230억 개에 달하는 대형 모델인데, 놀라운 건 오픈 웨이트(Open Weights) 방식으로 공개됐다는 점이에요. 즉, 소스 코드와 모델 가중치를 공개해 누구나 연구하고 활용할 수 있게 한 거죠.
그런데 단순히 모델만 공개한 게 아니에요. ‘미스트랄 바이브’라는 새로운 개발자 도구도 함께 선보였어요. 터미널에서 직접 AI와 소통하며 프로젝트 전체의 파일 구조를 스캔하고, 여러 파일을 동시에 수정할 수 있는 커맨드 라인 인터페이스(CLI)예요. 마케팅 출신으로 개발팀과 협업했던 경험으로 봤을 때, 이런 도구가 실제 개발 흐름에 자연스럽게 녹아든다면 생산성 향상 효과는 클 거라고 생각해요.
이 모델의 성능을 평가하는 벤치마크 ‘SWE-bench Verified’에서 72.2%라는 점수를 기록했대요. 이 벤치마크는 깃허브의 실제 이슈 500개를 AI가 해결하도록 하는 테스트인데, 오픈소스 모델 치고는 매우 높은 수준이죠. 하지만 제가 실전 투자를 하면서 배운 건, 벤치마크 점수만으로 모든 걸 판단하면 안 된다는 거예요. 실제 적용 가능성과 비용 효율성이 훨씬 중요하죠.
그래서 더 흥미로운 부분은 비용이에요. 미스트랄은 데브스트랄 2가 실제 작업에서 클로드 소넷보다 ‘약 7배 더 비용 효율적’이라고 발표했어요. 구체적으로 보면, 데브스트랄 2의 API 사용료는 입력 100만 토큰당 0.40달러, 출력 100만 토큰당 2.00달러 수준이에요. 반면 경쟁사인 클로드 소넷 4.5는 같은 기준으로 각각 3달러, 15달러나 하죠. 스타트업이나 개인 개발자에게는 이 차이가 매우 클 수밖에 없어요.
여기서 중요한 건 ‘바이브 코딩’이라는 트렌드와 연결된다는 점이에요. 자연어로 원하는 기능을 설명하면 AI가 코드를 생성해주는 방식인데, 2025년 올해의 단어로도 선정될 정도로 화제가 됐죠. 하지만 실전 투자자로서 저는 항상 ‘트렌드’와 ‘실제 가치’를 구분하려고 해요. 미스트랄은 데브스트랄 2가 단순 프로토타입이 아닌, 실제 프로젝트 전체의 일관성을 유지하고 실패를 감지해 수정할 수 있다고 주장해요. 이 주장이 사실이라면 게임 체인저가 될 가능성이 있습니다.
그런데 동시에 고민도 돼요. 개발자 사이먼 윌리슨의 인터뷰처럼, “바이브 코딩으로 프로덕션 코드베이스를 만드는 것은 분명히 위험하다”는 지적도 공감이 가요. 제가 투자하는 회사들의 CTO들을 만나보면, 기존 시스템을 유지보수하고 발전시키는 작업이 훨씬 복잡하고 중요하다고들 하거든요. AI가 정말 그런 난제를 해결할 수 있을까요?
마지막으로 투자 관점에서 정리해볼게요. 미스트랄의 이번 움직임은 오픈소스 AI 생태계의 경쟁력을 한 단계 끌어올리는 사건이에요. 하지만 단기적인 기술 발표에 휩쓸리기보다, 이 기술이 실제 기업의 개발 비용을 얼마나 줄여주고, 생산성을 얼마나 향상시키는지 지켜봐야 해요. 특히 데브스트랄 스몰 2처럼 노트북에서도 돌아가는 소형 모델의 등장은 접근성을 크게 높일 거예요. 기술의 민주화가加速되는 만큼, 관련된 인프라, 보안, 교육 분야의 투자 기회도 함께 눈여겨볼 시점입니다.
—
원문: [Ars Technica](https://arstechnica.com/ai/2025/12/mistral-bets-big-on-vibe-coding-with-new-autonomous-software-engineering-agent/)