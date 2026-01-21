중국 인공지능(AI) 스타트업 딥시크가 세계를 깜짝 놀라게 하며 등장한 지 1년 만에 차세대 대형언어모델(LLM)로 추정되는 신규 프로젝트를 준비 중인 정황이 포착됐다.



미중 AI 주도권 경쟁이 심화하는 가운데 중국 AI 업계가 외부 기술 의존도를 낮춘 역량 강화에 속도를 내고 있다는 분석이 나온다.

21일 중국 경제 매체 제일재경과 IT즈자 등에 따르면 딥시크는 최근 오픈소스 플랫폼 깃허브(GitHub)에 공개한 코드 업데이트 과정에서 'MODEL1'이라는 새로운 대형 모델 식별자를 다수 포함했다.



이 식별자는 딥시크의 기존 모델인 'V32'(딥시크 V3.2)와 구분돼 언급된 것으로 알려졌다.



업계에서는 코드 맥락상 MODEL1이 기존 아키텍처와 다른 새로운 모델을 가리킬 가능성이 큰 것으로 보고 있다.



딥시크는 해당 모델에 대한 설명을 내놓지 않았다.



딥시크는 2024년 12월 효율적인 대형언어모델 구조로 평가되는 MoE(Mixture of experts·전문가 혼합) 아키텍처를 적용한 플래그십 모델 V3를 출시하며 주목받았다.



이어 지난해 1월에는 강화학습 기반 추론 모델 R1을 선보여 수학 문제 해결과 코드 작성 등 복잡한 추론 과제에서 뛰어난 성능을 보였다는 평가를 받았다.



최근 잇따른 기술 논문 공개도 딥시크의 차세대 모델 출시가 임박했다는 관측에 힘을 싣고 있다.



량원펑을 포함한 딥시크 연구진은 지난 12일 '확장 가능한 조회 기반 조건부 메모리: 대형언어모델(LLM)을 위한 희소성의 새로운 축' 논문을 발표했다.



이는 사람이 익숙한 정보를 접할 때 추가적인 사고 없이 기존 기억을 불러내는 것처럼 LLM도 빈도가 높은 정보에 대해서는 반복적인 심층 추론을 하지 않도록 설계하는 방식이다.



지난 1일에는 AI 학습 과정의 불안정성과 제한된 확장성 문제를 다룬 '다양체-제약(Manifold-Constrained) 초연결' 프레임워크 관련 논문도 공개했다.



미국 기술 전문매체 디인포메이션은 딥시크가 향후 수주 내 차세대 모델을 공개할 예정이라며 특히 강력한 코딩 능력을 갖출 것이라고 보도하기도 했다.



딥시크의 차세대 모델 개발은 단순한 기업 차원의 신제품 출시를 넘어 미중 AI 기술 경쟁의 단면을 보여주는 사례로 평가된다.



미국의 반도체 수출 통제 등 기술 봉쇄가 이어지는 상황에서도 중국 AI 기업들이 독자적인 기술 경로를 통해 글로벌 선두 업체들과의 격차를 좁히려는 시도라는 해석이다.



싱가포르 연합조보는 "중국 AI 기업들은 엔비디아 칩을 자유롭게 확보하기 어려운 상황에서도 오픈 AI 등 글로벌 대형 기업들과 경쟁을 이어가고 있음을 보여주고 있다"고 전했다.

