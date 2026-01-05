하이퍼클로바X, 중국 오픈소스 일부 활용 인정

"핵심 모델은 100% 자체 개발" 해명

정부의 독자 파운데이션 인공지능(AI) 모델 정예팀인 네이버클라우드에서 프롬 스크래치 논란이 제기됐다.



5일 정보통신기술(ICT) 업계에 따르면 네이버클라우드의 하이퍼클로바X 시드 32B 싱크 모델이 중국 알리바바의 큐웬 2.4 언어모델과 비전 인코더 웨이트(가중치) 코사인 유사도와 피어슨 상관계수가 높다는 주장이 나왔다.

지난 12월 30일 서울 강남구 코엑스에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 참석자들이 네이버클라우드 부스를 체험하고 있다. 연합뉴스

코사인 유사도와 피어슨 상관계수는 모두 데이터셋의 유사도를 측정하는 방법이다.



코사인 유사도는 방향의 유사성을 판단하고, 피어슨 상관계수는 데이터의 분포가 얼마나 유사한지 나타낸다.



하이퍼클로바X와 큐웬 2.4 언어모델의 코사인 유사도와 피어슨 상관계수가 높다면 비전 인코더와 웨이트를 일부 사용한 것으로 풀이될 수 있다.



네이버클라우드는 중국 오픈소스를 가져다 쓴 점에 대해서는 인정한다고 밝혔다.



네이버클라우드 측은 "이번 모델에서 글로벌 기술 생태계와의 호환성과 전체 시스템의 효율적 최적화를 고려해 검증된 외부 인코더를 전략적으로 채택했다"라고 전했다.



이어 "이는 기술적 자립도가 부족해서가 아니라 표준화된 고성능 모듈을 활용해 전체 모델의 완성도와 안정성을 높이기 위한 엔지니어링 판단에 해당한다"라고 해명했다.



다만 네이버클라우드는 파운데이션 모델이 프롬 스크래치가 아니라는 주장에 대해서는 반박했다.



네이버클라우드 관계자는 "네이버는 파운데이션 모델을 프롬 스크래치 단계부터 100% 자체 기술로 개발해왔다"라고 일축했다.



그러면서 "비전 인코더는 시각 정보를 모델이 이해할 수 있는 신호로 변환하는 시신경 역할을 하고, 네이버는 VUClip과 같은 독자적인 비전 기술력을 보유하고 있다"라고 설명했다.



네이버클라우드는 AI 모델 구축 과정에서 다른 모듈을 활용하는 건 일반적인 방식이라고 부연했다.



네이버클라우드 관계자는 "알리바바의 큐웬-오디오는 오픈AI의 음성인식 기술을, 큐웬-옴니는 구글의 이미지 인식 기술을 기반으로 구축됐다"라며 "이번 모델의 핵심 기여는 텍스트, 음성, 이미지를 하나의 유기적인 구조 안에서 동시에 이해하고 생성하도록 설계하는 것이다"라고 덧붙였다.



네이버클라우드는 기술 선택 사항과 라이선스 정보를 허깅페이스와 테크리포트로 공개해왔고, 향후 기술 개발 과정에서 투명성을 유지하겠다고 전했다.

<연합>