글로벌 ‘빅테크’ 기업들이 차세에 인공지능(AI) 시장을 선점하기 위해 새로운 AI 모델을 출시하거나 AI 기업을 인수하는 등 ‘AI 경쟁전’을 이어가고 있다.
구글은 2일(현지시간) 개방형 라이선스를 채택해 상업적 이용이 자유로운 AI 모델 ‘젬마4’를 공개했다.
젬마4는 구글의 최고급 AI 모델인 ‘제미나이3’와 동일한 기술을 기반으로 개발됐으며, 구글이 지금껏 내놓은 개방형 모델 가운데 가장 뛰어난 성능을 갖춘 것으로 알려졌다.
구글은 젬마4를 매개변수(파라미터)가 각각 20억 개와 40억 개인 소형 버전과 260억 개와 310억 개인 대형 버전 등 4가지로 나눠 출시했다. 이 중 가장 규모가 큰 310억 개 모델은 AI 성능평가 지표인 ‘아레나’ 리더보드에서 3위를 기록했다.
소형 버전은 스마트폰이나 소형 로봇 내부에서 인터넷 연결 없이도 빠르게 구동할 수 있다.
구글은 젬마4에 자체 라이선스 규격 대신 상업적 이용을 허락하는 ‘아파치 2.0 라이선스’를 채택해 기업들이 쉽게 도입할 수 있도록 했다. 이를 통해 구글은 AI 에이전트 시장을 선점하려는 의도로 풀이된다.
엔비디아도 이날 젬마4가 기기 내장형 AI 흐름에 맞춰 빠르고 효율적으로 설계됐다고 소개하면서, 이 모델이 자사의 RTX 그래픽처리장치(GPU)에 최적화해 있다고 밝혔다.
구글이 젬마를 별도로 출시한 것은 AI 에이전트와 로봇, 실물 AI, 내장형 AI 시장으로 확대하려는 전략으로 해석된다. 인터넷 연결 없이도 작동하고, 작은 기기에서도 구동하고, 개발자가 필요에 따라 미세 조정할 수 있는 개방형 모델의 중요성이 커지고 있기 때문이다.
챗GPT 개발사 오픈AI는 범용인공지능(AGI) 시장 개척을 위해 팟캐스트 TBPN(기술사업프로그래밍네트워크)을 인수했다고 이날 밝혔다.
TBPN은 실리콘밸리 투자자·창업자 출신인 존 쿠건과 조디 헤이스가 지난 2024년 10월 시작한 기술 전문 방송이다.
TBPN는 지난해 약 500만 달러(약 75억원)의 광고 수익을 올렸고 올해는 3000만 달러(약 450억원)를 돌파할 것으로 예상된다.
피지 시모 오픈AI 사업 부문 최고경영자(CEO) “AGI를 세상에 선보인다는 사명에는 AI가 만들어내는 변화에 대해 진실하고 건설적인 대화를 나눌 수 있는 공간을 마련할 책임도 포함된다”고 이번 인수의 배경을 설명했다.
또 시모 CEO는 TBPN의 프로그램 운영과 출연자 선정 등에서 ‘편집권 독립’을 유지할 것이라고도 강조했다.
이밖에 마이크로소프트(MS)는 음성으로 받아쓰기가 가능하고, 음성과 이미지 생성에 특화된 모델 3종을 개발자용으로 한꺼번에 공개했다.
사티아 나델라 MS CEO는 이날 “모든 개발자에게 성장하는 MAI(MS AI) 모델 제품군을 제공하게 됐다”며 음성 전사 모델 ‘MAI-트랜스크라이브-1’, 음성 생성 모델 ‘MAI-보이스-1’, 이미지 생성 모델 ‘MAI-이미지-2’ 등을 선보였다.
MAI-트랜스크라이브-1은 영어와 한국어를 포함한 25개 언어를 인식할 수 있다. 또한 업계 표준 성능지표(벤치마크)인 ‘플뢰르’에서 오픈AI·구글 등의 모델을 제치고 가장 낮은 오류율을 기록했다.
MS는 이 모델이 다국어로 진행되는 회의장이나 시끄러운 카페·콘서트 현장 등에서도 음성을 또렷하게 인식할 수 있다고 설명했다.
아울러 MAI-보이스-1은 몇 초 길이의 음성 데이터만으로도 맞춤형 음성을 생성할 수 있고, 60초 분량의 오디오를 단 1초만에 만들어낼 수 있다고 MS는 밝혔다.
MAI-이미지-2는 성능지표 최상위권의 이미지를 낮은 가격에 만들 수 있다는 설명이다.
MS는 지난해부터 딥마인드 공동창업자 출신인 무스타파 술레이만 MAI 부문 CEO에게 ‘초지능’(Superintelligence) 연구 및 개발을 맡겼지만, 아직 경쟁사 수준의 범용 기반 모델(파운데이션 모델)을 완성하지 못한 상황이다.
나델라 CEO도 최근 사내 개발자 모임에서 3∼5년 내 최첨단 AI 자립의 중요성을 강조한 바 있다.

