생성형 인공지능(AI) 챗GPT 개발사 오픈AI가 13일(현지시간) 보고, 듣고, 사람과 실시간으로 대화할 수 있는 새 AI 모델을 공개했다. 2013년 AI와 사랑에 빠진 남성의 이야기를 다룬 영화 ‘허(Her)’가 현실이 됐다는 평가가 나온다.
미라 무라티 오픈AI 최고기술책임자(CTO)는 이날 온라인 신제품 발표 행사에서 ‘GPT-4o’라는 이름의 새 거대언어모델(LLM)을 공개하고 기능을 시연했다.
GPT-4o는 텍스트를 통해 대화했던 기존 챗GPT와 달리 이용자와 실시간 음성 대화를 통해 질문을 받고 답변을 내놓는다. 텍스트·음성뿐 아니라 이미지 인식 기능까지 갖춘 멀티모달(Multimodal) 모델로, 사람이 말하는 내용이나 보여주는 이미지를 즉각 이해하고 그에 걸맞은 답을 할 수 있다. 새 모델명의 ‘o’는 ‘옴니(Omni·모든 것)’라는 의미에서 따왔다고 오픈AI는 설명했다.
또 시연자가 종이에 “나는 챗GPT를 사랑한다(I♡ChatGPT)”라고 써서 보여주자, GPT-4o는 “다정하다”며 기뻐하는 모습을 보였다. 영화 ‘Her’에서 아내와 이혼 절차를 밟는 중이던 남자 주인공이 ‘사만다’라는 이름의 AI 비서에게 자신의 감정과 속마음을 공유하면서 점점 AI와 사랑에 빠지는 장면을 연상케 하는 연출이었다. 실제로 GPT-4o가 공개된 이후 샘 올트먼 오픈AI 최고경영자(CEO)는 자신의 엑스(X·옛 트위터)에 영화 제목 ‘her’를 적었다. 그는 자신의 블로그에서는 “(AI 모델이) 영화에 나오는 AI처럼 느껴지고, 그것이 현실이라는 게 놀랍다”며 “인간 수준의 반응 시간과 표현력에 도달한 것은 엄청난 변화”라고 자평했다.
GPT-4o는 외국어 음성을 실시간으로 번역하는 기능도 갖췄다. 서비스는 한국어 등 50개 언어로 제공된다. 이날 시연된 AI 음성 모드는 몇 주 안에 공개될 예정이다. 무료서비스지만 기존 유료 구독자는 무료 이용자보다 5배 많은 질문을 할 수 있다. 공개 당일부터 개발자들이 새 모델을 사용해 애플리케이션을 구축할 수 있도록 오픈AI의 응용 프로그램 인터페이스(API)를 통해서도 이용할 수 있다고 오픈AI는 전했다.
빅테크(거대기술) 기업들이 사람을 뛰어넘는 수준의 범용인공지능(AGI) 개발에 천문학적 돈을 쏟아붓고 있는 가운데 이날 GPT-4o의 공개로 오픈AI가 AGI 경쟁에서도 한발 앞서나가고 있다는 평가가 나온다.
이에 맞서 구글도 14일(한국시간 15일) 연례 개발자회의(I/O) 행사에서 자사 AI 모델 ‘제미나이’의 최신 버전 및 새로운 AI 기술들을 선보였다. 구글은 제미나이를 통해 자사의 검색엔진, 지도, OS(운영체제) 등을 강화할 방안을 모색해 왔는데, 이번 행사에서 한층 더 진화한 스마트폰과 AI 결합 기술이 공개될 것으로 보여 관심을 끌고 있다. 기존 구글의 AI 음성 비서 ‘구글 어시스턴트’에 제미나이를 적용하는 것이 대표적이다.
AI 경쟁에 뒤늦게 참전한 애플도 다음달 10일 세계개발자회의(WWDC)에서 AI 전략을 발표할 예정이다. 애플은 자사의 음성 비서인 ‘시리’에 생성형 AI 기능을 탑재해 대화 기능 등을 더욱 강화한 모델을 공개할 것으로 전해졌다.