제미나이에 ‘비상등’ 오픈AI…“GPT-5.2 출시”

즉답·사고·프로 모드 갖춰…환각 발생률↓

샘 올트먼 오픈AI 최고경영자. 뉴시스

미국 오픈AI는 11일(현지시간) 즉답(Instant)·사고(Thinking)·프로(Pro) 등 세 가지 모드를 갖춘 새 모델 생성형 인공지능(AI) ‘GPT-5.2’를 출시한다고 밝혔다. 이전 버전을 내놓은 지 불과 한 달 만이다.

즉답 모드는 빠른 답변에, 사고 모드는 코딩·수학 문제 해결·긴 문서 분석에, 프로 모드는 고난도 추론과 장시간 작업에 각각 최적화한 구성이다.

회사 측은 추론·코딩 성능을 개선하고 환각(hallucination) 발생률을 낮췄다고도 강조했다.

실제 GDPval 직무 수행 평가에서 GPT-5.2의 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 전작 GPT-5(38.8%) 대비 크게 향상됐다.

소프트웨어 엔지니어링 능력을 평가하는 SWE 코딩 벤치마크에서는 80%를 기록해 구글 ‘제미나이3 프로(76.2%)’를 앞섰고, 박사급 추론 능력 측정 벤치마크 HLE에서도 구글 최신 모델보다 높은 성능을 보였다는 설명이다.

내부 테스트 기준 오류율도 6.2%로 GPT-5.1 사고 모드 대비 약 30% 감소했다. 긴 글 맥락 파악 능력과 이미지·그래프 이해도, 다단계 업무 처리 역량 역시 향상됐으며, 민감한 대화 안전성과 미성년자 보호 기능도 강화됐다.

GPT-5.2는 이날부터 유료 구독자에게 순차 제공되며, GPT-5.1은 3개월 뒤 서비스가 종료된다.

구글 제미나이의 공세가 ‘무섭나’라는 기자의 질문에 미국 오픈AI의 ‘챗GPT’가 내놓은 답변. 챗GPT 화면 캡처

오픈AI의 움직임은 겉으로는 새로운 모델 출시지만, 업계에서는 오픈AI가 개발 일정을 당긴 배경에 ‘위기감’이 자리하고 있다고 본다.

불과 2년 전과는 완전히 달라진 장면이다.

2023년 챗GPT가 전 세계 검색 습관과 IT 질서를 뒤흔들며 등장했을 때 비상등을 켠 쪽은 구글이었다.

회사는 ‘코드 레드(Code Red)’를 발령하고 순다르 피차이 CEO가 직접 상황실에 상주했으며, 경영 일선에서 물러났던 래리 페이지와 세르게이 브린까지 호출해 대응책을 논의했다. 오픈AI에서 갈라져 나온 앤트로픽에 4억달러를 투자하는 등 대대적인 재정비에 나선 것도 이 시기였다.

2년이 흐른 최근에는 정반대의 상황이 펼쳐지고 있다.

급속히 성장한 구글 제미나이 시리즈, 특히 ‘제미나이3 프로’가 언어 성능과 이미지 생성·편집 도구를 중심으로 빠르게 점유율을 확장하며 오픈AI의 독주 구도를 흔들고 있다.

시장조사업체 시밀러웹에 따르면 1년 전 87%에 달하던 챗GPT 생성AI 트래픽 점유율은 이달 71.3%로 내려갔고, 같은 기간 제미나이는 5.7%에서 15.1%로 세 배 가까이 뛰어올랐다.

성능 경쟁에서도 제미나이3 프로는 이용자 기반 벤치마크 ‘LM아레나 리더보드’에서 1위에 올랐고, 박사급 추론 능력을 측정하는 HLE 평가에서도 GPT-5를 크게 앞선 것으로 나타났다.

종합하면 오픈AI가 내부적으로 ‘중대 경보’를 울리고 개발 속도를 끌어올린 이유가 여기에 있다는 분석이다.

GPT-5.2 출시는 비상등을 켠 오픈AI의 응답이자, 생성형 AI 시장의 새로운 균형점이 어디로 이동할지를 가늠하게 하는 신호로 받아들여지고 있다.