메뉴보기메뉴 보기 검색

[김동기의시대정신] AI 자가포식

입력 :
수정 :
폰트 크게 폰트 작게
오물처럼 쏟아진 AI 콘텐츠 탓
인간 창작 동력 잃어가는 사이
AI는 끊임없이 결과물 재학습
결국 자기복제의 늪 못 벗어나

2024년 7월, 영국 과학 저널 네이처 표지에 묘한 이미지가 실렸다. 로봇형 인공지능(AI)이 녹색 토사물을 쏟아내는 모습이었다. 표제는 ‘Garbage Out(쓰레기 배출)’. AI가 생성한 데이터를 AI가 재학습하는 순환이 반복되면 결국 스스로 무너진다는, 이른바 ‘모델 붕괴(Model Collapse)’에 대한 경고였다.

당시만 해도 신기술에 따르는 여러 비관론 중 하나 정도로만 보였다. 그러나 1년 반이 지난 지금, 포털에서 정보를 검색하거나 유튜브 피드를 넘길 때마다 불쑥 그 표지가 떠오른다. 네이처가 예견했던 AI 쓰레기가 어느새 블로그와 소셜미디어, 검색 결과 상단을 점령했다.

김동기 국가미래연구원 연구위원 전 KBS PD
김동기 국가미래연구원 연구위원 전 KBS PD

작년 말 네이버는 ‘2025 블로그 리포트’를 통해 한 해 동안 총 3억3000만개의 글이 올라왔다고 발표했다. 역대급 기록이라며, 1분마다 600개의 새로운 기록이 생성되고 있다고 설명했다. 과연 그 숫자가 자랑할 만한 일일까. 그중 상당수가 AI가 찍어낸 잡음이라는 걸 우리는 매일 체감하고 있지 않은가.

사실 나는 블로그와 커뮤니티에 정성껏 올라오는 개인의 기록들을 무척 감사히 활용하던 사람이었다. 여행 일정을 짤 때, 맛집을 찾을 때, 새로운 정책이 궁금할 때, 컴퓨터나 가전이 말썽을 부릴 때. 사진을 곁들여 차근차근 설명해 주는 글들을 볼 때마다 ‘좋아요’를 100번쯤 눌러주고 싶었다. 이런 성실한 포스팅은 대개 검색하자마자 상단에 떠 있곤 했다. 그 기록들을 믿고 낯선 나라의 기차를 예약하고, 컴퓨터 오류를 해결하고, 저녁 모임을 계획했다.

하지만 언젠가부터 손품이 배로 늘었다. AI에게 묻고 AI의 거짓말을 걸러내고, 다시 블로그와 커뮤니티를 뒤지다 횡설수설 광고 글 지뢰밭을 헤매고, 네이버와 구글을 오가며 사람이 쓴 글을 찾느라 진이 빠진다. 그렇게 정성스럽던 기록들이 AI 쓰레기 산에 묻혀가는 지금, 정작 그 글을 쓰던 사람들은 얼마나 맥이 빠질까. 찾는 이가 줄어들면 결국 그들도 하나둘 글쓰기를 멈출 것이다.

AI가 쓴 장황한 헛소리 아래엔 공허한 AI 댓글들이 줄줄이 달려 있다. AI가 글을 쓰면 AI가 댓글을 달고, AI가 ‘좋아요’를 누르고 여기저기 퍼 나른다. ‘죽은 인터넷 이론(Dead Internet Theory)’을 목격하고 있는 기분이다. 몇 년 전부터 음모론처럼 떠돌던 이 가설은, 우리가 접하는 인터넷 콘텐츠 대부분이 AI와 봇(Bot)이 만든 것이며 우리가 인간이라 믿고 대화하는 상대도 사실은 봇일 가능성이 크다는 주장이다. 인터넷은 진작 황폐해졌지만, 우리는 그 사실을 깨닫지 못한 채 봇들과 대화하며 상호작용의 환상 속에 살고 있다는 것이다.

2024년 옥스퍼드대학 출판부가 선정한 올해의 단어는 ‘브레인롯(Brain Rot, 뇌 썩음)’이었다. 자극적이고 저급한 온라인 콘텐츠를 과도하게 소비해 정신적·지적 능력이 퇴행하는 상태를 뜻한다. 2025년 영국 이코노미스트는 올해의 단어로 ‘슬롭(Slop, 오물)’을 꼽았다. AI가 무분별하게 찍어낸 저질 디지털 콘텐츠를 가리키는 말이다. 공급자인 AI가 오물을 쏟아내고, 수용자인 인간이 이를 흡수해 뇌가 썩어가는 기묘한 생태계가 만들어졌다.

이 오물을 인간만 흡수하는 게 아니다. 인간의 창작물은 쓰레기 산에 묻히고, 창작 동력을 잃은 인간이 하나둘 손을 놓는 사이 AI는 자신이 뱉어낸 결과물을 끊임없이 재학습한다. 결국 AI 지능도 퇴화한다. 네이처가 경고한 ‘모델 붕괴’, 즉 AI 자가포식 현상이다.

기술이 발전하면 AI 산출물의 질도 높아질 거란 낙관이 있다. 하지만 인간의 날것 경험이 고갈된 세상에서 AI는 자기 복제의 늪을 벗어날 수 없다. AI 생성 데이터를 재학습시킨 실험 결과, 세대가 거듭될수록 이전 세대의 오류·특징이 증폭됨이 드러났다. 복사에 복사를 거듭하면 형체가 뭉개지고, 근친교배로 유전적 다양성이 사라지면 기형이 발생하는 것과 같다. ‘합스부르크 AI’라고도 불린다.

그렇다고 품질 기준을 세워 데이터를 선별하면 평균화의 폭력이 시작된다. AI는 본질적으로 확률 기계다. 독특하거나 희귀한 정보는 낮은 확률로 간주해 지워버린다. 지식은 점차 밋밋해지고, 드물지만 가치 있는 통찰은 확률에 의해 사라진다.

어느 신생 출판사가 1년 동안 무려 9000권의 책을 펴냈다고 한다. 4개월 만에 137권을 집필한 작가도 있다. 국립중앙도서관은 지난해 납본 보상금으로 2억6000만원을 지출했다. 2016년 1200만원과 비교하면 이례적인 규모다. 구석의 책 하나까지도 소중히 보관해 후대에 남기기 위한 국가의 납본 제도를 악용한 AI 출판물들 때문이다. 결국 사상 처음으로 전자책 395종의 납본 신청이 거부되기에 이르렀다.

올해 한 신문사 신춘문예 당선작에조차 AI 특유의 ** 부호가 발견됐다는 소식에 숨이 막힌다. 지능의 진화라 믿었던 도구가 지능의 원본을 집어삼키고 있다. 자가포식은 이미 시작됐다.

 

김동기 국가미래연구원 연구위원 전 KBS PD