인공지능(AI)은 SF영화나 상상 속에만 존재하고 현실에서는 단순한 구호에 불과하다 느꼈던 것이 불과 얼마 전이다. AI에 대한 인식을 바꾼 결정적 계기가 챗GPT의 출현이다. 짧은 기간 동안 수많은 생성형 AI 서비스가 등장했고, 언어생성모델뿐 아니라 이미지, 음향, 음성, 동영상 등 다양한 생성모델로 확장하고 있다. AI 인플루언서, AI 기반의 무인이동체나 콜센터는 이미 현실화하고 있고, 우울증 치료를 도와주는 대화형 AI, 지체부자유자를 지원하는 AI 가사로봇이나 고령자를 위한 AI 간호 로봇 등 수많은 분야에서 AI를 적용함으로써 우리 삶을 편리하게 만들고 더 많은 부가가치를 창출할 수 있다. 미래의 새로운 성장동력으로서 적극적인 투자와 R&D, 사업화와 기존 산업과의 융합을 정책적으로 진흥해야 하는 이유다.
챗GPT는 AI 시대를 여는 새로운 혁신으로 인식되기도 하지만, 다른 한편 기존 질서를 훼손하거나 새로운 문제를 초래하는 문제아로 인식되기도 한다. AI의 수준은 데이터의 양과 질에 좌우되기 때문에 우수한 AI를 만들어내기 위해서는 불가피하게 기존 데이터를 대량으로 학습할 수밖에 없다. 즉, 저작권이나 데이터베이스권으로 보호받는 데이터를 크롤링(Crawling)하여 수집·이용하기도 하고, 다른 사람의 개인정보를 활용하기도 한다. 사람이 직접 권리 침해의 의도를 가지고 데이터를 수집·이용하는 것이 아니라 AI를 만들기 위해서 단순히 데이터 학습과정을 진행하는 것일 뿐이고 타인을 식별하거나 저작물을 감상·향유하는 것은 아니기 때문에 학습용 데이터로 수집·이용하는 것을 허용해야 한다는 주장도 적지 않다.
반면, AI 학습용 데이터로서 저작물이나 개인정보의 수집·이용을 무한정 허용하면, 기존의 저작권 생태계가 무너지고 AI가 고도화되면서 결국 기존 저작물과 유사하거나 동일한 저작물이 생성될 경우 저작권자의 권리침해가 현실화될 위험성이 높을 뿐 아니라 개인도 얼마든지 식별할 수 있게 되기 때문에 데이터 학습 단계에서 적절한 권리처리 혹은 법 준수가 필요하다는 주장도 설득력이 있다. 위험성에 대한 인식이 낮은 상태에서 첨단 AI의 편리함만을 생각하여 개발 중인 소프트웨어의 소스코드나 반도체 설계도와 같은 영업비밀이나 국가 기밀을 AI에 입력하는 경우에는 비밀 유출의 문제도 제기된다.