올해 초 ‘신경 연결망을 이용한 물리학 개념의 발견(Discovering Physical Concepts with Neural Networks)’이라는 제목의 논문이 물리학 학술지 ‘Physical Review Letters’에 발표되었다. 서로 다른 네 종류의 물리학 문제를 인공지능을 통해 살펴본 연구 결과가 실렸다. 이 중 대중의 큰 관심을 끈 것은 바로 태양계에 대한 결과다. 지구에서 본 화성과 태양의 위치를 입력으로 이용해 학습시킨 인공지능이 지구가 아닌 태양이 태양계의 중심이라는 것을 알아냈다는 결과가 논문에 담겼다. 모두 알고 있는 지동설을 찾아낸 것이 뭐 그리 신기한 일이냐고 독자가 생각한다면, 다시 곰곰이 생각해 보시길. 행성운동의 중심이 지구가 아닌 태양임을 밝히기까지, 우리 인류는 수천 년이 걸렸다. 이 일을 인공지능은 아주 짧은 계산 시간 안에 해냈다.
논문 저자들이 사이넷(SciNet)이라 부른 이 인공지능 시스템에 몇 언론이 ‘AI 코페르니쿠스’라는 재밌는 이름을 붙였다. 사이넷의 작동방식은 현실 물리학자의 사고방식을 닮았다. 여러 관찰데이터를 모아 물리학자가 먼저 하는 일은 데이터를 표상하는 단순한 모형 혹은 이론의 구축이다. 다음에는 모형을 이용해 주어진 문제의 답을 구하고 이를 실제의 데이터와 비교해 모형의 타당성을 검증한다. 현실에서 이 과정은 한 번에 끝나지 않는다. 여러 번의 반복을 통해 모형은 점점 정교해진다. 같은 데이터를 거의 비슷한 정확도로 설명하는 두 모형이 있을 때, 물리학자는 더 단순한 모형을 선호한다. 결국 지동설이 천동설을 대체한 것도 마찬가지였다. 중세의 천동설은 일식을 예측할 정도의 수준으로 발전해 있었다. 과학자들이 마음을 바꾸게 된 계기는 지동설이 더 정확하기 때문이 아니었다. 지동설이 더 단순하기 때문이었다.
AI 코페르니쿠스도 물리학자와 비슷한 방식의 구조를 가진다. 여러 개의 노드로 구성되어 있는 입력층을 통해 들어온 정보는 은닉층을 거쳐 데이터의 표상을 담당하는 중간의 작은 연결망으로 전달된다. 이 연결망이 바로, 물리학자 머릿속의 이론 모형에 해당한다고 할 수 있다. 아주 적은 숫자의 노드로 구성되어 있어서, 커다란 입력 정보를 적은 수의 변수를 이용해 표상하게 된다. 마치 현실의 방대한 데이터를 설명하는 단순한 물리학 모형처럼 말이다. 이렇게 적은 노드가 담당한 데이터의 표상은 다음에는 다시 큰 연결망으로 전달되어 주어진 문제의 답을 출력하도록 구성되어 있다. 출력한 답을 실제의 데이터와 비교해 둘의 차이를 줄이는 방향으로 인공지능 신경망의 학습이 진행된다.
김범준 성균관대 교수 물리학