이세돌 9단 첫 승, 알파고의 원리는 무엇일까? '누구냐 넌'

기사입력 2016-03-14 00:25:44
기사수정 2016-03-14 00:25:43

사진=바둑TV 공식 홈페이지/ 이세돌 9단의 첫 승리와 알파고의 원리 분석

이세돌 9단과 인공지능 알파고는 바둑 사상 '세기 최고의 대결'로 큰 화제를 모으고 있다. 이와 함께 이세돌 9단의 첫 승리로 인공지능 알파고는 어떤 원리로 작동하는지 궁금증을 자아냈다.

‘세계 최강 바둑기사’ 이세돌 9단이 구글의 인공지능 알파고와의 대결에서 연속 3번이나 불계패를 당해 바둑계와 과학자들에게 충격을 안겼다.

하지만 14일 펼쳐진 이세돌 9단과 알파고의 제 4국 대전에서 이세돌 9단이 승리를 기록하며 전세계적으로 놀라움을 선사했다.

사진=이세돌 9단과 알파고의 중계 `바둑TV` 방송화면 캡쳐/ 이세돌 9단의 첫 승리

그렇다면 알파고는 무엇이며, 어떤 원리로 작동될까?

알파고는 구글이 2014년 인수한 딥마인드가 ‘기계학습(machine learning·머신러닝)’ 기술을 바탕으로 개발한 인공지능 프로그램이다.

알파고의 원리는 크게 ‘딥러닝(deep learning)’과 ‘강화학습’이라는 기계학습 방법론으로 구성된다. 인공신경망을 기반으로 기계가 복잡한 문제를 스스로 학습·해결하고 스스로 훈련을 통해 진화해 가는 것이다.

하사비스는 알파고가 바둑을 학습하는 방식에 대해 "고급 트리 탐색과 ‘심층 신경망(deep neural network)’을 결합한 새로운 접근방식으로 알파고라는 시스템을 구축했다”고 밝혔다.

사진=알파고의 원리 관련 유투브 영상 캡쳐

이로 인해 '심층 신경망'은 수백만 개의 신경세포와 같은 연결고리를 포함하는 12개의 프로세스 레이어를 통해 바둑판을 분석한다.

하사비스는 “인간을 흉내내는 것이 아닌 실제 대국에서 인간을 이기기 위해 알파고는 자체 신경망 간에 수천만 회의 바둑을 두고 강화학습이라는 시행착오 프로세스를 사용해 스스로 새로운 전략을 발견하는 법을 학습했다”고 설명했다. 그 후 알파고는 실제 대국에 투입돼 여러 테스트를 거쳐서 탄생했다고 전했다.

한편 이세돌은 제4국 대전 후 인터뷰에서 "감사하다. 한 판을 이겼는데 이렇게 축하받은 건 처음인 것 같다"며 "3연패 당하고 1승 하니까 이렇게 기쁠 수가 없다"고 말해 눈길을 끌었다.

이슈팀 ent1@segye.com

<세계닷컴>