기사입력 2016-04-06 22:38:19
기사수정 2016-04-06 22:40:28
방대한 의료 빅데이터 활용
생명의 본질 규명 성큼 다가서
난치병 정복 새 시대 열리고
엄청난 사회적 비용도 절감
AI의 시너지효과 놀라워
구글 딥마인드의 인공지능(AI) 프로그램 알파고와 프로기사 이세돌 9단의 바둑대결이 몰고 온 AI 신드롬이 우리 사회 전반에 큰 파장을 미치고 있다. 반신반의했던 알파고의 위력이 예상을 뛰어넘으면서 과연 AI가 학습의 범위를 초월하는 창의적인 판단을 할 수 있는가라는 명제가 큰 화두가 됐다. 이런 가운데 딥마인드의 창업자인 데미스 하사비스가 밝혔듯이 의료 분야의 응용 가능성에 대해 초미의 관심이 모아지고 있다.
이미 IBM의 AI 컴퓨터 왓슨은 뉴욕의 한 병원에서 암환자의 임상데이터를 학습하기 시작했으며 1년이 경과된 시점에는 90%의 정확도로 진단을 내릴 수 있었다고 한다. 최근 다국적 제약회사인 아스트라제네카는 생어연구소, IBM과 손잡고 대규모의 항암제 반응 세포실험데이터를 공개한 뒤 기계학습을 통해 공개하지 않은 실험데이터를 누가 더 정확히 예측해내는지 ‘드림(DREAM)챌린지’라는 국제경진대회를 개최해 전 세계 많은 과학자로부터 큰 관심을 모으고 있다. 그렇다면 과연 AI는 인류의 건강과 질병치료에 얼마나 도움을 줄 수 있을까.
AI의 구현은 다양한 형태로 이루어질 수 있으나 기본적으로 미지의 시스템을 충분히 복잡한 함수의 연결로 표현한 뒤 시스템으로부터 관측된 입출력 데이터를 잘 표현할 수 있도록 함수에 포함된 수많은 계수의 값을 가능한 한 최적으로 추정함으로써 구현된다. 그러므로 AI의 성능은 학습데이터에 의존적일 수밖에 없다. 또한 학습된 데이터는 잘 모사할 수 있더라도 학습데이터와 매우 다른 새로운 입력이 주어질 경우 실제와 동떨어진 엉뚱한 출력값이 예측될 수도 있다. 무엇보다 큰 한계는 입출력 데이터 사이의 내부관계를 분석할 수 없다는 것이다. 데이터가 부족하더라도 스스로 강화학습을 통해 전략을 개선할 수 있는 게임의 경우와는 달리 그 정답이나 규칙을 미리 알 수 없는 바이오 의료 분야의 응용에서는 아직 여러 한계점이 남아 있는 것이다. 특히 생명을 다루는 경우에는 단 한번의 잘못된 예측도 매우 심각한 결과를 초래할 수 있기에 그 응용의 한계는 더욱 명확하다.
한편 현대의 생명과학에서는 그동안 축적된 방대한 실험결과를 토대로 생명체의 동작원리를 거대한 분자네트워크의 다이내믹스로 이해하고 분석하는 시스템생물학(systems biology)이 큰 주목을 받고 있다. 이를 위해 시스템생물학에서는 전통적인 생물학실험, 수학모델링, 그리고 컴퓨터시뮬레이션 분석을 융합해 접근한다. 이러한 시스템생물학은 생명체라는 시스템의 모델을 그 내부의 동작원리에 대한 메커니즘을 기반으로 조각조각의 실험적 정보를 집대성함으로써 구현하는 이른바 ‘화이트박스’ 모형을 추구한다. 이러한 접근을 통해 생명체가 어떤 환경에서 주어진 자극에 대해 어떠한 반응을 일으키는지 원인을 분석하며 접근해갈 수 있지만 여전히 정확한 모델을 구축하기에 정보가 부족한 부분이 그 한계로 남아있다. 이러한 한계는 물론 시간이 지남에 따라 데이터가 더욱 축적되면서 빠르게 극복될 것이다.
만일 블랙박스 모델에 기반한 AI와 화이트박스 모델에 기반한 시스템생물학이 융합돼 새로운 ‘그레이(grey)박스’ 모델이 개발된다면 바이오 의료 분야에 일대 혁신이 일어날 것이다. 이러한 접근을 통해 우리는 그동안 인류가 쌓아온 방대한 바이오 의료 빅데이터로부터 생명의 본질에 좀 더 다가갈 수 있을 것이며 인체질환에 대한 새로운 이해를 하게 될 것이다. 또한 환자맞춤형 치료를 통해 삶의 질을 크게 향상시킬 수 있고, 의료에 소요되는 사회적 비용을 효율적으로 절감할 수 있을 것이다. 알파고의 열풍이 단지 AI 그 자체에만 쏠리기보다 과학을 바라보는 보다 큰 안목과 통찰을 통해 AI가 시너지를 창출할 수 있는 새로운 미래를 내다보아야 한다.
조광현 KAIST 교수·바이오및뇌공학