딥마인드, 질병 유발 유전자 변이 89%까지 예측 [뉴스 투데이]

연구팀, AI 머신러닝 모델 개발
2억개 변이 학습… 32% 유해 확인
희소 질환 진단·치료 속도 기대

구글의 인공지능(AI) 부서인 딥마인드가 0.1%에 불과했던 유전자 변이 예측 가능성을 89%까지 높였다고 영국 BBC방송이 19일(현지시간) 보도했다. 유전자 변이로 인한 희소 질환 진단과 예측에 속도가 붙을 것으로 예상된다.

딥마인드가 이날 국제 학술지 사이언스에 발표한 내용에 따르면 연구팀은 유전자 변이가 질병에 미치는 영향을 분석·예측하는 머신러닝 모델 ‘알파미스센스’를 개발했다.



연구팀은 개발 과정에서 챗GPT·거대언어모델(LLM) 등과 같은 생성형 AI의 특성을 활용했다. 챗GPT는 인간이 사용하는 수많은 문장을 학습해 특정 단어 다음에 나올 단어를 예측한다. 이러한 개념을 활용한 단백질 언어 모델(protein language model)을 통해 알파미스센스는 수백만개 영장류 DNA 데이터에서 건강한 단백질이 어떤 염기 배열을 가졌는지 등을 학습해 질병이 발생할 가능성이 높은 변이를 찾아내도록 훈련됐다.

HBB유전자의 변이(왼쪽)인 베타-글로빈 단백질은 헤모글로빈의 하위 구조의 하나로 겸상적혈구빈혈을 일으킬 수 있으며 이온 채널에 작용하는 CFTR 단백질의 변이(오른쪽)는 낭포성 섬유증을 일으킬 수 있다. 딥마인드 홈페이지

그동안 돌연변이는 종류가 워낙 많아 질병과의 연관성을 알아내기가 어려웠다. 현재까지 알려진 돌연변이는 약 400만개로 이 중 2%만이 질병을 유발하거나 양성인 것으로 파악됐다.

알파미스센스는 돌연변이 중 가장 흔하게 발생한다고 알려진 ‘미스센스(Missense)’를 예측했다. 인간 DNA는 아데닌(A), 시토신(C), 구아닌(G), 티민(T) 4가지 염기가 일정한 순서대로 꼬이는 구조로 돼 있다. 그런데 한두 개가 빠지거나 순서가 뒤바뀐 돌연변이인 미스센스가 생기면 질병이 발생할 수 있다. 백인에게서 흔한 유전병인 낭포성 섬유증이나 흑인에게서 자주 발생하는 겸상 적혈구 빈혈증이 대표적이다. 암이나 뇌 발달 문제 등도 일으킬 수 있다.

알파미스센스는 1만9000개 이상의 인간 단백질에서 발생할 수 있는 2억1600만개의 단일 아미노산 변이 가능성을 평가해 질병을 유발할 수 있는 7100만개의 미스센스 변이를 예측했다.

그 결과 AI의 정밀도를 90%로 설정했을 때, 알파미스센스는 해당 변이의 57%가 인체에 무해하고 32%는 유해한 것으로 분석했다.

구글 딥마인드 연구팀은 “지금까지 인간 전체 유전자 변이 중 0.1% 정도만 질병 유발 가능성 여부를 판단할 수 있었는데, 알파미스센스가 이 비율을 89%까지 높였다”고 밝혔다. 국제 학술지 네이처도 “알파미스센스는 질병을 일으키는 유전자 변이와 그렇지 않은 것을 구분하는 데 다른 도구들보다 뛰어난 능력을 갖춘 것으로 보인다”면서 “한 번에 수천개의 유전자 변이를 측정해 문제가 되는 곳을 찾아내는 실험에서 매우 잘 작동했다”고 평가했다.