돌발상황 대응 못하는 AI 예보관… 인간과 ‘상호보완’ 필요 [연중기획-지구의 미래]

새 미세먼지 예보모델 등장

환경과학원 ‘대기질 예보 모델’ 사용
자료 토대로 하루에 4번 농도 안내
실시간 배출량 반영 못해 약점 지적

과거 패턴 분석한 AI 정확도 높지만
2020년 코로나 변수에 ‘오보’ 쏟아내
인간 직관·경험 바탕 ‘보조지표’ 활용
환경부 국립환경과학원은 우리나라 미세먼지를 공식적으로 예보하는 기관이다. 국립환경과학원은 2014년부터 미세먼지를 예보하기 시작해 그 역사가 채 10년이 안 됐다. 그러나 미세먼지 예보 기술이 빠르게 성장해 이제는 다양한 수치모델을 활용해 미세먼지 농도를 예측하고 있다. 수치모델은 입력자료를 다양한 방정식을 거쳐 미세먼지 농도 예측값을 산출해내는 모델을 통칭한다. 컴퓨터 도움을 빌려 입력자료를 간접적으로 실험해 몇 시간부터 며칠 뒤의 미세먼지를 예측해내는 것이다. 올해는 짧다면 짧은 국내 미세먼지 예보사에 새로운 발자취를 남길 해다. 올 한 해 검증을 거쳐 새로운 미세먼지 예보 모델이 등장한다. 인공지능(AI)이 본격적으로 미세먼지 예보에 발을 들이기 시작했다.

 

◆AI의 널뛰기, 기존 패턴대로라면 ‘백전백승’

 

31일 국립환경과학원에 따르면 예보관들은 AI 기술이 접목된 예보모델을 참고하고 있다. 국립환경과학원이 참고하는 AI모델 중 하나는 허창회 서울대 지구환경과학 교수팀이 개발한 시스템이다. 지난해부터 시범 도입했다.

 

현재 국립환경과학원은 대기질 예보(CMAQ)모델을 주로 사용한다. 현재 국립환경과학원이 하루에 네 번(5시, 11시, 17시, 23시) 안내하는 미세먼지 농도도 주로 이 모델을 근거로 한다. 기상조건, 오염물 배출 등 관측치를 토대로 이후 대기질을 예보하는 이 모델은 하지만 실시간 배출량을 반영하지 못하고 관측값의 대표성이 떨어지는 등 정확성을 보장할 수 없다는 약점이 지적돼 왔다. 2018년 기준 하루 예측 정확도가 73%, 이틀 예측 정확도는 68%에 그치는 수준이었다.

 

허 교수팀은 CMAQ모델에 시간패턴을 읽어내는 순환신경망(RNN)이라는 AI 딥러닝 기법을 결합한 예보모델을 개발했다. 가령 3월을 예측한다면 앞서 입력된 1·2·3월, 2·3·4월, 3·4·5월의 입력값을 근거로 한다. CMAQ모델 같은 수치모델은 복잡한 대기화학 방정식을 풀어 미래 결과를 계산한다. 반면 AI는 과거의 패턴을 읽어 어제와 비슷한 대기조건에서 당시 다음 날의 대기질이 어땠는지 찾아낸다. 이를 보고 ‘그럼 내일 미세먼지 농도는 이렇겠군’하고 예보하는 식이다. 직관 없이 외운 대로만 문제에 접근하는 고지식한 모범생과 경험치로 내일 날씨를 어림짐작하는 할머니 사이의 모습을 띤 셈이다.

허 교수팀은 2015년부터 2017년의 자료를 RNN모델에 ‘학습’시키고 2018년의 미세먼지 농도를 예측하게 했다. 결과는 기존 CMAQ모델만 사용할 때보다 확연히 좋아졌다. 초미세먼지(PM2.5) 하루 예보 정확도는 80.2%로, 이틀 예보 정확도는 74.0%로 올라갔다. CMAQ모델만을 사용한 2018년 당시 예보는 정확도가 각각 61.8%, 62.7%였다. RNN모델이 결합해 10∼20%포인트가량 더 정확도가 높아졌다. 허 교수팀의 새 모델은 2019년 가상 예보도 비슷한 정확도로 계산해냈다.

 

하지만 신종 코로나바이러스 감염증(코로나19)이 휩쓴 지난해 지구는 AI가 보기에도 이상했던 걸까. 지난해 예보는 정확도가 크게 떨어지는 모습이 나타났다. AI는 기존 학습 내용에 따라 지난해도 미세먼지가 나쁠 것이란 결과를 내놓았다. 과거와 비슷한 대기순환 조건임을 고려하면 지난해 미세먼지 농도가 짙었어야 하지만 실제로는 훨씬 좋았던 것이다.

 

연구진에게 지난해 오보의 정확한 원인은 아직 미스터리다. 허 교수는 “중국 오염원 배출량이나 국내 배출량 모두 당장 자료를 구할 수 없어 정확한 원인 분석이 어렵다”면서도 “지난해 코로나19 같은 돌발상황에 발생하는 극단적인 현상은 AI가 맞히지 못하는 것”이라고 설명했다.

 

◆답만 써놓는 AI, 풀이과정을 내놓아라

 

지난해 ‘돌발상황’에 전혀 대응하지 못한 AI. 여기서 AI의 맹점이 드러난다. 이 새 모델은 익숙한 환경에서는 100%에 가까운 정확도를 뽐낼 수 있어도 조금이라도 환경이 바뀌면 융통성을 발휘하지 못한다. AI는 정해진 알고리즘대로, 이미 짜인 일련의 과정에 따라 움직인다. 여러 정보를 흡수하면 비슷한 정보끼리 경향성을 발견하거나 평균을 어림잡을 수 있는 인간의 사고방식과 전혀 다르다. AI에는 그저 각각이 개별 정보일 뿐이다.

 

처음 학습된 대로만, ‘이런 상황에서는 과거에 이랬으니 이번에도 이래야 한다’고 원칙적으로만 사고하는 유형에 가까운 AI 입장에서 지난해 같은 돌발변수는 예측 정확도를 높이는 데 걸림돌이다. 허 교수는 “지난해 데이터를 포함하면 올해 예측성이 오히려 낮아졌다”며 “비정상적인 상황을 학습하고 나니 이후 예측 결과가 영향을 받아 지난해 수치는 아예 학습시키지 않으려 한다”고 설명했다.

 

이런 특징 때문에 서울의 미세먼지를 완벽하게 예측하는 AI라도 부산에서는 오답만 뱉어내는 기계로 전락할 수 있다. 난방 등으로 오염원 배출이 많아지는 겨울철, 온도가 오르면 대기가 정체돼 미세먼지 농도가 높아지기 쉽다. 그러나 이건 경향성일 뿐 지역별 바람·습도에 따라, 시간에 따라 실제 관측값은 다 다르다. 정확한 예보를 위해서는 지역별로 모든 정보를 처음부터 학습시켜 ‘지역 맞춤형’ AI 예보모델을 만들어야 한다.

 

AI 계산 과정을 알아내는 것도 숙제다. 과거 자료를 흡수한 AI는 알고리즘에 따라 입력된 자료를 이리저리 계산해 최종 예보만 내놓을 뿐 산출 과정은 알려주지 않는다. 이를 보는 예보관들의 심정은 말 없는 학생이 수학문제를 아무 풀이과정 없이 답만 적어놓은 것을 본 선생님의 마음 같아진다. 답을 맞혔으면 어떻게 맞혔는지, 틀렸으면 처음에 식부터 틀렸는지 마지막 계산에서 실수가 있었는지 알 방법이 없어 ‘오답노트’가 불가능하기 때문이다.

 

AI의 결과 산출 과정은 ‘블랙박스’라고 불린다. 허 교수가 가장 풀고 싶어 하는 AI 예보의 비밀도 블랙박스에 있다. 허 교수는 “AI를 보완하고 싶어도 왜 이런 결과가 나왔는지 알 수 없어서 완전 믿고 쓰기가 어려웠다”며 “블랙박스 풀기가 앞으로 AI의 예측성을 높이기 위해 나아갈 방향”이라고 말했다. 이어 “블랙박스를 풀면 기존 모델을 재학습시킬 수 있고 풀이과정도 고치기 쉬워질 것”이라고 내다봤다.

◆예보관의 새로운 친구, AI모델

 

허 교수는 AI에 ‘대기과학 문제를 푸는 통계도구’ 이상의 의미를 부여하지 않는다. 미세먼지 예측은 일기 예측에 더해 인간이 내뿜은 오염물질 배출까지 함께 계산해야 한다. 이중으로 불확실성이 커 훌륭한 가르침을 받은 AI라도 혼자 예보하기는 무리다. 바꿔 말해 AI 기술이 고도화한다 해도 인간 예보관의 일자리까지 차지할 수는 없을 것으로 보인다.

 

허 교수는 “바둑이 19×19 틀의 2차원에서 벌어지는 일이라면 미세먼지 예보는 몇 곱하기 몇인지도 모르는 세계에서 정답도 없는 값을 찾아가는 일”이라고 빗댔다. 그러면서 “미세먼지 AI 예보가 발전해도 결국 예보는 알고리즘이 아닌 대기과학 문제”라며 “AI는 주어진 과거 자료에 근거한 계산 값만 딱 맞히지 조금만 바뀌어도 모른다. 결국 대기과학 현상을 이해하는 사람이 이 기술을 다뤄야 AI도 발전한다”고 말했다. 미세먼지 예보 핵심은 여전히 입력된 데이터로 통계적 최적값을 산출하는 것이 아니라 직관과 경험까지 종합한 분석력이란 뜻이다.

전국전국 대부분의 지역에 황사와 미세먼지가 이어진 30일 오전 서울 남산에서 바라본 도심이 뿌옇다. 뉴스1

국립환경과학원이 바라보는 AI 예보모델의 활용 범위도 크게 다르지 않다. 각각의 예보모델마다 고유의 가중치와 편향이 발생한다. 모델을 활용하는 예보관들도 주로 참고하는 모델이 있고 가중치를 두는 자료가 다르다. AI모델이 기존 수치모델의 단점을 보완하기 위해 탄생했지만 이 또한 본래 가중치와 편향에서 자유로울 수 없다. 실황과 AI모델의 특성을 종합해 최고로 정확한 예보를 내는 일은 앞으로도 당분간 인간의 영역으로 남을 전망이다.

 

국립환경과학원 관계자는 “예보관이 미세먼지 등급(좋음·보통·나쁨·매우 나쁨) 등을 결정할 때 여러 모델을 참고하는데, AI모델이 예측한 결과도 그중 하나가 되는 정도”라며 “‘나쁨’ 등급 이상일 때 기존 수치모델에 비해 고농도 예보 정확도가 향상됐다는 결과를 확인했지만, 아직 계절별 특성 등 모델 특징을 파악하는 중”이라고 말했다.

 

박유빈 기자 yb@segye.com