안형준 국가데이터처장 “올 데이터 총괄 기본법 제정… AI 기반 통계 혁신 이끌겠다” [세계초대석]

데이터도 자산… 활용 근거 없어
칸막이로 나뉘어 있는 정보 모아
범국가적인 데이터 유통망 구축

AI 친화적 메타 생태계 구축 땐
정확성 높아지고 활용도 극대화
청년·노년층 관련 통계 고도화

물가지수 항목 소비 맞춰 추가
자가주거비 포함 신중하게 접근
경제총조사 ‘온라인 참여’ 확대
“한국은 현재 동영상·언어 등 데이터를 확충하는 1단계에 머물러 있는데, 인공지능(AI)을 활용해 데이터 품질을 높이는 동시에 활용까지 이뤄질 때 혁신이 시작됩니다. AI를 제대로 써서 우리 사회가 발전할 수 있도록 국가데이터처가 중심을 잡겠습니다.”

 

안형준 국가데이터처장은 지난달 30일 서울 용산구 세계일보에서 진행한 인터뷰에서 올해 데이터기본법 제정의 필요성과 향후 과제를 묻는 질문에 이렇게 답했다. 안 처장은 “그간 데이터를 자산으로서 규정한다든지 보존·활용하는 데 있어 기본적인 규정이 없었다”면서 “칸막이로 나뉘어 있는 데이터를 모아서 가치를 높이기 위한 여러 장치들을 기본법에 넣었고, 국민생활에 중요한 핵심 데이터는 국가데이터로 지정해 개방할 계획”이라고 설명했다.

안형준 국가데이터처장이 지난달 30일 서울 용산 세계일보에서 진행한 인터뷰에서 데이터 총괄·조정 부처로서의 역할에 대해 강조하고 있다. 안 처장은 고용·물가 등 주요 통계를 시각화하는 한편 지역별 아동가구의 규모·분포를 한눈에 파악할 수 있는 ‘아동가구통계지도’를 구축하는 등 시각화 기반 서비스를 지속적으로 확대하고 있다고 밝혔다. 이제원 선임기자

데이터기본법이 주목되는 건 AI 친화적 메타데이터 구축의 출발점이 되기 때문이다. 생성형 AI는 기본적으로 텍스트를 기반으로 해결책을 찾는 탓에 통계 데이터베이스(DB)를 읽지 못하는 어려움이 있었다. 하지만 기본법이 제정돼 AI 메타데이터가 구현되면 AI가 스스로 데이터를 읽고 의미를 추출해 내는 작업이 가능해진다. 데이터의 정확도와 활용도가 극대화되는 이른바 ‘질적 도약’이 이뤄지게 되는 것이다.

 

안 처장은 데이터처의 전신인 통계청이 출범한 1990년 이후 처음으로 내부 승진으로 수장(지난해 8월)에 올라 ‘마지막 통계청장’과 ‘초대 데이터처장’이란 타이틀을 동시에 갖고 있다. 2016년 통계청 내 통계데이터허브국을 처음 만들어 빅데이터를 접목한 경험이 있는 만큼 AI 시대 ‘데이터 생태계’를 업그레이드시킬 적임자로 평가받는다.

 

안 처장은 저출생·고령화 대응 관련 새 통계를 개발하는 등 데이터 고도화 방안 역시 공을 들이고 있다고 강조했다. 안 처장은 “올해 처음으로 청년층의 부채 수준이 저출생에 얼마나 영향을 미치는지 상관관계를 분석할 계획”이라면서 “노인들은 빈곤율이 높은 반면 자산은 많은 상황인데, 자산을 소득으로 치환해 노인빈곤율을 정밀하게 분석할 것”이라고 말했다.

 

올해 12월 국가통계위원회를 통해 5년 만에 개편되는 물가지수와 관련해서는 “(사용자가 많아진) 스마트워치 등을 새롭게 넣어 국민 체감도를 높일 것”이라고 밝혔다. 안 처장은 다만 자가주거비를 물가지수에 넣는 방안에 대해서는 우리나라의 경우 주거 가중치가 너무 높아 전체 물가지수의 정확도를 떨어뜨릴 수 있는 부분이 있어 “조심스럽게 접근하겠다”고 말했다. 다음은 안 처장과의 일문일답.

 

―지난해 10월 통계청에서 데이터처로 승격됐다. 달라진 점은 무엇이 있나

“처로 승격하는 건 오랜 숙원이었다. 통계가 중요한 역할을 하고 있지만 그 가치를 제대로 인정받지 못했는데, 이번에 통계뿐 아니라 데이터 총괄·조정까지 기능이 확대돼 조직 위상이 올라갔다. 데이터 관련 업무를 하기 위해서는 법적 권한이 있어야 하는데 지금은 직제만 바뀌었고, 법적 근거가 아직 없어 올해 국가데이터기본법 제정을 추진하고 있다.”

 

―데이터기본법이 기존의 통계법과 어떤 차이를 갖고 있나.

 

“데이터와 통계의 관계를 먼저 말씀드리겠다. 과거에는 통계를 작성하기 위해 데이터를 모아서 통계를 작성했다. 어떻게 보면 통계가 좀 더 고급이고, 데이터는 재료 정도인 측면이 있었다. 하지만 AI 시대가 되면서 데이터가 훨씬 더 넓은 의미가 됐다. 통계도 데이터의 일부이고, 의미 있는 모든 것들이 데이터로 활용된다. 지금까지 데이터와 관련한 법령은 행정안전부가 갖고 있는 ‘공공데이터법’이 있고, 과학기술정보통신부의 ‘데이터산업법’ 등 분산돼 있었다. 또 기본적인 자산으로서 데이터의 성격이라든지, 보존 및 활용하는 규정이 없었다. 그래서 저희가 총괄 조정을 하면서 데이터기본법을 제정하려고 하는 것이다.”

 

―데이터의 질적 수준도 높아지나.

 

“데이터처로 승격된 이유도 바로 거기에 있다. 데이터라는 건 모아서 연계해야 가치가 올라가는 건데 지금까지 그게 안 됐다. 데이터의 가치를 높이기 위한 각종 장치를 기본법 안에 넣었다. 공공·민간 분야에서 서로 다른 기관이 보유한 데이터를 안전하게 연계·결합할 수 있는 법적 근거도 마련된다. AI 친화적 메타데이터 작성·관리기준이 마련해 AI가 쉽게 활용할 수 있는 양질의 메타데이터가 구축되는 것도 중요한 변화다.”

 

―AI 메타데이터가 무엇이고, 구축되면 뭐가 달라지나.

 

“현재 생성형 AI는 텍스트 기반이라 뒤에 나올 단어를 확률로 제시하는데, 그 원리상 통계 DB를 바로 접근해서 읽기 어려운 한계가 있다. 통계가 포함된 질문을 던지면 종종 기사나 블로그 등 2차 출처를 활용해 부정확한 결과가 제시되는 것도 이 때문이었다. 그런데 AI가 데이터를 정확하게 이해하고 활용할 수 있도록 하는 맞춤형 설명정보인 AI 메타데이터가 구축되면 AI가 길을 잃지 않고 정확한 정보를 찾게 된다. AI가 공식 데이터 DB를 직접 조회하고 정의·기준을 함께 참고하기 때문에 정확성이 높아지고, 데이터 간 융합 활용성도 극대화된다.”

 

―물가 얘기를 해보자. 매달 데이터처가 물가를 발표하는데, 체감물가와 괴리된다는 의견도 있다.

 

“전체 물가지수가 체감하고 다른 건 사람마다 활용하는 물품이 다르기 때문이다. 초등학생이 있는 가구는 학생이 쓰는 품목이 많이 잡히는 등 근원적인 한계가 있다. 기본적으로 소비자물가는 국제노동기구(ILO) 국제기준에 맞춰 품목과 가중치 두 개를 개편한다. 먼저 품목은 가처분소득의 1만분의 1 이상인 품목, 즉 350원 이상인 450~500개를 뽑는다. 기계적으로 결정되는 셈이다. 가중치는 그 속에서 얼마나 많이 쓰는지 계산해 산출한다. 올해 12월 국가통계전체위원회를 통해 물가지수에 새 항목이 포함되는데, 스마트워치와 클라우드 저장공간 이용료가 처음으로 들어갈 것 같다.”

 

―현재 자가주거비가 물가지수에 제외되고 있는데, 일각에서는 포함해야 한다는 주장도 나온다.

 

“포함하는 것에 대해 좀 조심스럽게 보고 있다. 자가주거비는 실제로 자기가 사는 집을 전·월세 등 서비스 개념으로 환원했을 때 가격이다. 그런데 전체 물가의 가중치를 100으로 한다면 자가주거비가 28 정도가 돼 엄청나게 높다. 이 상태에서 자가주거비를 넣으면 아무리 장바구니 물가가 올라도 집값이 안 오르면 물가가 변동되지 않는 문제가 생긴다. 또 물가는 전국 공통인데 집값은 지역마다 다르다. 그러면 우리 체감과 더 괴리되고 물가 관리가 쉽지 않게 된다. 그래서 아주 신중하게 접근하려고 한다.”

 

―최근 지표 중 잘 나오는 게 합계출산율이다. 저출생 정책을 뒷받침할 통계가 중요할 것 같다.

 

“재작년부터 인구동태패널을 구축한 바 있다. 1983년부터 1995년생 전체를 대상으로 그 사람들의 취업, 주택 소유 이런 요인들이 최종적으로 혼인과 출산에 어떻게 영향을 미치는지 분석할 수 있는 패널을 만들었고 이를 통해 출산대책을 지원했다. 올해는 이걸 좀 더 고도화할 계획이다. 요즘 청년층이 영끌을 통한 부채가 있는데, 부채 수준이 혼인·출산에 미친 영향을 추가적으로 볼 예정이다.”

 

―반대로 초고령화사회를 맞아 고령층 통계를 세분화해야 한다는 여론도 있다.

 

“올해 좀 손보려고 하는 건 가계동향조사에서 지금까지는 65세 정도만 했다. 이제는 좀 더 세분화해서 70대 이상을 따로 나눠서 그분들의 소득, 소비를 보려고 한다. 또 우리가 경제협력개발기구(OECD) 기준 노인빈곤율 1위인데, 어떻게 보면 고령층의 자산은 많은 상황이다. 가계금융복지조사 자료를 이용해서 자산을 소득으로 치환해 국가 전체적으로 노인빈곤율을 분석해 연구자료로 제공할 계획도 갖고 있다.”

 

―5년마다 찾아오는 경제총조사가 올해 실시된다. 올해 뭐가 달라지나.

 

“경제총조사는 5년에 한 번씩 우리 경제상황을 ‘원 샷’으로 찍어내는 조사다. 올해 750만개 업체를 대상으로 6월1일부터 7월22일까지 실시하는데, 6월1일부터 온라인 조사를 먼저 시작하고, 6월12일부터 현장조사가 실시된다. 올해 예년과 다른 점은 방문조사 사업체 축소를 위해 온라인조사 대상 사업체를 사전에 지정해 PC나 모바일로만 조사에 참여하도록 유도하고, 현장조사 규모는 전체 사업체의 44.4%로 축소한다는 점이다. 또 항목에서는 AI 시대를 맞아 ‘AI를 실제로 활용하고 있는지’를 묻는 질문이 처음 들어간다. 실제 조사하는 데 있어서도 보이스봇, 챗봇 등을 활용해 24시간 콜센터를 운용하는 등 AI 기술이 도입된다.”

 

안형준국가데이터처장은…

●1968년 서울 출생 ●고려대 경제학과 ●행정고시 40회 ●통계청 물가동향과장 ●〃 통계데이터허브국장 ●〃 경제통계국장 ●〃 경제동향통계심의관 ●〃 통계정책국장 ●통계교육원장 ●통계청 차장 ●통계청장 ●초대 국가데이터처장