데이터처, 역점 정책과제 수립



AI 친화적 ‘메타데이터’ 시범 구축

개인정보 노출 없는 재현자료 활용

AI 학습용 데이터 개방사업도 추진



현행 통계에 AI 활용한 ‘혁신’ 기대

챗봇 활용 대국민 조사 편의성 향상

체감도 높은 생활밀접통계 등 개발

집세지수·인구동태패널 등 선보여

국가데이터처가 인공지능(AI)을 공식통계에 활용하기 위한 작업에 본격 착수한다. AI가 경제활동인구조사 등 각종 통계에 접근할 수 있도록 AI 친화적 메타데이터를 시범구축하고, 개별 응답자 정보가 노출되지 않는 재현자료를 활용해 AI 학습용 데이터 개방에도 나선다. 아울러 행정자료 기반 집세지수(전·월세 지수)를 개발해 소비자물가지수를 보다 현실화하는 등 핵심 통계도 개선할 계획이다.

3일 데이터처는 최근 역점 정책과제로 ‘AI 시대 국가통계 대전환’을 선정하고, AI와 통계데이터의 융합을 추진하기로 했다. 정부 국정과제인 AI 3대 강국 도약에 맞춰 통계 생산에 AI를 적극 활용, 대국민 맞춤형 서비스를 고도화하겠다는 것이다.



데이터처는 이를 위해 AI가 승인통계에 접근할 수 있는 체계를 구축하기로 했다. 경제활동인구조사나 지역별고용조사 등 국민이 자주 활용하는 통계에 AI가 접근할 수 있도록 AI 친화적 메타데이터를 내년 중 시범 구축할 예정이다. 메타데이터란 통계데이터의 내용·구조를 설명하는 데이터를 말하는데, 현재 구축된 메타데이터는 AI 접근성이 떨어진다는 지적이 많았다. 데이터처는 현재 재현자료 33종의 안정성과 통계적 유용성을 검증 중이다. 내년에는 AI 기반 재현자료 자동 생성 및 평가 프로그램을 구축해 고품질 통계 마이크로데이터를 AI 학습용으로 개방하기로 했다. 재현자료는 원자료의 합계·평균 등 통계적 특성을 유지하면서도 응답자의 민감 정보는 감춰 데이터보호 신기술로 인정받고 있다.



데이터처는 각종 통계와 AI를 융합하면 통계조사와 생산에서 일대 혁신이 일어날 수 있다고 보고 있다. 가령 가계동향조사 지출 내역 AI를 활용해 분류할 수 있고, AI 챗봇과 보이스봇을 활용해 대국민 조사 응답 편의성도 높일 수 있다는 것이다. 당장 이달부터 AI를 투입, 온라인 상품가격 정보를 정제해 주간 지표를 만드는 등 신규 지표 개발 연구에도 탄력이 붙고 있다. 데이터처 관계자는 “AI 혁신 기술 활용으로 통계조사방식 현대화를 통해 국민 응답 부담이 감소되고, 국민이 체감할 수 있는 생활밀접통계 개발이 가능해질 것”이라고 말했다.

데이터처는 아울러 우리 현실을 보다 잘 설명할 수 있게 각종 통계도 개편하기로 했다. 가계동향조사 및 외식특별조사 결과 등을 기초로 최근 소비자 기호 및 가계 소비지출 변화를 반영해 소비자물가지수 대표 품목과 가중치를 개편하고, 행정자료를 기반으로 전세와 월세 지수도 새롭게 개발한다.



인구위기, 지역균형 관련 통계 역시 확충된다. 우선 인구통계 부문에서 ‘인구동태패널통계’가 개발된다. 1983~1995년생 각 집단의 생애를 추적해 거주지·취업활동·소득 등의 조건이 생애사건(미혼→혼인→출산)을 유지·변화하는 데 얼마나 영향을 주는지 파악하겠다는 취지다. 저출생 원인 분석에 유용하게 활용될 것으로 기대된다. 데이터처는 아울러 육아휴직 통계를 개선하고, 생활인구 통계를 고도화하는 등 혼인·출산 지역소멸 대응 정책에 필요한 다양한 인구통계를 만들 예정이다. 17개 시도(권역별)의 경제활동별 실질 부가가치 및 성장률을 보여주는 지역내총생산(GRDP) 작성주기가 연간에서 분기로 단축되고, 17개 시도 건설·설비·연구개발(R&D)·토지 등 자산규모 및 생산성 지표를 제공하는 지역별 자본스톡도 개발된다.