◆공공데이터 미국 24만건 VS 한국 7만건
24일 최 박사가 쓴 ‘한국과 미국의 공공데이터 개방 비교 및 향후 과제’ 보고서에 따르면 지난달 2일 기준 한국의 공공데이터 포털에 공개된 데이터는 7만7684건이다. 반면 미국의 개방된 데이터(data.gov)는 지난달 7일 기준 24만5379건으로 한국과 큰 차이를 보인다.
한국의 공공데이터 조회 상위 30위권에는 분야별로 교통물류 4건, 공공행정 중 교통사고 3건, 보건의료 3건, 산업고용 3건, 환경기상 3건 등이 올라 있다. 반면 미국은 상위 30위권 안에 보건복지 분야가 5건으로 가장 많았고, 이어 통합지리정보 데이터, 뉴욕시 데이터 등이 상위에 올랐다. 한국과는 달리 학자금 대출, 복권, 보행친화도 등도 높은 순위를 차지했다.
한국데이터산업진흥원의 데이터산업 현황조사(2021) 자료를 보면 국내 빅데이터 시장 중 공공분야 규모는 2015년 698억원에서 2021년 6827억원으로 약 10배 가까이 증가했다. 특히 당시 26%에 그쳤던 시장 비중은 2018년 34%, 2020년 43.2%, 2021년 43.7%로 꾸준히 늘어 이제는 민간 영역과 비슷한 수준에 이르렀다.
◆양국 검색어 달라… 보건복지 공통 관심
양국의 시민들이 찾는 데이터가 다른 점은 두 나라의 정치, 행정, 사회문화적 차이에 기이한 것으로 풀이된다. 그런데도 공통으로 많이 검색된 분야로는 보건복지, 보건의료가 꼽혔다. 미국은 만성질환(6위), 알츠하이머와 노화(14위), 코로나19(26위) 등의 데이터를 찾는 비중이 높았고, 우리나라도 건강검진정보(19위), 국민건강영양조사(29위) 등 보건의료 관련 데이터에 사람들의 관심이 많았다.
한국은 아직 미국보다 데이터의 접근성이 부족하다는 지적이 나온다. 한국은 주로 파일, 오픈 API(애플리케이션 프로그래밍 인터페이스), 표준데이터셋으로 구분해 개방하고 있다. 그러나 일부는 로그인을 하고 활용신청을 해야 자료에 접근할 수 있다. 반면 미국은 대부분 오픈 API 형식으로 일괄 개방해 별도의 로그인을 거치지 않고 자료를 내려받을 수 있다.
◆공공데이터에 대한 뚜렷한 시각차
이 같은 차이점은 공공데이터를 다루는 제도에 기인한 것으로 분석된다. 한국은 ‘공공데이터의 이용 및 활성화에 관한 법률’을 바탕으로 자료를 공개하다 보니 자료의 제공과 활용 중심에 초점이 맞춰져 있어 정작 자료의 생성부터 폐기에 이르는 데이터 생애주기와 관련한 규정은 미흡하다는 지적도 있다.
미국은 1996년 제정된 정보자유법을 중심으로 공공데이터 개방 정책이 진행됐다. 특히 2019년에는 정부 데이터 공개법률을 제정하면서, 정보를 공개할 때 기계판독이 가능한 행태로 해야 한다고 규정했다. 또 각 연방기관의 장은 데이터 생애주기 관리를 책임지는 등의 직무를 담당하는 데이터책임관을 지정하도록 했다. 자료를 공개한다는 점에선 한국과 큰 차이가 없지만 그 책임을 지는 담당자를 지정하도록 하는 점에선 차이를 보였다.
특히 미국은 데이터책임관의 자격으로 기밀 데이터의 보호, 익명 처리를 위한 통계 및 관련 기술에 대한 사항, 데이터 관리 및 통합관리, 수집, 분석, 보호, 사용 및 배포와 관련된 학력 및 경력을 갖추도록 세세하게 정했다는 점에서 큰 차이를 보인다. 이러한 점이 결국 잦은 정보 유출 논란에 휩싸이는 한국과 미국의 차이점이 된 것으로 분석된다.
◆“공공데이터 양보다 질 높여야”
한국은 경제협력개발기구(OECD)가 실시한 공공데이터 평가에서 2015년과 2017년, 2019년 1위를 차지할 정도로 높은 평가를 받았지만 여전히 공공데이터를 다루는 데 폐쇄적이란 지적이 나온다. 최근에는 공공데이터를 활용하는 데 초점을 맞춘 것에서 벗어나 생애주기 전반을 고려할 필요가 있다는 의견도 늘고 있다. 생애주기는 데이터의 생성, 수집, 저장, 분석, 활용부터 폐기에 이르는 일련의 과정을 의미한다.
보고서는 “한국의 ‘공공데이터법’을 데이터의 운영주기를 반영하고 행정기관의 책무를 고려한 법 개정이 필요하다”고 주장했다. 또 미국의 사례 중 사람이 걷기 편한 길을 의미하는 보행친화도(11위), 소비자 불만 데이터(15위), 홍수위험수위(19위) 등 시민들에게 필요한 새로운 공공데이터를 발굴해 제공해야 한다는 목소리도 높다. 최 박사는 “시민들이 관심 있는 교통, 보건, 산업, 환경 분야의 공공데이터 개방에 더 많은 정책적 고려가 있어야 한다”고 지적했다.
◆이상용 경남연구원 빅데이터센터장 “韓, 데이터 공개 폐쇄적… 제도 개선 필요”
“빅데이터 기업 70%는 서울·수도권에 몰려 있고, 경남에는 1%에 불과합니다.”
이상용 경남연구원 빅데이터센터장은 24일 통화에서 빅데이터의 지역 격차에 대해 이렇게 말했다. 경남도 빅데이터센터는 지역 데이터 인력 양성, 도민 데이터 인프라 활용과 분석 지원을 위한 기관이다.
이 센터장은 “수도권은 데이터를 생산할 수 있는 여건이 상당히 좋다. 데이터 기업과 인력이 풍부한 반면 지방은 그 부분에서 상당히 열악하다”고 했다. 그는 구조적 문제 외에도 “지역에서도 생산되는 데이터 양 자체는 적지 않지만 이를 전문적으로 처리할 인력이 부족하다 보니 공공데이터를 더 많이 개방하기 위해선 품질이 담보돼야 하는데 이런 측면에서 어려움이 많다”고 토로했다.
그는 지역 격차를 극복하기 위한 방안으로 구조적 문제와 인적 자원을 꼽았다. 이 센터장은 “지역에도 데이터기업이 옮겨올 수 있도록 여건을 마련해야 한다”며 “데이터 관리 인력이나 생산 인력은 외부에서 무조건 데려오기보다 지역 내에서 교육이나 프로젝트성으로 보완하는 방안도 검토해야 한다”고 강조했다. 그는 이런 노력을 중앙정부와 지방자치단체가 함께 해나가야 한다고 봤다.
그는 2023년 데이터 시장 규모는 30조원에서 2027년 50조원으로 대폭 늘어날 것으로 내다봤다. 이 센터장은 “지난 10년간 데이터의 절대 양은 늘었고 이제는 이를 활용한 비즈니스를 창출하고 있고 이 분야에서 앞으로 더 큰 성장이 예상된다”고 전망했다.
이 센터장은 “미국이나 유럽과 한국을 비교하면 가장 큰 차이점은 개방성”이라며 “한국은 아직 데이터를 공개하는 데 폐쇄적인 부분이 있다. 공개 여부를 따지거나 책임 소재 등이 먼저 거론된다”고 했다. 이어 “이러한 인식의 차이나 제도적인 문제에서도 개선이 필요하다”고 조언했다. 또 “지역 데이터기업 육성, 국비 데이터 공모사업 활용, 데이터 리터러시(문해력) 향상, 기관·지역 네트워크 강화 등으로 데이터 기반을 확충해야 한다”고 강조했다.