정확도 90% 이상… 고문헌 한문 자동 분절 프로그램 개발

한국국학진흥원 기술 개발 연구 성과
인력 대비 30배 이상 빠른 속도
테스트 거친 후 프로그램 제공

국내 국학 연구진이 ‘고문헌 한문 자동 문장 분절 프로그램’을 개발했다. 한국국학진흥원이 지난해부터 국학자료 AI(인공지능) 기반 자동번역 프로그램 개발 사업에 매진한 결과다.

 

22일 한국국학진흥원에 따르면 전통 기록유산은 대부분 한문으로 기술돼 일반인은 접근하기 어렵다. 지금과 같은 아날로그 번역 방법을 유지하면 전통 기록유산의 디지털화와 번역에는 300년 이상 소요된다.

고문헌 한문 자동 문장 분절 결과. 한국국학진흥원 제공

하지만 인공지능 기술을 활용하면 인력 대비 30배 이상의 빠른 속도로 디지털화 작업이 가능하다. 따라서 디지털 텍스트화와 한글 번역이 필수적인 상황이다.

 

한국국학진흥원은 소장 자료 번역에 자동 문장 분절 프로그램을 이용한다. 원문 자료의 자동 인식부터 문장 분절, 한글 번역까지 일련의 과정을 인공지능을 통해 자동화한다. 자동 문장 분절 프로그램의 정확도는 90% 이상이다.

 

한국국학진흥원 관계자는 “이달까지 연구원을 대상으로 테스트를 마친 후 일반인에게 자동 문장 분절 프로그램을 공개한다”면서 “고문헌 문자인식(OCR)을 활용한 고도서 한자 인식과 이미지 검색 서비스도 지원하고 있다”고 말했다.