나라지식정보, 싱가포르서 근대 다문자 OCR 기술 해외 수요 검증… 필기체·손상 문서 고도화 박차
김형석 기자
작성일 2026-05-26 18:02
본문

나라지식정보는 과학기술정보통신부 산하 정보통신산업진흥원(NIPA)의 지원을 받아 ‘한국 근대 다문자 자료 활용 지원 AI 솔루션 개발 및 실증’ 사업의 일환으로 ‘한-싱가포르 AI 혁신 교류 프로그램’과 ‘Milipol Tech X 2026’에 참가했다. 이번 행사를 통해 현지 기술 교류와 부스 전시를 진행하며 기술의 해외 시장 경쟁력을 검증했다.
이번 싱가포르 방문은 단순한 시장 탐색을 넘어, 2차년도 기술 고도화의 우선순위를 현장에서 검증하는 중요한 기회가 되었다. 현지에서는 의료 기록, 식민지 행정 문서, 선박 로그북 등 영문 필기체와 손상된 이미지를 포함한 문서의 디지털화 수요가 높다는 점이 확인되었다. 기존 범용 OCR 기술로는 한계가 드러난 현장에서, 나라지식정보의 다문자 OCR 기술이 핵심 경쟁력으로 인식되었다.
나라지식정보 컨소시엄은 공공AX 과제에서 이러한 특수 문서 처리에 집중하고 있다. 본 과제는 한자, 일본어, 옛한글, 국한문 혼용문, 세로쓰기 등 근대 자료를 대상으로 OCR, 번역·요약, 의미 검색을 통합하는 솔루션을 지향한다. 1차년도에는 4만 건의 데이터 구축과 OCR·번역·검색 프로토타입, 워크벤치 기반 파일럿을 마련했으며, 2차년도에는 20만 건 이상의 데이터 확장, 다국어·다서체 대응 OCR 고도화, AI 에이전트 기반 전처리, RAG 연계 플랫폼 구축을 본격화할 계획이다.
또한, 싱가포르 현지에서는 동남아 지역의 특성을 고려한 배포 환경의 중요성이 부각되었다. 저대역폭 환경과 오프라인 운용 요구가 여전히 존재함에 따라, 클라우드 중심 AI 서비스만으로는 현장 적용에 제약이 있다는 피드백이 나왔다. 이에 따라 온디바이스·엣지 추론, 경량화 모델, 온프레미스 배포 전략을 함께 고려해야 한다는 점이 확인되었다. Quantexa와의 온프레미스 자연어 이해(NLU) 협력 및 KLASS와의 손상 문서 OCR 도입 협의 가능성이 제기된 배경이다.
접근성 분야에서도 새로운 가능성이 열렸다. AI 기반 장면 묘사나 점자 변환과 같은 시각 보조 분야는 상대적으로 공백이 큰 것으로 분석되었다. 싱가포르의 ‘Enabling Masterplan 2030’이 장애 포용 정책을 적극 추진하는 점은 이러한 수요를 뒷받침하는 배경으로 작용했다. 나라지식정보는 OCR 기술을 역사 자료 디지털화를 넘어 접근성 응용 분야로 확장할 실마리를 확보했다.
나라지식정보는 이번 싱가포르 기술 교류 결과를 바탕으로 2026년 사업 고도화에 직접 반영할 계획이다. 손상 문서와 필기체 인식 정확도 개선, 의미 검색 정밀도 향상, 현장 실증 강화와 함께 연내 공인 검증 및 성과 확산을 추진한다. 또한, 해외 교류를 통해 확인한 수요를 국내 공공 데이터 AX 사업과 연결하는 피드백 기반 개발 루프를 본격적으로 가동할 예정이다.
나라지식정보는 2008년 설립 이후 한국의 언어, 역사, 문화 데이터를 중심으로 180여 기관에 약 600건의 공공 데이터·AI 사업을 수행해 온 지식정보화 전문 기업이다. 자체 개발한 고문헌, 비정형 데이터 OCR 엔진 ‘NARA OCR’과 RAG LLM ‘NA-LLM’, AI Agent ‘주춧돌LM’ 등의 기술력을 바탕으로 아날로그 기록물의 디지털 전환 및 지식 콘텐츠 활용 서비스를 제공하고 있다.
기사 공유하기
추천 0
