RPM9

경제·사회
HOME > 경제·사회 > 경제일반

네이버 문자 인식 기술(OCR), 글로벌 기술 경쟁력 입증

발행일 : 2018-07-10 16:40:38
네이버 문자 인식 기술(OCR),  글로벌 기술 경쟁력 입증

국제 경진 대회에서 가장 높은 점수 기록

네이버 인공지능 플랫폼 클로바(Clova)와 인공지능 통번역 서비스 파파고(Papago)의 공동 ​​OCR 연구 팀이 글로벌 업체들과의 경쟁에서 높은 성과를 기록하며 기술력을 입증했다.

네이버는 국제패턴인식협회인 ‘IAPR’이 시작한 국제 경진 대회인 ‘ICDAR Robust Reading Competition’을 통해 올해만 세 가지 과제에서 1위를 기록했다고 밝혔다. ICDAR Robust Reading Competition은 디지털 이미지와 비디오 상에서 텍스트를 감지/인식하는 기술인 Robust Reading 분야에서 가장 권위있는 국제경진 대회이다.

OCR(Optical Character Recognition)은 크게 이미지에서 ▲문자의 위치를 찾는 ‘검출 기술’과 ▲문자가 무엇인지 알아내는 ‘인식 기술’로 나뉘는데, 특히 네이버의 문자 검출 기술이 알리바바, 텐센트, 센스타임 등 글로벌 업계와의 경쟁에서 가장 높은 점수를 기록했다.

먼저, 10일 ‘해당 사이트’에 따르면 2017년에 공개된 다국어 데이터를 기반으로 한 문자 영역 검출에 대한 과제 ‘Multi-Lingual scene Text(MLT) – Localization’에서 네이버가 73.68%를 기록하며 1위를 차지했다. 해당 기술은 영어를 포함한 라틴 계열의 문자뿐만 아니라, 한국어, 일본어, 중국어, 아랍어, 뱅골어 , 특수 기호 등 총 7개의 문자 영역을 검출하는 기술로, 단일 언어를 검출하는 것 보다 훨씬 고도화된 기술력이 요구된다.

또한, 역시 2017년 다국어 데이터 기반의 문자 종류 구분에 대한 과제​ ‘Multi-Lingual scene Text (MLT) - Script Identification‘에서도 네이버 클로바 팀에서 인턴으로 재직하고 있는 정성효 학생(고려대 주재걸 교수 연구실 소속)이 주도로 연구한 방식이 89.01%를 기록, 1위를 차지했다. ​문자 종류 구분 기술은 다국어 문자 검출 기술과 연관된 기술로, 검출된 영역에 해당하는 총 7개의 문자 종류 중 하나의 문자 종류로 분류하는 기술이다.

한편, 지난 6월에는 2013년에 공개된 근접 촬영 데이터에 대한 문자 영역 검출 과제​ ‘Focused Scene Text – Localization’에서도 네이버의 문자 검출 기술이 타 글로벌 AI 기업 대비 가장 높은 점수인 94.02%를 기록한바 있다.

소성렬기자

“말도 안되는 가격!! 골프 풀세트가 드라이버 하나 값~~ 598,000원”

최신포토뉴스

위방향 화살표