광학 폰트 인식을 위한 특징 추출 방법
- 전문가 제언
-
○ 형태 인식에서 특징 추출은 가장 중요한 과정으로서 이는 다시 세분하여 국부 특징 추출과 전역 특징 추출이 있는데 전자에서는 전처리 과정에서의 이미지 분할이 중요한 결과이고 후자에서는 전역 또는 특질 분석을 하기 때문에 복잡한 자료 세트의 분류가 중요한 문제이다. 전역 특징 추출의 한 응용은 OFR인데 본 논문에서는 아랍계 문자에 대한 연구를 제안하며 그 결과는 GLCM과 비교한다.
○ 전역 특징 추출은 쉽게 개발할 수 있고 일반화 될 수 있다. 다른 폰트가 추가됨에 따라서 수정이나 전처리가 불필요하다. 전역 특징 추출의 네 종류는 통계적 방법, 구조 또는 구문 방법, 모델 기반 방법 그리고 신호 처리 인데 폰트는 공간 분포를 가진 2진 이미지로 정의하기 때문에 통계적인 방법이 특징 추출에 가장 유리하다. 이 방법은 화소의 분포와 이미지에서의 화소들의 연관성으로 구성되기 때문이다.
○ 참고 문헌에 국내 연구자의 결과가 인용되지 않아 ScienceDirect에서 정보 검색을 한 결과 font recognition에서는 국내 활동의 자취를 찾기 힘들었고 feature extraction과의 교집합에는 562편의 논문이 나와서 그리 활발한 분야는 아니며 국내 연구자의 논문 수도 역시 미미했다. 구체적인 알고리듬으로서 font recognition과 edge detection의 교집합의 282편 중에도 국내 활동은 거의 없었고 알고리듬으로서는 Laplacian과 Sobel이 Kirsch에 비해서 많이 사용되었다.
○ font recognition은 OCR 계열의 프린트된 문자와 필기체로 양분할 수 있는데 전자는 이미 품질이 높은 상용 소프트웨어가 있고 필기체에 대한 국내 연구도 수준이 높아서 주로 스마트 폰에 사전과 소프트웨어를 공급하는 국내 벤처 업체가 있다. 필기체 인식은 아직 어려운 문제가 남아 있으나 연구가 필요한 이론적인 기술보다는 공학 노하우에 가까운 기술이기 때문에 저널에서는 논문을 찾기 힘들다고 판단되어 이 분야에 대한 국내 학술활동이 활발하지 못한 이유이다.
- 저자
- Bilal Bataineh, ,Siti Norul Huda Sheikh Abudullah, Khairudin Omar
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 정보통신
- 연도
- 2012
- 권(호)
- 39(5)
- 잡지명
- Expert Systems with Applications
- 과학기술
표준분류 - 정보통신
- 페이지
- 5470~5477
- 분석자
- 김*창
- 분석물
-
이미지변환중입니다.