공학 문서관리에서의 구조적 문서 검색의 개요
- 전문가 제언
-
○ 정보 검색 분야는 그 연구와 응용 개발이 이미 잘 확립된 분야이다. 그러나 공학 문서와 같이 수식이나 그래프, 도표들로 이루진 문서에 대한 검색은 질의 방법과 검색에서 차이가 있으므로 기존의 정보검색 시스템으로서는 적용에 한계가 있다.
○ 전통적인 IR 시스템은 내용 정보를 이용하고 사용자의 요구에 반응하여 적합한 전체 문서(이를테면, 전체 Web 페이지)를 발견하고 전달하는데 초점을 둔다. 그러나 공학자들은 전 문서의 반환 보다는 자신에게 가장 적합한 부분의 결과를 선호하게 된다.
○ 기술문서의 정보검색의 효율성과 정확도를 높이기 위하여 두 가지의 방향으로 연구가 진행된다. 하나는 문서를 구조화하는 방법이고 다른 하나는 구조화된 문서를 검색하는 방법의 개선이다. 구조문서에는 SGML이나 XML DTD(Document Type Definition)과 같은 마크업 언어를 이용하여 문서를 포맷하는 방법이 사용된다.
○ 이 논문에서 S. Liu 등은 구조화된 문서 검색(Structured Document Retrieval: SDR) 방법에 대하여 그 초기 등장에서부터 개발과 응용에 이르기까지에 기술 문헌을 조사하고 SDR의 정보 접속 수행능력을 개선하기 위한 문제점과 최신의 기술에 대하여 개관한다. 특히 SDR에 관련하여 앞으로의 기술 전망에 대한 연구 방향을 제시하고 있다.
○ 이와 관련된 해외 연구로서는 R. Power 등의 구조문서, S. Mao 등의 문서구조 분석의 연구가 있고 Z. Liu의 문서에서의 XML 응용에 대한 연구가 있다. 그 외에 A. Trotman의 구조문서 탐색에 관한 연구가 있다. 그러나 국내에서는 아직 이 분야에 대한 연구는 발표된 바가 없다.
○ 과학 기술의 개발 연구 못지않게 발표된 연구 업적을 효율적으로 정확하게 사용자에게 전달하는 방법의 개선은 매우 중요하다. 데이터베이스 연구와 더불어 검색 엔진의 개발, 효율적인 검색이 가능한 문서의 구조화에 대한 연구 등은 매우 중요한 연구임에 틀림없다.
- 저자
- S.Liu, C.A. McMahn, S.J. Culley
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 정보통신
- 연도
- 2008
- 권(호)
- 59
- 잡지명
- Computers in Industry
- 과학기술
표준분류 - 정보통신
- 페이지
- 3~16
- 분석자
- 김*기
- 분석물
-
이미지변환중입니다.