텍스트요약 자동평가
- 전문가 제언
-
○ 근래 컴퓨터에 의하여 처리된 많은 양의 정보가 있으며 그 정보는 텍스트정보를 들 수 있다. 인터넷의 발달, 다양한 문서의 전자화로 텍스트정보는 증가되고 있는 것으로 텍스트자동 요약의 연구는 일본의 대학이나 정보과학연구소 등에서 활발하게 이루어지고 있다.
○ 현재 문서요약의 연구에서는 먼저 중요한 문서 또는 주요한 개소를 추출한 후에 자연언어적인 보정처리를 하여 요약 문서를 생성하는 기법이 대부분이며 요약의 기점인 중요문서 추출기법의 연구에서는 단어의 출현빈도를 기본으로 한 모델이 많다.
○ 그러나 단어의 출현빈도를 기본으로 한 모델에서는 전체적으로 빈도가 높은 단어의 영향을 받기 쉽고 단어의 출현경향의 변화에 따라 충분한 정도(精度)가 얻어지지 않는 문제점이 있다.
○ 또한 출현하는 빈도가 높은 단어가 다수 포함된 문서에서는 중요도가 현저하게 높게 나타나는 경향이 있다. 이러한 문제점을 해결하기 위해서는 문서의 전체상(全體像)을 파악하여 문서에서 중요한 부분의 개요를 추출하는 것이다.
○ 대량정보․문서의 관리와 검색은 어디에 어떠한 내용의 문서가 있는가를 파악하는 것이 중요하며 많은 문서를 논리전개에 따라 요약하고 그 요약에서 유사한 문서를 분류하는 것이다. 즉 정보추출, 자동요약, 문서분류 등 관련기술을 이용한 지적정보 검색시스템의 연구가 필요하다.
- 저자
- Hidetsugu Nanba, Tsutomu Hirao
- 자료유형
- 학술정보
- 원문언어
- 일어
- 기업산업분류
- 정보통신
- 연도
- 2008
- 권(호)
- 23(1)
- 잡지명
- 人工知能??誌
- 과학기술
표준분류 - 정보통신
- 페이지
- 10~16
- 분석자
- 유*로
- 분석물
-
이미지변환중입니다.