알림마당

  1. home

텍스트요약 자동평가

전문가 제언
○ 근래 컴퓨터에 의하여 처리된 많은 양의 정보가 있으며 그 정보는 텍스트정보를 들 수 있다. 인터넷의 발달, 다양한 문서의 전자화로 텍스트정보는 증가되고 있는 것으로 텍스트자동 요약의 연구는 일본의 대학이나 정보과학연구소 등에서 활발하게 이루어지고 있다.

○ 현재 문서요약의 연구에서는 먼저 중요한 문서 또는 주요한 개소를 추출한 후에 자연언어적인 보정처리를 하여 요약 문서를 생성하는 기법이 대부분이며 요약의 기점인 중요문서 추출기법의 연구에서는 단어의 출현빈도를 기본으로 한 모델이 많다.

○ 그러나 단어의 출현빈도를 기본으로 한 모델에서는 전체적으로 빈도가 높은 단어의 영향을 받기 쉽고 단어의 출현경향의 변화에 따라 충분한 정도(精度)가 얻어지지 않는 문제점이 있다.

○ 또한 출현하는 빈도가 높은 단어가 다수 포함된 문서에서는 중요도가 현저하게 높게 나타나는 경향이 있다. 이러한 문제점을 해결하기 위해서는 문서의 전체상(全體像)을 파악하여 문서에서 중요한 부분의 개요를 추출하는 것이다.

○ 대량정보․문서의 관리와 검색은 어디에 어떠한 내용의 문서가 있는가를 파악하는 것이 중요하며 많은 문서를 논리전개에 따라 요약하고 그 요약에서 유사한 문서를 분류하는 것이다. 즉 정보추출, 자동요약, 문서분류 등 관련기술을 이용한 지적정보 검색시스템의 연구가 필요하다.
저자
Hidetsugu Nanba, Tsutomu Hirao
자료유형
학술정보
원문언어
일어
기업산업분류
정보통신
연도
2008
권(호)
23(1)
잡지명
人工知能??誌 
과학기술
표준분류
정보통신
페이지
10~16
분석자
유*로
분석물
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동