첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

수사학 기반의 다문서 요약

전문가 제언

다문서 요약에서 문제는 첫째로 정보의 중복으로 간단한 단어 일치의 방법은 쓸 수 없고 또 다른 문제는 개념을 나타내는 단어들의 분포가 희박하다는 것이다. 결국, 요약에서는 문서 간의 중요한 차이를 인식하고 공동 부분을 내포시켜야 한다는 것이다.

전통적인 다문서 요약은 과학 논문, 법적 문서, 뉴스 등등과 같이 어떤 특정된 구조로 되어 있고 또한 장르에 속하는 경우에 효과적이나 웹에 있는 다중 매체 정보에는 다른 방법이 필요하다. 본 논문에서는 수사학적인 역할에 의존하여 문장을 연결하는데 이 자체는 문장의 구조와 영역에 좌우된다. 수사학적인 역할이 판명되면 문장의 의미를 알 수 있고 이로부터 요약을 할 수 있다.

 

ScienceDirect에서 multi-document summarization을 검색하면 862편의 논문이 있어서 그리 활발한 분야는 아니라고 생각된다. 그리고 rhetorics와 관련이 있는 논문은 14편에 불과하여 추세 판단이 힘들고 여기에 있는 한편의 한국인 논문도 주제와는 더 세부적인 의료 분야의 질의응답에 관한 것으로서 국내 활동도 거의 없는 상태이다.

 

따라서 주제를 확장하여 862편의 multi-document summarization의 국내 활동을 보면 33편의 논문이 나온다. 비율을 보아서 국내 연구가 그리 활발한 분야는 아니다. 33편의 내역을 좀 더 자세히 분석하여 보면 6편은 요약과 관계가 낮은 분야에 대한 논문이고 7편의 논문은 문서 요약이나 문장 연계와 밀접한 관계가 있으며 6편의 논문이 웹 또는 웹 문서를 다루고 있다. 6편의 논문은 분류학 등의 기초적인 문제를 다루고 있으며 나머지 논문은 질의응답 등의 다양한 분포를 가지고 있다. 결론적으로 요약과 직결된 분야는 국내 연구가 아직 미미하다고 생각된다.

저자
John Atkinson, Ricardo Munoz
자료유형
학술정보
원문언어
영어
기업산업분류
정보통신
연도
2013
권(호)
40(11)
잡지명
Expert Systems with Applications
과학기술
표준분류
정보통신
페이지
4346~4352
분석자
김*창
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동