수사학 기반의 다문서 요약
- 전문가 제언
-
○ 다문서 요약에서 문제는 첫째로 정보의 중복으로 간단한 단어 일치의 방법은 쓸 수 없고 또 다른 문제는 개념을 나타내는 단어들의 분포가 희박하다는 것이다. 결국, 요약에서는 문서 간의 중요한 차이를 인식하고 공동 부분을 내포시켜야 한다는 것이다.
○ 전통적인 다문서 요약은 과학 논문, 법적 문서, 뉴스 등등과 같이 어떤 특정된 구조로 되어 있고 또한 장르에 속하는 경우에 효과적이나 웹에 있는 다중 매체 정보에는 다른 방법이 필요하다. 본 논문에서는 수사학적인 역할에 의존하여 문장을 연결하는데 이 자체는 문장의 구조와 영역에 좌우된다. 수사학적인 역할이 판명되면 문장의 의미를 알 수 있고 이로부터 요약을 할 수 있다.
○ ScienceDirect에서 multi-document summarization을 검색하면 862편의 논문이 있어서 그리 활발한 분야는 아니라고 생각된다. 그리고 rhetorics와 관련이 있는 논문은 14편에 불과하여 추세 판단이 힘들고 여기에 있는 한편의 한국인 논문도 주제와는 더 세부적인 의료 분야의 질의응답에 관한 것으로서 국내 활동도 거의 없는 상태이다.
○ 따라서 주제를 확장하여 862편의 multi-document summarization의 국내 활동을 보면 33편의 논문이 나온다. 비율을 보아서 국내 연구가 그리 활발한 분야는 아니다. 33편의 내역을 좀 더 자세히 분석하여 보면 6편은 요약과 관계가 낮은 분야에 대한 논문이고 7편의 논문은 문서 요약이나 문장 연계와 밀접한 관계가 있으며 6편의 논문이 웹 또는 웹 문서를 다루고 있다. 6편의 논문은 분류학 등의 기초적인 문제를 다루고 있으며 나머지 논문은 질의응답 등의 다양한 분포를 가지고 있다. 결론적으로 요약과 직결된 분야는 국내 연구가 아직 미미하다고 생각된다.
- 저자
- John Atkinson, Ricardo Munoz
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 정보통신
- 연도
- 2013
- 권(호)
- 40(11)
- 잡지명
- Expert Systems with Applications
- 과학기술
표준분류 - 정보통신
- 페이지
- 4346~4352
- 분석자
- 김*창
- 분석물
-
이미지변환중입니다.
