첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

웹 탐색에서 애매한 질의의 확인

전문가 제언
○ 불확실한 용어에는 모호한(vague) 개념을 나타내는 것과 애매한(ambiguous) 개념을 나타내는 두 형태가 존재한다. 모호한 용어는 “구름 낀 날씨“와 같이 경계가 분명치 않은 개념을 나타내고 애매한 용어는 ”사건의 불특정성“과 같이 어느 것으로 결정할 수 없는 의미가 내포된 개념을 나타내는 용어이다.

○ 불확실한 용어를 사용한 질의는 일반적으로 두 개 이상의 의미를 갖는 애매한 질의와 다양한 부제목을 포함하고 사용자는 그 중에 하나만을 선택하는 광범위한 질의가 있다. 애매한 질의는 이를테면, “giant”라는 질의에 대하여 ”Giant Company Soft(컴퓨터회사)“, “Giant Bike(자전거제조회사)“, ”Giant(영화제목)“, ”San Francisco Giant(농구팀)“와 같은 응답을 얻을 수 있는 질의이다.

○ 광범위한 질의는 이를테면, “노래"라는 질의에 대하여 ”노래“, "노래 잘 부르는 방법”, “노래 학원”, “최신 노래”, “좋은 노래”와 같은 부제목 검색을 요구하는 응답을 반환하고 사용자는 이 중에서 자기에게 적합한 제목을 골라 다시 검색하는 질의이다.

○ 이 논문에서는 애매한 질의에 대한 정의와 분류 방법을 제안하고 애매한 질의를 자동적으로 식별할 수 있는 방법을 제안한다. 이 방법을 통하여 일반적인 탐색 로그(log)에서 애매한 질의의 비율이 16%임을 추정하였고 질의에 대한 실험 결과는 제안된 방법에서 애매한 질의의 식별 비율이 약 87%임을 보였다.

○ 인간의 언어는 일반적으로 추상적인 개념을 포함한다. 따라서 언어의 의미를 컴퓨터를 이용하여 파악하려면 형식 언어의 구조나 단어 사이의 관계만 가지고는 한계가 있다. 불확실성 언어를 다루는 퍼지(fuzzy) 이론이 있기는 하나 의미론적(semantic) 관점의 연구가 더 필요하다. 질의가 인간의 언어로 이루어진다는 의미에서 애매한 질의에 대한 연구는 웹 의미론과 더불어 관심을 갖게 하는 분야이다. 다만 이 논문에서와 같은 애매한 질의의 분류나 분류 비율의 추정 등이 실세계 활용에서 어느 정도 효율적인지는 의문으로 남는다.
저자
Ruihua Song , Zhenxiao Luo , Jian-Yun Nie , Yong Yu , Hsiao-Wuen Hon
자료유형
학술정보
원문언어
영어
기업산업분류
정보통신
연도
2009
권(호)
45
잡지명
Information Processing & Management
과학기술
표준분류
정보통신
페이지
216~229
분석자
김*기
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동