첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

웹 사이트의 계층적 특징에 기반을 둔 예측 모델

전문가 제언
○ 웹 마이닝은 데이터 마이닝을 인터넷에 적용하여 유용한 지식과 형태를 자동적으로 추출하는 것이 목적이다. 이를 위해서는 사용자의 행동을 미리 예측해야 하는데 여기에는 Markov 확률 모델, 순차적으로 흔적을 정리하는 HPG(hypertext probabilistic grammar) 모델, Morse 모델이라고 불리는 무작위 모델 등이 사용된다.

○ 본 논문에서는 웹 로그 자료의 계층적 구조에 착안하여 웹 페이지는 디렉토리와 페이지 자체의 2계층 자료로 간주하여 TLPM라고 하는 예측 모델을 제안한다. 첫 수준에서는 Markov 모델을 사용하여 카테고리를 예측하고 두 번째 수준에서는 Bayes 모델로 페이지를 예측한다. 이와 같이 우선 카테고리를 선정하여 이 안에 있는 페이지만 검토하여 작업의 범위를 축소한다.

○ 분야 정보 검색을 한 결과 가장 상위 분야인 data mining은 16,734편의 논문이 있어 큰 분야이고 web usage mining도 상대적으로 큰 분야로 2,3489편, 검색에서 나온 결과를 다시 하위 개념인 web log file로 제한하여 검색하면 613편(본 저널에 75편)의 논문이 있다. 본 저널에 실린 75편의 논문 중에는 한국인 논문이 7편으로 약 10%를 차지하여 이 분야에 대한 연구가 국내 여러 대학에서 진행되고 있음을 알 수 있다.

○ 본 논문의 주제인 prediction으로 분야를 다시 제한하여 본 저널에 실린 논문을 확인한 결과 42편의 논문 중에 4편의 한국인 논문이 있어서 상위 분야인 web log file에서와 같은 비중으로 이 분야가 상대적으로 활발한 국내 연구 분야임이 확인되었고, 실제로 이 중의 2편은 본 논문에서 인용되었다. 상위 분야에 있으나 prediction에 포함되지 않은 3편의 한국인 논문은 분류, 세션 관리 그리고 웹 항해에 대한 것이었다.
저자
Chu-Hui Lee , Yu-lung Lo, Yu-Hsiang Fu
자료유형
학술정보
원문언어
영어
기업산업분류
정보통신
연도
2011
권(호)
38(4)
잡지명
Expert Systems with Applications
과학기술
표준분류
정보통신
페이지
3422~3430
분석자
김*창
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동