첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

웹페이지 평판계산을 위한 하이퍼그래프 웹 모델링

전문가 제언
○ 웹 페이지 평판(reputation)은 웹 페이지 탐색 엔진이 해당 웹 페이지를 얼마나 자주 링크하는 가를 측정하는 정도를 나타낸다. 웹 페이지 안에는 제목, 메타 태그, 콘텐츠와 같은 들어오는 링크를 유발하는 소위 앵커(anchor) 요소가 존재한다. 이들은 특정한 키워드를 위한 탐색 엔진에서 페이지의 등급(ranking)을 매기는 중요한 역할을 담당한다.

○ 페이지 등급은 특정한 페이지가 얼마나 많은 투표(vote) 값을 가졌는지에 의하여 웹 페이지에 할당된 값이다. 여기서 투표 값은 웹 페이지를 향하여 들어오는 링크의 수이다. 링크의 값은 링크가 연결된 웹 페이지의 페이지 등급에 의하여 결정된다. 페이지 등급이 낮을수록 페이지를 갱신하는데 더 많은 작업을 필요로 한다. 링크에 관련된 알고리즘으로는 Pagerank와 Indegree 알고리즘이 있다.

○ 웹 하이퍼그래프(hypergraph)는 페이지의 집합을 서로 겹치지 않은 블록으로 나누고 하이퍼아크(hyperarc)를 만들어 서로 다른 블록의 페이지들 사이에 링크를 이용한 웹 그래프이다. 하이퍼아크는 링크 분석을 위한 신뢰 있는 정보를 제공하기 위하여 페이지의 불록을 단일 페이지와 연결한다.

○ 이 논문에서는 Pagerank와 Indegree 알고리즘의 하이퍼그래프 버전을 만들기 위하여 HyperPagerank와 HyperIndegree라고 하는 하이퍼모델을 사용하고 이를 써서 호스트 기반 알고리즘과 도메인 기반 알고리즘을 페이지 기반 알고리즘과 비교한다. 웹 정보수집을 통하여 HyperPagerank 알고리즘과 HyperIndegree 알고리즘이 페이지 평판에 더 좋은 결과를 가짐을 웹정보 자료수집의 실험을 통하여 보인다.

○ 페이지 평판이나 링크 분석과 같은 분야의 국내 연구는 아직은 이론개발 수준이다. 페이지 평판 문제는 포털과 같은 인터넷 시장에서 개발된 웹 페이지를 평가하는 하나의 도구가 될 수도 있다. 투표나 평판과 같은 사회적인 용어를 사용하여 웹 페이지 사이에 링크를 분석한다는 개념은 소셜 네트워크를 지향하는 미래 인터넷 시장의 새로운 트렌드이다. 앞으로 이 분야에 대한 연구는 더욱 활성화 될 것으로 본다.
저자
Klessius Berlt, Edleno Silva de Moura, Andre Carvalho, Marco Cristo, Nivio Ziviani, Thierson Couto
자료유형
학술정보
원문언어
영어
기업산업분류
정보통신
연도
2010
권(호)
35
잡지명
Information Systems
과학기술
표준분류
정보통신
페이지
530~543
분석자
김*기
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동