웹페이지 평판계산을 위한 하이퍼그래프 웹 모델링
- 전문가 제언
-
○ 웹 페이지 평판(reputation)은 웹 페이지 탐색 엔진이 해당 웹 페이지를 얼마나 자주 링크하는 가를 측정하는 정도를 나타낸다. 웹 페이지 안에는 제목, 메타 태그, 콘텐츠와 같은 들어오는 링크를 유발하는 소위 앵커(anchor) 요소가 존재한다. 이들은 특정한 키워드를 위한 탐색 엔진에서 페이지의 등급(ranking)을 매기는 중요한 역할을 담당한다.
○ 페이지 등급은 특정한 페이지가 얼마나 많은 투표(vote) 값을 가졌는지에 의하여 웹 페이지에 할당된 값이다. 여기서 투표 값은 웹 페이지를 향하여 들어오는 링크의 수이다. 링크의 값은 링크가 연결된 웹 페이지의 페이지 등급에 의하여 결정된다. 페이지 등급이 낮을수록 페이지를 갱신하는데 더 많은 작업을 필요로 한다. 링크에 관련된 알고리즘으로는 Pagerank와 Indegree 알고리즘이 있다.
○ 웹 하이퍼그래프(hypergraph)는 페이지의 집합을 서로 겹치지 않은 블록으로 나누고 하이퍼아크(hyperarc)를 만들어 서로 다른 블록의 페이지들 사이에 링크를 이용한 웹 그래프이다. 하이퍼아크는 링크 분석을 위한 신뢰 있는 정보를 제공하기 위하여 페이지의 불록을 단일 페이지와 연결한다.
○ 이 논문에서는 Pagerank와 Indegree 알고리즘의 하이퍼그래프 버전을 만들기 위하여 HyperPagerank와 HyperIndegree라고 하는 하이퍼모델을 사용하고 이를 써서 호스트 기반 알고리즘과 도메인 기반 알고리즘을 페이지 기반 알고리즘과 비교한다. 웹 정보수집을 통하여 HyperPagerank 알고리즘과 HyperIndegree 알고리즘이 페이지 평판에 더 좋은 결과를 가짐을 웹정보 자료수집의 실험을 통하여 보인다.
○ 페이지 평판이나 링크 분석과 같은 분야의 국내 연구는 아직은 이론개발 수준이다. 페이지 평판 문제는 포털과 같은 인터넷 시장에서 개발된 웹 페이지를 평가하는 하나의 도구가 될 수도 있다. 투표나 평판과 같은 사회적인 용어를 사용하여 웹 페이지 사이에 링크를 분석한다는 개념은 소셜 네트워크를 지향하는 미래 인터넷 시장의 새로운 트렌드이다. 앞으로 이 분야에 대한 연구는 더욱 활성화 될 것으로 본다.
- 저자
- Klessius Berlt, Edleno Silva de Moura, Andre Carvalho, Marco Cristo, Nivio Ziviani, Thierson Couto
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 정보통신
- 연도
- 2010
- 권(호)
- 35
- 잡지명
- Information Systems
- 과학기술
표준분류 - 정보통신
- 페이지
- 530~543
- 분석자
- 김*기
- 분석물
-