첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

웹 페이지 분류를 위한 특징 선정법

전문가 제언
○ 웹 페이지의 양이 급증함에 따라서 수작업으로 자료를 분류하는 것은 생산성이 낮아 웹 페이지의 자동적인 분류가 필요하다. 우선 이 논문에서 다루는 문제의 계층적인 소속을 정리하면 웹 페이지 분류에 형태 분류를 적용하는 연구에 속하고 다시 세분하면 형태 분류에서 거론하는 특징 공학의 문제이다.

○ 특징 공학에는 다시 다음의 세 가지 과정이 있다. 이들은 특징 생성 단계, 특징 정제 단계 그리고 특징 활용 단계이다. 본 논문의 문제는 특징 정제 단계에 속하는 것으로 이 단계에서는 원래 생성된 특징 중에서 일부를 특징 선정 그리고/또는 특징 추출에 의해서 효율성과 정확도를 높이는 단계이다.

○ 특징 선정은 입력의 차원수를 줄이는데 많이 사용되어 이에 관한 많은 연구가 있다. 일반적으로 입력의 차원수를 감소하려면 용어를 선정하는 방법, 용어를 묶는 방법, 문서를 묶는 방법 그리고 문서의 표현을 변환하는 방법이 있는데 본 논문의 퍼지(fuzzy) 등급 분석과 DPM은 용어 선정을 위한 것이다.

○ 특징 선정에서의 문제는 특징의 수를 감소하면서 정확도를 많이 희생하지 않고 균형을 유지하는 것이 관건인데 저자들은 좋은 결과를 얻은 것으로 보인다. 특징 선정에서는 관련 척도가 중요한데 DPM이라는 새로운 척도를 제안하여 특징의 긍정적인 면과 부정적인 면을 모두 고려한 것이고 또한 분류 과정을 순차적인 과정에서 병행적인 과정으로 만든 것이 공헌이다.

○ 국내에서 포탈(portal)을 운영하는 업체들은 웹 페이지의 분류 문제를 다루고 있으나 구체적인 방법은 아직 발표된 것이 없는 형편이고 특히 이 논문에서 제안하는 방법과 유사한 분야에서는 국내 연구자가 발표한 논문은 이 수준의 저널에서는 볼 수 없었으나 특징 공학의 다른 분야의 논문은 몇 개 있었다.
저자
Chih-Ming Chen, Hahn-Ming Lee, Yu-Jung Chang
자료유형
학술정보
원문언어
영어
기업산업분류
정보통신
연도
2009
권(호)
36(1)
잡지명
Expert Systems with Applications
과학기술
표준분류
정보통신
페이지
260~272
분석자
김*창
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동