첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

기계 학습에 의한 악성 웹 탐지

전문가 제언
○ DHTML(Dynamic HTML)에서는 브라우저(browser)와의 상호 작용을 개선하기 위해서 웹 페이지의 내용과 JavaScript 같은 대사 언어로 작성된 프로그램이 내장되어 공격자에게는 좋은 기회를 제공한다. DHTML을 사용한 악성 웹은 아직도 구식의 항바이러스 소프트웨어에 의해서 처리되고 있어 문제시되고 있다.

○ 징후 기반의 탐지 기법에 대해서는 이미 많은 연구가 있었고 또한 상당수의 상용 항바이러스 패키지가 이 기법을 사용하고 있다. 그러나 근본적으로 DHTML 코드는 2진 코드와 달리 순수한 문서의 형태, 원격 페이지에 대한 복수의 링크(link) 계층 그리고 변형의 용이성을 가지고 있어서 기계 학습에 의한 새로운 접근 방식이 필요하다.

○ 이 논문에서는 DHTML을 구성하는 HTML, CSS 그리고 DOM의 3분야에서 JavaScript 함수, HTML 문서 수준의 항목 그리고 Active X의 항목들을 특징으로 추출하고 단순 Bayes 알고리듬, 결정 트리 알고리듬, 벡터 지원 기계(SVM : Support Vector Machine) 그리고 증강 결정 트리 알고리듬 등을 사용한 분류기로 채택한 기계 학습 기법을 제안하여 증강 트리 알고리듬이 다른 분류기 알고리듬이나 상용 패키지에 비해서 우수함을 증명하였다.

○ 국내 동향을 파악하기 위해서 이 저널을 검색한 결과 DHTML에 대한 연구는 본 논문 한편이고 논문에서 국내 연구자의 논문이 인용되지 않아 이러한 연구는 국내에서 수행되지 않고 있다. 분야를 더 확산하여 spam과 악성 웹에 대해서 유사한 검색을 한 결과 이 두 분야는 국내 연구가 취약한 것으로 판명되었다.

○ 반대로 징후 기반 기법과 2진 코드에 대해서는 각각 200개와 130개의 논문이 검색되고 있고 악성 웹 문제는 아직도 징후 기반의 2진 코드 처리에 중점을 두는 것이 국제적인 추세이므로 상용 항바이러스 패키지도 이 기법을 사용한다. 따라서 국내 개발자나 portal site 운영자도 이러한 수준에 있다고 추측할 수 있다.
저자
Yung-Tsung Hou , Yimeng Chang , Tsuhan Chen , Chi-Sung Laih , Chia-Mei Chen
자료유형
학술정보
원문언어
영어
기업산업분류
정보통신
연도
2010
권(호)
37(1)
잡지명
Expert Systems with Applications
과학기술
표준분류
정보통신
페이지
55~60
분석자
김*창
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동