첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

스팸 메일에 대한 효율적인 대책

전문가 제언
○ 인터넷에서 스팸 메일의 증가로 여러 가지 해법이 제시되고 있는데 이 중에 가장 유망한 것은 기계 학습 방법이다. 비교적 최신의 방법으로서는 아직도 문서 분류에 거의 사용되지 않는 MDL 원칙이다. 이 원칙은 관측 자료 세트에 대한 가장 좋은 설명은 자료 압축이라는 것이고 본 논문에서는 이와 함께 CF의 두 가지 방법을 사용한다.

○ MDL은 귀납적 추론으로 유망한 분야는 모델 선정인데 좀 더 일반적으로는 overfitting 문제이다. 이는 전통적인 방법이 모델의 수정을 요하는 것과는 달리 MDL은 모델의 파라미터와 구조를 모두 예측할 수 있다. CF는 작은 양 그리고 또는 중요하지 않은 특징에 의해서 개입되는 잡음을 줄이기 위한 것인데 이는 메일이 스팸인가 또는 아닌가를 판단하는 과정과 유사하다.

○ 참고 문헌에 국내 연구자의 결과가 인용되지 않아 ScienceDirect에서 정보 검색을 한 결과 spam e-mail과 machine learning의 교집합에는 240편의 논문이 있었는데 이 중에 spam에 대한 일반론, 영향, 비용 통계 등을 다루는 내국인 논문은 5편 발견했으나 spam의 대응에 관한 것은 찾지 못했다. 상용확가 진행된 분야이고 연구 분야 자체가 활발하지 못한 것이 국내에도 반영되었다고 판단된다. .

○ 스팸에 대한 방지책의 기법으로서 MDL의 사용은 아직 미미하여 위의 240편 중에서 4편의 논문 밖에 없었다. CF가 차지하는 비중은 상대적으로 높아서 240편 중에 62편이었다. 그러나 MDL이나 CF를 색인으로 검색한 논문에서 한국인 논문은 볼 수 없었다. 이 사실로서 국내에서는 스팸 방지책에 대한 연구가 적어도 저널에 발표되는 수준에서는 없다는 것이 재확인 되었다.
저자
Tiago A. Almeida, Akebo Yamakami
자료유형
학술정보
원문언어
영어
기업산업분류
정보통신
연도
2012
권(호)
39(7)
잡지명
Expert Systems with Applications
과학기술
표준분류
정보통신
페이지
6557~6561
분석자
김*창
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동