사기 탐지를 위한 비용 민감한 결정 트리 접근 방식
- 전문가 제언
-
○ 신용카드 사기 탐지를 하려면 실제 영역에서 여러 가지 형태의 비용이 발생한다. 대부분의 분류기는 이 문제를 직면하지 않고 약간의 경우에만 오분류 비용 문제만을 감안하고 있는 현실이다. 오분류 비용은 일정하지 않아서 각 FN은 이에 따라 우선순위가 부여되어야 한다. 본 논문에서는 비용 민감한 방법을 제시하는데 근래 기계 학습에서도 비용 민감한 학습이 유망한 연구 분야로 대두되고 있다.
○ 비용 민감 문제를 다루는 방법은 첫째는 훈련 자료의 분포의 변화, 두 번째 방법은 고비용 부류에 대해서 오분류의 난이도 조정, 마지막 방법은 비용 무관한 모델을 수정하는 것인데 이러한 발상의 근본은 FN의 비용이 다른 점과 정상 거래가 사기 거래보다 많아서 자료가 불균형하기 때문이다.
○ ScienceDirect에서 fraud detection을 찾으면 1,638편의 논문이 나와서 그리 큰 분야는 아니라고 생각되는데 한 가지 특징은 검색된 많은 논문의 제목이 실제로 fraud detection이라는 표제어를 가지고 있다는 점이다. 이 사실은 연구 제목 자체가 구체적이고 연구 방향에 있어서도 상당히 체계를 갖추고 있는 것으로 분석된다. cost sensitive로 분야를 제한하면 518편의 논문이 있고 이 중에서 decision tree는 193편을 차지하여 방법론으로서의 중요성을 알 수 있다.
○ fraud detection 1,638편 중에서 expert system with application에는 219편의 논문이 있고 여기에는 21편의 한국인 논문이 있어서 편수로는 10%를 차지하여 국내 활동이 있는 것이나 주제와 직결된 논문은 반에도 미치지 못한다. cost sensitive decision tree의 193편에는 한국인 논문이 12편 있는데 주제와 관련이 깊은 것이 많아서 위의 두 결과를 종합하면 fraud detection은 비교적 국내 활동이 있는 분야라는 결론을 내릴 수 있다.
- 저자
- Yusuf Sahin, Serol Bulkan, Ekrem Duman
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 정보통신
- 연도
- 2013
- 권(호)
- 40()
- 잡지명
- Expert Systems with Applications
- 과학기술
표준분류 - 정보통신
- 페이지
- 5916~5923
- 분석자
- 김*창
- 분석물
-