사생활 보호 데이터 마이닝에 기반한 섭동의 응용
- 전문가 제언
-
○ 사생활 보호 데이터 마이닝은 2000년 IBM 연구소에서 처음으로 제안한 솔루션으로, 고객이 입력하는 개인 정보를 무작위로 바꾸어 기업의 데이터베이스에 저장함으로써, 개인 정보의 불법 추출을 방지하고 고객들이 안심하고 올바른 정보를 입력할 수 있도록 하자는 것이었다.
○ 이는 데이터 마이닝이 올바른 정보에 기초하여야 올바르고 유용한 정보의 추출이 가능하기 때문이다. 섭동 데이터 마이닝은 초기 데이터 분포에 적당한 확률분포를 추가하여 초기 분포를 재구축하고, 아를 다시 확률기법을 활용하여 본래의 분포로 재생하는 과정을 밟는다.
○ 섭동에 기반을 둔 방법에서 노이즈의 추가 때문에 정보의 손실 대 비밀의 보존은 항상 절충된다. 문제는 자신의 비밀을 얼마나 양보할 수 있는가다. 이것은 사람에 따라 달라진다. 각 사람마다 관습과 문화에 따라 사적인 비밀에 대한 서로 다른 태도를 가지기도 한다. 불행하게도 현재의 섭동 기반 사생활 보호 데이터 마이닝 기술은 개인이 바라는 사적비밀 수준의 선택을 허용하지 않는다.
○ Liu 등은 이 논문에서 개인이 자기 자신의 비밀 수준을 선택할 수 있고, 개별적으로 적응 가능한 섭동 모델을 제안하였다. 이 방법의 효율성은 종합적이고 실제 데이터 상에서 수행된 여러 실험으로 나타내었고, 이 실험을 통하여 단순하나 효율적이고 효과적인 섭동 데이터를 통한 데이터 마이닝 모델을 구축하기 위한 기술을 제시하였다.
○ 온라인상에서 사생활 문제는 커다란 사회문제가 되고, 기업의 신뢰도와 직결된다. 기업을 믿지 못하면 고객은 자신과 관련된 사적인 비밀 사항을 기업에게 거짓으로 제공하게 되고 이를 토대로 추출된 데이터는 신뢰할 수 없을뿐더러 이를 기반으로 펼치는 기업의 운영에 막대한 지장을 초래한다.
○ 대형 포탈 업체의 고객 정보가 누설되는 현실에서 무엇보다도 사생활 보호를 위한 업계의 노력과 연구자들의 기술 개발 및 정부의 적극적인 정책이 절실히 요구된다.
- 저자
- Li Liu, Murat Kantarcioglu, Bhavani Thuraisingham
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 정보통신
- 연도
- 2008
- 권(호)
- 65
- 잡지명
- Data & Knowledge Engineering
- 과학기술
표준분류 - 정보통신
- 페이지
- 5~21
- 분석자
- 김*기
- 분석물
-
이미지변환중입니다.