분류 유틸리티를 위한 정보 기반 데이터 익명화
- 전문가 제언
-
○ 정보 보호에 있어서 정보를 가진 개인에게는 정보를 이용하여 자신이 식별되지 않을 권리와 자신에 관련된 사적인 정보를 삭제할 권리가 있다고 주장한다. 이런 관점에서 개인들이 만들어낸 정보를 수집하는 기관에서 수집된 데이터의 공개는 프라이버시 문제를 일으킨다. 특히 개인들이 만들어낸 빅 데이터를 활용하여 특정 패턴을 찾아내려는 기관이나 단체에서는 개인의 프라이버시를 위하여 각 개인을 익명화할 필요가 있다.
○ 익명화를 이용한 프라이버시 보호 모델로서 k-익명(k-anonymity) 보호의 개념이 있다. 데이터 공개에서 k-익명 보호를 제공한다는 것은 공개된 데이터에 포함된 각 개인의 정보가 공개과정에서 적어도 k-1명의 개인정보와 구별되지 않는다는 것을 의미한다. 실제 시스템에서 k-익명성을 제공하는 모델로서는 Datafly, ?-Argus 및 and k-Similar 등이 있다.
○ 이 논문에서는 정확한 패턴 분류 모델의 구축을 위하여 익명화된 데이터 테이블을 생성하기 위한 두 가지의 알고리즘을 제안한다. 이들 알고리즘들은 분류 가용성을 극대화하기 위하여 속성들을 일반화하고 프라이버시 요구사항 k이나 분산 제약조건에 의하여 속성 값들의 노출을 은폐한다.
○ 익명화 연구에서는 데이터를 공개할 때 데이터베이스 안에 각 레코드나 속성들의 조합 또는 개인에게 민감한 속성들을 나타내는 식별자(identifier)를 제거하여 각 레코드가 누구의 정보를 포함하고 있는지 모르게 익명화한다. 이 분야에 관련된 기초 연구는 국내에서 많이 활성화되어 있으나 데이터의 특성에 따른 구현의 어려움 때문에 구글이나 애플과 같은 IT 대기업에서 사용하고 있는 익명화가 국내 기업에 적용된 사례는 보고된 바가 없다.
○ 소셜 네트워크의 활성화로 빅 데이터의 활용이 새로운 IT의 화두로 대두되고 있으며, 개인관련정보를 익명화한 빅 데이터의 분석을 통하여 새로운 부가가치를 창출하는 기술의 개발이 요구된다. 이런 관점에서 이 연구는 이 분야를 연구하는 분들에게 많은 참고가 될 것이다.
- 저자
- Jiuyong Li, Muzammil Baig, Raymond Chi-Wing Wong,
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 정보통신
- 연도
- 2011
- 권(호)
- 70
- 잡지명
- Data & Knowledge Engineering
- 과학기술
표준분류 - 정보통신
- 페이지
- 1030~1045
- 분석자
- 김*기
- 분석물
-
이미지변환중입니다.