첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

클러스터 분석을 위한 사생활보호 데이터 공개

전문가 제언
○ 병원에서 축적된 환자의 의료정보 데이터나 신용기관에서 취합한 개인 신용정보 데이터들은 하나의 클러스터를 형성한다. 클러스터에 포함된 정보를 분석하기 위하여 정보 보유자는 정보 분석자에게 이를 공개하여야 하나 여기에는 대부분 개인의 민감한 정보를 포함하고 있어서 개인정보의 누출이라는 위험이 발생할 수 있다.

○ 이 경우 정보 공개라는 정보의 속성과 개인의 사생활 보호라는 두 이념의 상충이 발생한다. 따라서 정보 보유자는 데이터 공개에 앞서 데이터를 암호화하거나 익명화하여 공개에 따르는 사생활 침해를 미연에 방지하여야 한다.

○ 익명화의 하나로 데이터 마스킹(data masking) 기법이 있다. 데이터 마스킹은 식별되지 않으나 실제처럼 보이는 가상 데이터를 만들어 민감한 개인정보를 보호하는 방법이다. 데이터 마스킹 기법에는 데이터 암호화, 성별을 Bob이나 Julie 등으로 나타내는 대체방법, 데이터를 공란(####)으로 나타내는 방법 및 12345를 54321과 같이 수자의 배열을 바꾸어 나타내는 방법 등이 있다.

○ Fung 등은 이 논문에서 클러스터 분석을 위하여 유용한 개인의 사생활과 정보를 보호하는 데이터의 마스크 버전을 생성하는 실제적인 데이터 공개 프레임워크를 제안한다. 실생활 데이터 상에서 실험은 마스킹 프로세서에서 클러스터의 구조를 그대로 유지하면서 클러스터의 품질을 보존하는 방법이다.

○ 개인의 의료정보나 신용정보 클러스터는 사회적 공개가 아닌 특수 기관에게 공개되는 것이 원칙이나 흔히 불순한 동기에 의하여 정보가 유출되는 사례가 빈번히 발생하여 사회적 문제가 되기도 한다. 따라서 정보 공개에 대한 적절한 사생활 보호는 이 논문에서와 같이 데이터 수준에서 방비하는 것도 중요하지만 국가의 정책 차원에서 이루어져야 한다. 이 논문은 데이터 보안 소프트웨어를 연구하는 과학자들에게 좋은 참고자료임에 틀림없다.
저자
Benjamin C.M. Fung, Ke Wang, Lingyu Wang, Patrick C.K. Hung
자료유형
학술정보
원문언어
영어
기업산업분류
정보통신
연도
2009
권(호)
68
잡지명
Data & Knowledge Engineering
과학기술
표준분류
정보통신
페이지
552~575
분석자
김*기
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동