프라이버시를 보존하는 비정형 빅데이터 분석 기법
- 전문가 제언
-
○ 정보통신기술의 발전과 함께 데이터량이 기하급수로 증가하는 빅데이터 시대가 다가오고 있다. 가트너는 빅데이터를 부피가 크고 유입속도가 빠르며 속성이 다양한 데이터로 정의하고 있다. 방대한 데이터로부터 유용한 정보를 추출하는 과정은 데이터의 생성, 수집, 저장 및 관리, 가공 및 처리, 분석, 스토리텔링 및 시각화로 이루어지며 각각의 단계에서 다양한 기술이 활용된다.
○ 빅데이터 분석 기법은 대량의 데이터를 처리할 수 있는 기능을 제공하지만 개인의 프라이버시에 대한 큰 위협을 수반한다. 유용한 연구를 위해 분석 플랫폼에 의해 처리되는 데이터는 다양한 개인정보를 포함할 수 있다. 따라서 프라이버시와 개인 데이터의 유용성 사이에 균형을 유지하는 프라이버시 보호 기법이 필요하다.
○ 익명화와 같은 기존의 프라이버시 보호 기법은 데이터 세트를 민감속성, 준식별자, 비민감속성과 같은 일단의 세트로 구분해야 한다. 정형 데이터는 이러한 구분이 가능하지만 비정형 데이터는 민감속성과 준식별자를 판별하기가 매우 어렵다. 본고에서는 모바일, 건강관리, 사회적 매체, 웹 활용 등 다양한 분야에서 빅데이터 분석의 보안 문제와 프라이버시 보호 데이터 발행 기법, 비정형 데이터 비식별화 기법 등의 연구 과제를 제시한다.
○ 우리나라의 빅데이터 활용을 위한 기술 수준은 해외 선진국 대비 3.3년 정도 뒤진 것으로 파악된다. 미국, 일본, 유럽연합 등은 프라이버시 보호와 데이터의 유용성 간의 균형을 위해 개인정보의 비식별 조치, 재식별 방지 및 처벌 등 지속적인 감시 및 사후관리를 강조하고 법제화를 통해 지원하고 있다. 국내에서는 행정자치부가 빅데이터 활성화를 위한 개인정보 보호제도 개선의 일환으로 '개인정보 비식별 조치 가이드라인'을 발표했다. 정부, 학계, 기업, 사용자 사이에 개인정보 활용에 대한 합의를 바탕으로 제도를 조속히 정착시키기 위한 노력이 필요하다.
- 저자
- Brijesh B. Mehta, Udai Pratap Rao
- 자료유형
- 니즈학술정보
- 원문언어
- 영어
- 기업산업분류
- 정보통신
- 연도
- 2016
- 권(호)
- 78()
- 잡지명
- Procedia Computer Science
- 과학기술
표준분류 - 정보통신
- 페이지
- 120~124
- 분석자
- 송*택
- 분석물
-