화상과 영상의미 이해 현황 및 검색 인터페이스
- 전문가 제언
-
○ 화상과 영상은 오락성이 있으므로 다수인이 희망하는 콘텐츠를 시청할 수 있는 검색 서비스가 개발되어 많이 이용되고 있다. 또한 화상과 영상의 해석기법이 개발되어 메타데이터를 자동적으로 추출하는 기법이 개발되고 있다. 통계적 기계학습에 의한 미디어 해석기법이 고도화됨에 따라 화상정보의 인식 및 영상정보의 의미 이해의 정밀도 향상에 기여하고 있다.
○ 최근, 텍스트 검색에서 Bag of Keypoints법이 유력하게 검토되고 있으며, 이는 통계적 기계학습 기법과 친화성이 높을 것으로 전망된다. 화상과 영상이 갖고 있는 고유의 다양성과 애매성(모호성)에 따라 검색결과의 가시화 시스템이 필요하다. 최근 이 검색결과의 가시화 시스템에 관한 연구개발이 추진되고 있다.
○ 최근, 유튜브와 같은 개인이 촬영한 영상이 증가함에 따라 다양한 문제를 해결할 기법이 필요한 실정이다. 또한 영상의 의미를 이해하기 위해 계층성을 포함한 영상의 구조해석을 검토하고, 화상이 갖고 있는 다의성과 모호성을 정밀하게 파악할 필요가 있다.
○ 희망하는 콘텐츠를 정확하게 표현하는 질문(query)을 상정하지 못하는 경우가 발생하므로 항상 질문을 의식하면서 화상과 영상을 시청하는 상황에서 정보를 어떻게 제공할 것인가를 검토할 필요가 있다.
○ 화상과 영상의 의미 이해, 검색 인터페이스에 관한 연구개발은 아직 초기단계에 있다. 앞으로 검색결과의 가시화 시스템을 개발함으로써 다양한 학문 간의 융합을 실현하고, 비전 컴퓨팅에서의 정보처리, 화상과 영상으로부터의 새로운 가치창출 등이 실현되기를 기대한다.
- 저자
- Miki Haseyama
- 자료유형
- 학술정보
- 원문언어
- 일어
- 기업산업분류
- 정보통신
- 연도
- 2010
- 권(호)
- 93(9)
- 잡지명
- 電子情報通信學會誌
- 과학기술
표준분류 - 정보통신
- 페이지
- 764~769
- 분석자
- 장*석
- 분석물
-