첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

시각적 이미지 인식기술의 발전전망

전문가 제언
이 논문은 Caltech 전기공학과 컴퓨터 및 신경시스템 학과 교수이자 박사과정 디렉터인 Pietro Perona 교수가 COMMUNICATIONS OF THE ACM의 기술전망 섹터에 기고한 글로 이미지 인식기술의 전망을 제시한다.

무엇이 잘못된 걸가? 저자는 몇 가지를 주장한다.

첫째, 우선 기존 모델은 2D이미지의 객체통계에 기반을 둔 전적으로 현상학적인 모델이다. 또한 3D모델의 기하학적 측면 혹은 표면 특성이나 재질을 설명하지는 않는다.

둘째, 최근의 목표는 객체 범주를 폭 넓게 인식하고자 한다는 것이다. 즉 병과 고양이, 사람을 구별하는 것이 아니라 학질모기와 집모기, 샴 고양이와 미얀마고양이를 구분하는 것이다. 아직은 미세한 분류방법을 정확히 모른다.

셋째, 사람들은 훈련을 거쳐 분류 인식방법을 배울 수 있다. 의대생이 학습하려면 얼마나 많은 대퇴골이 필요할까? 기존 알고리즘은 어느 정도 제대로 처리하기 위해서는 수천 번의 훈련사례기 필요하다. 도전의 근본적인 문제는 규모이다. 예를 들어 인식을 위한 의미 있는 시각적 분류 수는 105 척추동물 종, 107 곤충 종이 있다.

결론: 우리는 웹의 가용정보 획득을 훈련시키고 지능적 정보문의를 위해 전문가에게 간단히 접속 가능한 시스템을 개발할 필요가 있다.
저자
Pietro Perona
자료유형
연구단신
원문언어
영어
기업산업분류
과학기술일반
연도
2013
권(호)
56(9)
잡지명
Communications of the acm
과학기술
표준분류
과학기술일반
페이지
96~96
분석자
박*만
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동