Image Classification
컴퓨터 비전에서 핵심 과제이자 cs231n에서 주로 다룰 문제
Image Classification의 과정을 요약하자면 다음과 같다
시스템에 image를 input 예: 고양이 사진 input
시스템은 주어진 카테고리에서 입력된 사진이 어느 카테고리에 속할지 선택 예: [개, 고양이, 트럭, 말, 비행기, …] 중 뭘까?
시스템 output 예: 고양이와 가장 유사하다!
Semantic Gap
우리가 보는 고양이 사진 vs 컴퓨터가 보는 고양이 사진
우리는 딱 보면 “고양이!” 임을 알 수 있다
컴퓨터에겐 그저 거대한 숫자 집합으로 보인다
모두 고양이다
고양이를 검색한 사진이다. 사람은 모든 사진에 고양이가 있음을 쉽게 알 수 있다.
컴퓨터에겐 서로 각기 다른 숫자 집합으로 보일 뿐이다.
이미지의 픽셀 값은 모조리 달라지지만 고양이임을 인식해야 한다.
알고리즘은 이런 변화에 쉽게 흔들려선 안된다! 그래서 image classification이 어렵다!
⇒ Semantic Gap
앞으로 이를 가능하게 만든 요소에 다룰 예정이다.
Data-Driven Approach (데이터 중심 접근 방법)
Data-Driven Approach 이전의 방법
카테고리별 규칙을 정함
예를 들어 (고양이: 뾰족한 귀2 & 코1), (말: …)
보기만 해도 머리 아픔
확장성, 유연성 👎
그래서 Data-Driven Approach란 insight가 등장하였다
동작 방식