2강 image classification | Notion

Image Classification

컴퓨터 비전에서 핵심 과제이자 cs231n에서 주로 다룰 문제
Image Classification의 과정을 요약하자면 다음과 같다
- 시스템에 image를 input 예: 고양이 사진 input
- 시스템은 주어진 카테고리에서 입력된 사진이 어느 카테고리에 속할지 선택 예: [개, 고양이, 트럭, 말, 비행기, …] 중 뭘까?
- 시스템 output 예: 고양이와 가장 유사하다!

Semantic Gap

우리가 보는 고양이 사진 vs 컴퓨터가 보는 고양이 사진

Untitled

우리는 딱 보면 “고양이!” 임을 알 수 있다
컴퓨터에겐 그저 거대한 숫자 집합으로 보인다

모두 고양이다

Untitled

고양이를 검색한 사진이다. 사람은 모든 사진에 고양이가 있음을 쉽게 알 수 있다.
컴퓨터에겐 서로 각기 다른 숫자 집합으로 보일 뿐이다.
- 이미지의 픽셀 값은 모조리 달라지지만 고양이임을 인식해야 한다.
- 알고리즘은 이런 변화에 쉽게 흔들려선 안된다! 그래서 image classification이 어렵다!
⇒ Semantic Gap
- 앞으로 이를 가능하게 만든 요소에 다룰 예정이다.

Data-Driven Approach (데이터 중심 접근 방법)

Data-Driven Approach 이전의 방법

카테고리별 규칙을 정함
- 예를 들어 (고양이: 뾰족한 귀2 & 코1), (말: …)
  - 보기만 해도 머리 아픔
  - 확장성, 유연성 👎
  - 그래서 Data-Driven Approach란 insight가 등장하였다

동작 방식