softmax

기존의 argmax에서는[1,2,3]이면 [0,0,1]인데, softmax에서는[0.0900,0.2447,0.6652]로 부드럽게 뽑아줌. sum은 1이다.

crossentropy

Untitled

두 개의 확률분포가 주어졌을 때, 두 개가 얼마나 비슷한지 나타내는 것

Untitled

low-level의 크로스엔트로피 train

  1. 모델 초기화:
  2. Optimizer 설정:
  3. 학습 과정:
  4. 로깅:

하이레벨 크로스앤트로피

F.cross_entropy 함수를 사용합니다. 이로 인해 원-핫 인코딩 과정이 필요 없어지고, 코드가 더 간결

Maximun Likelihood Estimation

  1. 100번던졌을때 27번 나오는 사건에서, 이 상황을 가장 잘 설명하는 확률분포함수의 파라미터를 찾는 과정이 MLE라는 것
  2. TOP이 0.27인 분포를 찾으려면, 기울기를 보면 됨
  3. Gradient Ascent/Decent
  4. 최적화 : 세타는 세타 마이너스 러닝레이트세타변량로스함수

오버피팅