4장 신경망 시작하기: 분류와 회귀 | Notion

이진분류

데이터 준비(인코딩) : 2가지 방법

목적 >> 숫자 리스트들이 가진 길이를 일치시켜야 하기 때문
1. 패딩을 추가하고 (samples, max_length) 크기의 정수텐서로 변환 (11장)
2. 멀티핫인코딩하여 0과 1의 벡터로 변환한다. (해당되는 숫자의 인덱스에 1로 입력하고 나머지는 0으로 채워진 벡터)

model 설정

활성화 함수	중간층	relu
	마지막층	sigmoid
층 수		3
유닛의 수	중간층	16
	마지막층	1	* 마지막에는 확률 하나를 출력. (0~1 사이의 값: 1에 가까울수록 긍정에 가까울 확률)

compile 과정

| 손실함수 | binary_crossentropy mean_squared_error | * crossentropy? → 확률을 출력하는 모델을 사용할 때 최선의 선택! → 확률 분포 사이의 차이를 측정. (원본 분포와 예측 분포 간의 차이 측정) | | --- | --- | --- | | 옵티마이저 | rmsprop | * rmsprop? → 거의 모든 문제에 무난무난함. | | 훈련 지표 | “accuracy” | |

다중분류

데이터 준비(인코딩) : 2가지 방법
1. 레이블의 리스트를 정수텐서로 변환한다.
2. 원핫인코딩(one-hot encoding)을 사용한다.

model 설정

활성화 함수	중간층	relu
	마지막층	softmax	* 각 샘플마다 46개의 토픽에 대한 확률분포를 담은 벡터를 출력. (46칸의 벡터)
층 수		3
유닛의 수
(Dense 층의 크기)	중간층	64	* 클래스가 46개므로 정보의 병목으로 데이터 손실을 방지하고자 데이터보다 더 큰 크기의 중간층을 사용.
	마지막층	46	46개의 토픽의 확률을 담은 46차원 벡터

compile 과정

| 손실함수 | categorical_crossentropy

sparse_categorical_crossentropy | → 확률 분포 사이의 거리를 측정. (모델이 출력한 확률분포와 진짜 레이블의 분포 사이의 거리) → 정수리스트로 인코딩했어야 함. | | --- | --- | --- | | 옵티마이저 | rmsprop | | | 훈련 지표 | “accuracy” | |

스칼라 회귀

데이터 준비

→ 각 특성별로 정규화 (각 특성의 평균을 빼고 표준편차로 나누기)
- 테스트 데이터에도 훈련데이터와 같은 값으로 계산해야함.
- 기본원칙! 테스트 데이터에서 계산한 값은 절대 사용하면 안된다!

model 설정

활성화 함수	중간층	relu
	마지막층	없음	* 선형층 (출력값의 범위를 제한하지 않음)
층 수		3
유닛의 수
(Dense 층의 크기)	중간층	64
	마지막층	1	for 스칼라 회귀

compile 과정

| 손실함수 | mse (mean squared error) | → 예측과 타깃 사이의 거리 제곱
- 회귀문제에서 널리 사용 | | --- | --- | --- | | 옵티마이저 | rmsprop | | | 훈련 지표 | “mae” (mean absolute error) | → 평균 절대 오차 → 예측과 타깃 사이 거리의 절댓값 ex) 값이 0.5가 나오면 예측이 평균적으로 0.5천달러 차이가 난다는 뜻! |
문제내기