728x90
❓ Regression
- 데이터 변수들간의 함수 관계를 파악하여 통계적으로 추론하여 결과를 도출하는 기술이다.
❓ Hypothesis
- 위는 Regression 데이터를 가지고 좌표를 찍은 모습이다.
- Regression 모델을 학습하기 전에 하나의 가설을 세울 필요가 있다.
- 우리가 예측할 무언가의 실제 데이터 결과가 어떤지는 모르겠으나 아래 사진의 1차원 방정식의 그래프 형태인 모델이 우리의 가설에 맞아 떨어질 것이다. 즉, 우리 가설의 결과가 1차원 방정식 그래프 형태인 모습일 것이다.
- 가설은 H(x)로 나타내고 H(x) = Wx+b 형태의 방정식이다. W(weight), b(bias)
- 우리의 목표는 실제 데이터 값들과 가장 유사하게 H(x)를 그려주는 W와 b를 값을 찾는 것이다. (W와 b 값은 여러개로 존재할 수 있다.)
❓ Cost (비용)
- Cost는 가설이 나타내는 1차원 방정식 그래프와 실제 데이터와의 거리이다.
- 거리를 측정했을 때 거리가 짧은 것이 모델이 예측한 값(가설)과 실제 데이터 값이 유사하다는 의미이므로 cost의 값이 작을 수록 좋다.
❓ Cost function
- 가설을 나타내는 선과 실제 데이터와의 거리를 측정하여 차이들의 평균을 구하는 function 이다.
- H(x) -y (H(x)는 가설이 예측한 값이고 y는 실제 데이터를 의미한다)
- 하지만 가설과 실제 데이터의 차이를 측정하는 식은 H(x)-y가 아닌 $\left ( H\left ( x \right )-y\right )^{2}$ 식을 사용한다.
- cost function을 제곱하는 이유
- 예측한 값(가설)과 실제 데이터의 차이가 양수 혹은 음수로 나오게 되는데 편차로 구하기 위해서 제곱을 함.
- 예측한 값과 실제 데이터 값의 차이를 제곱하게 되면 차이가 큰 부분은 더 크게 차이가 나게 되므로 극명하게 비교, 확인 할 수 있음.
- H(x)는 W,b로 이루어진 식이니 cost 는 W와 b의 function이 된다.
- m은 학습 데이터의 갯수를 의미한다.
- cost가 이러한 식을 가질 때 가장 작은 cost 값을 가지는 W와 b의 값을 찾는 것이 Linear Regression 의 학습니다.
반응형
'Programming > Deep Learning' 카테고리의 다른 글
[모두를 위한 딥러닝] TensorFlow Basic (0) | 2022.04.06 |
---|---|
[모두를 위한 딥러닝] 머신러닝과 Supervised/Unsupervised learing (0) | 2022.04.05 |