본문 바로가기

머신러닝, 딥러닝

혼자 공부하는 머신러닝+딥러닝 2주차

[기본 미션]

# k-최근접 이웃 회귀

knr = KNeighborsRegressor()

# 5부터 44까지의 데이터를 2차원 배열로 만들음
x = np.arange(5, 45).reshape(-1, 1)

for n in [1, 5, 10]:
  knr.n_neighbors = n
  knr.fit(train_input, train_target)

  prediction = knr.predict(x)

  plt.scatter(train_input, train_target)
  plt.plot(x, prediction)
  plt.title(f'n_neighbors = {n}')
  plt.xlabel('length')
  plt.ylabel('weight')
  plt.show()

 

[선택미션]

파라미터란?
한국어로 매개변수이며, 모델 내부에서 결정되는 변수로 그 값은 데이터로부터 결정된다.
선형 회귀 모델에서의 계수 coef_, 절편 intercept_와 같이 머신러닝 모델이 특성에서 학습한 것(사용자가 직접 설정하는 것이 아니라 모델링에 의해 자동으로 결정되는 값)은 모델 파라미터라고 부른다.

하이퍼파라미터란?
머신러닝 알고리즘이 학습하지 않는 파라미터이다. 사람이 사전에 지정해야 하는 파라미터로, 대표적으로 릿지와 라쏘의 규제 강도 alpha 파라미터가 있다.