[Site Map]  [빅데이터분석목차]

 

연관토픽

  1. [연관] 오버피팅, 과적합(overfitting)

 

개념

  • 샘플 데이터가 모자라거나 제대로 학습이 되지 않아, 학습 데이터에 대해서도 정확한 결과를 도출하지 못하는 현상
  • 모델의 일반화가 과도하게 고려되어 발생하는 상황
  • 훈련집합의 모델을 너무 간단하게 정의하여 정확도가 같은 모델로 훈련집합과 테 스트 집합에서 모든 낮은 성능을 보임

 

 

언더피팅

  • High Bias
  • Low Variance

 

 

 

언더 피팅의 개념도

 

 

 

언더피팅 사례

  • 1차 모델로 적합 시키는 경우 최적해를 찾아오더라도 큰 오차가 발생하는데 모델의 용량이 작기 때문에 과소적합(Under fitting 이 발생함

 

 

 

언더 피팅의 발생원인

발생원인 설명
less features feature(차원)가 너무 단순하여 학습 정확도 저하
gradient vanishing back propagation에서 sigmoid 함수로 인해 gradient vanishing 문제 발생시

 

 

 

언더 피팅의 대응방안

대응방안 설명
fine more features feature(차원, 변수)를 추가하여 variance를 증가
학습모델 변경 high variance 기계학습 모델인 의사결정트리, KNN, SVM과 같은 학습 모델 사용
ReLU 함수 사용 sigmoid 함수를 ReLU 함수로 대체

 

 

 

 

 

+ Recent posts