연관토픽
기술 | 내용 |
평활화 | - 데이터의 노이즈를 제거하기 위해 추세를 벗어나는 값들을 변환 - 구간화, 군집화 등의 기법 사용 |
집계 | - 다양한 차원으로 데이터를 요약하는 기법 - 속성의 개수를 줄이거나 유사한 데이터 객체를 줄이는 방법 - 함수를 이용해 일괄적으로 새로운 변수로 값을 생성하는 방법 |
일반화 | - 특정 구간에 분포하는 값으로 스케일을 변화시키는 기법 - 데이터가 범용적인 설명력을 가지도록 적합한 모델을 만드는 기법 |
정규화 | - 데이터를 정해진 구간 안에 들어가도록 이상값을 변환하는 기법 - 최소-최대 정규화, Z-스코어 정규화, 소수 스케일링 등 통계 기법 사용 |
속성생성 | - 새로운 속성 값을 생성하는 기법 - 주어진 여러 데이터 분포를 대표할 수 있는 새로운 속성을 활용 |