데이터 전처리
- Data Preprocessing
- 데이터를 실제 업무에 활용하기에 앞서서 정제하는 행위
데이터 전처리 부담
- 데이터 분석가는 업무 시간 중 80%정도를 데이터 수집 및 전처리 과정에 사용[1]
유형
- 데이터 품질 향상
- 이상치 처리
- 결측치 처리
- 노이즈 제거
- 오타 처리
- 개행문자 등 특수문자 처리
- 데이터 통일
- 메타 데이터 조정: 칼럼명 통일
- 데이터 형태 조정: Data Type, Datetime Type, 원핫 인코딩
- 연계 정보 조정: 불필요 칼럼 삭제, 칼럼 추가 등
- 개인정보 보호
참고 문헌
출처: IT위키(IT위키에서 최신 문서 보기)
* 본 페이지는 공대위키에서 미러링된 페이지입니다. 일부 오류나 표현의 누락이 있을 수 있습니다. 원본 문서는 공대위키에서 확인하세요!