티스토리 뷰
뜻
: Exploratory Data Analysis
정의
: 기 수집된 data로부터 데이터의 형태, 관계 파악
명백하게 공식화된 이전의 가설을 검증하기 보다는 자료를 탐구함으로써 시작하는 통계적 분석의 형태를 의미
분석 모형은 EDA를 통해 도출된 특징을 기반으로 수행
--> regression을 도입하는지.. 등을 선택하는 전처리 과정에 속함
주요 분석내용
1) 데이터의 요약 ( 중앙값, 사분위 등 )과 그래프 ( 산포도 등 )
2) 데이터를 재표현 ( re-expression, Transformation )
3) 데이터가 어떤 분포에 적합한지 알아보는 방법
4) 통계적 가설 설정 과정 없음
활용
1) 기술통계량과 경험 ( Biz 노하우)에 따른 결론 유추
2)분석의 첫 단계
- 데이터 본포의 적합성 검증
3) 통계적 가설이나 모형 수립
'ML_DL > 용어' 카테고리의 다른 글
Gradient descent algorithm (0) | 2017.02.07 |
---|
댓글