데이터사이언스 #AI부트캠프 #EDA

EDA 란? (Exploratort data analysis) 존 튜키라는 통계학자가 창안한 자료 분석 방법론이다. 주어진 자료만 가지고도 충분한 정보를 찾을 수 있도록 여러가지 탐색적 자료 분석 방법을 개발. 쉽게 말하자면, 데이터를 그래프나 통계적인 방법으로 자료를 직관적으로 바라보는 과정! EDA에 가장 중요한점은 바로 직!관!성! . 한눈에 데이터 추이가 눈에 보여야 한다. 위 그래프는 아동학대에 관한 프로젝트를 진행하면서 데이터 전처리를 하기 전 인사이트를 도출하기 위해 수행했던 EDA이다. 보통 한 프로젝트에 시각화를 최소한 20개 이상을 진행해야. 목표를 제대로 정할 수 있다 생각한다. 위 프로젝트 같은 경우에는 변수(컬럼)이 80가지가 넘었다. 모델학습을 진행할때 변수를 선택하는 과정도 아..
ERE
'데이터사이언스 #AI부트캠프 #EDA' 태그의 글 목록