- EDA는 해당 데이터를 가감없이 분석하여, 비즈니스 인사이트를 찾아내는 과정을 말합니다.
- 우리는 어떤 기업의(e.g. Shinhan Bank, TOSS, Naver, Fastcampus, …) 데이터 분석가가 되어 실무 데이터를 가지고 어떤 인사이트를 찾아낼 수 있을지 고민해봅니다.
- 간단하게 예를 들어보면, Spotify 데이터를 이용하여 2023년에 가장 핫한 음악 트렌드를 정리하여 마케터에게 전달해줄 수 있습니다.
- 패스트캠퍼스 구매내역 데이터가 있다면, 어떤 사람들이 강의를 많이 구매하는지, 어떤 제목을 가진 강의들이 인기가 많은지 정리하여 내년도 기획안에 의사결정에 도움이 될 수 있습니다.
- 분석해보고 싶은 분야를 정하고, 해당 데이터셋을 선정하고 문제 정의를 하는 것부터 시작하여, 실제 파이썬 코드로 EDA를 직접 수행하는 과정을 진행해보겠습니다.
- 아래 데이터들은 EDA에서 고민해볼 주제와 그에 해당하는 예시 데이터셋입니다. 해당 데이터를 사용해도 되고, 다른 데이터를 크롤링하거나 찾아서 사용해도 됩니다.
- Media - Spotify
Spotify Dataset 2023
- SNS - Tweets
Tweets and User Engagement
- Finance - Airbnb
Get the Data
- Public - US Accidents
US Accidents (2016 - 2023)
- Medical - Depression
The Depression Dataset
- Psychology - MBTI
(MBTI) Myers-Briggs Personality Type Dataset
- 자유주제 - 직접 관심있는 주제를 선정하고 어떤 방식의 분석을 수행할지 얘기해봅니다.