
오늘은 저번에 진행했던 1차 프로젝트의 나머지 부분과 2차 프로젝트에 관한 내용을 이어 진행해보고자 한다.
그럼 본격적인 시각화 과정을 담아보겠다.

먼저 저번에 변환한 파일들을 확인할 시간
adidas.isnull().sum() 함수를 사용해서 결측값이 있는지 확인한다.
여기서 isnull()은 결측값을 의미, sum()은 말 그대로 더하는 것을 의미한다.
info()로 본 컬럼들의 값은 변환이 잘 되어 있음을 확인할 수 있다.

adidas 데이터프레임에서 연도(year)와 월(month)별로 Units Sold (판매된 단위)의 합계를 계산하고 이를 선 그래프로 시각화하는 과정이다. 구체적으로 보면
- adidas.groupby(['year', 'month']): adidas 데이터프레임을 year (연도)와 month (월) 칼럼을 기준으로 그룹화
- ['Units Sold'].sum(): 그룹화된 데이터에서 Units Sold (판매된 단위) 칼럼의 값을 더함
- .plot.line(): pandas의 시각화 기능을 사용하여 합계된 데이터를 선 그래프로 그림, 변화 추이를 판단하기 용이
결과를 보면 2021년부터 판매량이 급등하는 것을 알 수 있다.


구체적인 수치를 보면 2020년 12월 대비, 2021년 1월에 9배 정도 상승한 것을 알 수 있다.
그 이유를 찾아 판매점을 기준으로 피벗테이블을 작성해 보았다. 가장 눈에 띄게 보이는 건 상점 몇 개가 본격적으로 2021년부터 판매를 시작했다는 것이고 Foot Locker도 5배 이상 급증한 것을 보여준다.
이것을 통해 당시 발생한 사건이나 이슈를 찾아 결과를 도출해내고 인사이트를 발견할 수 있다.

위의 결과를 바탕으로 만든 선그래프
전체적으로 우상향하는 모습을 보여준다. 또한 많이 팔릴수록 매출액의 변동폭도 크게 보인다.
2020년 중반부에 매출이 감소하는 형태를 보이는데 이 당시 특정현상이 발생했을 것으로 추정된다.
walmart가 특이하게도 매출이 증가했다가 감소하는 형태를 보여준다.


각 판매점 브랜드의 매장코드이다. 소매브랜드 안에도 ID가 여러개 있는데 이는 여러 매장이 있다는 것을 의미한다.
점포의 수의 변동폭을 확인하기 위해 코드를 작성해보았다.
이 코드는 중복값을 제거해서 소매점의 ID를 보여준다.
월마다 소매점의 수 변화를 보여준다.
이를 통해 2021년 1월부터 14개로 많아지는 것을 볼 수 있다.

사실 많은 사람들이 기간을 보고 눈치챘겠지만 코로나로 인한 영향으로 매출데이터가 변화하였다.
2020년 감염자의 수는 정점을 찍었고 하반기로 갈수록 점점 줄어들었다. 이에 판매가 다시 증가하였고
2021년 신년을 맞아 본격적으로 판매를 재개한 듯 하다. 이렇게 데이터 분석을 통해 현상을 분석하고 결과를
도출할 수 있다.
이후 강의에는 온라인, 오프라인 중 어디가 더 이득을 봤는지, 다양한 시각화 등에 대해 다룬다.
혹시 관심있다면 한 번 들어보는 것을 추천한다.
https://mcode.co.kr/video/list2?viewMode=view&idx=115
메타코드M
빅데이터 , AI 강의 플랫폼 & IT 현직자 모임 플랫폼ㅣ메타코드 커뮤니티 일원이 되시기 바랍니다.
mcode.co.kr
'IT > 데이터분석 도전하기' 카테고리의 다른 글
| [빅데이터분석기사] 빅데이터분석기사 무료 공부 전략 (필기/실기) ver.2024 (1) | 2024.06.05 |
|---|---|
| [STABLEDIFFUSION] 메타코드M 생성형 AI 입문 완성강의_이미지 생성 (0) | 2024.06.01 |
| [데이터분석] 메타코드M 유통/이커머스 데이터분석 입문 포트폴리오 만들기_1차 프로젝트 (0) | 2024.05.16 |
| [개인 프로젝트] 고객들의 취향저격, 잘 팔리는 유니폼을 찾아보고 판매해보자_1편 검색량 확인 (0) | 2024.05.10 |
| [특강] 메타코드M 10년차 데이터분석가 서류 통과율 높이는 전략 (0) | 2024.05.09 |