
이번 달에 데이터분석 강의가 하나 런칭했는데 관심있는 주제여서 신청하게 됐다.
개인적으로 이쪽분야에 관심이 많은데 딱 맞는 주제라 앞으로 분석을 진행할 때 진행방향에 있어 도움이 많이 될 것 같다.
또한 유통과 이커머스 분야는 친숙한 주제라 학습하기도 쉬운 느낌..!
그러면 강의 리뷰를 시작해보겠다.

먼저 강의목차소개부터 진행
저번에 데이터분석가가 되는 방법을 알려준 JAKE님이 강의를 진행하신다.
비전공자도 듣기 쉽고 톤이 좋으신 강사님이라 개인적으로 선호하는 강사님이기도 하다.
프로젝트는 총 4차례로 진행되며 본 리뷰에서는 1차 프로젝트에 대한 내용을 다루겠다.

현재 한국의 유통업은 이마트, 롯데마트, 쿠팡 이렇게 3가지 기업이 3강을 이루고 있다.
여기서 리테일은 소매라고도 하며 상품이나 서비스를 최종 소비자에게 직접 판매하는 활동이며 대량으로 상품을 구매하는 도매와 대비되는 개념이다.
리테일의 유형에는 오프라인 매장 리테일과 온라인 리테일이 있다.
오프라인 매장 리테일: 전통적인 매장, 백화점, 전문점 등에서 이루어지는 소매 활동
온라인 리테일: 인터넷을 통해 상품이나 서비스를 판매하는 전자상거래

본 1차 프로젝트에 사용되는 자료는 Adidas 미국 판매데이터이다.
kaggle에서 받을 수 있으며 총 13개의 컬럼값으로 구성되어 있다.
가게이름, 가격, 판매방법 등 친숙한 개념들로 이루어진 데이터 셋이라 분석을 진행하기 용이하다.
진행은 COLAB으로 진행하니 구글계정으로 환경세팅을 미리 해놓아야 한다.

Retailer: 소매점
Retailer ID: 소매점 코드
Invoice Date: 주문날짜
Region: 지역
State: 주
City: 도시
Product: 제품
Price per Unit: 각 가격
Units Sold: 판매가
Total Sales: 전체 판매량
Operating Profit: 이익
Operating Margin: 마진
Sales Method: 판매방법



본 데이터를 전처리하면서 가장 먼저 해야되는 건 문자를 숫자로, 숫자를 문자로 변환하는 과정이다.
예를 들어 $50,000면 특수문자가 들어가 있기에 전부 제거해주고 숫자로 바꿔주어야 한다.
위의 코드를 보면 [%$,]을 ' '으로 변환하는 것을 볼 수 있는데 특수문자를 공백으로 만드는 것이다.
또한 regex=True는 정규식을 따르는 것을 의미한다.
숫자를 문자로 바꾸는 것은 따로 제거과정이 없으니 좀 더 간단히 진행할 수 있다.
다음 포스팅에선 본격적인 분석에 들어가 보겠다. 오늘도 화이팅
'IT > 데이터분석 도전하기' 카테고리의 다른 글
| [STABLEDIFFUSION] 메타코드M 생성형 AI 입문 완성강의_이미지 생성 (0) | 2024.06.01 |
|---|---|
| [데이터분석] 메타코드M 유통/이커머스 데이터분석 입문 포트폴리오 만들기_2차 프로젝트 (0) | 2024.05.26 |
| [개인 프로젝트] 고객들의 취향저격, 잘 팔리는 유니폼을 찾아보고 판매해보자_1편 검색량 확인 (0) | 2024.05.10 |
| [특강] 메타코드M 10년차 데이터분석가 서류 통과율 높이는 전략 (0) | 2024.05.09 |
| [데이터분석] 메타코드M SQL과 Python 연결해서 데이터분석 해보기 (0) | 2024.05.09 |