반응형
[파이썬 머신러닝 실무 테크닉 100] : 데이터 로딩과 불필요한 항목 제외
- 전에 생성한 order_data.csv파일을 사용한다.
import pandas as pd
order_data = pd.read_csv('C:/Users/ojh96/output_data/order_data.csv')
print(len(order_data))
order_data.head()
- order_data.csv파일을 읽어온다.
order_data = order_data.loc[(order_data['status'] == 1) | (order_data['status'] == 2)]
print(len(order_data))
order_data.columns
- loc를 통해 status가 1이나 2인 데이터만 추출한다.
- 1은 결제 완료, 2는 배달 완료이다.
- loc로 여러 조건을 지정할 때는 각 조건을 ()로 감싸고 & | 연산자로 연결하면 된다.
analyze_data = order_data[[
'store_id', 'customer_id', 'coupon_cd',
'order_accept_date', 'delivered_date', 'total_amount',
'store_name', 'wide_area', 'narrow_area',
'takeout_name', 'status_name'
]]
print(analyze_data.shape)
analyze_data.head()
- 위에 출력된 리스트에서 불필요한 몇 항목을 제외하고 analyze_data에 저장한다.
- 애초에 필요한 항목만 이렇게 적어줄 수도 있고 항목이 많다고 하면 모두 다 저장해 주고 불필요한 항목을 삭제해 줘도 된다.
- 전에 생성한 order_data.csv파일을 사용한다.
import pandas as pd order_data = pd.read_csv('C:/Users/ojh96/output_data/order_data.csv') print(len(order_data)) order_data.head()
- order_data.csv파일을 읽어온다.
order_data = order_data.loc[(order_data['status'] == 1) | (order_data['status'] == 2)] print(len(order_data)) order_data.columns
- loc를 통해 status가 1이나 2인 데이터만 추출한다.
- 1은 결제 완료, 2는 배달 완료이다.
- loc로 여러 조건을 지정할 때는 각 조건을 ()로 감싸고 & | 연산자로 연결하면 된다.
- 위에 출력된 리스트에서 불필요한 몇 항목을 제외하고 analyze_data에 저장한다.
- 애초에 필요한 항목만 이렇게 적어줄 수도 있고 항목이 많다고 하면 모두 다 저장해 주고 불필요한 항목을 삭제해 줘도 된다.
- analyze_data = order_data[[ 'store_id', 'customer_id', 'coupon_cd', 'order_accept_date', 'delivered_date', 'total_amount', 'store_name', 'wide_area', 'narrow_area', 'takeout_name', 'status_name' ]] print(analyze_data.shape) analyze_data.head()
- 이런 식으로 order_data의 status가 1이나 2인 데이터가 속한 항목들이 출력이 된다.
도서명 : 파이썬 머신러닝 실무 테크닉 100
출판사 : Jpub (제이펍)
학습 페이지 :
해당 글의 실습 예제와 코드는 파이썬 머신러닝 실무 테크닉 100 책을 참고하고 있습니다.
출판사에 허락을 받고 올리는 글 입니다.
참고
2021.12.23 - [프로그래밍언어/Python] - [Python] : [파이썬 머신러닝 실무 테크닉 100] : 머신러닝 공부를 시작한다.
반응형
'프로그래밍언어 > Python' 카테고리의 다른 글
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 데이터 전체 파악하기 (0) | 2022.01.10 |
---|---|
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 분석 기초 테이블을 파일에 저장하자. (0) | 2021.12.29 |
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 마스터가 존재하지 않는 코드에 이름을 설정하자 (0) | 2021.12.28 |
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 마스터 데이터를 조인하자 (0) | 2021.12.28 |
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 마스터가 존재하지 않는 코드에 이름을 설정하자 (0) | 2021.12.25 |
댓글