본문 바로가기
프로그래밍언어/Python

[Python] : [파이썬 머신러닝 실무 테크닉 100] : 데이터 로딩과 불필요한 항목 제외

by 오주현 2022. 1. 10.
반응형
[파이썬 머신러닝 실무 테크닉 100] : 데이터 로딩과 불필요한 항목 제외
  • 전에 생성한 order_data.csv파일을 사용한다.
import pandas as pd
order_data = pd.read_csv('C:/Users/ojh96/output_data/order_data.csv') 
print(len(order_data))
order_data.head()
  • order_data.csv파일을 읽어온다.
order_data = order_data.loc[(order_data['status'] == 1) | (order_data['status'] == 2)]
print(len(order_data))
order_data.columns
  • loc를 통해 status가 1이나 2인 데이터만 추출한다.
    • 1은 결제 완료, 2는 배달 완료이다.
  • loc로 여러 조건을 지정할 때는 각 조건을 ()로 감싸고 & | 연산자로 연결하면 된다.
analyze_data = order_data[[
    'store_id', 'customer_id', 'coupon_cd',
    'order_accept_date', 'delivered_date', 'total_amount',
    'store_name', 'wide_area', 'narrow_area',
    'takeout_name', 'status_name'
]]
print(analyze_data.shape)
analyze_data.head()
  • 위에 출력된 리스트에서 불필요한 몇 항목을 제외하고 analyze_data에 저장한다.
  • 애초에 필요한 항목만 이렇게 적어줄 수도 있고 항목이 많다고 하면 모두 다 저장해 주고 불필요한 항목을 삭제해 줘도 된다.
  • 전에 생성한 order_data.csv파일을 사용한다.
    import pandas as pd
    order_data = pd.read_csv('C:/Users/ojh96/output_data/order_data.csv') 
    print(len(order_data))
    order_data.head()
    
    • order_data.csv파일을 읽어온다.
    order_data = order_data.loc[(order_data['status'] == 1) | (order_data['status'] == 2)]
    print(len(order_data))
    order_data.columns
    

    • loc를 통해 status가 1이나 2인 데이터만 추출한다.
      • 1은 결제 완료, 2는 배달 완료이다.
    • loc로 여러 조건을 지정할 때는 각 조건을 ()로 감싸고 & | 연산자로 연결하면 된다.

    • 위에 출력된 리스트에서 불필요한 몇 항목을 제외하고 analyze_data에 저장한다.
    • 애초에 필요한 항목만 이렇게 적어줄 수도 있고 항목이 많다고 하면 모두 다 저장해 주고 불필요한 항목을 삭제해 줘도 된다.
  • analyze_data = order_data[[ 'store_id', 'customer_id', 'coupon_cd', 'order_accept_date', 'delivered_date', 'total_amount', 'store_name', 'wide_area', 'narrow_area', 'takeout_name', 'status_name' ]] print(analyze_data.shape) analyze_data.head()
  • 이런 식으로 order_data의 status가 1이나 2인 데이터가 속한 항목들이 출력이 된다.

도서명 : 파이썬 머신러닝 실무 테크닉 100

출판사 : Jpub (제이펍)

학습 페이지 : 

 

해당 글의 실습 예제와 코드는 파이썬 머신러닝 실무 테크닉 100 책을 참고하고 있습니다.

출판사에 허락을 받고 올리는 글 입니다.

 

참고

2021.12.23 - [프로그래밍언어/Python] - [Python] : [파이썬 머신러닝 실무 테크닉 100] : 머신러닝 공부를 시작한다.

 

반응형

댓글