본문 바로가기
프로그래밍언어/Python

[Python] : [파이썬 머신러닝 실무 테크닉 100] : 데이터 통계량을 확인하자

by 오주현 2021. 12. 24.
반응형
[파이썬 머신러닝 실무 테크닉 100] : 데이터 통계량을 확인하자

데이터 통계량을 확인하자


  • 하나로 모은 데이터를 확인한다.
  • 결손값을 확인해야 한다.
    • 결손값이 있다면 집계, 머신러닝에 큰 영향을 준다.
order_all.isnull().sum()
  • isnull() 함수를 통해 결손값의 수를 출력한다.
    • True/Flase 형태로 값을 반환한다.
  • True의 수를 열마다 sum() 함수로 집계한다.
order_all.describe()
  • describe() 함수를 통해 통계량을 출력합니다.
    • 수치 데이터를 집계하기 때문에 데이터 타입이 수치면 모두 집계한다.
order_all['total_amount'].describe()
  • 확인하고 싶은 부분만 집계하여 확인한다.
print(order_all['order_accept_date'].min())
print(order_all['order_accept_date'].max())
print(order_all['delivered_date'].min())
print(order_all['delivered_date'].max())
  • 데이터 범위를 확인할 수 있다.
    • 최소 값과 최대 값을 체크하면 시작, 종료일로 된다.

 


도서명 : 파이썬 머신러닝 실무 테크닉 100

출판사 : Jpub (제이펍)

학습 페이지 : 16 ~ 18

 

해당 글의 실습 예제와 코드는 파이썬 머신러닝 실무 테크닉 100 책을 참고하고 있습니다.

출판사에 허락을 받고 올리는 글 입니다.

 

참고

2021.12.23 - [프로그래밍언어/Python] - [Python] : [파이썬 머신러닝 실무 테크닉 100] : 머신러닝 공부를 시작한다.

 

반응형

댓글