반응형
[파이썬 머신러닝 실무 테크닉 100] : 데이터 통계량을 확인하자
데이터 통계량을 확인하자
- 하나로 모은 데이터를 확인한다.
- 결손값을 확인해야 한다.
- 결손값이 있다면 집계, 머신러닝에 큰 영향을 준다.
order_all.isnull().sum()
- isnull() 함수를 통해 결손값의 수를 출력한다.
- True/Flase 형태로 값을 반환한다.
- True의 수를 열마다 sum() 함수로 집계한다.
order_all.describe()
- describe() 함수를 통해 통계량을 출력합니다.
- 수치 데이터를 집계하기 때문에 데이터 타입이 수치면 모두 집계한다.
order_all['total_amount'].describe()
- 확인하고 싶은 부분만 집계하여 확인한다.
print(order_all['order_accept_date'].min())
print(order_all['order_accept_date'].max())
print(order_all['delivered_date'].min())
print(order_all['delivered_date'].max())
- 데이터 범위를 확인할 수 있다.
- 최소 값과 최대 값을 체크하면 시작, 종료일로 된다.
도서명 : 파이썬 머신러닝 실무 테크닉 100
출판사 : Jpub (제이펍)
학습 페이지 : 16 ~ 18
해당 글의 실습 예제와 코드는 파이썬 머신러닝 실무 테크닉 100 책을 참고하고 있습니다.
출판사에 허락을 받고 올리는 글 입니다.
참고
2021.12.23 - [프로그래밍언어/Python] - [Python] : [파이썬 머신러닝 실무 테크닉 100] : 머신러닝 공부를 시작한다.
반응형
'프로그래밍언어 > Python' 카테고리의 다른 글
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 마스터 데이터를 조인하자 (0) | 2021.12.25 |
---|---|
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 불필요한 데이터를 제거하자 (0) | 2021.12.24 |
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 여러 데이터를 유니온하기 (0) | 2021.12.24 |
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 폴더 안에 있는 파일을 확인하자 (0) | 2021.12.24 |
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 데이터 결합하기 (0) | 2021.12.23 |
댓글