본문 바로가기
프로그래밍언어/Python

[Python] : [파이썬 머신러닝 실무 테크닉 100] : 데이터 결합하기

by 오주현 2021. 12. 23.
반응형
[파이썬 머신러닝 실무 테크닉 100] : 

데이터를 유니온(결합)하자


  • 세로로 결합하는 것이 유니온(union)이다.
  • 가로로 결합하는 것은 조인(join)이다.
  • tbl_order_4와 tbl_order_5를 유니온한다.
tbl_order_5 = pd.read_csv('c:/python/chapter01/tbl_order_202105.csv')
tbl_order_5
  • tbl_order_5를 로딩한다.

order_all = pd.concat([tbl_order_4, tbl_order_5], ignore_index=True)
order_all
  • pd.concat 함수로 유니온을 수행한다.
  • ignore_index = True는 데이터 프레임마다 가지고 있는 인덱스 번호를 0부터 다시 쓰는 것을 의미한다.
    • 필요에 따라 원래 인덱스를 유지할 것인지 이렇게 새롭게 정의 할 것인지 정해주면 된다.

len(order_all) == len(tbl_order_4) + len(tbl_order_5)
  • 유니온한 건수가 맞는지 확인을 위해 비교할 수 있다.
    • True / False로 나타나게 된다. (일치 / 불일치)

 


도서명 : 파이썬 머신러닝 실무 테크닉 100

출판사 : Jpub (제이펍)

학습 페이지 : 9, 10

 

해당 글의 실습 예제와 코드는 파이썬 머신러닝 실무 테크닉 100 책을 참고하고 있습니다.

출판사에 허락을 받고 올리는 글 입니다.

 

참고

2021.12.23 - [프로그래밍언어/Python] - [Python] : [파이썬 머신러닝 실무 테크닉 100] : 머신러닝 공부를 시작한다.

 

반응형

댓글