반응형
Pandas, 판다스 기초
import pandas as pd
import numpy as np
임포트 해 줍니다.
명령어를 입력하고 Shift + Enter를 눌러주면 실행이 됩니다.
s = pd.Series([1,3,5,np.nan,6,8])
s
pandas의 데이터 유형 중 기초가 되는 것이 Series입니다.
파이썬의 LIST 데이터도 사용이 가능합니다.
중간에 nan은 Not A Number입니다.
dates = pd.date_range('20130101', periods=6)
dates
날짜형 데이터인 date_range를 통해 기본 날짜를 지정하고 period 옵션을 통해 6일간이라고 지정해 줍니다.
df = pd.DataFrame(np.random.randn(6,4), index=dates,
columns=['A','B','C','D'])
df
DataFrame 유형의 데이터를 만들 수 있습니다.
random 변수를 만들고 np.random.randn: 표준 정규 분포에서 난수 matrix array를 생성합니다.
컬럼에는 columns=['A','B','C','D']로 지정하고 index 명령으로 앞에서 만든 날짜형 데이터인 dates를 index 옵션으로 지정해 줍니다.
df.head(3)
head() 명령어는 기본적으로 첫 5행을 보여줍니다.
괄호에 숫자를 넣으면 그 숫자만큼의 행을 볼 수 있습니다.
반응형
'프로그래밍언어 > Python' 카테고리의 다른 글
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 머신러닝 공부를 시작한다. (0) | 2021.12.23 |
---|---|
[Python] : Jupyter Notebook을 활용한 데이터 분석 (0) | 2021.11.24 |
[Python] : Jupyter notebook, 주피터 노트북 설치 (0) | 2021.11.24 |
[Python] : Anaconda, 아나콘다 설치 (0) | 2021.11.24 |
[Python] : 동적 웹 페이지 크롤링 (1) | 2021.11.17 |
댓글