본문 바로가기
반응형

파이썬머신러닝실무테크닉10012

[Python] : [파이썬 머신러닝 실무 테크닉 100] : 데이터 전체 파악하기 [파이썬 머신러닝 실무 테크닉 100] : 데이터 전체 파악하기 analyze_data.describe() describe()는 수치 타입 항목을 집계해 준다. alyze_data.dtypes 데이터 타입을 조회해 보면 describe()로 조회된 항목은 int64 타입인 것을 확인할 수 있다. analyze_data[['store_id', 'coupon_cd']] = analyze_data[['store_id', 'coupon_cd']].astype(str) analyze_data.dtypes 데이터 타입을 변경해 줄 수도 있다. .astype(str)을 지정해 문자열 타입으로 변경한다. analyze_data.describe() describe()는 수치 타입 항목을 집계해 준다. alyze_data.. 2022. 1. 10.
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 데이터 로딩과 불필요한 항목 제외 [파이썬 머신러닝 실무 테크닉 100] : 데이터 로딩과 불필요한 항목 제외 전에 생성한 order_data.csv파일을 사용한다. import pandas as pd order_data = pd.read_csv('C:/Users/ojh96/output_data/order_data.csv') print(len(order_data)) order_data.head() order_data.csv파일을 읽어온다. order_data = order_data.loc[(order_data['status'] == 1) | (order_data['status'] == 2)] print(len(order_data)) order_data.columns loc를 통해 status가 1이나 2인 데이터만 추출한다. 1은 결제 .. 2022. 1. 10.
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 분석 기초 테이블을 파일에 저장하자. [파이썬 머신러닝 실무 테크닉 100] : 분석 기초 테이블을 파일에 저장하자. 분석 기초 테이블을 파일에 저장하자. 가공한 데이터를 파일에 저장한다. output_dir = os.path.join(current_dir, 'output_data') os.makedirs(output_dir, exist_ok=True) os의 path.join()로 조인한다. os의 makedirs()를 통해 폴더를 만들어준다. 폴더가 존재하면 에러가 발생 exist_ok=True 설정으로 방지 가능 output_file = os.path.join(output_dir, 'order_data.csv') order_data.to_csv(output_file, index=False) os의 path.join()로 조인한다. in.. 2021. 12. 29.
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 마스터가 존재하지 않는 코드에 이름을 설정하자 [파이썬 머신러닝 실무 테크닉 100] : 마스터가 존재하지 않는 코드에 이름을 설정하자 마스터가 존재하지 않는 코드에 이름을 설정하자 마스터가 제공되지 않아 값은 볼 수 있지만 무엇을 의미하는지 알 수 없다. order_data.loc[order_data['takeout_flag'] == 0, 'takeout_name'] = 'delivery' order_data.loc[order_data['takeout_flag'] == 1, 'takeout_name'] = 'takeout' order_data takeout_flag가 0이면 delivery, 1이면 takeout으로 takeout_name에 설정한다. order_data.loc[order_data['status'] == 0, 'status_name.. 2021. 12. 28.
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 마스터 데이터를 조인하자 [파이썬 머신러닝 실무 테크닉 100] : 마스터 데이터를 조인하자 마스터 데이터를 조인하자 마스터 데이터를 가로로 결합한다. order_data = pd.merge(order_data, m_store, on = 'store_id', how = 'left') order_data order_data와 m_store를 조인한다. on = 으로 공통 열을 지정해 가로로 결합한다. how = ‘left’를 통해 좌측에 있는 order_data 메인으로 지정한다. order_data = pd.merge(order_data, m_area, on = 'area_cd', how = 'left') order_data 클론한 뒤 조인을 해준다. 데이터 조인을 할 떄는 순서와 키를 사전에 확인해야 한다. 도서명 : 파이썬 .. 2021. 12. 28.
[독서 및 서평] : 파이썬 머신러닝 실무 테크닉 100 파이썬 머신러닝 실무 테크닉 100 https://book.naver.com/bookdb/book_detail.nhn?bid=21347076 파이썬 머신러닝 실무 테크닉 100 100개의 실전 예제를 풀며 익히는 머신러닝 & 데이터 활용법이것이 현장에서 활용할 수 있는 데이터 활용술!우리가 사는 세상은 그야말로 데이터로 가득한 세상입니다. 주위를 보면 데이터가 아 book.naver.com 목적 한이음 공모전 때 부족했던 머신러닝 경험을 공부한다. Python을 조금 더 잘 다룰 수 있게 한다. 실전 실무에서 사용한다고 하는데 간접적으로 실무 경험을 한다. 책을 선물 받은 커뮤니티 사이트에 책 리뷰를 남겨 책에 대한 정보를 찾고자 하는 사람들에게 도움을 준다. 기본은 학습을 하고 뒷 부분은 필요한 부분에.. 2021. 12. 26.
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 마스터가 존재하지 않는 코드에 이름을 설정하자 [파이썬 머신러닝 실무 테크닉 100] : 마스터가 존재하지 않는 코드에 이름을 설정하자 마스터가 존재하지 않는 코드에 이름을 설정하자 마스터가 없어 값을 볼 수 없는 값이 있다. order_data.loc[order_data['takeout_flag'] == 0, 'takeout_name'] = 'delivery' order_data.loc[order_data['takeout_flag'] == 1, 'takeout_name'] = 'takeout' order_data takeout_flag의 경우에 따른 이름을 설정한다. 0인 상황일 시 delivery 1인 상황일 시 takeout order_data.loc[order_data['status'] == 0, 'status_name'] = '주문 접수' .. 2021. 12. 25.
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 마스터 데이터를 조인하자 [파이썬 머신러닝 실무 테크닉 100] : 마스터 데이터를 조인하자 마스터 데이터를 조인하자 데이터를 가로로 결합한다. 조인을 하면 데이터가 연결되므로 분석이 더 쉬워진다. order_data = pd.merge(order_data, m_store, on = 'store_id', how = 'left') order_data 두 데이터를 조인한다. on = 을 통해 연결할 값을 가로로 결합할 수 있다. how = 를 통해 두 데이터 중 어느 데이터를 주죽으로 할 것인지 결정한다. order_data = pd.merge(order_data, m_area, on='area_cd', how='left') order_data 도서명 : 파이썬 머신러닝 실무 테크닉 100 출판사 : Jpub (제이펍) 학습 페이지.. 2021. 12. 25.
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 불필요한 데이터를 제거하자 [파이썬 머신러닝 실무 테크닉 100] : 불필요한 데이터를 제거하자 order_data = order_all.loc[order_all['store_id'] != 999] order_data 필요하지 않은 정보를 제거한다. 도서명 : 파이썬 머신러닝 실무 테크닉 100 출판사 : Jpub (제이펍) 학습 페이지 : 18, 19 해당 글의 실습 예제와 코드는 파이썬 머신러닝 실무 테크닉 100 책을 참고하고 있습니다. 출판사에 허락을 받고 올리는 글 입니다. 참고 2021.12.23 - [프로그래밍언어/Python] - [Python] : [파이썬 머신러닝 실무 테크닉 100] : 머신러닝 공부를 시작한다. 2021. 12. 24.
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 데이터 통계량을 확인하자 [파이썬 머신러닝 실무 테크닉 100] : 데이터 통계량을 확인하자 데이터 통계량을 확인하자 하나로 모은 데이터를 확인한다. 결손값을 확인해야 한다. 결손값이 있다면 집계, 머신러닝에 큰 영향을 준다. order_all.isnull().sum() isnull() 함수를 통해 결손값의 수를 출력한다. True/Flase 형태로 값을 반환한다. True의 수를 열마다 sum() 함수로 집계한다. order_all.describe() describe() 함수를 통해 통계량을 출력합니다. 수치 데이터를 집계하기 때문에 데이터 타입이 수치면 모두 집계한다. order_all['total_amount'].describe() 확인하고 싶은 부분만 집계하여 확인한다. print(order_all['order_accep.. 2021. 12. 24.
[Python] : [파이썬 머신러닝 실무 테크닉 100] : 폴더 안에 있는 파일을 확인하자 [파이썬 머신러닝 실무 테크닉 100] : 폴더 안에 있는 파일을 확인하자 폴더와 내용을 확인한다. import os current_dir = os.getcwd() current_dir os 라이브러리를 임포트 한다. as를 통해 별칭을 부여할 수도 있지만 라이브러리 명 자체가 길지 않으니 따로 붙이진 않는다. getcwd() 함수를 통해 현재 디렉터리를 얻는다. os.listdir(current_dir) os.listdir()을 통해 현재 디렉터리 아래의 모든 폴더 이름과 파일 이름을 리스트로 저장한다. tbl_order_file = os.path.join(current_dir, 'c:/python/chapter01/tbl_order_*.csv') tbl_order_file os.path.join()을.. 2021. 12. 24.
[TIL] : 56 일일 배움을 위한 Today I Learned ! 알고리즘 자바로 어려웠던 소수 구하기를 파이썬으로 간단하게 해냈다. 에라토스테네스의 체를 사용하여 소수 구하기를 할 수 있다. 2021.12.21 - [Algorithm/파이썬 알고리즘 문제풀이 (코딩테스트대비)] - [파이썬 알고리즘 문제풀이] : 소수 구하기 (에라토스테네스의 체) 회고 드디어 21년 진행한 마지막 프로젝트 회고를 마쳤다. 정리하면서 쓰지 않고 바로 끊임없이 쓰려고 했다. 딱 그 과거의 장면을 떠올릴 때 느끼는 그 느낌을 경험에 싣고 싶었다. 오늘 커뮤니티 두 곳에 회고를 올렸는데 500분 넘게 봐주셨다. 그 중 누군가에게 도움이 된 회고가 되었다면 만족한다. 2021.12.21 - [회고] - [회고] : 파스타 공모전 회고 커뮤니티.. 2021. 12. 21.
반응형