본문 바로가기
반응형

프로그래밍언어/R24

[R] : 변수명 바꾸기 변수명 바꾸기 변수명을 바꿔야 할 때가 있는데 이럴 때는 colnames()함수로 이름을 바꿔주자 파일을 불러온다. DF 2022. 4. 19.
[R] : 조건으로 변수 선택하기 조건으로 변수 선택하기 데이터프레임에서 키가 170보다 큰 사람을 선택할 수 있다. subset() 함수를 사용한다. 예제 파일을 불러온다. DF 170)) 아래와 같이 하면 키가 180이상인 사람의 이름과 키만 볼 수도 있다. select 인자를 이용하면 관측치의 원하는 변수만 볼 수 있다. subset(DF, select=c(name,height),subset=(height>180)) 특정 변수만 뺴고 보기 subset(DF, select=-height) 여러 개도 가능하다. subset(DF, select=c(-height, -weight)) https://ohju96.notion.site/b9457ab1a1d648f691dd2a3a93a572f1 조건으로 변수 선택하기 조건으로 변수 선택하기 oh.. 2022. 4. 19.
[R] : 쉽게 변수 선택하기 쉽게 변수 선택하기 매번 DF$height 이렇게 변수를 선택할 때 마다 귀찮다. R에는 검색 목록이 있는데 여기에 등록하면 height 변수로 바로 접근이 가능하다. 데이터 파일을 불러온다. DF 2022. 4. 19.
[R] : 여러 개 변수를 선택한다. 여러 개 변수를 선택한다. 예제 파일을 불러온다. DF 2022. 4. 19.
[R] : 외부 데이터 가져오기와 변수 선택하기를 진행한다. 외부 데이터 가져오기와 변수 선택하기를 진행한다. 데이터 파일을 먼저 불러온다. DF 2022. 4. 19.
[R] : 여러 개의 벡터를 만들어 데이터프레임을 만든다. dataframe를 사용한다. 여러 개의 벡터를 만들어 데이터프레임을 만든다. 벡터를 만들어 준다. a1 2022. 4. 19.
[R] : 여러 종류 벡터 만들기 여러 종류 벡터 만들기 벡터 만들기 a1 2022. 4. 19.
[R] : 표로 데이터 정리하기 집합자료와 데이터의 종류에 대해 공부한다. 이산형 데이터, 연속형 데이터, 명목형 데이터, 순서형 데이터의 예시이다. 자세한 내용은 Notion을 참고한다. https://ohju96.notion.site/341f2a49b665476c8023854384e47a11 표로 데이터 정리하기 위와 같은 테이블을 집합자료라고 부른다. ohju96.notion.site 2022. 4. 19.
[R] : R에서 외부 데이터 읽기 CSV 포맷 읽어들이기 List 2022. 4. 19.
[R] : 함수와 객체 Hello World 출력 print("Hello World") R은 계산기이다. 1+2+3+4+5 factorial() 함수 사용해보기 factorial(9) 두 개의 인자가 필요한 함수 rep()는 어떤 값을 몇 번 반복해 벡터 타입의 시퀸스로 반환시키라는 의미이다. rep(x="배고파", times=5) R로 x,y 좌표에 점을 찍어보자. plot(10, 10) 두 개의 점을 찍을 수도 있다. plot(c(5,7), c(20,30)) runif()함수는 랜덤 숫자를 반환한다. plot(runif(100), funif(100)) R은 변수란 말 대신 객체란 단어를 사용한다. Object1과 Object2 객체를 만들고 1과 2를 넣는다. 객체의 값을 입력할 때 2022. 4. 19.
[R] : 고수준 그래프 함수 고수준 그래프 함수 DF 2022. 4. 6.
[R] : 기술 통계 값 구하기 library("data.table") DF 2022. 3. 23.
[R] : 데이터 프레임 다루기(4) DF 2022. 3. 23.
[R] : 데이터 개념 이해하기(3) 데이터 개념 이해하기(3) 전국 커피숍 폐업/영업 상황을 살펴본다. install.packages("data.table") library("data.table") library("ggplot2") 필요한 패키지를 불러온다. DF 2022. 3. 14.
[R] : 데이터 개념 이해하기(2) 대장암 환자 자료를 분석해 본다. 건강보험심사평가원에서 공개한 보건의료빅데이터개방시스템을 활용한다. DF 2022. 3. 14.
[R] : 데이터 개념 이해하기(1) 데이터 개념 이해하기(1) 20만건 관측치가 넘는 데이터셋의 명목형 변수 도수분포표를 만들어 본다. install.packages("hflights") 먼저 데이터셋 패키지를 불러온다. library("hflights") 패키지를 불러온다. head(hflights,5) 데이터를 살펴본다. str(hflights) 객체가 data.frame이고 관측치는 22만건 변수는 21이다. CountOfDest 2022. 3. 14.
[R] : 데이터 프레임 다루기(3) 데이터 프레임 다루기(3) DF 2022. 3. 14.
[R] : 데이터 프레임 다루기(2) DF 2022. 3. 14.
[R] : 데이터 프레임 다루기(1) 데이터프레임 다루기 벡터 R의 최소 데이터 단위이다. 여러 개의 벡터가 모여 하나의 데이터 프레임을 이루게 된다. R에서의 4가지 벡터 character : 문자열을 나타낸다. factor : 순서형 변수와 명목형 변수를 모두 나타낸다. 카테고리형 변수를 표현하는 데이터 타입이다. integer : 정수 값을 표현하는 데이터 타입이다. 이산형 변수에서 사용한다. numeric : 연속형 변수는 이 numeric 타입을 사용하는 것을 권장하고, 실수까지 표현이 가능한 데이터 타입이다. 벡터 만들기 a1 2022. 3. 11.
[R] : 표로 데이터 정리하기 위와 같은 자료를 [ 집합자료 ] 라고 부른다. 한 개 값을 지칭할 때 기준에 따라 변수값 혹은 관측값이라고 부른다. 데이터의 종류는 숫자인지 아닌지에 따라 범주형, 수치형으로 나뉜다. 변수 범주형 변수 명목형 변수 숫자가 아닌, 문자로 나타내지는 변수 값 예 ) 남, 여 순서형 변수 명목형과 비슷하지만 순서가 있다. 예) 학점 [ A+, A-, B+, B- ...] 수치형 변수 이산형 변수 셀 수 있고 정수로 사용된다. 연속형과 구분되어야 하기 때문에 서로 독립적이고 이어져 있지 않다. 예) 1명, 2명 연속형 변수 변수 값이 연속적인 수치 예) 10 ~ 20 도수분포표 : 측정 값을 카운트해 정리하는 표(명목형) 상대도수분포표 : 변수 값이 변수 값에서 어떤 비중을 차지하는지 나타내는 것을 상대도수라.. 2022. 3. 11.
[R] : R에서 외부 데이터 읽어 들이는 다양한 방법 CSV 포맷 읽어들이기 R이 있는 파일의 루트 파일에 예제 파일을 넣는다. read.csv()로 경로를 입력하여 파일을 불러올 수 있다. 즉, 외부에서 테이블로 정리한 데이터를 R로 가져오면 dataframe 객체에 담긴다. read.csv() 함수는 첫 번째 행을 변수행의 이름으로 인식하도록 기본 값이 설정되어 있다. 만약 csv 파일에 변수행의 이름이 없다면 read.csv() 함수의 header 인자를 FALSE로 설정해 주어야 한다. txt 포맷을 다양한 방법으로 읽어들이기 List 2022. 3. 2.
반응형