본문 바로가기
프로그래밍언어/R

[R] : 데이터 프레임 다루기(4)

by 오주현 2022. 3. 23.
반응형
DF <- read.csv("c:/r/example_studentlist.csv")
DF

명목형 변수로 도수분포표를 만들기 위해 데이터를 불러온다.

 

Freq <- table(DF$bloodtype)
Freq

혈액형을 나타내는 변수의 빈도수를 구한다. table() 함수를 통해 명목형 변수의 항목의 개수를 셀 수 있다.

 

ReleativeFreq <- prop.table(Freq)
ReleativeFreq

Table<- rbind(Freq, ReleativeFreq)
Table

상대 도수로 구하고 행을 붙인다. prop.table() 함수는 상대도수를 구하는 함수이다. 상대 도수를 구하고 Freq 객체에 rbind를 통해 상대도수를 행으로 붙인다.

 

Table <- addmargins(Table, margin=2)
Table

addmargins(테이블객체, margin=합구하는방식)

margin은 생략하면 행,열의 합을 모두 구하고, 1을 넣으면 열의 합만, 2를 넣으면 행의 합만 구한다.

 


R에서 연속형 변수를 도수분포표로 만들어 본다.

DF <- read("c:/r/example_studentlist.csv")
DF

데이터를 불러온다.

 

FactorOfHeight <- cut(DF$height, breaks=4)
FactorOfHeight

4구간으로 나누어준다.

cut(나눌 변수, breaks=나누고 싶은 구간의 계수, labels=나눈 구간의 이름)

(1, 11] 은 1은 포함하지 않고 11은 포함하라는 뜻으로 () 는 포함하지 않는다이고, [] 은 포함한다 이다.

 

FreqOfHeight <- table(FactorOfHeight)
FreqOfHeight

빈도수(도수)를 구한다.

 

FreqOfHeight <- rbind(FreqOfHeight,prop.table(FreqOfHeight))
FreqOfHeight

상대 도수를 구한다.

 

rownames(FreqOfHeight) [2] <- "RelativeFreq"
FreqOfHeight

이름 바꾸기

 

CumuFreq <- cumsum(FreqOfHeight[2,])
CumuFreq

FreqOfHeight <- rbind(FreqOfHeight, CumuFreq)
FreqOfHeight

누적상대도수를 구한다.

 

rownames(FreqOfHeight) <- c("도수", "상대도수", "누적도수")
FreqOfHeight

 

이름을 바꾼다.

FreqOfHeight <- addmargins(FreqOfHeight, margin=2)
FreqOfHeight

합을 구한다.

 


반응형

댓글