본문 바로가기
프로그래밍언어/R

[R] : 표로 데이터 정리하기

by 오주현 2022. 3. 11.
반응형

위와 같은 자료를 [ 집합자료 ] 라고 부른다.

한 개 값을 지칭할 때 기준에 따라 변수값 혹은 관측값이라고 부른다.

데이터의 종류는 숫자인지 아닌지에 따라 범주형, 수치형으로 나뉜다.

  • 변수
    • 범주형 변수
      • 명목형 변수
        • 숫자가 아닌, 문자로 나타내지는 변수 값
        • 예 ) 남, 여
      • 순서형 변수
        • 명목형과 비슷하지만 순서가 있다.
        • 예) 학점 [ A+, A-, B+, B- ...]
    • 수치형 변수
      • 이산형 변수
        • 셀 수 있고 정수로 사용된다. 연속형과 구분되어야 하기 때문에 서로 독립적이고 이어져 있지 않다.
        • 예) 1명, 2명
      • 연속형 변수
        • 변수 값이 연속적인 수치
        • 예) 10 ~ 20

도수분포표 : 측정 값을 카운트해 정리하는 표(명목형)

상대도수분포표 : 변수 값이 변수 값에서 어떤 비중을 차지하는지 나타내는 것을 상대도수라고 한다.(명목형)

 

도수분포표 : 연속형 변수인 경우 구간(계급이라고 부른다.)을 정해 그 구간 안에 속한 점수를 세어 개수를 표시한다.(연속형)

누적상대도수 : 상대도수를 더해가며 누적된 값을 나타낸다.

 

분할표 : 비율을 확인할 수 있는 표, 다른 방법은 전체에서 어떤 값이 어떤 비율을 차지하는지 알아보는 것, 분할표는 목적에 따라 상대비율의 기준을 정해 사용할 수 있다.

반응형

댓글