반응형
위와 같은 자료를 [ 집합자료 ] 라고 부른다.
한 개 값을 지칭할 때 기준에 따라 변수값 혹은 관측값이라고 부른다.
데이터의 종류는 숫자인지 아닌지에 따라 범주형, 수치형으로 나뉜다.
- 변수
- 범주형 변수
- 명목형 변수
- 숫자가 아닌, 문자로 나타내지는 변수 값
- 예 ) 남, 여
- 순서형 변수
- 명목형과 비슷하지만 순서가 있다.
- 예) 학점 [ A+, A-, B+, B- ...]
- 명목형 변수
- 수치형 변수
- 이산형 변수
- 셀 수 있고 정수로 사용된다. 연속형과 구분되어야 하기 때문에 서로 독립적이고 이어져 있지 않다.
- 예) 1명, 2명
- 연속형 변수
- 변수 값이 연속적인 수치
- 예) 10 ~ 20
- 이산형 변수
- 범주형 변수
도수분포표 : 측정 값을 카운트해 정리하는 표(명목형)
상대도수분포표 : 변수 값이 변수 값에서 어떤 비중을 차지하는지 나타내는 것을 상대도수라고 한다.(명목형)
도수분포표 : 연속형 변수인 경우 구간(계급이라고 부른다.)을 정해 그 구간 안에 속한 점수를 세어 개수를 표시한다.(연속형)
누적상대도수 : 상대도수를 더해가며 누적된 값을 나타낸다.
분할표 : 비율을 확인할 수 있는 표, 다른 방법은 전체에서 어떤 값이 어떤 비율을 차지하는지 알아보는 것, 분할표는 목적에 따라 상대비율의 기준을 정해 사용할 수 있다.
반응형
'프로그래밍언어 > R' 카테고리의 다른 글
[R] : 데이터 프레임 다루기(2) (0) | 2022.03.14 |
---|---|
[R] : 데이터 프레임 다루기(1) (0) | 2022.03.11 |
[R] : R에서 외부 데이터 읽어 들이는 다양한 방법 (0) | 2022.03.02 |
[R] : 패키지, Package (0) | 2022.03.02 |
[R] : 함수와 객체 이해하기 (0) | 2022.03.02 |
댓글