명목형, 서열형, 간격형, 비율형

변수(variable)란 연구에서 측정하는 대상의 특성을 의미합니다. 변수는 명목형(Nominal), 순서형(Ordinal), 간격형(Interval), 비율형(Ratio) 네 가지로 나뉩니다. 각 변수는 데이터의 속성과 분석 방법에 따라 다르게 사용됩니다.

  • 명목형순서형범주형 자료(Cateogirlcal data) 라고 하고 ,
  • 간격형비율형양적 자료 (Numerical data) 라고 합니다.

명목형 변수 (Nominal Variable)

오직 분류의 역할

명목형 변수는 숫자로 표현할 수 있지만, 순서나 크기의 개념이 없는 변수입니다. 즉, 단순한 분류(Category) 역할을 하며, 평균이나 크기를 비교할 수 없습니다.

정의

서로 다른 범주(Category)로만 구분되며, 순서나 크기의 개념이 없음.

예시

성별: 남성, 여성
혈액형: A형, B형, O형, AB형
질병 유무: 있음, 없음

순서형 변수 (Ordinal Variable)

순서 (Order)만 존재

순서형 변수는 범주 간 순서가 존재하지만, 숫자 간 차이가 일정하지 않은 변수입니다. 즉, 순위는 있지만, 정확한 거리나 차이를 측정할 수 없습니다.

정의

범주 간 순서(Order)는 존재하지만, 간격(interval)이 일정하지 않음.

예시

병기: 1기, 2기, 3기, 4기
통증 정도: 경미함, 보통, 심함
만족도: 매우 불만족, 불만족, 보통, 만족, 매우 만족

구간형 변수 (Interval Variable)

숫자간 간경은 있지만 비율은 없음

구간형 변수는 숫자 간 차이가 일정하지만, 절대적인 0(기준점)이 없는 변수입니다. 즉, 덧셈과 뺄셈은 가능하지만, 비율 계산(곱셈, 나눗셈)은 불가능합니다.

정의

숫자 간 차이가 일정하지만, 절대적 0이 존재하지 않아 비율 계산이 불가능함.

예시

온도(섭씨, 화씨)
: 20°C와 40°C의 차이는 일정하지만, 40°C가 20°C의 2배라고 말할 수 없음.
지능지수(IQ)
: 100과 120의 차이는 동일하지만, IQ 120이 IQ 60의 2배라고 할 수 없음.
날짜(연도)
: 2000년과 2020년의 차이는 20년이지만, 2000년이 1000년의 2배라고 할 수 없음.

비율형 변수 (Ratio Variable)

수치의 비율 계산도 가능함

비율형 변수는 숫자 간 차이가 일정하고, 절대적인 0(기준점)이 존재하는 변수입니다. 즉, 덧셈, 뺄셈, 곱셈, 나눗셈(비율 계산)이 모두 가능합니다.

정의

절대적인 0이 존재하며, 비율 계산이 가능함.

예시

체중: 80kg은 40kg의 2배로 계산 가능.
키: 180cm와 90cm의 차이가 일정하고, 비율 비교 가능.
나이: 40세는 20세의 2배로 계산 가능.

변수의 비교

구분명목형순서형구간형비율형
순서 개념없음있음있음있음
차이 계산불가능불가능가능가능
비율 계산불가능불가능불가능가능
절대적 0없음없음없음있음
예시성별, 혈액형병기, 통증 정도온도, IQ키, 체중

정리

변수는 연구에서 데이터를 측정하고 분석하는 방식에 따라 다르게 분류됩니다. 명목형 변수는 단순한 분류, 순서형 변수는 순서가 존재, 구형 변수는 차이를 비교할 수 있고, 비율형 변수는 절대적 0이 있어 비율 계산까지 가능합니다.

BIOSTATISTICS, 의통계학