🚩 회귀 분석(Regression Analysis)은 변수 간의 관계를 수학적으로 모델링하여 예측하는 방법입니다. 독립변수(X)와 종속변수(Y)의 관계를 분석하며, 독립변수가 하나인 경우 단순 회귀(Simple Regression), 여러 개인 경우 다중 회귀(Multiple Regression)를 사용합니다.
단순 회귀 분석
단순 회귀 (Simple Regression)
✅ 단 하나의 독립변수(X)를 사용하여 종속변수(Y)를 예측하는 회귀 분석 방법입니다.
단순 회귀 공식
공식
✅ Y = β₀ + β₁X + ε
✅ 여기서 β₀는 절편(intercept), β₁는 회귀 계수(coefficient), ε는 오차항(error term)입니다.
단순 회귀 예시
예시: 키와 몸무게
✅ 키(X)가 증가할수록 몸무게(Y)도 증가하는 경향이 있다면, 단순 회귀 분석을 통해 키를 이용해 몸무게를 예측할 수 있습니다.
다중 회귀 분석
다중 회귀 (Multiple Regression)
✅ 두 개 이상의 독립변수(X₁, X₂, … Xn)를 사용하여 종속변수(Y)를 예측하는 회귀 분석 방법입니다.
다중 회귀 공식
공식
✅ Y = β₀ + β₁X₁ + β₂X₂ + ... + βnXn + ε
✅ 여러 독립변수가 종속변수에 영향을 미치는 관계를 설명합니다.
다중 회귀 예시
예시: 시험 성적 예측
✅ 학생의 시험 성적(Y)을 예측하기 위해 학습 시간(X₁), 수업 출석률(X₂), 과제 수행도(X₃) 등을 고려할 수 있습니다.
단순 회귀와 다중 회귀의 차이
🚩 단순 회귀는 한 개의 독립변수로 종속변수를 예측하지만, 다중 회귀는 여러 개의 독립변수를 고려하여 보다 정밀한 예측이 가능합니다.
특징
단순 회귀
다중 회귀
독립변수 개수
1개
2개 이상
관계 분석
한 변수와 종속변수 간 관계
여러 변수와 종속변수 간 관계
예측 정확도
비교적 낮음
비교적 높음
회귀 분석의 활용
의학 연구에서의 활용
혈압과 심혈관 질환 위험 예측
✅ 단순 회귀: 혈압(X)으로 심혈관 질환 위험(Y) 예측 ✅ 다중 회귀: 혈압(X₁), 콜레스테롤 수치(X₂), 체질량지수(X₃) 등을 함께 고려하여 예측
경제 및 경영 분야에서의 활용
기업 매출 예측
✅ 단순 회귀: 광고비(X)로 매출(Y) 예측 ✅ 다중 회귀: 광고비(X₁), 시장 규모(X₂), 경쟁사의 가격(X₃) 등을 고려하여 예측