Principal Component Analysis (PCA)

2025-04-29

좋습니다!
Principal Component Analysis (PCA) — 바로 정확하고 깔끔하게 정리해드리겠습니다.

🎯 PCA란?

**PCA (주성분 분석)**는 고차원 데이터를 저차원으로 압축하면서,
데이터의 가장 중요한 특징(분산)을 최대한 보존하는 차원 축소(dimensionality reduction) 기법입니다.

즉,

목적	설명
차원 축소	feature 수가 많으면 계산이 느리고 과적합(overfitting) 위험 → 줄여서 효율적으로 만듦
노이즈 제거	덜 중요한 축을 제거하면서 데이터의 핵심 구조를 보존
시각화	고차원(>3D) 데이터를 2D/3D로 투영해서 쉽게 볼 수 있게 함
속도 향상	학습이나 추론 시 feature 수 줄여서 처리 속도 빠르게

예를 들어:

데이터가 퍼져 있는 “최대 방향"을 따라 새 축을 그리고,
그 축에 데이터를 “떨어뜨려"서 차원을 줄입니다.

(필요하면 그림도 그려서 보여드릴 수 있어요!)

PCA는 데이터의 분산을 최대로 보존하면서, 고차원 데이터를 더 적은 수의 축으로 요약하는 차원 축소 방법이다.

필요하면 바로 이어서 PCA Scikit-Learn 코드 예제 (fit_transform)도 보여드릴게요! 🔥

혹시 PCA 실제 예제 (Python 코드 + 시각화) 같이 볼까요? 🚀
(직접 눈으로 보면 바로 이해됩니다!)