تفاوت دو ضریب
سلام، خوبه که این تفاوت کوچولو را بدونیم:
ضریب r پیرسون معمولا برای توصیف ارتباط بین دو مقدار بیان میشود. مثلاً ارتباط بین تعداد ساعات مطالعه با نمره امتحان. میتوان با این ضریب کورلیشن بین این دو مقدار را محاسبه کرد.
مجذور R معمولاً تخمین کیفیت برازش یک مدل بر یک سری داده را بیان میکند. در واقع بیان کننده نسبت میزان تغییر پذیری متغیر وابسته Y توصیف شونده با متغیر مستقل X است.
در حالت مدل رگرسیون خطی ساده، اگر ما (xi,yi) را یک نمونه (تصادفی) از یک توزیع مشترک فرض کنیم، مربع ضریب کورلیشن نمونه r و ضریب تبیین R2 برابر هستند، اما درواقع هر دو یک چیز را اندازه نمیگیرند. ضریب r یک تخمین از ارتباط خطی بین x و y است اما ضریب تبیین یک تخمین از کل تغییرات y بیان شده توسط پیشگو یا همان رگرسور x است. در حقیقت ضریب R2 همچنین یک تخمین از کل تغییرات y بیان شده توسط رگرسورهای x1 تا xk در مدل های رگرسیون خطی چندگانه است. ضریب R2 یک تخمین معمولی از کیفیت کلی از برازش است اما باید با احتیاط از آن استفاده کرد زیرا همیشه ممکن است افزایش این ضریب با اضافه کردن ترم های کافی از رگرسورها به مدل اتفاق بیافتد.