فائزه حجتی | اسفند ۲۳, ۱۳۹۵ | 2 دیدگاه
آزمون های همبستگی برای بررسی رابطه بین دو یا چند متغیر به کار میروند. همبستگی به معنای همتغییری دو متغیر است که از آن استنباط میشود افزایش یا کاهش یک متغیر با افزایش یا کاهش متغیر دیگر همراه است. به عنوان مثال، بین هوش و پیشرفت تحصیلی دانشآموزان رابطه مستقیم وجود دارد. یعنی هر چه هوش دانشآموزان بیشتر باشد، نمره پیشرفت تحصیلی آنها نیز افزایش مییابد. آزمون های همبستگی به دو دسته آزمون های پارامتریک و ناپارامتریک تقسیم میشوند. در صورتی که مقیاس متغیرها فاصله ای یا تسبی و توزیع متغیرها نرمال باشد، از آزمون های همبستگی پارامتریک مانند آزمون همبستگی پیرسون و در غیر این صورت از آزمون های همبستگی ناپارامتریک استفاده میگردد.
ضریب همبستگی پیرسون، جزء آزمونهای آماری پارامتریک محسوب میشود که نشان دهنده درجه رابطه خطی بین دو متغیر است و توسط کارل پیرسون ارائه شده و آن را با حرف r نشان میدهند. مقدار آن بین دو عدد ۱+ و ۱- تغییر میکند. مقدار قدر مطلق ضریب همبستگی، شدت یا درجه رابطه بین دو متغیر و علامت آن (مثبت یا منفی) جهت رابطه (مستقیم یا معکوس) را نشان میدهد. ضریب همبستگی پیرسون یک شاخص متقارن است. یعنی همبستگی بین متغیرهای X و Y با همبستگی بین متغیرهای Y و X برابر است.
استفاده از ضریب همبستگی پیرسون مستلزم پیش فرضهای زیر است:
در مطالعه همبستگی با حالتهای مختلفی مواجه میشویم. حالتهای مختلف همبستگی بین متغیرها و نمودار پراکنش آنها عبارتند از:
شدت یا درجه همبستگی. در صورتیکه ضریب همبستگی محاسبه شده معنیدار باشد، هر چه مقدار قدر مطلق آن پایین و نزدیک صفر باشد، رابطه ضعیف و هرچه بالاتر و نزدیک ۱ باشد، رابطه قویتر است.
ضریب تعیین. میزان اشتراک تغییرات، درصد پراکندگی یا واریانس مشترک بین دو متغیر را تعیین میکند. با محاسبه این ضریب میتوان تعیین کرد که چند درصد از کل واریانس X ناشی از واریانس Y است. هر چه این درصد بالاتر باشد به طور قطع رابطه قویتر خواهد بود.
ν=(r)۲×۱۰۰
به عنوان مثال اگر شدت همبستگی بین دو متغیر ۰٫۵۴ باشد (۰٫۵۴=r)، ضریب تعیین برابر است با
ν=(۰٫۵۴)۲×۲۹= ۱۰۰
یعنی متغیر X، حدود ۲۹ درصد واریانس Y را تبیین میکند.
در صورتی که متغیرها از نوع اسمی و رتبهای (ترتیبی) بوده و یا توزیع آماری جامعه نرمال نباشد، برای بررسی رابطه بین دو متغیر از آزمونهای همبستگی ناپارامتریک استفاده میشود. این آزمونها در جدول زیر ارائه شدهاند.
جدول ۱: آزمونهای همبستگی ناپارامتریک
ضریب همبستگی اسپیرمن معادل ناپارامتریک ضریب همبستگی پیرسون به شمار میرود که میزان همبستگی دو متغیر در سطح رتبهای یا یکی رتبهای و دیگری در سطح فاصلهای را اندازهگیری میکند. یا اینکه دادهها فاصلهای باشند، ولی مفروضههای آمار پارامتریک رعایت نشده باشد. همچنین در مواردی که تعداد افراد نمونه کمتر از ۳۰ نفر است، به جای ضریب همبستگی پیرسون به کار برده میشود. و آن را با علامت rs یا حرف یونانی ρ (رو) نشان میدهند.
مقدار ضریب همبستگی اسپیرمن مانند ضریب همبستگی پیرسون تفسیر میشود.
فرمول محاسبه ضریب همبستگی اسپیرمن
N: تعداد جفت دادهها
D: تفاوت بین رتبههای هر جفت از دادهها
ضریب همبستگی کندال برای دادههای رتبه بندی شده زمانیکه تعداد آزمودنیها از ۱۰ نفر کمتر است، به کار میرود. کندال از تعداد توافقها و عدم توافقها در رتبه بندیها برای محاسبه ضریب خود استفاده میکند. برای مثال فرض کنید استاد روانشناسی بالینی ۱۰ نفر از دانشجویان خود را براساس دانش روانشناسی و شایستگی آن ها برای شاغل شدن در این رشته رتبه بندی کرده است. برای بررسی رابطه بین دانش روانشناسی و شایستگی میتوانیم از ضریب همبستگی کندال استفاده کنیم.
ضریب همبستگی رتبهای کندال به tau-a کندال نیز معروف است، متقارن میباشد و مقدار آن بین ۱+ و ۱- قرار دارد و مشابه با ضریب همبستگی پیرسون تفسیر میشود.
فرمول محاسبه ضریب همبستگی رتبهای کندال (tau-a)
P: تعداد توافقها یعنی تعداد اعداد (مواردی) که رتبه بالاتری برای هر رتبه متغیر دوم به دست آوردهاند.
Q: تعداد عدم توافقها یعنی تعداد اعداد (مواردی) که رتبه پایینتری برای هر رتبه متغیر دوم به دست آوردهاند.
N: تعداد آزمودنیها (حجم نمونه)
ضریب همبستگی رتبهای کندال b یا tau-b زمانی استفاده میشود که متغیرهای مورد مطالعه در سطح رتبهای اندازه گیری شده و جدول داده ها مربع شکل باشند. یعنی تعداد سطوح رتبه بندی دو متغیر برابر باشند. همچنین در محاسبات خود زوج هایی که رتبه آنها برابر است، را در نظر میگیرد. مانند رابطه بین نمره امتحان و زمان صرف شده برای مرور درس. نمره امتحان دارای ۵ حالت A، B، C، D وF است. همچنین زمان صرف شده برای مرور درس دارای ۵ طبقه شامل کمتر از ۵ ساعت، ۵ تا ۹ ساعت، ۱۰ تا ۱۴ ساعت، ۱۵ تا ۱۹ ساعت و ۲۰ ساعت به بالا است.
ضریب همبستگی رتبهای کندال b متقارن است و مقدار آن بین ۱+ و ۱- قرار دارد و مشابه با ضریب همبستگی پیرسون تفسیر میشود.
فرمول محاسبه ضریب همبستگی رتبهای کندال b
P: تعداد توافقها یعنی تعداد اعداد (مواردی) که رتبه بالاتری برای هر رتبه متغیر دوم (Y) به دست آوردهاند.
Q: تعداد عدم توافقها یعنی مجموع تعداد اعداد (مواردی) که رتبه پایینتری برای هر رتبه متغیر دوم (Y) به دست آوردهاند.
TY: تعداد زوجهایی که رتبه Y آنها برابر می باشد.
TX: تعداد زوجهایی که رتبه X آنها برابر می باشد.
از ضریب همبستگی رتبهای کندال c یا tau- c زمانی استفاده میشود که متغیرهای مورد مطالعه در سطح رتبهای اندازه گیری شده و جدول دادههای مربوط به آن ها مستطیل شکل باشد. اما در محاسبات خود زوجهای گره خورده (زوجهایی که رتبه آنها برابر است) را نادیده میگیرد. مانند رابطه بین رضایت مشتری (با عبارت “من از مدت زمانی که طول کشید تا بسته به دست من برسد، راضی هستم” در طیف ۵ گزینهای لیکرت از کاملاً مخالفم تا کاملاً موافقم اندازه گیری شده است) و زمان تحویل کالا (دارای ۴ طبقه شامل روز بعد، ۲ روز بعد، ۳ تا ۵ روز و بیش از ۵ روز است)
ضریب همبستگی رتبهای کندال c متقارن است و مقدار آن بین ۱+ و ۱- قرار دارد و مشابه با ضریب همبستگی پیرسون تفسیر میشود.
فرمول محاسبه ضریب همبستگی رتبهای کندال c
P: تعداد توافقها یعنی تعداد اعداد (مواردی) که رتبه بالاتری برای هر رتبه متغیر دوم (Y) به دست آوردهاند.
Q: تعداد عدم توافقها یعنی مجموع تعداد اعداد (مواردی) که رتبه پایینتری برای هر رتبه متغیر دوم (Y) به دست آوردهاند.
N: تعداد آزمودنیها (حجم نمونه) و m: حداقل سطر یا ستون
ضریب گاما برای نشان دادن رابطه بین دو متغیر رتبهای استفاده میشود که از طریق آن می توان اقدام به پیش بینی یک متغیر وابسته از روی یک متغیر مستقل نمود. مانند رابطه بین امنیت شغلی (پایین، متوسط و بالا) و رضایت شغلی (پایین، متوسط و بالا)
با استفاده از ضریب گاما میتوان میزان کاهش خطا در پیش بینی متغیر وابسته را آزمون نمود. ضریب گاما براساس تعداد جفتهای هماهنگ و ناهماهنگ (معکوس) محاسبه میشود. ضریب همبستگی گاما متقارن است و مقدار آن بین ۱+ و ۱- قرار دارد و مشابه با ضریب همبستگی پیرسون تفسیر میشود.
فرمول محاسبه ضریب گاما (ϒ)
P: تعداد جفتهایی که جهت تغییرات رتبههای x و y آنها هماهنگ و یکسان است. یعنی اگر رتبه x افزایش یا کاهش یابد، رتبه y نیز در همان جهت تغییر میکند.
Q: تعداد جفتهایی که جهت تغییرات رتبههای x و y آنها ناهماهنگ و مخالف هم است. یعنی اگر رتبه x افزایش یا کاهش یابد، رتبه y در خلاف جهت آن تغییر میکند.
ضریب d سامرز برای ارزیابی رابطه بین دو متغیر رتبهای به کار میرود، شکل خاصی از ضریب گاما است که در آن یکی از متغیرها به عنوان متغیر وابسته در نظر گرفته میشود. از ضریب گاما دقیقتر است.
ضریب d سامرز نامتقارن است. مانند رگرسیون عمل میکند. بنابراین، زمانی مورد استفاده قرار میگیرد که قصد داریم مقدار متغیر وابسته (Y) را از روی مقدار متغیر مستقل (X) پیشبینی کنیم.
فرمول محاسبه ضریب d سامرز
P: تعداد زوجهایی که جهت تغییرات رتبههایx و y آنها هماهنگ و یکسان است. یعنی اگر رتبه x افزایش یا کاهش یابد، رتبه y نیز در همان جهت تغییر میکند.
Q: تعداد زوجهایی که جهت تغییرات رتبههای x و y آنها ناهماهنگ و مخالف هم است. یعنی اگر رتبه x افزایش یا کاهش یابد، رتبه y در خلاف جهت آن تغییر میکند.
Ty: تعداد زوجهای گره خورده که رتبه x آنها برابر باشد.
Tx: تعداد زوجهای گره خورده که رتبه y آنها برابر باشد.
ضریب همبستگی تتراکوریک هنگامی استفاده میشود که هر دو متغیر مورد مطالعه، دو ارزشی ساختگی باشند. یعنی دو متغیر در واقع پیوسته (کمی) و نرمال باشند، اما به عمد و از روی ضرورت آنها را به صورت دو ارزشی در آورده باشیم. بنابراین میتواند برای دادههای رتبهای در مقابل رتبهای استفاده شود که ویژگیهای فوق را داشته باشند. رتبههای دو متغیر گسسته هستند و به این ترتیب با ضریب اسپیرمن تفاوت دارند. همچنین، میتواند در موقعیتهایی که دو نمره دهنده برای یک متغیر وجود دارد، به عنوان معیاری برای توافق بین نمره گذاران استفاده شود. به عنوان مثال،پاز دو روانپزشک بخواهیم وجود یا عدم وجود افسردگی حاد را در تعدادی از بیماران تشخیص دهند. دامنه ضریب همبستگی تتراکوریک اعداد محدوده ۱- تا ۱+ را پوشش میدهد. معمولاً ضرایب همبستگی تتراکوریک بزرگتر و پراکندهتر از ضرایب همبستگی پیرسون هستند.
فرمول محاسبه ضریب همبستگی تتراکوریک
a,b,c,d: فراوانی هر یک از خانه های جدول داده ها
ضریب همبستگی دو رشتهای نقطهای مورد خاصی از پیرسون است و مشابه با r پیرسون تفسیر میشود. ضریب همبستگی دو رشتهای نقطهای رابطه خطی بین دو متغیر که در آن یک متغیر کمی (فاصلهای یا نسبی) و متغیر دیگر اسمی یا دوارزشی واقعی است، را بررسی میکند. مانند رابطه بین جنسیت و پیشرفت در زبان انگلیسی به عنوان زبان دوم. منظور از متغیر دوارزشی متغیری است که تنها یکی از دو مقدار صفر یا یک را شامل میشود. مانند زن / مرد، بله / خیر، رد / قبول، حاضر / غائب و … .
فرمول محاسبه ضریب همبستگی دو رشتهای نقطهای
ضریب همبستگی دورشتهای شبیه به دورشتهای نقطهای است. تفاوت آنها در این است که دادههای کمی (فاصلهای یا نسبی) را در مقابل دادههای رتبهای قرار میدهد. دادههای رتبهای در اصل مربوط به یک متغیر پیوسته بودهاند که خود پژوهشگر آن را به طور گسسته با دو ارزش اندازه گیری نموده است. بنابراین ضریب همبستگی دو رشتهای زمانی استفاده میشود که یک متغیر دارای مقیاس فاصلهای یا نسبی و متغیر دوم دوارزشی ساختگی باشد. البته با این فرض که توزیع متغیرها نرمال باشد. مقدار ضریب همبستگی دو رشتهای گاهی از یک بیشتر میشود. خطای معیار آن خیلی بیشتر از پیرسون است و معمولاً برای تحلیل سئوالات به کار میرود.
مثال: برای بررسی رابطه بین اضطراب و پیشرفت تحصیلی. اگر نمرات اضطراب را براساس میانگین به اضطراب بالا و اضطراب پایین طبقهبندی کنیم، میتوانیم از ضریب همبستگی دورشتهای استفاده کنیم.
فرمول محاسبه ضریب همبستگی دو رشتهای
یک ضریب همبستگی دو متغیری برای دادههای پیوسته است، زمانی که رابطه خطی بین دو متغیر وجود ندارد. ضریب اتا را در مواقعی که یکی از متغیرها اسمی یا رتبهای و دیگری فاصلهای/ نسبی باشد، نیز میتوان به کار برد. ضریب همبستگی اتا مبتنی بر خطای پیش بینی است. یعنی مقدار این ضریب نشان میدهد با در نظر گرفتن متغیر اسمی یا رتبهای، چه مقدار از خطای پیش بینی متغیر فاصلهای مورد نظر کاسته میشود. مانند رابطه بین حرکات مخاطره آمیز در حین رانندگی و میزان تصادفات
این ضریب نامتقارن است، مشابه با ضریب همبستگی پیرسون تفسیر میشود، اما هرگز نمیتواند منفی باشد.[۱] یعنی دامنه تغییرات آن بین ۰ و ۱+ است.
فرمول محاسبه ضریب همبستگی اتا
مجذور خی (χ۲) دو متغیره یک آزمون ناپارامتریک برای بررسی وجود یا عدم وجود رابطه بین دو متغیر اسمی یا یک اسمی و یک رتبهای است. اساس آن بررسی و سنجش تفاوت فراوانیهای مشاهده شده و فراوانیهای مورد انتظار است. با استفاده از تفاوت بین فراوانیهای مشاهده شده و فراوانیهای مورد انتظار به وجود یا عدم وجود رابطه بین دو متغیر پی میبریم. در صورتی که هیچ رابطهای بین دو متغیر وجود نداشته باشد، میتوان نتیجه گرفت که دو متغیر مستقلند. به همین دلیل به این آزمون، آزمون استقلال گفته میشود. مانند رابطه بین دو متغیر جنسیت و استفاده از مواد مخدر
با استفاده از مجذور خی دو متغیره فقط وجود یا عدم وجود رابطه بین دو متغیر مشخص میشود. برای تعیین شدت یا میزان همبستگی باید از آزمونهای تعقیبی مجذور خی مانند ضریب فی (φ)، ضریب توافقی (C) و ضریب کرامر (V) استفاده کرد.
فرمول محاسبه χ۲ دو متغیره
هنگامی که دو متغیر مورد مطالعه اسمی و دو ارزشی واقعی باشند، برای محاسبه ضریب همبستگی آن ها از ضریب فی استفاده میشود. یعنی دادهها در یک جدول توافقی ۲×۲ که دارای ۲ سطر و ۲ ستون است، ارائه شده باشند. مانند بررسی رابطه بین جنسیت و احساس درد کارگران کارخانه در حین کار
بهترین مورد استفاده ضریب فی محاسبه همبستگی بین سئوالهای یک آزمون صحیح- غلط است. ضریب فی متقارن است. دامنه تغییرات آن بین ۰ و ۱ است و جهت رابطه در آن معنی ندارد. زیرا با توجه به اسمی بودن دادهها، همبستگیهای منفی از نظر ریاضی غیر ممکن است.
فرمول محاسبه ضریب فی از طریق جدول اعداد توافقی
((φ= (ad-bc)/√((a+b)(c+d)(a+c)(b+d
ضریب توافقی هنگامی استفاده میشود که هر دو متغیر اسمی یا یکی از متغیرها اسمی و دیگری رتبهای باشد. تفاوت آن با ضریب فی در این است که وقتی برای هر متغیر اسمی ۳ ارزش یا بیشتر وجود داشته باشد و جدول دادهها مربع شکل، یعنی تعداد سطر و ستون در جدول برابر باشد (مانند جدولهای ۳×۳، ۴×۴ و …) از ضریب توافقی استفاده میکنیم. مانند رابطه بین وضعیت تأهل (مجرد، متاهل و مطلقه) و وضعیت اقتصادی (بد، متوسط، خوب)
ضریب توافقی متقارن است، دامنه تغییرات آن بین ۰ و ۱ است و جهت رابطه در آن معنی ندارد. زیرا با توجه به اسمی بودن دادهها، همبستگی های منفی از نظر ریاضی غیر ممکن است. البته هر چه تعداد ارزشها یا طبقات متغیر بیشتر باشد، مقدار این ضریب نیز بیشتر خواهد بود. اما به ندرت به ۱ میرسد مگر اینکه تعداد طبقات بسیار افزایش یابد.
فرمول محاسبه ضریب توافقی از طریق آماره خی دو
ضریب V کرامر هنگامی استفاده میشود که هر دو متغیر اسمی باشند. اما تعداد ارزشهای ممکن برای دو متغیر برابر نباشند. به عبارت دیگر تعداد سطر و ستون در جدول دادهها برابر نباشند، مانند جدولهای ۳×۲، ۵×۳ و … . مانند رابطه بین جنسیت و گرایش سیاسی
ضریب V کرامر متقارن است، دامنه تغییرات آن بین ۰ و ۱+ است و جهت رابطه در آن معنی ندارد. زیرا با توجه به اسمی بودن دادهها، همبستگی های منفی از نظر ریاضی غیر ممکن است.
فرمول محاسبه ضریب V کرامر از طریق آماره خی دو
χ۲: مقدار آماره خیدو N: تعداد آزمودنیها (حجم نمونه)
r: تعداد سطر در جدول دادهها c: تعداد ستون در جدول دادهها
(min(r,c: حداقل مقدار دو عدد تعداد سطر و تعداد ستون
ضریب لامبدا زمانی به کار میرود که دو متغیر مورد مطالعه اسمی و چند ارزشی یا یکی از متغیرها اسمی و دیگری رتبهای باشد. این ضریب نسبت به تعداد مقولهها (ارزشهای) دو متغیر محدودیتی ندارد. برای پیش بینی مقادیر متغیر وابسته از روی مقادیر متغیر مستقل به کار میرود و کاهش نسبی در خطا را انعکاس میدهد. به عنوان مثال، آیا با استفاده از وابستگی افراد به یک حزب سیاسی میتوان رأی آنها به یک نامزد انتخاباتی را پیش بینی کرد.
ضریب لامبدا بین ۰ و ۱+ است. اگر مقدار این ضریب ۰ باشد، یعنی متغیر مستقل در پیش بینی متغیر وابسته هیچ کمکی نمیکند و مقدار ۱ یعنی متغیر مستقل به طور کامل متغیر وابسته را پیشبینی میکند.
ضریب لامبدا نامتقارن است. با توجه به اینکه کدام متغیر را متغیر مستقل در نظر میگیریم، دو مقدار لامبدا به دست میآید. میانگین این دو مقدار به عنوان معیاری مناسب برای میزان همبستگی دو متغیر استفاده میشود.
فرمول محاسبه ضریب لامبدا
ضریب تاو گودمن و کروسکال نیز برای ارزیابی شدت رابطه بین متغیرهایی که هر دو اسمی یا یکی اسمی و دیگری رتبهای باشد، به کار میرود. این ضریب نسبت به تعداد مقولههای متغیرها محدودیت ندارد. برای مثال، پیش بینی خشونت طلبی در افراد براساس گروه سنی.
ضریب گودمن و کروسکال یک ضریب متقارن است که در آن متغیر مستقل و وابسته مشخص نیست. مقدار این ضریب همیشه بین صفر و یک نیست. به ویژه زمانی که تعداد طبقات متغیر وابسته بیش از متغیر مستقل باشد. این ضریب نامتقارن است و دامنه تغییرات آن از ۰ تا ۱+ است.
فرمول محاسبه ضریب تاو گودمن و کروسکال
[۱]– www. Andrews.edu/~calkins/math/edrm611/edrm13.htm
سلام، عالی بود
با آرزوی سلامتی و تندرستی برای تمام کسانی که به گسترش علم در جامعه کمک می کنند
تشکر* استفاده کردم