تجزیه و تحلیل آماری

فائزه حجتی

آزمون های همبستگی

فائزه حجتی | اسفند ۲۳, ۱۳۹۵ | 0 دیدگاه

آزمون های همبستگی

آزمون های همبستگی برای بررسی رابطه بین دو یا چند متغیر به کار می‌روند. همبستگی به معنای هم‌تغییری دو متغیر است که از آن استنباط می‌شود افزایش یا کاهش یک متغیر با افزایش یا کاهش متغیر دیگر همراه است. به عنوان مثال، بین هوش و پیشرفت تحصیلی دانش‌آموزان رابطه مستقیم وجود دارد. یعنی هر چه هوش دانش‌آموزان بیشتر باشد، نمره پیشرفت تحصیلی آن‌ها نیز افزایش می‌یابد. آزمون های همبستگی به دو دسته آزمون های پارامتریک و ناپارامتریک تقسیم می‌شوند. در صورتی که مقیاس متغیرها فاصله ای یا تسبی و توزیع متغیرها نرمال باشد، از آزمون های همبستگی پارامتریک مانند آزمون همبستگی پیرسون و در غیر این صورت از آزمون های همبستگی ناپارامتریک استفاده می‌گردد.

 

  1.  آزمون همبستگی پیرسون (Pearson Correlation Coefficient)
  2.  آزمون‌های همبستگی ناپارامتریک
    1. ضریب همبستگی رتبه­ ای اسپیرمن (Spearman Correlation Coefficient)
    2. ضریب همبستگی رتبه‌ای کندال tau- b) b)
    3. ضریب همبستگی رتبه‌ای کندال tau- c) c)
    4. ضریب گاما (Gamma)
    5. ضریب d سامرز (Somers’ d)
    6. ضریب همبستگی تتراکوریک (tetrachoric correlation cooefficient)
    7. ضریب همبستگی دو رشته‌ای نقطه‌ای (point- biserial correlation coefficient)
    8. ضریب همبستگی دو رشته‌ای (biserial correlation coefficient)    
    9. ضریب همبستگی اتا (η)
    10. آزمون مجذور خی (χ۲) دو متغیره (آزمون استقلال)
    11. ضریب فی (phi coefficient)
    12. ضریب توافقی (Contingency coefficient)

 

 

آزمون همبستگی پیرسون (Pearson Correlation Coefficient)

  • ضریب همبستگی برای توصیف شدت رابطه بین متغیرها به کار می‌رود.
  • رابطه علت و معلولی را نمی‌توان از همبستگی استنباط کرد. یعنی می‌تواند متغیر سومی وجود داشته باشد که ارتباط بین دو متغیر مورد مقایسه را توصیف کند. برای مثال، تحقیقات نشان می‌دهد بین اضطراب مادران و یادگیری کودکان رابطه معکوس وجود دارد. ممکن است کاهش یادگیری کودک و اضطراب مادر ناشی از علل دیگری مانند درآمد پایین خانواده، مشکلات ژنتیکی و غیره باشد
  • گاهی بین متغیرها همبستگی ساختگی، مصنوعی یا مجازی وجود دارد. درحالی‌که احتمالاً رابطه و قطعاً رابطه علی بین آن‌ها وجود ندارد. برای مثال بین هوش و رنگ چشم افراد همبستگی وجود دارد.
  • همچنین همبستگی‌ای که در یک نمونه قابل ملاحظه است، ممکن است در نمونه دیگر معادل صفر باشد.

ضریب همبستگی پیرسون، جزء آزمون‌های آماری پارامتریک محسوب می‌شود که نشان دهنده درجه رابطه خطی بین دو متغیر است و توسط کارل پیرسون ارائه شده و آن را با حرف r نشان می‌دهند. مقدار آن بین دو عدد ۱+ و ۱- تغییر می‌کند. مقدار قدر مطلق ضریب همبستگی، شدت یا درجه رابطه بین دو متغیر و علامت آن (مثبت یا منفی) جهت رابطه (مستقیم یا معکوس) را نشان می‌دهد. ضریب همبستگی پیرسون یک شاخص متقارن است. یعنی همبستگی بین متغیرهای  X و Y با همبستگی بین متغیرهای Y و X برابر است.

 پیش فرض‌های ضریب همبستگی پیرسون

استفاده از ضریب همبستگی پیرسون مستلزم پیش فرض‌های زیر است:

  1. مقیاس متغیرها حداقل فاصله‌ای باشد.
  2. توزیع‌ها تقریباً نرمال باشند.
  3. رابطه بین دو متغیر خطی باشد. نمودار پراکندگی، ساده ترین روش برای بررسی خطی یا غیرخطی بودن رابطه­ی بین متغیرها می‌باشد.
  4. شرط یکسانی واریانس‌ها رعایت شود. به عبارت دیگر، باید نمودار پراکندگی یکسان باشد. به این معنی که عرض نقاط در سرتاسر نمودار یکسان باشد.

فرمول محاسبه ضریب همبستگی پیرسون

آزمون های همبستگی فرمول پیرسون

حالت‌های مختلف همبستگی

در مطالعه همبستگی با حالت‌های مختلفی مواجه می‌شویم. حالت‌های مختلف همبستگی بین متغیرها و نمودار پراکنش آن‌ها عبارتند از:

آزمون های همبستگی ،پحالتها

  شدت یا درجه همبستگی. در صورتی‌که ضریب همبستگی محاسبه شده معنی‌دار باشد، هر چه مقدار قدر مطلق آن پایین و نزدیک صفر باشد، رابطه ضعیف و هرچه بالاتر و نزدیک ۱ باشد، رابطه قوی‌تر است.
ضریب تعیین.
میزان اشتراک تغییرات، درصد پراکندگی یا واریانس مشترک بین دو متغیر را تعیین می‌کند. با محاسبه این ضریب می‌توان تعیین کرد که چند درصد از کل واریانس  X ناشی از واریانس Y است. هر چه این درصد بالاتر باشد به طور قطع رابطه قوی‌تر خواهد بود.

ν=(r)۲×۱۰۰

به عنوان مثال اگر شدت همبستگی بین دو متغیر ۰٫۵۴ باشد (۰٫۵۴=r)، ضریب تعیین برابر است با

ν=(۰٫۵۴)۲×۲۹= ۱۰۰

یعنی متغیر X، حدود ۲۹ درصد واریانس Y را تبیین می‌کند.

 

آزمون‌های همبستگی ناپارامتریک

در صورتی که متغیرها از نوع اسمی و رتبه‌ای (ترتیبی) بوده و یا توزیع آماری جامعه نرمال نباشد، برای بررسی رابطه بین دو متغیر از آزمون‌های همبستگی ناپارامتریک استفاده می‌شود. این آزمون‌ها در جدول زیر ارائه شده‌اند.

جدول ۱: آزمون‌های همبستگی ناپارامتریک

آزمون‌های همبستگی ناپارامتریک

ضریب همبستگی رتبه ­ای اسپیرمن (Spearman Correlation Coefficient)

ضریب همبستگی اسپیرمن معادل ناپارامتریک ضریب همبستگی پیرسون به شمار می‌رود که میزان همبستگی دو متغیر در سطح رتبه‌ای یا یکی رتبه‌ای و دیگری در سطح فاصله‌ای را اندازه‌گیری می‌کند. یا اینکه داده‌ها فاصله‌ای باشند، ولی مفروضه‌های آمار پارامتریک رعایت نشده باشد. همچنین در مواردی که تعداد افراد نمونه کمتر از ۳۰ نفر است، به جای ضریب همبستگی پیرسون به کار برده می‌شود. و آن را با علامت rs یا حرف یونانی ρ (رو) نشان می‌دهند.

مقدار ضریب همبستگی اسپیرمن مانند ضریب همبستگی پیرسون تفسیر می‌شود.

فرمول محاسبه ضریب همبستگی اسپیرمن

آزمون های همبستگی فرمول اسپیرمن

N: تعداد جفت داده‌ها

D: تفاوت بین رتبه‌های هر جفت از داده‌ها

 

ضریب همبستگی رتبه‌ای کندال (Kendall coefficient)

ضریب همبستگی کندال برای داده‌های رتبه‌ بندی شده زمانی‌که تعداد آزمودنی‌ها از ۱۰ نفر کمتر است، به کار می‌رود. کندال از تعداد توافق‌ها و عدم توافق‌ها در رتبه‌ بندی‌ها برای محاسبه ضریب خود استفاده می‌کند. برای مثال فرض کنید استاد روانشناسی بالینی ۱۰ نفر از دانشجویان خود را براساس دانش روانشناسی و شایستگی آن ها برای شاغل شدن در این رشته رتبه بندی کرده است. برای بررسی رابطه بین دانش روانشناسی و شایستگی می‌توانیم از ضریب همبستگی کندال استفاده کنیم.

ضریب همبستگی رتبه‌ای کندال به tau-a کندال نیز معروف است، متقارن می‌باشد و مقدار آن بین ۱+ و ۱- قرار دارد و مشابه با ضریب همبستگی پیرسون تفسیر می‌شود.

فرمول محاسبه ضریب همبستگی رتبه‌ای کندال (tau-a)

فرمول ضریب همبستگی رتبه‌ای کندال

P: تعداد توافق‌ها یعنی تعداد اعداد (مواردی) که رتبه بالاتری برای هر رتبه متغیر دوم به دست آورده‌اند.

Q: تعداد عدم توافق‌ها یعنی تعداد اعداد (مواردی) که رتبه پایین‌تری برای هر رتبه متغیر دوم به دست آورده‌اند.

N: تعداد آزمودنی‌ها (حجم نمونه)

 

ضریب همبستگی رتبه‌ای کندال tau- b) b)

ضریب همبستگی رتبه‌ای کندال b یا tau-b زمانی استفاده می‌شود که متغیرهای مورد مطالعه در سطح رتبه‌ای اندازه‌ گیری شده و جدول داده‌ ها مربع شکل باشند. یعنی تعداد سطوح رتبه‌ بندی دو متغیر برابر باشند. همچنین در محاسبات خود زوج‌ هایی که رتبه آن‌ها برابر است، را در نظر می‌گیرد. مانند رابطه بین نمره امتحان و زمان صرف شده برای مرور درس. نمره امتحان دارای ۵ حالت A، B، C، D وF است. همچنین زمان صرف شده برای مرور درس دارای ۵ طبقه شامل کمتر از ۵ ساعت،‌ ۵ تا ۹ ساعت،‌ ۱۰ تا ۱۴ ساعت، ۱۵ تا ۱۹ ساعت و ۲۰ ساعت به بالا است.

ضریب همبستگی رتبه‌ای کندال b متقارن است و مقدار آن بین ۱+ و ۱- قرار دارد و مشابه با ضریب همبستگی پیرسون تفسیر می‌شود.

فرمول محاسبه ضریب همبستگی رتبه‌ای کندال b

فرمول ضریب همبستگی رتبه‌ای کندال b

P: تعداد توافق‌ها یعنی تعداد اعداد (مواردی) که رتبه بالاتری برای هر رتبه متغیر دوم (Y) به دست آورده‌اند.

Q: تعداد عدم توافق‌ها یعنی مجموع تعداد اعداد (مواردی) که رتبه پایین‌تری برای هر رتبه متغیر دوم (Y) به دست آورده‌اند.

TY: تعداد زوج‌هایی که رتبه Y آن‌ها برابر می باشد.

TX: تعداد زوج‌هایی که رتبه X آن‌ها برابر می باشد.

 

ضریب همبستگی رتبه‌ای کندال tau- c)  c)

از ضریب همبستگی رتبه‌ای کندال c یا tau- c زمانی استفاده می‌شود که متغیرهای مورد مطالعه در سطح رتبه‌ای اندازه‌ گیری شده و جدول داده‌های مربوط به آن‌ ها مستطیل شکل باشد. اما در محاسبات خود زوج‌های گره خورده (زوج‌هایی که رتبه آن‌ها برابر است) را نادیده می‌گیرد. مانند رابطه بین رضایت مشتری (با عبارت “من از مدت زمانی که طول کشید تا بسته به دست من برسد، راضی هستم” در طیف ۵ گزینه‌ای لیکرت از کاملاً مخالفم تا کاملاً موافقم اندازه‌ گیری شده است) و زمان تحویل کالا (دارای ۴ طبقه شامل روز بعد،‌ ۲ روز بعد،‌ ۳ تا ۵ روز و بیش از ۵ روز است)

ضریب همبستگی رتبه‌ای کندال c متقارن است و مقدار آن بین ۱+ و ۱- قرار دارد و مشابه با ضریب همبستگی پیرسون تفسیر می‌شود.

فرمول محاسبه ضریب همبستگی رتبه‌ای کندال  c

آزمون های همبستگی رتبه‌ای کندال c

P: تعداد توافق‌ها یعنی تعداد اعداد (مواردی) که رتبه بالاتری برای هر رتبه متغیر دوم (Y) به دست آورده‌اند.

Q: تعداد عدم توافق‌ها یعنی مجموع تعداد اعداد (مواردی) که رتبه پایین‌تری برای هر رتبه متغیر دوم (Y) به دست آورده‌اند.

N: تعداد آزمودنی‌ها (حجم نمونه)      و      m: حداقل سطر یا ستون

 

ضریب گاما (Gamma)

ضریب گاما برای نشان دادن رابطه بین دو متغیر رتبه‌ای استفاده می‌شود که از طریق آن می توان اقدام به پیش‌ بینی یک متغیر وابسته از روی یک متغیر مستقل نمود. مانند رابطه بین امنیت شغلی (پایین، متوسط و بالا) و رضایت شغلی (پایین، متوسط و بالا)

با استفاده از ضریب گاما می‌توان میزان کاهش خطا در پیش‌ بینی متغیر وابسته را آزمون نمود. ضریب گاما براساس تعداد جفت‌های هماهنگ و ناهماهنگ (معکوس) محاسبه می‌شود. ضریب همبستگی گاما متقارن است و مقدار آن بین ۱+ و ۱- قرار دارد و مشابه با ضریب همبستگی پیرسون تفسیر می‌شود.

فرمول محاسبه ضریب گاما (ϒ)

آزمون های همبستگی فرمول ضریب گاما

P: تعداد جفت‌هایی که جهت تغییرات رتبه‌های x و y آن‌ها هماهنگ و یکسان است. یعنی اگر رتبه x افزایش یا کاهش یابد، رتبه y نیز در همان جهت تغییر می‌کند.

Q: تعداد جفت‌هایی که جهت تغییرات رتبه‌های x و y آن‌ها ناهماهنگ و مخالف هم است. یعنی اگر رتبه x افزایش یا کاهش یابد، رتبه y در خلاف جهت آن تغییر می‌کند.

 

ضریب d سامرز (Somers’ d)

ضریب d سامرز برای ارزیابی رابطه بین دو متغیر رتبه‌ای به کار می‌رود، شکل خاصی از ضریب گاما است که در آن یکی از متغیرها به عنوان متغیر وابسته در نظر گرفته می‌شود. از ضریب گاما دقیق‌تر است.

ضریب d سامرز نامتقارن است. مانند رگرسیون عمل می‌کند. بنابراین، زمانی مورد استفاده قرار می‌گیرد که قصد داریم مقدار متغیر وابسته (Y) را از روی مقدار متغیر مستقل (X) پیش‌بینی کنیم.

فرمول محاسبه ضریب d سامرز

آزمون های همبستگی فرمول ضریب d سامرز

P: تعداد زوج‌هایی که جهت تغییرات رتبه‌هایx و y آن‌ها هماهنگ و یکسان است. یعنی اگر رتبه x افزایش یا کاهش یابد، رتبه y نیز در همان جهت تغییر می‌کند.

Q: تعداد زوج‌هایی که جهت تغییرات رتبه‌های x و y آن‌ها ناهماهنگ و مخالف هم است. یعنی اگر رتبه x افزایش یا کاهش یابد، رتبه y در خلاف جهت آن تغییر می‌کند.

Ty: تعداد زوج‌های گره خورده که رتبه x آن‌ها برابر باشد.

Tx: تعداد زوج‌های گره خورده که رتبه y آن‌ها برابر باشد.

 

ضریب همبستگی تتراکوریک (tetrachoric correlation cooefficient)

ضریب همبستگی تتراکوریک هنگامی استفاده می‌شود که هر دو متغیر مورد مطالعه، دو ارزشی ساختگی باشند. یعنی دو متغیر در واقع پیوسته (کمی) و نرمال باشند، اما به عمد و از روی ضرورت آن‌ها را به صورت دو ارزشی در آورده باشیم. بنابراین می‌تواند برای داده‌های رتبه‌ای در مقابل رتبه‌ای استفاده شود که ویژگی‌های فوق را داشته باشند. رتبه‌های دو متغیر گسسته هستند و به این ترتیب با ضریب اسپیرمن تفاوت دارند. همچنین، می‌تواند در موقعیت‌هایی که دو نمره دهنده برای یک متغیر وجود دارد، به عنوان معیاری برای توافق بین نمره گذاران استفاده شود. به عنوان مثال،‌پاز دو روانپزشک بخواهیم وجود یا عدم وجود افسردگی حاد را در تعدادی از بیماران تشخیص دهند. دامنه ضریب همبستگی تتراکوریک اعداد محدوده ۱- تا ۱+ را پوشش می‌دهد. معمولاً ضرایب همبستگی تتراکوریک بزرگتر و پراکنده‌تر از ضرایب همبستگی پیرسون هستند.

فرمول محاسبه ضریب همبستگی تتراکوریک

آزمون های همبستگی فرمول تتراکوریک

a,b,c,d: فراوانی هر یک از خانه های جدول داده ها

 

ضریب همبستگی دو رشته‌ای نقطه‌ای (point- biserial correlation coefficient)

ضریب همبستگی دو رشته‌ای نقطه‌ای مورد خاصی از پیرسون است و مشابه با r پیرسون تفسیر می‌شود. ضریب همبستگی دو رشته‌ای نقطه‌ای رابطه خطی بین دو متغیر که در آن یک متغیر کمی (فاصله‌ای یا نسبی) و متغیر دیگر اسمی یا دوارزشی واقعی است، را بررسی می‌کند. مانند رابطه بین جنسیت و پیشرفت در زبان انگلیسی به عنوان زبان دوم. منظور از متغیر دوارزشی متغیری است که تنها یکی از دو مقدار صفر یا یک را شامل می‌شود. مانند زن / مرد، بله / خیر، رد / قبول، حاضر / غائب و … .

فرمول محاسبه ضریب همبستگی دو رشته‌ای نقطه‌ای

آزمون های همبستگی فرمول دو رشته‌ای نقطه‌ای

 

ضریب همبستگی دو رشته‌ای (biserial correlation coefficient)    

ضریب همبستگی دورشته‌ای شبیه به دورشته‌ای نقطه‌ای است. تفاوت آنها در این است که داده‌های کمی (فاصله‌ای یا نسبی) را در مقابل داده‌های رتبه‌ای قرار می‌دهد. داده‌های رتبه‌ای در اصل مربوط به یک متغیر پیوسته بوده‌اند که خود پژوهشگر آن را به طور گسسته با دو ارزش اندازه‌ گیری نموده است. بنابراین ضریب همبستگی دو رشته‌ای زمانی استفاده می‌شود که یک متغیر دارای مقیاس فاصله‌ای یا نسبی و متغیر دوم دوارزشی ساختگی باشد. البته با این فرض که توزیع متغیرها نرمال باشد. مقدار ضریب همبستگی دو رشته‌ای گاهی از یک بیشتر می‌شود. خطای معیار آن خیلی بیشتر از پیرسون است و معمولاً برای تحلیل سئوالات به کار می‌رود.

مثال: برای بررسی رابطه بین اضطراب و پیشرفت تحصیلی. اگر نمرات اضطراب را براساس میانگین به اضطراب بالا و اضطراب پایین طبقه‌بندی کنیم، می‌توانیم ‌از ضریب همبستگی دورشته‌ای استفاده کنیم.

فرمول محاسبه ضریب همبستگی دو رشته‌ای

آزمون های همبستگی فرمول دو رشته‌ای

 

ضریب همبستگی اتا (η)

یک ضریب همبستگی دو متغیری برای داده‌های پیوسته است، زمانی که رابطه خطی بین دو متغیر وجود ندارد. ضریب اتا را در مواقعی که یکی از متغیرها اسمی یا رتبه‌ای و دیگری فاصله‌ای/ نسبی باشد، نیز می‌توان به کار برد. ضریب همبستگی اتا مبتنی بر خطای پیش‌ بینی است. یعنی مقدار این ضریب نشان می‌دهد با در نظر گرفتن متغیر اسمی یا رتبه‌ای، چه مقدار از خطای پیش‌ بینی متغیر فاصله‌ای مورد نظر کاسته می‌شود. مانند رابطه بین حرکات مخاطره‌ آمیز در حین رانندگی و میزان تصادفات

این ضریب نامتقارن است، مشابه با ضریب همبستگی پیرسون تفسیر می‌شود، اما هرگز نمی‌تواند منفی باشد.[۱] یعنی دامنه تغییرات آن بین ۰ و ۱+ است.

فرمول محاسبه ضریب همبستگی اتا

آزمون های همبستگی فرمول ضریب همبستگی اتا

 

 

آزمون مجذور خی (χ۲) دو متغیره (آزمون استقلال)

مجذور خی (χ۲) دو متغیره یک آزمون ناپارامتریک برای بررسی وجود یا عدم وجود رابطه بین دو متغیر اسمی یا یک اسمی و یک رتبه‌ای است. اساس آن بررسی و سنجش تفاوت فراوانی‌های مشاهده شده و فراوانی‌های مورد انتظار است. با استفاده از تفاوت بین فراوانی‌های مشاهده شده و فراوانی‌های مورد انتظار به وجود یا عدم وجود رابطه بین دو متغیر پی می‌بریم. در صورتی که هیچ رابطه‌ای بین دو متغیر وجود نداشته باشد، می‌توان نتیجه گرفت که دو متغیر مستقلند. به همین دلیل به این آزمون، آزمون استقلال گفته می‌شود. مانند رابطه بین دو متغیر جنسیت و استفاده از مواد مخدر

با استفاده از مجذور خی دو متغیره فقط وجود یا عدم وجود رابطه بین دو متغیر مشخص می‌شود. برای تعیین شدت یا میزان همبستگی باید از آزمون‌های تعقیبی مجذور خی مانند ضریب فی (φ)، ضریب توافقی (C) و ضریب کرامر (V) استفاده کرد.

 پیش فرض‌های آزمون خی‌دو

  • متغیر باید به صورت طبقه ای (در سطح اسمی) باشند.
  • تعداد طبقات متغیر دو یا بیشتر باشد.
  • مجموع فراوانی‌های مورد انتظار با مجموع فراوانی‌های مشاهده شده برابر باشد.
  • فراوانی مورد انتظار بیش از ۲۰ درصد خانه های جدول  کمتر از ۵ نباشد. اگر چنین باشد محقق باید خانه های مجاور را با هم ترکیب کند تا مقدار فراوانی مورد انتظار را به بیش از ۵ برساند.
  • فراوانی‌ها یا مشاهدات مستقل از یکدیگر باشند.
  • داده‌ها از یک نمونه تصادفی انتخاب شده باشند.

فرمول محاسبه χ۲ دو متغیره

آزمون های همبستگی فرمول خی‌دو دو متغیره

ضریب فی (phi coefficient)

هنگامی که دو متغیر مورد مطالعه اسمی و دو ارزشی واقعی باشند، برای محاسبه ضریب همبستگی آن‌ ها از ضریب فی استفاده می‌شود. یعنی داده‌ها در یک جدول توافقی ۲×۲ که دارای ۲ سطر و ۲ ستون است، ارائه شده باشند. مانند بررسی رابطه بین جنسیت و احساس درد کارگران کارخانه در حین کار

بهترین مورد استفاده ضریب فی محاسبه همبستگی بین سئوال‌های یک آزمون صحیح- غلط است. ضریب فی متقارن است. دامنه تغییرات آن بین ۰ و ۱ است و جهت رابطه در آن معنی ندارد. زیرا با توجه به اسمی بودن داده‌ها، همبستگی‌های منفی از نظر ریاضی غیر ممکن است.

فرمول محاسبه ضریب فی از طریق جدول اعداد توافقی

((φ= (ad-bc)/√((a+b)(c+d)(a+c)(b+d

 

ضریب توافقی (Contingency coefficient)

ضریب توافقی هنگامی استفاده می‌شود که هر دو متغیر اسمی یا یکی از متغیرها اسمی و دیگری رتبه‌ای باشد. تفاوت آن با ضریب فی در این است که وقتی برای هر متغیر اسمی ۳ ارزش یا بیشتر وجود داشته باشد و جدول داده‌ها مربع شکل، یعنی تعداد سطر و ستون در جدول برابر باشد (مانند جدول‌های ۳×۳، ۴×۴ و …) از ضریب توافقی استفاده می‌کنیم. مانند رابطه بین وضعیت تأهل (مجرد، متاهل و مطلقه) و وضعیت اقتصادی (بد،‌ متوسط، خوب)

ضریب توافقی متقارن است، دامنه تغییرات آن بین ۰ و ۱ است و جهت رابطه در آن معنی ندارد. زیرا با توجه به اسمی بودن داده‌ها، همبستگی‌ های منفی از نظر ریاضی غیر ممکن است. البته هر چه تعداد ارزش‌ها یا طبقات متغیر بیشتر باشد، مقدار این ضریب نیز بیشتر خواهد بود. اما به ندرت به ۱ می‌رسد مگر اینکه تعداد طبقات بسیار افزایش یابد.

فرمول محاسبه ضریب توافقی از طریق آماره خی دو

آزمون های همبستگی فرمول ضریب توافقی

 

ضریب وی کرامر (Cramer’s V)

ضریب V کرامر هنگامی استفاده می‌شود که هر دو متغیر اسمی باشند. اما تعداد ارزش‌های ممکن برای دو متغیر برابر نباشند. به عبارت دیگر تعداد سطر و ستون در جدول داده‌ها برابر نباشند، مانند جدول‌های ۳×۲، ۵×۳ و … . مانند رابطه بین جنسیت و گرایش سیاسی

ضریب V کرامر متقارن است، دامنه تغییرات آن بین ۰ و ۱+ است و جهت رابطه در آن معنی ندارد. زیرا با توجه به اسمی بودن داده‌ها، همبستگی‌ های منفی از نظر ریاضی غیر ممکن است.

فرمول محاسبه ضریب V کرامر از طریق آماره خی دو

آزمون های همبستگی فرمول ضریب V کرامر

χ۲: مقدار آماره خی‌دو                 N: تعداد آزمودنی‌ها (حجم نمونه)

r: تعداد سطر در جدول داده‌ها       c: تعداد ستون در جدول داده‌ها

(min(r,c: حداقل مقدار دو عدد تعداد سطر و تعداد ستون

 

ضریب لامبدا (Lambda coefficient)

ضریب لامبدا زمانی به کار می‌رود که دو متغیر مورد مطالعه اسمی و چند ارزشی یا یکی از متغیرها اسمی و دیگری رتبه‌ای باشد. این ضریب نسبت به تعداد مقوله‌ها (ارزش‌های) دو متغیر محدودیتی ندارد. برای پیش‌ بینی مقادیر متغیر وابسته از روی مقادیر متغیر مستقل به کار می‌رود و کاهش نسبی در خطا را انعکاس می‌دهد. به عنوان مثال، آیا با استفاده از وابستگی افراد به یک حزب سیاسی می‌توان رأی آن‌ها به یک نامزد انتخاباتی را پیش‌ بینی کرد.

ضریب لامبدا بین ۰ و ۱+ است. اگر مقدار این ضریب ۰ باشد، یعنی متغیر مستقل در پیش‌ بینی متغیر وابسته هیچ کمکی نمی‌کند و مقدار ۱ یعنی متغیر مستقل به طور کامل متغیر وابسته را پیش‌بینی می‌کند.

ضریب لامبدا نامتقارن است. با توجه به اینکه کدام متغیر را متغیر مستقل در نظر می‌گیریم، دو مقدار لامبدا به دست می‌آید. میانگین این دو مقدار به عنوان معیاری مناسب برای میزان همبستگی دو متغیر استفاده می‌شود.

فرمول محاسبه ضریب لامبدا

آزمون های همبستگی فرمول ضریب لامبدا

 

ضریب تاو گودمن و کروسکال (Goodman and Kruskal’s tau)

ضریب تاو گودمن و کروسکال نیز برای ارزیابی شدت رابطه بین متغیرهایی که هر دو اسمی یا یکی اسمی و دیگری رتبه‌ای باشد، به کار می‌رود. این ضریب نسبت به تعداد مقوله‌های متغیرها محدودیت ندارد. برای مثال، پیش‌ بینی خشونت طلبی در افراد براساس گروه سنی.

ضریب گودمن و کروسکال یک ضریب متقارن است که در آن متغیر مستقل و وابسته مشخص نیست. مقدار این ضریب همیشه بین صفر و یک نیست. به ویژه زمانی که تعداد طبقات متغیر وابسته بیش از متغیر مستقل باشد. این ضریب نامتقارن است و دامنه تغییرات آن از ۰ تا ۱+ است.

 

فرمول محاسبه ضریب تاو گودمن و کروسکال

آزمون های همبستگی فرمول ضریب تاو گودمن و کروسکال

 

 

[۱]– www. Andrews.edu/~calkins/math/edrm611/edrm13.htm

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *