تجزیه و تحلیل آماری

فائزه حجتی

آزمونهای ناپارامتریک برای فرضیه های تفاوتی

فائزه حجتی | اسفند ۱, ۱۳۹۵ | 5 دیدگاه

آزمونهای ناپارامتریک برای فرضیه‌های تفاوتی

در صورتی که شرایط استفاده از آزمونهای پارامتریک وجود نداشته باشد، برای مقایسه میانگین در یک یا چند گروه، از آزمونهای ناپارامتریک برای فرضیه‌های تفاوتی استفاده می‌شود. به عبارت دیگر، اگر متغیرها از نوع اسمی و رتبه‌ای باشند یا اگر متغیرها از نوع فاصله ای و نسبی بوده ولی توزیع آماری جامعه نرمال نباشد، از روشهای ناپارامتریک استفاده می شود.

 

 

آزمون مجذور خی یک متغیره (نیکویی برازش)

آزمون مجذور خی (۲ χ) برای سنجش تفاوت فراوانی مشاهده شده و فراوانی مورد انتظار طبقات یک متغیر به کار برده می‌شود تا مشخص کند آیا تفاوت موجود معنی‌دار بوده یا ناشی از خطا یا تصادفی است. برای مثال فرض کنید یک بازازیاب معتقد است که میزان جذابیت ۴ برند گوشی‌های هوشمند در بین مردم یکسان است. به همین منظور او از تعدادی از درباره این‌که کدام برند را ترجیح می‌دهند، سئوال می‌کند.

پیش فرض‌های آزمون خی‌دو

۱- متغیرها باید به صورت طبقه‌ای (در سطح اسمی) باشند.
۲-  تعداد طبقات متغیر دو یا بیشتر باشد.
۳-  مجموع فراوانی‌های مورد انتظار با مجموع فراوانی‌های مشاهده شده برابر باشد.
۴-  فراوانی مورد انتظار بیش از ۲۰ درصد خانه‌های جدول کمتر از ۵ نباشد. اگر چنین باشد محقق باید خانه‌های مجاور را با هم ترکیب کند تا مقدار فراوانی مورد انتظار را به بیش از ۵ برساند.<div
۵- فراوانی‌ها یا مشاهدات مستقل از یکدیگر باشند.
۶- داده‌ها از یک نمونه تصادفی انتخاب شده باشند.

آزمونهای ناپارامتریک برای فرضیه های تفاوتی، آزمون خی‌دو تک متغیره

تصمیم‌گیری: در صورتی که مقدار ۲ χ محاسبه (مشاهده) شده از ۲ χ بحرانی جدول بزرگتر یا مساوی باشد (یا ۰٫۰۵ > p-value)، فرض صفر رد و فرض خلاف تأیید می‌شود. بنابراین با اطمینان ۹۵ درصد می‌توان نتیجه گرفت بین فراوانی مشاهده شده و فراوانی مورد انتظار طبقات متغیر مورد مطالعه تفاوت معنی‌داری وجود دارد.

 

آزمون u مان- ویتنی (Mann-Whitne U test)

آزمون u مان- ویتنی یک آزمون ناپارامتریک برای مقایسه رتبه‌های دو گروه مستقل است. در واقع از این آزمون زمانی استفاده می‌شود که مفروضه‌های آزمون t مستقل مانند یکسانی واریانس‌ها یا نرمال نبودن توزیع داده‌ها رعایت نشده و مقیاس متغیر وابسته رتبه‌ای باشد. برای مثال، با استفاده از آزمون u مان- ویتنی می‌توانید بررسی کنید که آیا بین نگرش زنان و مردان نسبت به تبعیض در پرداخت دستمزد تفاوت وجود دارد؟ در اینجا نگرش نسبت به تبعیض در پرداخت دستمزد متغیر وابسته می‌باشد که در مقیاس رتبه‌ای اندازه‌گیری شده است. جنسیت نیز متغیر مستقل است که دارای دو گروه زنان و مردان می‌باشد. در صورتی که متغیر وابسته یعنی نگرش در مقیاس فاصله‌ای و توزیع آن نرمال نباشد، نیز می‌توانیم از این آزمون استفاده می‌کنیم.

فرضیه‌های صفر و خلاف به صورت زیر نوشته می‌شوند:

آزمونهای ناپارامتریک برای فرضیه های تفاوتی، فرمول محاسبه آزمون من ویتنی

توجه:‌ در بعضی منابع مقدار حجم نمونه n2 وn1 را ۲۰ معرفی و در نظر گرفته اند.

تصمیم‌گیری:

  • اگر حجم نمونه در دو گروه کوچکتر یا مساوی ۸ باشد (۸ ≥ n2 وn1)، به جدول توزیع  مراجعه می‌کنیم. در صورتی که مقدار  محاسبه شده از مقدار  بحرانی جدول کوچکتر باشد،  (یا ۰٫۰۵ > p-value) فرض صفر رد و فرض خلاف تأیید می‌شود. بنابراین با اطمینان ۹۵ درصد می‌توان نتیجه گرفت بین میزان متغیر مورد مطالعه در دو گروه تفاوت معنی‌داری وجود دارد.
  • اگر حجم نمونه در دو گروه بزرگتر از ۸ باشد (۸ <  n2وn1)، توزیع  تقریباً نرمال خواهد بود و برای تفسیر آن از جدول توزیع Z استفاده می‌شود. درصورتی که مقدار Z محاسبه شده بزرگتر یا مساوی Z جدول باشد (یا ۰٫۰۵ > p-value)، فرض صفر رد و فرض خلاف پذیرفته می‌شود. بنابراین با اطمینان ۹۵ درصد می‌توان نتیجه گرفت بین میزان متغیر مورد مطالعه در دو گروه تفاوت معنی‌داری وجود دارد.

 

آزمون ویلکاکسون  (Wilcoxon Test)

آزمون ویلکاکسون به بررسی تفاوت بین دو گروه جور شده یا یک گروه که دو بار مورد آزمون قرار گرفته است، می‌پردازد. از این آزمون زمانی استفاده می‌شودکه مفروضه‌های آزمون t وابسته مانند یکسانی واریانس‌ها یا نرمال نبودن توزیع داده‌ها رعایت نشده باشد و متغیر وابسته پیوسته و حداقل در مقیاس رتبه‌ای باشد. برای مثال، آیا میزان مصرف روزانه سیگار قبل و بعد از یک برنامه ۶ هفته‌ای هیپنوتیسم درمانی تفاوت دارد؟ در اینجا میزان مصرف روزانه سیگار متغیر وابسته است که در مقیاس رتبه‌ای اندازه گیری شده و گروه‌های وابسته “قبل” و “بعد” از هیپنوتیسم درمانی می‌باشند.

فرضیه‌های بدون جهت H0 و H1 به صورت زیر نوشته می‌شوند:

آزمونهای ناپارامتریک برای فرضیه های تفاوتی، فرمول محاسبه آزمون ویلکاکسون

  • تصمیم‌گیری:
    در صورتی که ۲۵≥N : اگر مقدار T محاسبه شده کوچکتر یا مساوی مقدار T بحرانی جدول مربوط به توزیع ویلکاکسون باشد (یا ۰۵/۰ > p-value)، فرض صفر رد و فرض خلاف پذیرفته می‌شود. بنابراین با اطمینان ۹۵ درصد می‌توان نتیجه گرفت بین میزان متغیر مورد مطالعه در دو گروه تفاوت معنی‌داری وجود دارد.
  • در صورتی که ۲۵<N : مقدار T به Z تبدیل می‌شود. سپس با مقدار بحرانی جدول توزیع Z مقایسه و تفسیر می‌شود. یعنی درصورتی که مقدار Z محاسبه شده بزرگتر یا مساوی Z جدول باشد (یا ۰٫۰۵ > p-value)، فرض صفر رد و فرض خلاف پذیرفته می‌شود. بنابراین با اطمینان ۹۵ درصد می‌توان نتیجه گرفت بین میزان متغیر مورد مطالعه در دو گروه تفاوت معنی‌داری وجود دارد.

 

آزمون کروسکال والیس (Kruskal-Wallis H test)

آزمون کروسکال والیس یا آزمون H معادل ناپارامتریک تحلیل واریانس یکطرفه است که تفاوت رتبه‌ای سه یا بیش از سه گروه مستقل را نشان می‌دهد. در واقع از این آزمون زمانی استفاده می‌شود که مفروضه‌های آزمون تحلیل واریانس یکطرفه مانند یکسانی واریانس‌ها یا نرمال نبودن توزیع داده‌ها رعایت نشده باشد. مقیاس متغیر وابسته حداقل رتبه‌ای و حداقل سه گروه مستقل با اندازه نمونه حداقل ۵ وجود داشته باشد.

برای مثال، شما می‌خواهید بررسی کنید که آیا وضعیت اجتماعی – اقتصادی افراد بر نگرش آن‌ها نسبت به افزایش مالیات فروش تاثیر می‌گذارد. نگرش نسبت به افزایش مالیات فروش متغیر وابسته است که در مقیاس رتبه‌ای اندازه گیری شده و وضعیت اجتماعی – اقتصادی متغیر مستقل می‌باشد که دارای سه سطح است: طبقه کارگر، طبقه متوسط و طبقه ثروتمند.

فرضیه‌های H0 و H1 به صورت زیر نوشته می‌شوند:

آزمونهای ناپارامتریک برای فرضیه های تفاوتی، فرمول محاسبه آزمون کروسکال والیس

تصمیم‌گیری: برای تفسیر نتایج آزمون کروسکال والیس دو حالت وجود دارد:

  • برای بیش از ۳ گروه و در هر گروه بیش از ۵ آزمودنی با استفاده از جدول خی‌دو
  • برای ۳ گروه و در هر گروه ۵ یا کمتر از ۵ آزمودنی با استفاده از جدول مقادیر بحرانی H
    در صورتی که مقدار H محاسبه شده از مقدار مقدار بحرانی جدول بزرگتر یا مساوی باشد (یا ۰٫۰۵ > p-value)، فرض صفر رد و فرض خلاف تأیید می‌شود. بنابراین در فرضیه بدون جهت با اطمینان ۹۵ درصد می‌توان گفت رتبه‌بندی متغیر مورد مطالعه در گروه‌ها متفاوت است.

 

آزمون فریدمن (Friedman Test)

آزمون فریدمن برای مقایسه میانگین رتبه‌بندی گروه‌های مختلف (بیش از دو گروه وابسته) یا اولویت بندی متغیرها براساس بیشترین تأثیر بر متغیر وابسته به کار می‌رود. بنابراین گروه‌ها باید از قبل جور شده باشند. یعنی آزمودنی‌های یکسان (همتا شده) در سه موقعیت یا بیشتر شرکت می‌کنند. همچنین تعداد آزمودنی‌ها در هر یک از گروه‌ها برابر است که البته از معایب این آزمون به حساب می‌آید. آزمون فریدمن مشخص می‏کند که آیا میانگین‌ها یا حاصل جمع‏های رتبه‏ها به طور معنی‏داری با یکدیگر تفاوت دارند یا خیر.

در صورتی که پیش فرض‌های لازم برای انجام آزمون‌های پارامتریک تحلیل واریانس دوطرفه یا تحلیل واریانس با اندازه‌گیری‌های مکرر وجود نداشته باشد، از معادل ناپارامتریک آن‌ها یعنی آزمون فریدمن استفاده می‌شود. این روش، مفروضه‌ای درباره شباهت توزیع متغیر در ردیف‌های مختلف ندارد. به­علاوه، تعامل را مورد بررسی قرار نمی‌دهد، زیرا بدون اندازه‌های کمی، تعامل بی‌معنی است.

برای مثال فرض کنید یک تحلیلگر بازاریابی معتقد است که اثربخشی نسبی سه نوع تبلیغ شامل ارسال پست الکترونیک، درج در روزنامه و مجله را مقایسه کند. این تحلیلگر یک آزمایش بلوکی تصادفی انجام می‌دهد و شرکت بازاریابی برای ۱۲ مشتری از همه انواع تبلیغات در طول یک دوره یک ساله استفاده و درصد پاسخ آن‌ها را به هر یک از انواع تبلیغات در آن سال ثبت می‌کند. او برای تعیین این‌که آیا میانه اثر آزمایش برای هر یک از انواع تبلیغات متفاوت است یا نه از آزمون فریدمن استفاده می‌کند.

پیش فرض‌های آزمون فریدمن

۱- مفروضه‌های یکسانی واریانس‌ها یا نرمال نبودن توزیع داده‌ها رعایت نشده باشد.
۲- مقیاس متغیر وابسته حداقل رتبه‌ای باشد.
۳- حداقل سه گروه وابسته وجود داشته باشد.

در آزمون فریدمن، فرضیه‌های صفر و خلاف غالباً به صورت‌های زیر تنظیم می‌شوند.

آزمونهای ناپارامتریک برای فرضیه های تفاوتی، فرمول محاسبه آزمون فریدمن

تصمیم‌گیری: برای تفسیر نتایج آزمون فریدمن دو حالت وجود دارد:

  • در نمونه‌های کوچک یعنی برای ۳=k و ۹ تا ۲=N و نیز ۴=k و ۴ تا ۲=N از جدول فریدمن استفاده می‌شود.
  • وقتی k و N بزرگتر از مقادیر فوق باشد، آزمون فریدمن تقریباً دارای توزیعی برابر با خی‌دو با درجه آزادی ۱-df= k است. از این‌رو برای آزمون H0 می‌توان از جدول توزیع خی‌دو استفاده کرد.

در صورتی که مقدار ۲ χ محاسبه شده از مقدار ۲ χ بحرانی جدول بزرگتر یا مساوی باشد (یا ۰٫۰۵ > p-value)، فرض صفر رد و فرض خلاف تأیید می‌شود. بنابراین در فرضیه بدون جهت با اطمینان ۹۵ درصد می‌توان نتیجه گرفت بین گروه‌های همتا در زمینه متغیر وابسته تفاوت وجود دارد یا حاصل جمع‏ های رتبه‏ ها به طور معنی‏ داری با یکدیگر تفاوت دارند.

۱۴ آبان, ۱۳۹۶ پاسخ دادن

خیلی خوب توضیح داده اید. موفق باشید.

    فائزه حجتی

    ۲۸ آبان, ۱۳۹۶ پاسخ دادن

    بسیار خوشحالم که موجبات رضایت شما را فراهم نموده است

۲۲ اسفند, ۱۳۹۷ پاسخ دادن

ممنون

۲۶ اسفند, ۱۳۹۷ پاسخ دادن

خیلی عالی بود.لایک داره

۲۰ تیر, ۱۳۹۹ پاسخ دادن

سلام-خیلی علی توضیح دادین-خدا قوت

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *