الف- اگر حجم نمونه کم است، هر دو آزمون نتایج یکسانی دارند.
ب- اگر حجم نمونه بیشتر از ۲۰۰۰ است، آزمون کلموگروف – اسمیرنوف مناسب تر از آزمون شاپیرو – ویلک است.
آزمون توزیع نرمال داده ها | ||||||
Kolmogorov-Smirnova | Shapiro-Wilk | |||||
Statistic | df | Sig. | Statistic | df | Sig. | |
بهای تمام شده | ۰٫۳۷۴ | ۱۲ | ۰٫۰۰۰ | ۰٫۶۷۱ | ۱۲ | ۰٫۰۰۰ |
-
- Lilliefors Significance Correction
جدول ۴-۱۷ محاسبه توزیع نرمال متغیر بهای تمام شده
معمولا چنانچه سطح معنی داری در این دو آزمون که در این جدول با Sig نمایش داده شده است بیشتر از ۵% باشد، می توان داده ها را با اطمینان بالایی نرمال فرض کرد در غیر اینصورت نمی توان توزیع داده ها را نرمال دانست. با توجه به جدول فوق و مقادیر سطح معنی دار Sig که در هر دو آزمون کلموگروف – اسمیرنوف و آزمون شاپیرو – ویلک کمتر از ۵% شده است در نتیجه فرض نرمال بودن توزیع متغیر بهای تمام شده رد می شود و به عبارتی همان گونه که در تحلیل توصیفی پیش بینی کرده بودیم، توزیع داده های این متغیر نرمال نیست. نمودار ساق و برگ و نمودار جعبه ای در زیر این موضوع را تایید می کند.
۴-۱۸نمودار های تحلیلی اکتشافی داده ها (Explore Plots)
زمانی که توزیع یک متغیر مهم است، بهتر است که توزیع متغیر همراه با یک نمودار نشاد داده شود. نمودار های مورد استفاده برای این منظور، نمودار ساقه و برگ (Stem and leaf)، نمودار جعبه ای (Boxplot)، و هیستوگرام می باشند که هر سه ی آن ها اغلب برای نمایش توزیع یک متغییر کمی استفاده می شوند.
( اینجا فقط تکه ای از متن پایان نامه درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
برای بررسی و مشاهده ی شکل توزیع یک متغییر، نمودارهای فوق را معرفی می کنیم. برای بررسی توزیع ها از روی نمودارها، به عبارتی دیگر برای فهمیدن چگونگی توزیع مقادیر داده ها، می توانید از روی مقادیر انتهایی، صدک ها یا چارک ها و محل هایی که داده های بیشتری تجمع کرده اند، ارزیابی کنید.
۴-۱۹نمودار های جعبه ای
قبل از آن که در مورد گزینه های قسمت Boxplots ار کادر گفتگوی کلید Plots توضیح دهیم، شکل یک نمودار جعبه ای را به طور کلی شرح می دهیم.یک نمودار جعبه ای برای یک گروه جعبه ای است که ضلع پایین آن نماینده ی صدک ۲۵(چارک اول) و ضلع بالایی آن نماینده صدک ۷۵( چارک سوم ) باشد. طول عمودی جعبه، نشان دهنده ی دامنه ی بین چارکی (interquartile) می باشد. خط داخلی جعبه نشان دهنده ی میانه (Median) است. توجه کنید که پهنای جعبه نشان دهنده ی هیچ چیز نمی باشد بلکه تنها مقیاس معنی دار در نمودار جعبه ای، مقیاس عمودی است و تمامی مقادیر در این مقیاس نشان داده می شوند. میانه توسط خطی درون نمودار جعبه ای (در عرض) نمایش داده می شود که روی آن می توانیم محل تجمع داده ها را به دست آوریم. از روی طول جعبه می توانیم ببینیم که چقدر داده ها از هم اختلاف دارند(پراکندگی)، اگر میانه در وسط جعبه قرار نداشته باشد می تواند نشان دهنده ی آن باشد که داده ها قرینه نیستند. اگر میانه به سمت پایین جعبه متمایل باشد نشان دهنده ی آن است که دم داده ها به سمت مقادیر بیشتر است که به آن چولگی مثبت می گویند(یعنی تعداد زیادی از داده ها در ابتدای مقیاس پراکنده شده اند). اگر میانه به سمت بالای جعبه متمایل باشد نشان دهنده ی آن است که دم داده ها به سمت مقادیر کمتر است که به آن چولگی منفی می گویند(بایزیدی، اولادی و عباسی ،۱۳۹۱،ص۶۲).
کشیدگی یک متغیر، ضخامت ناحیه دم یک توزیع (فراوانی نسبی داده های واقع در دو کرانه ) را نشان می دهد.
خطوطی که در بالا و پایین جعبه به سمت جعبه کشیده شده اند ویسکر (Whisker) نام دارند( کوچک ترین و بزرگ ترین نقاطی است که فاصله ی آن ها از پایین یا بالای جعبه کمتر از یک و نیم برابر طول جعبه است).
داده هایی که خارج از محدوده ی ویسکر قرار می گیرند، داده های پرت(outliers)، (مقادیری که فاصله ی آن ها از بالا یا پایین جعبه کمتر از سه برابر طول جعبه است) نام دارند. مقادیری که فاصله ی آن ها از بالا یا پایین جعبه بیش از سه برابر طول جعبه باشد را مقادیر انتهایی (Extreme)می نامند.
گزینه های قسمت Boxplots در کادر گفتگوی Explore:plots به شما امکان می دهند نحوه ی نمایش چند نمودار جعبه ای را با هم مشخص نمایید و یا آن ها را غیر فعال کنید، گزینه ها عبارتند از:
Factor levels together(سطوح فاکتور با هم): این گزینه را هنگامی انتخاب کنید که می خواهید توزیع ها را در سطوح فاکتورها با هم مقایسه کنید.
Dependents together( متغیر های وابسته با هم): این گزینه را زمانی انتخاب کنید که می خواهید توزیع های متغیر ها وابسته را درون هر سطح فاکتور با هم مقایسه کنید، آن گاه توزیع های چند متغیر وابسته را در یک نمودار ملاحظه خواهید کرد.
None: این گزینه از ایجاد نمودار های جعبه ای جلو گیری می کند (ابراهیم بایزیدی و دیگران، ص ۶۲ و۶۳ ).
۴-۲۰نمودار های توزیع نرمال
قسمت Desciptives از کادر گفتگوی Explore:plots دو نمودار ساقه و برگ (Stem and leaf) و هیستوگرام(Histogram) را در اختیار شما قرار داده است که می توانید با آن ها به ارزیابی توزیع متغیر ها بپردازید. ابتدا نمودار هیستوگرام و سپس نمودار ساقه و برگ را معرفی می کنیم.
۴-۲۱هیستوگرام
اگر یک متغیر تعداد داده های زیادی داشته باشد(برای مثال متغیر کمی وزن را در نظر بگیرید) نمایش گرافیکی تمام داده ها برای ارائه فراوانی های آن ها، نیاز به جای زیادی دارد و نمی تواند توصیف خوبی ارائه کند.(برای مشاهده ی فراوانی های مربوط به یک متغیر کیفی که دارای تعداد مقادیر زیادی نیست مثل متغیرq1 با ۵ مقدار، نمودار ستونی (Bar chart) به کار می بریم که دران محور افقی نشان دهنده ی سطوح متغیرq1 و ارتفاع ستون های عمودی نمایان گر فراوانی سطوح مربوط به آنهاست).
روند هیستوگرام برای نمایش چنین متغیر هایی مقادیر آن ها را رده بندی می کند و سپس توزیع فراوانی رده ها را به صورت نموداری ارائه می کند( یک رده عبارت از فاصله ای از مقادیر است که با نقطه میانی آن فاصله شناخته می شودمثلا رده ی ۱۲ تا ۱۶ در متغیر میانگین نمرات فاصله ای است که افراد با میانگین های ۱۲ تا ۱۶ را در بر می گیرد و نقطه میانی آن ۱۴ می باشد). یک هیستوگرام، رده ها را در محور افقی نشان می دهد و محور عمودی نمایانگر فراوانی آن هاست. محور افقی هیستوگرام به گونه ای انتخاب می شود تا بتوان تمامی نمونه ها را نشان داد.با برازش منحنی نرمال درنمودار هیستوگرام می توان به صورت چشمی توزیع فراوانی داده ها را با توزیع نرمال مقایسه نمود(بایزیدی، اولادی و عباسی ،۱۳۹۱،ص ۶۴).