۳ -۱۰-۱ مدل رگرسیون
اگر چنانچه پس از رسم نمودار پراکنش میان دو متغیر، بهترین خط را به روش حداقل توانهای دوم[۱۱۳] برازش کنیم به نحوی که مجموع توانهای دوم انحرافات عمودی از خط برازنده حداقل شود؛ آنگاه به چنین خطی، خط رگرسیون میگویند. به زبان ریاضی، معادله خط رگرسیون را میتوان به شکل زیر تعریف نمود:
معادله:
عرض از مبدأ و شیب خط رگرسیون یا همان میزان تغییرات بر حسب متغیر است. مقادیر a و b طوری تعیین میشوند که مجموع انحرافات بین کل مشاهدات (Y) و برآورد آن به وسیله یعنی ( کمینه شود.
برای برآورد مقادیر و از روابط زیر استفاده میشود:
( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
معادله:
معادله:
معادله:
معادله:
رابطه رگرسیون فوق یک رابطه ساده دو متغیره است؛ یعنی تغییرات یک متغیر وابسته را به تغییرات یک متغیر توضیحی مستقل میتوان نسبت داد، اما بسیاری از نظریهها و ایدههای مالی مبین آن هستند که متغیر وابسته تحت تأثیر بیش از یک متغیر مستقل قرار دارد، وجود بیش از یک متغیر توضیحی در یک زمان در معادله رگرسیون و بررسی تمامی این متغیرهای توضیحی به طور هم زمان بر روی متغیر وابسته موجب اعتبار بیشتر آن میشود. (عادل آذر، ۱۳۸۳)
تعمیم یک مدل ساده به مدلی با متغیر مستقل کار بسیار سادهای است، بنابراین میتوان مدل رگرسیون چند متغیره را به صورت زیر بیان کنیم:
معادله:
; ;, …, t
رگرسیون خطی دارای مفروضاتی است که برای استفاده از این مدل وجود آنها ضروری میباشد. در ادامه به معرفی این مفروضات و آزمونهای آنها میپردازیم.
۳- ۱۰ -۲ آزمون خطی بودن
یکی از مفروضات ضمنی مدل رگرسیون خطی کلاسیک، این است که فرم طبیعی مناسب این مدلها به صورت خطی است. بدین معنی که فرض میشود پارامترهای مدل مناسب فرم خطی است. در مورد رگرسیونهای دو متغیره روابط بین دو متغیر به وسیله یک خط مستقیم نمایش داده میشود، اما این فرض همواره صادق نیست. خطی بودن مدل را با بهره گرفتن از آزمون رمزی میتوان آزمون نمود که یک آزمون تصریح نامناسب فرم تبعی است. در این روش اقلام مرتبه بالاتر مقادیر برازش شده در یک رگرسیون معین، مورد استفاده قرار میگیرند. این رگرسیون معین، رگرسیونی است که متغیر وابسته رگرسیون اصلی بر توانهای مقادیر برازش شده متغیرهای توضیحی اصلی، برازش شده است. (بروکز[۱۱۴]، ۱۳۸۹)
۳ -۱۰-۳ آزمون خود همبستگی
فرض دیگر مدل رگرسیون خطی صفر بودن کواریانس بین اجزای خطا در طول زمان (به صورت مقطعی برای انواع دادهها) میباشد، به عبارت دیگر فرض فوق مبین این است که خطاها به یکدیگر وابسته نیستند. در صورتیکه خطاها غیر همبسته نباشند، به این معنی است که خود همبسته هستند و یا به صورت پیاپی همبسته میباشند، بنابراین فرض مزبور نیازمند آزمون است.
پیامدهای ناشی از وجود خود همبستگی، مشابه پیامدهای ناشی از نادیده گرفتن ناهمسانی واریانس است. به طوری که ضرایب برآورده شده با بهره گرفتن از نا اریب بوده ولی ناکارا است، یعنی حتی در نمونههای بزرگ بهترین برآورد کنندههای خطی نا اریب نیست، به طوری که خطای معیار برآورد شده میتواند نادرست باشد، بنابراین امکان دارد که استنباطهای نادرستی در مورد اینکه آیا یک متغیر عامل تعیین کننده مهمی در تغییرات متغیر وابسته باشد یا نه، صورت پذیرد.
سادهترین آزمون خود همبستگی پسماندها، آزمون دوربین- واتسون است. دوربین- واتسون آزمونی برای خود همبستگی مرتبه اول است، یعنی این آزمون تنها برای رابطه بین یک خطا و مقدار قبلی خودش میباشد. آماره دوربین- واتسون بر یکی از سه مقدار مهم صفر، ۲ و ۴ دلالت دارد.
-
- در صورتی که آماره دوربین- واتسون ۲ باشد، یعنی زمانی که هیچگونه همبستگی بین پسماندها وجود ندارد. به طور کلی میتوان گفت که اگر این آماره نزدیک عدد ۲ باشد، شواهد کمی دال بر خود همبستگی وجود دارد.
-
- اگر آماره برابر صفر باشد، خود همبستگی کامل مثبتی بین پسماندها وجود دارد.
-
- همچنین اگر آماره دوربین- واتسون برابر با مقدار ۴ باشد، خود همبستگی کامل منفی بین پسماندها وجود دارد.
البته آزمونهای دیپری نیز مانند آزمون بروش- گودفری برای آزمون خود همبستگی وجود دارد. این آزمون عمومیت بیشتری نسبت به آزمون دوربین- واتسون داشته و میتواند در شرایط گستردهتری مورد استفاده قرار گیرد، زیرا دارای محدودیتهای دوربین- واتسون به صورت شکلی از رگرسیون مرحله اول نمیباشد. (بروکز، ۱۳۸۹)
در نرمافزار EVIEWS آماره دوربین- واتسون به صورت خودکار محاسبه میشود، همچنین آزمون بروش- گودفری را نیز میتوان اجرا کرد که همان آزمون LM میباشد.
۳ -۱۰-۴ آزمون همسانی واریانسها
یکی از مفروضات معادله رگرسیون ثابت بودن واریانس خطاها میباشد که به عنوان فرض همسانی واریانسها شناخته میشود. در صورتیکه خطاها، واریانس ثابتی نداشته باشند، گفته میشود که ناهمسانی واریانس وجود دارد.
آزمونهای آماری رسمی متعددی در زمینه ناهمسانی واریانس وجود دارد که یکی از سادهترین این روشها آزمون گلدفلت- کوانت[۱۱۵]یا میباشد. بر اساس این روش کل نمونه با طول به دو زیر نمونه با طول و تقسیم و مدل رگرسیونی هر زیرگروه برآورد شده و واریانس دو پسماند محاسبه میشوند. فرضیه صفر این است که واریانس جزء اخلالها برابر باشد. آماره این آزمون با نشان داده میشود که نسبت سادهای از دو واریانس پسماند است که واریانس بزرگتر در صورت کسر قرار میگیرد. در صورتی که آماره آزمون از مقدار بحرانی تجاوز کند، فرضیه صفر مبتنی بر یک واریانس ثابت رد میشود.
آزمون معروف دیگری به نام آزمون عمومی وایت[۱۱۶]در زمینه ناهمسانی واریانس وجود دارد. این آزمون به لحاظ اندک بودن مفروضات آن مفید میباشد. (بروکز، ۱۳۸۹)
۳ -۱۰- ۵ آزمون نرمال بودن پسماندها
به منظور اجرای فرضیههای تک یا توأم در مورد پارامترهای مدل، فرض نرمال بودن پسماندهای مدل مطرح میشود. سومین و چهارمین گشتاور استاندارد شده یک توزیع به عنوان چولگی و کشیدگی شناخته میشود. چولگی معیاری است مبنی بر این که توزیع پیرامون میانگینش متقارن نیست و کشیدگی معیاری برای توپری و دنبالههای توزیع است. یک توزیع نرمال چوله نبوده و کشیدگی آن برابر ۳ است. همچنین میتوان ضریبی را برای کشیدگی مازاد تعریف کرد که برابر با ضریب کشیدگی منهای۳ میباشد، به طوری که یک توزیع نرمال ضریب کشیدگی مازادی برابر صفر دارد. یک توزیع نرمال به صورت متقارن و میانه پهنا است. یک توزیع نرمال پیرامون میانگینش متقارن است درحالیکه یک توزیع چوله اینگونه نیست و یکی از دنبالهها طولانیتر از دیگری است.
یک توزیع کشیده توزیعی است که دارای دنبالههای توپر بوده و در بالای میانگین دارای ارتفاع بیشتری نسبت به یک متغیر تصادفی با توزیع نرمال با همان میانگین و انحراف معیار میباشد. درحالیکه یک توزیع پهن در قسمت میانگین دارای ارتفاع کم با دنبالههای کم پشت و نازکتر میباشد و بیشتر توزیع در شانههای توزیع نسبت به توزیع نرمال قرار دارد. (بروکز، ۱۳۸۹)
آزمونهای مختلفی برای آزمون نرمال بودن متغیرها مورد استفاده قرار میگیرد. آزمون جاک- بهرا، آندرسون- دارلینگ و ریان- جوینر از آن جمله هستند.
۳- ۱۰-۶ همبستگی
تحلیل همبستگی ابزاری آماری است که به وسیله آن میتوان درجهای را که یک متغیر به متغیر دیگر، از نظر خطی مرتبط است، اندازهگیری کرد. بعبارت سادهتر همبستگی معیاری است برای تعیین میزان ارتباط دو متغیر و معمولاً همراه با تحلیل رگرسیون به کار میرود. در همبستگی دو معیار ضریب همبستگی و ضریب تعیین بحث میشود.
۳ -۱۰-۷ ضریب همبستگی ®
ضریب همبستگی نوع رابطه مستقیم یا معکوس و همچنین شدت رابطه بین دو یا چند متغیر را نشان میدهد. ضریب همبستگی همیشه بین ۱- و ۱ میباشد. اگر =۱ باشد در آن صورت تمامی نقاط بر روی یک خط راست قرار دارند و همبستگی، مثبت و کامل میباشد یعنی ضریب زاویه (شیب) خط مثبت است. اگر =-۱ باشد در این حالت تمامی نقاط روی خط مستقیم قرار دارند ولی ضریب زاویه خط منفی است و اگر چنانچه =۰ باشد نشانه عدم وجود همبستگی میان متغیرهاست.
متداولترین ضریب همبستگی، ضریب همبستگی پیر سون است که به صورت زیر قابل محاسبه است:
معادله: