حذف فیلد هایی که دارای مقادیر Null زیاد بوده و یا مقادیری برای آنها وجود ندارد:
( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
در جدول اطلاعات فروش فیلد های زیر به علت مقایر Null زیاد حذف شدند:
تخفیف – Discount
هزینه های اضافی – Addition-Cost
هزینه واحد – unit-Cost
در جدول اطلاعات مشتری فیلد های زیر به علت مقایر Null زیاد حذف شدند:
جنسیت، از آنجایی که بیشتر مشتریان این شرکت را مشتریان حقوقی تشکیل می دادند. این فیلد دارای مقادیر Null بسیاری بود.
در جدول اطلاعات مشتریان، نوع مشتری اعم از حقیقی و حقوقی نیز وجود دارد که در بعضی از موارد مشتریان حقوقی با نوع حقیقی تعریف شده بودند، که تناقضات موجود بر طرف شد.
نرمال سازی داده ها:
تفاوت مقیاس ها در متغیر های مختلف، نتایج داده کاوی را در جهات متفاوتی تحت تاثیر قرار می دهد. برای کاهش تاثیر این نکته در نتایج داده کاوی به نرمال سازی داده پرداخته می شود. در فصل سوم به صورت کامل روش های متداول نرمال سازی داده بیان شد. دراین مطالعه برای نرمال سازی داده ها از روش امتیاز Z با رابطه زیر استفاده شده است. پس از اعمال این رابطه به روی داده ها، داده های موجود در پایگاه داده به صورت یکپارچه ذخیره شده اند. [۳۳]
کاهش بعد:
در دنیای واقعی، معمولا داده به ندرت به منظور داده کاوی جمع آوری می شوند. در چنین مواردی معمولا با حجم عظیمی از داده ها روبه رو شده و به دنبال استفاده از آنها برای کاربرد خاص می باشیم. بنابراین کاهش بعد یکی از افدامات مورد نیاز است. ساخت، استخراج و انتخاب مشخصه ها، از رویکرد های کارآمد برای کاهش داده
می باشد. در این مطالعه با بهره گرفتن از رفتار مشاهده شده مشتری در گذشته متغیر های پیش بینی برای شناسایی مشتریان رویگردان انتخاب شده است که در ادامه به بررسی آنها پرداخته می شود. [۴۰]
۵٫۴ . متغیرهای پیش بینی در این مطالعه
در این قسمت متغیر های پیش بینی که در این مطالعه مورد استفاده قرار گرفته است به تفضیل شرح داده
می شود. قبل از بررسی تشریحی هر کدام از این متغیر ها، لیست آن در جدول شماره ۱٫۵٫۴ نشان داده شده است.
جدول شماره ۱٫۵٫۴٫ متغیر های پیش بینی
نام متغیر | نشان | شرح |
تناوب خرید | Frequency | تعداد دفعات مراجعه مشتری به سازمان، این شاخص به ایجاد تمایز بین مشتریان وفادار و رویگردان بسیار کمک می کند. |
طول ارتباط فعال مشتری با سازمان | Length of Relationship | مدت زمانی که مشتری ارتباط خود را با سازمان آغاز کرده است. این مقدار با احتمال پایداری رابطه مشتری با سازمان در ارتباط می باشد. |
تناوب خرید نسبی | Relative – Frequency | این مقدار معادل نسبت تناوب خرید به عمر فعال مشتری می باشد. rF = |
متوسط فاصله زمانی بین خرید | Interpurchase Time | متوسط زمان سپری شده بین خرید های متوالی مشتریان. |
واریانس فاصله زمانی بین خرید | به منظور در نظر گرفتن نظم رفتاری مراجعان به سازمان و بررسی پراکندگی داده ها حول میانگین. |