-معایب
الگوریتم های یادگیری مدل در این کتابخانه هنوز به بلوغ کامل نرسیده اند و درحال تکامل هستند.
برای پیاده سازی الگوریتم های داده کاوی توسط این ابزار باید از ترکیب های متفاوت آنچه در اختیار هست استفاده کرد.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
ج-WEKA[21]
ابزار رایج و متن باز داده کاوی است که کتابخانه های آماری و داده کاوی بسیاری را شامل میشود. این نرم افزار بوسیله جاوا نوشته شده است و در دانشگاه وایکاتو در کشور نیوزلند توسعه داده شده است.
-مزایا
دارای بسته های فراوان یادگیری ماشین.
دارای نمای گرافیکی مناسب.
مشخصا به عنوان یک ابزار داده کاوی معرفی شده است.
کار کردن با آن ساده است.
اجرای همزمان چندین الگوریتم و مقایسه نتایج.
همانطور که مشخص شد weka در مقابل دیگر نرم افزار های بیان شده به لحاظ قدرت و کاربر پسندی به Rapidminer نزدیک تر است و شباهت های زیادی به هم دارند زیرا که:
هردو به زبان جاوا نوشته شده اند.
هردو تحت مجوزGPL منتشر شده اند.
Rapidminer بسیاری از الگوریتمهای weka را در خود بارگذاری میکند.
اما weka معایبی نسبت به Rapidminer دارد از جمله اینکه:
در اتصال به فایلهای حاوی داده Excel و پایگاه های داده که مبتنی بر جاوا نیستند ضعیف عمل میکند.
خواندن فایلهای csv به شکل مناسبی سازماندهی نشده است.
به لحاظ ظاهری در رده پایینتری قرار دارد.
در نهایت بعد از بررسی های انجام شده حتی در میان نرم افزار های غیرمتن باز تنها ابزاری که کارایی بالاتری از Rapidminer داشت statistica بود که متن باز نبوده و استفاده از آن نیازمند تقبل هزینه آن است]صنیعی آباده ۱۳۹۱[.
در یازدهمین و دوازدهمین بررسی سالانه KDDnuggets Data Mining / Analytics رای گیری با طرح این سوال که کدام ابزار داده کاوی را ظرف یک سال گذشته برای یک پروژه واقعی استفاده کرده ایددر سال ۲۰۱۰ از بین ۹۱۲ نفر و در سال ۲۰۱۱ ازبین ۱۱۰۰ نفر انجام شد. توزیع رای دهندگان بدین صورت بوده است:
اروپای غربی ۳۷%
آمریکای شمالی ۳۵%
اروپای شرقی ۱۰%
آسیا ۶%
اقیانوسیه ۴%
آمریکای لاتین ۴%
آفریقا و خاورمیانه %۴
نتایج به شرح جدول ۳-۱ بوده است :
جدول شماره ۳-۱: نتایج رای گیری استفاده از نرم افزارهای داده کاوی
۲۰۱۱ Vote | ۲۰۱۰ Vote | Software name |
۳۷. ۸% | ۲۷. ۷% | Rapidminer |
۲۹. ۸% | ۲۳. ۳% | R |
۲۴. ۳% | ۲۱. ۸% | Excel |