پایان نامه با موضوع تشخیص داده های مفقودی پنهان
در برخی برنامه ها، کدهای صریحی برای داده های مفقودی وجود دارد مانند NA (در دسترس نیست) ولی بسیاری از برنامه ها نیز، هیچ کد صریحی در این زمینه ارائه نداده، و کد داده های معتبر یا نامعتبر بصورت مقادیر داده درست، ثبت می شوند. چنین مقادیر مفقودی را د…
دسته بندی: جزوات» سایر موارد
فرمت فایل دانلودی: pdf
حجم فایل: 1,196 کیلوبایت
در برخی برنامه ها، کدهای صریحی برای داده های مفقودی وجود دارد مانند NA (در دسترس نیست)
ولی بسیاری از برنامه ها نیز، هیچ کد صریحی در این زمینه ارائه نداده، و کد داده های معتبر یا نامعتبر
بصورت مقادیر داده درست، ثبت می شوند. چنین مقادیر مفقودی را داده های م فقودی پنهان
می نامیم. (disguised missing)
داده های مفقودی پنهان، ممکن است بر کیفیت تحلیل داده، تاثیر منفی داشته باشند، مثلا، نتایج قوانین
بروشنی، نیاز به استفاده از مدیریت کیفیت داده قبل از KDD‐Cup‐ انجمنی کشف شده در داده های 98
تحلیل را نشان دادند.
روش اکتشافی نمونه تعبیه شده بدون) EUSH، در رساله جاری، برای حل مشکل داده های مفقودی پنهان
جانبداری) را تحلیل کردیم، موانع روش را نشان داده و روش جدیدی بر اساس تست دونمونه ای مربع
قابل EUSH چی، پیشنهاد دادیم. روش پیشنهادی، نیازمند هیچ گونه دانش پیشینه حوزه نبوده و بخوبی با EUSH قابل مقایسه است.