تفاصيل الوثيقة

نوع الوثيقة : رسالة جامعية 
عنوان الوثيقة :
نهج التعويض عن القيم المفقودة في تصنيف التغريدات غير المرغوبة
MISSING VALUES IMPUTATION APPROACH IN SPAM TWEETS CLASSIFICATION
 
الموضوع : كلية الحاسبات وتقنية المعلومات 
لغة الوثيقة : العربية 
المستخلص : تعد مشكلة البيانات المفقودة تقريباً مشكلة لا يمكن تجنبها في الأبحاث التي تعتمد على جمع كمية كبيرة من البيانات. وقد تكون المعلومات مفقودة عندما لا يرغب المستخدمون في تقديم بياناتهم الشخصية بسبب مخاوف الخصوصية أو غياب الحافز. خاصةً بالنسبة للبيانات الاختيارية التي تطلبها بعض الأنظمة مثل نظام تويتر (Twitter). يمكن أن يؤثر إهمال أو حذف البيانات المفقودة سلبًا على القوة الإحصائية لدراسة ما ، كما يمكن أن يُنتج تقديرات متحيزة لفئات ما على حساب فئات اخرى ، مما يؤدي إلى استنتاجات غير صحيحة. وهدفت هذه الدراسة إلى تحسين جودة تصنيف البيانات من خلال استخدام نماذج متعددة للتعويض عن البيانات المفقودة والتي تم جمعها من حسابات المغردين على تويتر، ولتحسين فهم أسلوب عمل مرسلي الرسائل غير المرغوب فيها. وقدم البحث دراسة تحليلية للتعويض عن بيانات تويتر المفقودة باستخدام طريقتين: طريقة التعويض المتعدّد من خلال المعطيات المتسلسلة الكاملة (MICE) وطريقة زيادة التوقعات (EM) وتم اختبار نتيجة أثر البيانات الكاملة بعد عملية التعويض من خلال طريقتين: التحليل الإحصائي وخوارزميات التصنيف. وقد أظهرت نتائج النموذج المتبنى بإستخدام تقنية التعلم الآلي ( مصنف الغابات العشوائية) دقة مقدارها ( 96.2% ) بإستخدام عملية التعويض المتعدد من خلال المعطيات المتسلسلة الكاملة (MICE) كما أظهرت الدراسة أيضًا أن عدد إشارة إعلام المستخدمين (@mention) وعدد عناوين URL في كل تغريده هي أكثر ميزتين محتملتين يمكنهما اكتشاف الرسائل غير المرغوب فيها . 
المشرف : أ.د. أميمة بامسق 
نوع الرسالة : رسالة ماجستير 
سنة النشر : 1439 هـ
2018 م
 
تاريخ الاضافة على الموقع : Sunday, July 1, 2018 

الباحثون

اسم الباحث (عربي)اسم الباحث (انجليزي)نوع الباحثالمرتبة العلميةالبريد الالكتروني
وفاء حسين دفعDaffa, Wafaa Husseinباحثماجستير 

الملفات

اسم الملفالنوعالوصف
 43538.pdf pdf 

الرجوع إلى صفحة الأبحاث