Abstract:
Sequential rule mining is a technique in the field of data mining that allows one for the
discovery of temporal relationships between events and for making predictions. The
discovery of temporal relationships between events stored in large databases is important
in many areas such as stock market analysis, e-learning, etc. In many real-world
applications, such as wireless sensor networks, databases contain uncertain data due to
factors such as missing, incomplete, or inaccurate information. Data uncertainty is modeled
by an existential probability that is associated with each element in each sequence in the
database. In this thesis, we focus on the extraction of uncertain sequential rules. We
propose a new approach for extracting sequential rules from uncertain sequence databases,
by evaluating the performance of the developed methods on synthetic and real data.
ملخص
استخراج القواعد التسلسلیة، المعروف أیضًا باسم استخراج الأنماط التسلسلیة، ھو تقنیة في مجال استكشاف البیانات
تسمح باكتشاف العلاقات الزمنیة بین الأحداث والتنبؤ بھا. یعد اكتشاف العلاقات الزمنیة بین الأحداث المخزنة في قواعد
البیانات الكبیرة مھمًا في العدید من المجالات مثل تحلیل سوق الأسھم والتعلم الإلكتروني وما إلى ذلك. في العدید من
التطبیقات الواقعیة، مثل شبكات المستشعرات اللاسلكیة، تحتوي قواعد البیانات على بیانات غیر مؤكدة بسبب عوامل
مثل المعلومات المفقودة أو غیر المكتملة أو غیر الدقیقة. یتم نمذجة عدم الیقین في البیانات من خلال احتمال وجودي
مرتبط بكل عنصر في كل تسلسل في قاعدة البیانات. تركز ھذه الأطروحة على استخراج القواعد التسلسلیة غیر
المؤكدة. نقترح نھجًا جدیدًا لاستخراج القواعد التسلسلیة من قواعد بیانات التسلسلات غیر المؤكدة، من خلال تقییم أداء
الطرق المتطورة على البیانات الاصطناعیة والواقعیة.