Résumé:
Named Entity Linking is the task of linking an ambiguous entity mention to a corresponding
entry in a knowledge base. Current methods have mostly focused on large
unstructured text data to learn representations of entities. Harvesting entity from these
large text collections and linking it, is a major challenge.
Solutions to this entity linking problem, we propose an efficient linking method that
uses machine learning technics and algorithms. We considered it as a binary classification
problem, started with some principal features as mention and its candidate and other
feature as mention context and candidate context to train the model and testing it. We
use there ML method, one of them was Random forest which complete the task with a
positive and satisfactory result.
Keywords : Entity linking, Machine learning, knowledge base, Binary classification,
Natural language processing
II
Résumé
La liaison d’entité nommée est la tâche de lier une mention d’entité ambiguë à une
entrée correspondante dans une base de connaissances. Les méthodes actuelles se sont
principalement concentrées sur de grandes données textuelles non structurées pour apprendre
des représentations d’entités. Récolter des entités à partir de ces grandes collections
de textes et les relier est un défi majeur.
Solutions à ce problème de liaison d’entités, nous proposons une méthode de liaison
efficace qui utilise des techniques et des algorithmes d’apprentissage automatique. Nous
l’avons considéré comme un problème de classification binaire, commencé avec certaines
caractéristiques principales comme mention et son candidat et d’autres caractéristiques
comme contexte de mention et contexte de candidat pour entraîner le modèle et le tester.
Nous y utilisons des méthodes d’apprentissage automatique, l’une d’entre elles était la
forêt aléatoire qui termine la tâche avec un résultat positif et satisfaisant.
Mots clés : Entité Nommée, Apprentissage automatique, Base de connaissances,
Classification binaire, Traitement du langage naturel..
III
ملخص
ربط الكيانات المسماة هي مهمة ربط كيان ما ذكر في نص مع الكيان الذي يوافقه في قاعدة المعرفة، الطرق الحالية
ركزت على النصوص الكبيرة غير المنظمة لإستكشاف نمط لتمثيل هذه الكيانات. إستخراج هذه الكيانات من هذه
النصوص الكبيرة وربطها تعد ت حديا كبيرا.
كحل لهذه المشكلة، إقترحنا نهج ربط فعال يستعمل تقنيات وخوارزميات الذكاء الصناعي. فإعتبرنا المشكل وكأنه
مشكل تصنيف ثنائي، بدأنا بتدريب النموذج بإستخدام الخصائص الأساسية كالكيان المذكور في النص ومثيله في قاعدة
المعرفة، وقمنا بإختباره بعد ذلك. استخدمنا ثلاث خوارزميات للذكاء الصناعي من بينها الغابة العشوائية والتي أكملت
المهمة بنتيجة إيجابية ومرضية.
الكلمات المفتاحية: ربط الكيانات، الذكاء الصناعي، قاعدة المعرفة، التصنيف الثنائي، معالجة اللغة
الطبيعية.