Proposition and evaluation of an entity linking system based on machine learning methods

Thumbnail Image

Date

2021

Journal Title

Journal ISSN

Volume Title

Publisher

Université Mohamed el-Bachir el-Ibrahimi Bordj Bou Arréridj Faculté de Mathématique et Informatique

Abstract

Named Entity Linking is the task of linking an ambiguous entity mention to a corresponding entry in a knowledge base. Current methods have mostly focused on large unstructured text data to learn representations of entities. Harvesting entity from these large text collections and linking it, is a major challenge. Solutions to this entity linking problem, we propose an efficient linking method that uses machine learning technics and algorithms. We considered it as a binary classification problem, started with some principal features as mention and its candidate and other feature as mention context and candidate context to train the model and testing it. We use there ML method, one of them was Random forest which complete the task with a positive and satisfactory result. Keywords : Entity linking, Machine learning, knowledge base, Binary classification, Natural language processing II Résumé La liaison d’entité nommée est la tâche de lier une mention d’entité ambiguë à une entrée correspondante dans une base de connaissances. Les méthodes actuelles se sont principalement concentrées sur de grandes données textuelles non structurées pour apprendre des représentations d’entités. Récolter des entités à partir de ces grandes collections de textes et les relier est un défi majeur. Solutions à ce problème de liaison d’entités, nous proposons une méthode de liaison efficace qui utilise des techniques et des algorithmes d’apprentissage automatique. Nous l’avons considéré comme un problème de classification binaire, commencé avec certaines caractéristiques principales comme mention et son candidat et d’autres caractéristiques comme contexte de mention et contexte de candidat pour entraîner le modèle et le tester. Nous y utilisons des méthodes d’apprentissage automatique, l’une d’entre elles était la forêt aléatoire qui termine la tâche avec un résultat positif et satisfaisant. Mots clés : Entité Nommée, Apprentissage automatique, Base de connaissances, Classification binaire, Traitement du langage naturel.. III ملخص ربط الكيانات المسماة هي مهمة ربط كيان ما ذكر في نص مع الكيان الذي يوافقه في قاعدة المعرفة، الطرق الحالية ركزت على النصوص الكبيرة غير المنظمة لإستكشاف نمط لتمثيل هذه الكيانات. إستخراج هذه الكيانات من هذه النصوص الكبيرة وربطها تعد ت حديا كبيرا. كحل لهذه المشكلة، إقترحنا نهج ربط فعال يستعمل تقنيات وخوارزميات الذكاء الصناعي. فإعتبرنا المشكل وكأنه مشكل تصنيف ثنائي، بدأنا بتدريب النموذج بإستخدام الخصائص الأساسية كالكيان المذكور في النص ومثيله في قاعدة المعرفة، وقمنا بإختباره بعد ذلك. استخدمنا ثلاث خوارزميات للذكاء الصناعي من بينها الغابة العشوائية والتي أكملت المهمة بنتيجة إيجابية ومرضية. الكلمات المفتاحية: ربط الكيانات، الذكاء الصناعي، قاعدة المعرفة، التصنيف الثنائي، معالجة اللغة الطبيعية.

Description

Keywords

Keywords : Entity linking, Machine learning, knowledge base, Binary classification, Natural language processing

Citation

Endorsement

Review

Supplemented By

Referenced By