Résumé:
Le paradigme internet des objets, le traitement des données textuelles sont aujourd’hui au cœur de nombreux scenarios industriels ou dans la recherche scientifique. L’intégration des données exige aux applications la manipulation de données hétérogènes. L'avènement de RDF et XML a rendu donc possible d'encoder ou d'annoter des données pour qu’elles soient traitées par les méthodes de l’intelligence artificielle. Par conséquent, favorise une rapidité d’évolution vers une riche base de connaissances. Le langage SPARQL a été dédié pour interroger un contenu sémantique, la version SPARQL 1.1 est devenue une recommandation du W3C en 2013. L’extraction des données temporelles dans des domaines critiques tels que la gestion des systèmes géographique (GPS) des données de capteurs, système de surveillance (e.g. médicaux, maisons, données financières), va sans doute aider les systèmes intelligents à mieux situer le contexte des usagers. Toutefois, SPARQL ne supporte pas les requêtes spatiales et temporelles. Dans ce contexte nous avons discuté des extensions spéciales comme GEOSPARQL pour l'interrogation des données géospatiales ainsi que d’autres extensions. Quant temporelle, plusieurs propositions ont été faites, par exemple, TSPARQL, une extension SPARQL temporelle adaptée au modèle de base de données RDF. Le but des travaux qui ont été réalisés dans le cadre de ce mémoire est d’étudier les requêtes SPARQL et leurs extensions. Enfin, nous avons voulu proposer un modèle de transformation à partir d’une requête rédigée en langage naturel en langue Arabe en une ou plusieurs requêtes SPARQL. Il s’agit ici d’une interface pour décomposer la phrase (i.e., la requête) en un formalisme XML. Cette méthode s’appuie sur le traitement de langage naturel via un parser (i.e. ; un analyseur) dédié à la langue Arabe tel que Stanford Natural Language Processing. The Internet of Things paradigm and the processing of textual data are today at the heart of many industrial scenarios or scientific research. Data integration requires applications to manipulate heterogeneous data. Therefore, the advent of RDF and XML has made it possible to encode or annotate data so that artificial intelligence methods can process it. Thus, it promotes rapid evolution toward a rich knowledge base.
The SPARQL language was dedicated to query semantic content; SPARQL version 1.1 became a W3C recommendation in 2013. Extracting temporal data in critical areas such as the management of geographic system (GPS) sensor data and monitoring systems (e.g., medical, houses, financial data) will undoubtedly help intelligent systems better situate the context of users. However, SPARQL does not support spatial and temporal queries. In this context, we have discussed particular extensions like GEOSPARQL and other extensions for querying geospatial data. As for the treatment of the temporal notion, several proposals have been proposed, for example, TSPARRQL, a temporal SPARQL extension adapted to the RDF database model. The work carried out within this thesis is to study SPARQL queries and their extensions. Finally, we wanted to propose a transformation model from a query written in natural language in Arabic into one or more SPARQL queries. This interface decomposes the sentence (i.e., the query) into an XML formalism. This method is based on natural language processing via a parser (i.e. an analyzer) dedicated to the Arabic language, such as Stanford Natural Language Processing.