Soutenance de thèse de Pierre-Henri PARIS

Carte non disponible

Date/heure
Date(s) - 17/06/2020
10 h 00 - 13 h 00

Soutenance de thèse de Pierre-Henri PARIS

Catégories


J’ai le plaisir de vous convier à ma soutenance de thèse que j’ai effectuée au sein de l’équipe ISID du laboratoire CEDRIC au CNAM, sous la direction de Samira SI-SAID CHERFI et Fayçal HAMDI.  Elle s’intitule « Identity in RDF knowledge graphs: Propagation of properties between contextually identical entities ».
 
La soutenance se déroulera en ligne le Mercredi 17 Juin à 10h00 sur Zoom.
Vous êtes cordialement invités à cette soutenance virtuelle.
Si vous souhaitez participer à la soutenance sur Zoom, je vous prie de bien vouloir nous en faire part (faycal.hamdi@cnam.fr et pierre-henri.paris@upmc.fr).
Si vous ne pouvez pas être présent ce jour là, ou si vous ne souhaitez pas interagir lors de la soutenance, il est possible de voir en streaming (ou a posteriori) ma soutenance ici : https://youtu.be/JAFkg5gjmk4

Membres du Jury:
Nathalie PERNELLE – Université Sorbonne Paris Nord (rapporteure)   
Mathieu d’AQUIN – NUI Galway (rapporteur)
Catherine Faron-Zucker – Université Nice Sophia Antipolis (examinatrice)
Cecilia ZANNI-MERK – INSA Rouen Normandie (examinatrice) 
Bernd AMANN – Sorbonne Université (examinateur)   
Dimitris KOTZINOS – ENSEA (examinateur)    
Samira SI-SAID CHERFI – CNAM  (directrice)
Fayçal HAMDI – CNAM – (co-encadrant)  
 
Résumé :
En raison du grand nombre de graphes de connaissances et, surtout, de leurs interconnexions encore plus nombreuses à l’aide de la propriété owl:sameAs, il est devenu de plus en plus évident que cette propriété est souvent mal utilisée. En effet, les entités liées par la propriété owl:sameAs doivent être identiques dans tous les contextes possibles et imaginables. Dans les faits, ceci n’est pas toujours le cas et induit une détérioration de la qualité des données. L’identité doit être considérée comme étant dépendante d’un contexte. Nous avons donc proposé une étude à large échelle sur la présence de la sémantique dans les graphes de connaissances, puisque certaines caractéristiques sémantiques permettent justement de déduire des liens d’identités. Cette étude nous a amenés naturellement à construire une ontologie permettant de donner la teneur en sémantique d’un graphe de connaissances. Nous avons aussi proposé une approche de liage de données fondée à la fois sur la logique permise par les définitions sémantiques, et à la fois sur la prédominance de certaines propriétés pour caractériser la relation d’identité entre deux entités. Nous nous sommes aussi intéressés à la complétude et avons proposé une approche permettant de générer un schéma conceptuel afin de mesurer la complétude d’une entité. Pour finir, à l’aide des travaux précédents, nous avons proposé une approche fondée sur les plongements de phrases permettant de calculer les propriétés pouvant être propagées dans un contexte précis. Ceci permet l’expansion de requêtes SPARQL et, in fine, d’augmenter la complétude des résultats de la requête. 

Abstract:
Due to a large number of knowledge graphs and, more importantly, their even more numerous interconnections using the owl:sameAs property, it has become increasingly evident that this property is often misused. Indeed, the entities linked by the owl:sameAs property must be identical in all possible and imaginable contexts. This is not always the case and leads to a deterioration of data quality. Identity must be considered as context-dependent. We have, therefore, proposed a large-scale study on the presence of semantics in knowledge graphs since specific semantic characteristics allow us to deduce identity links. This study naturally led us to build an ontology allowing us to describe the semantic content of a knowledge graph. We also proposed an interlinking approach based both on the logic allowed by semantic definitions, and on the predominance of certain properties to characterize the identity relationship between two entities. We looked at completeness and proposed an approach to generate a conceptual schema to measure the completeness of an entity. Finally, using our previous work, we proposed an approach based on sentence embedding to compute the properties that can be propagated in a specific context. Hence, the propagation framework allows the expansion of SPARQL queries and, ultimately, to increase the completeness of query results. 

Cordialement,
Pierre-Henri PARIS
Haut