Médiation de données sémantique dans SenPeer, un système pair-à-pair de gestion de données
La société de l’information demande un accès efficace à l’information disponible, information qui
est souvent hétérogène et distribuée. Ces dernières années, il a été noté une croissance drastique des
informations électroniques échangées. Chaque utilisateur se connecte à Internet et a accès à une quantité importante d’informations en ligne. Cette information est la plupart du temps disséminée à travers un grand nombre de sources de données. L’utilisateur, en plus de n’être intéressé que par une petite portion de cette information, souhaite consacrer le minimum de temps et de ressources pour son acquisition. Dans le but de partager efficacement cette information, plusieurs solutions techniques ont été proposées. Le Web et les réseaux Pair-à-Pair (P2P) ont permis de mettre en place des moyens simples de partage de données entre les utilisateurs tout en se limitant cependant à la recherche par mots-clés. Dans le but d’organiser des données dispersées sur différents sites, le concept de base de données distribuée a été introduit. Une base de données distribuée est définie comme une collection multiple de bases de données logiquement liées et distribuées sur un réseau d’ordinateurs. Un système de base de données distribuée est le logiciel qui permet la gestion de la base de données distribuée. Son rôle principal est de rendre la distribution transparente à l’utilisateur en masquant les détails fastidieux liés à la gestion des données. Un tel système, dans sa forme la plus simple, est constitué d’un serveur central supportant un schéma global et offrant les services d’une base de données distribuée, traitement de requêtes distribuées et gestion de la consistance des données entre autres. Le principe fondamental derrière la gestion des données est l’indépendance des données. Cette indépendance permet aux applications et aux utilisateurs de partager des données au niveau conceptuel tout en ignorant les détails liés à l’implémentation. Cette approche fournit ainsi un support pour la gestion des schémas, l’expression de requêtes de haut niveau, le traitement et l’optimisation automatique de requêtes.