Web sémantique: quand l'info devient connaissance | Juin 2011


Web sémantique, mode d'emploi

Les moteurs de recherche traditionnels, qui travaillent par mots clés, finiront par céder leur place aux moteurs intelligents.

Aujourd’hui, les systèmes de recherche par mots clés n'identifient pas parfaitement les nuances de langage. Ils ne sont pas capables de repérer les synonymes, les déclinaisons. Les moteurs de recherche sémantiques nous permettent au contraire d’obtenir plus rapidement les informations souhaitées en mettant en relation différentes sources avec le thème recherché.

Définition du Web sémantique

Le Web sémantique est défini par son concepteur, Tim Berners-lee, comme la transformation du World Wide Web en un réseau où les documents publiés sont associés à des métadonnées reliées entre elles.  Le Web devient alorsun«élaborateur de connaissances» et non plus simplement un «transmetteur d’informations».

Le principe

L'idée de base repose sur la séparation et l'identification des informations d’un document pour en faciliter sa gestion et son traitement. Le Web sémantique est développé et géré au travers de différents outils.

Les standards

Le W3C (World Wide Web Consortium) est l'organisme de standardisation à but non lucratif qui est chargé de promouvoir la comptabilité des technologies du Web, dont les plus populaires sont:

  • XML (eXtensible Markup Language)
  • RDF (Ressource Description Framework)
  • OWL (Web Ontology Language)

Ces trois éléments sont les couches principales pour passer du Web statique au Web sémantique.

XML: permet de définir les mots clés adéquats d’un document mais n’est pas capable de mettre en relation les différents documents

RDF: est une application XML qui permet de définir les relations entre les documents en tenant compte de la composante  sujet / verbe / complément

OWL: est une extension du langage RDF qui permettra de codifier les futurs dictionnaires ou encyclopédies ontologiques

Les avantages

On peut faire une recherche par similarité
Il arrive souvent que l’utilisateur ne sait pas exactement ce qu’il recherche. Ce  type de technologie lui permettra de trouver des documents qu’il n’aurait pas trouvés avec un moteur de recherche statique.

Les résultats sont de qualité
Les documents trouvés sont véritablement en relation avec les mots clés  introduits dans le moteur de recherche.

La recherche est plus fluide
Aujourd’hui l’utilisateur passe très peu de temps à identifier ses mots clés mais il perd beaucoup de temps à trier les informations trouvées. Avec le Web sémantique, les propositions de réponses étant plus pertinentes, le gain de temps est évident.

Les limites

Mise à niveau
Il n’existe pas encore beaucoup de documents enregistrés selon les «codes» de cette technologie, donc le réseau de données n'est pas encore très dense.

Langues
Une des grandes limites du Web sémantique est sa mise en place pour chaque langue, la mise en relation devant tenir compte de la complexité des idiomes.

Standardisation
La sémantisation exige la mise en place de normes qui ne seront peut-être pas respectées.

Les domaines d’applications

Le Web sémantique a plusieurs champs d’applications qui vont au delà de la simple recherche d’informations sur Internet.

Réseaux sociaux et blogs
Le partage d’informations (lieu, nom des personnes, etc.) et d’images permet d’augmenter le nombre de données disponibles et de se connecter avec les personnes avec lesquelles nous avons plus d’affinités.

Recherche d’archives documentaires
Cette nouvelle technologiepermet d’effectuer des recherches simultanées au travers de plusieurs documents numériques en différentes langues.


La recherche d'informations en entreprise
Des logiciels permettent de collecter, d’analyser, de structurer de grands volumes de données.

Industrie de pointe
Dans certains domaines comme l’aéronautique ou la recherche médicale, la création d'ontologies (ensemble de concepts et de paramètres caractéristiques d’un domaine spécialisé) permet d’agréger des données de conception et de production provenant de  systèmes d'informations épars.

Les outils

Tumbup
Nouveau «moteur de recommandation» lié à Facebook

Wolfram Alpha
Moteur de recherche lancé en mars 2009 qui répond directement à la saisie de questions factuelles en anglais par le calcul de la réponse à partir d'une base de données, au lieu de procurer une liste de documents ou de pages Web pouvant contenir la réponse

Exalead
Moteur de recherche avec des fonctionnalités avancées qui le différencie des moteurs de recherche traditionnels comme Google

Google Squared
Moteur de recherche sémantique créé par Google et lancé en juin 2009 – le premier effort significatif de Google pour comprendre l'information sur le Web et la présenter de manière nouvelle

Gellish
Moteur qui,par l'intermédiaire des utilisateurs et leur interaction, vise à construire une ontologie universelle.

Références:
http://memoire2004-marionconsalvi.blogspot.com
http://en.wikipedia.org/wiki/Semantic_Web
http://www.journaldunet.com/solutions
http://www.slideshare.net/jpfauconnier
http://sourceforge.net/apps/trac/gellish
http://en.wikipedia.org/wiki/Google_Squared
http://www.commentcamarche.net/faq


Sources Images:
http://wbarreto.wordpress.com


dossier préparé par:


Eléonore Arnaud, Simon Barbone, Corinne Isaia, Sandra Rodrigues, Pedro Miguel Rodrigues de Almeida