Diagramme illustrant la recherche augmentée, brevet déposé par Google en 2013.

Comment rendre votre information repérable, accessible et interopérable

Ce billet s’inscrit dans la ligne du précédent, qui appelait à remplacer le terme fourre-tout de découvrabilité par les objectifs, beaucoup plus concrets, de repérabilité, accessibilité et interopérabilité.

Diagramme illustrant la recherche augmentée dans un brevet déposé par Google en 2013
Diagramme illustrant la recherche augmentée, brevet déposé par Google en 2013.
Source de la référence: ce billet de Bill Slawski.

Nos sites web sont des ensembles d’informations structurées pouvant être repérées, consultées, utilisées et interconnectées sur la grande plateforme ouverte qu’est le Web. C’est pour cette raison que les nôtres sont au cœur de la découverte de contenus et d’offres diverses. Nous devrions consacrer prioritairement nos efforts à les moderniser. Parce qu’aujourd’hui, tout part de là.

Objectif: aider les moteurs à repérer et lier des entités

Les moteurs de recherche indexent le contenu des pages web. Grâce au développement de bases de connaissances structurées (Knowledge Graph), ceux-ci peuvent repérer dans chaque page des choses ayant une signification spécifique, comme des personnes, des lieux, des événements ou des œuvres. Ces choses sont appelées « entités nommées ». Les entités nommées qui sont repérées sont catégorisées et associées selon le modèle d’organisation propre à chacune des bases de connaissances des moteurs de recherche.

Nos sites web, lorsqu’ils sont bien conçus, alimentent ces bases de connaissances. C’est pour cette raison qu’il faut prioriser l’amélioration de la repérabilité des contenus sur nos sites avant de verser des données dans Wikidata. Cette base de connaissances, tout comme d’autres, sert à réduire l’ambiguïté entre des entités (homonymes) et à valider les liens entre elles. Elle ne remplace cependant pas les sources d’information interconnectées, classifiées et référencées que sont les sites web.

Stratégie: quoi, pour qui, avec quels objectifs?

L’amélioration des conditions de repérabilité de l’information ne produit pas de résultat immédiat, contrairement aux tactiques de référencement organique de pages. Elle s’inscrit dans la durée et doit s’appuyer sur des notions précises plutôt que sur des mythes.

La réflexion stratégique permet de déterminer les objectifs à atteindre, les questions auxquelles les données doivent répondre, les publics cibles et les caractéristiques des offres à mettre de l’avant. Les objectifs vérifiables et mesurables de la « découvrabilité » sont les indicateurs de succès qui ont été déterminés en amont dans la stratégie numérique.

Responsabilités: qui fait quoi?

Comme je l’ai déjà mentionné dans un autre billet, nous ne devons plus concevoir des sites web comme des documents, mais comme des plateformes de données. Il faut nous affranchir d’un modèle de conception hérité du document imprimé afin de concevoir le site en commençant par les modèles de données plutôt que par les modèles de pages. Viennent ensuite la définition des structures représentant le ou les domaine de connaissance, puis la représentation des types d’entités sous forme de nœuds et de liens pour former, finalement, des graphes. Tout ceci nous oblige à revoir la méthodologie de conception de sites et à faire appel à des compétences qui sont rarement sollicitées pour des projets web.

Il ne s’agit pas uniquement de savoir comment intégrer ce processus dans les activités d’un projet, mais aussi de savoir ce qui doit être fait à l’interne et ce qui doit, par contre, être confié à des spécialistes.

Il n’existe pas de recette toute faite, ni d’application, pour améliorer ainsi l’organisation de l’information. L’élaboration d’un modèle de données représentant différentes entités et les relations qui les définissent est un travail de spécialiste. De plus, la spécificité des offres, objectifs stratégiques, publics cibles et environnements technologiques soulèvent des questions auxquelles une présentation de 3 heures ne permet pas de fournir de réponses solides.

Trois étapes essentielles pour structurer l’information

J’utilise des outils simples pour accompagner des équipes dans leurs démarches d’amélioration de sites web et de description de contenus avec des données structurées. Cependant, les projets n’avanceraient pas si ces équipes étaient livrées à elles-même, sans ressources pour répondre aux nombreuses questions que la démarche permet de soulever.

1. Organiser le site web autour des entités

L’organisation du site et la structure de l’information concernent les pages web lisibles par des humains et indexables par des machines (voir Structurer l’information autour d’entités repérables) et le code informatique de ces pages qui est interprétable par des machines (lire Schema.org n’est pas le moteur de recherche).

Vous pouvez évaluer en quelques points si la structure et le contenu des pages de votre site fournissent aux éléments d’information (entités nommées, métadonnées, mots clés) les meilleures conditions d’exploitation, pour des visiteurs et pour des moteurs de recherche.

  • Arborescence (accès aux offres et contenus).
  • Nomenclature (alignement de la taxonomie sur les publics cibles).
  • URL unique et lisible pour chaque offre et contenu.
  • Images (nomenclature de fichier, texte alternatif, résolutions).
  • Description (caractéristiques, attributs distinctifs, expérience).
  • Information à valeur ajoutée (liens vers d’autres sources d’information complémentaire).

2. Faire « du lien »

Comment évaluer le potentiel de rayonnement de vos contenus dans le numérique?

  • En cartographiant l’écosystème composé de points et de liens qui jouent un rôle central dans leur visibilité et découverte.
  • En identifiant les points (site web, réseaux sociaux, sites de partenaires) permettant d’établir des connexions pertinentes vers vos offres.

Vous reporterez ensuite, dans une grille, les points ainsi identifiés, puis dresser l’inventaire détaillé de l’information diffusée, de la fréquence des publications, des rôles et responsabilités de chacun. Vous serez alors en mesure de:

  • Déterminer les points permettant de rejoindre différents publics (en d’autres termes, associer les bons canaux et contenus aux bons publics).
  • Identifier les liens à créer ou à solidifier ainsi que les partenariats à développer.

3. Décrire les entités

Cette grille permettra d’identifier les métadonnées qui rendent vos offres et contenus uniques et plus faciles à trouver. Vous pouvez à la fois:

  • Trouver les mots pour différencier votre offre auprès de vos publics cibles.
  • Fournir des métadonnées permettant aux moteurs de recherche de fournir des réponses personnalisées.

Ces activités devraient être réalisées en groupe, au sein d’une organisation ou, lorsqu’il s’agit d’une initiative collective, avec les représentants de différentes organisations.

2 réflexions sur « Comment rendre votre information repérable, accessible et interopérable »

  1. Cet article offre beaucoup de réponses et de pistes de réflexion. Il ouvre aussi le débat sur d’autres questions encore mal cernées, dans un contexte de ruissellement de financements publics tous destinés à réduire l’érosion que subit le « contenu » peu « découvrable ».

    Je ne crois pas qu’il soit nécessaire de minimiser la notion de découvrabilité (et d’en parler comme d’un concept flou) pour faire l’apologie des efforts de repérabilité ou de normalisation des sites Web. Comme tu le soulignes, toutes ces choses sont liées et l’attention que nous leur accordons est parfois simplement facteur de la finalité visée, finalité qui peut varier. Pour les produits audiovisuels, il est impératif de documenter les codecs numériques. Les producteurs et créateurs de ces artefacts si fichent de plus en plus de leur consacrer des efforts de publication sur des sites Internet.

    Je souligne ceci simplement pour éviter que nous repartions sur un autre débat de mot, plutôt que de se concentrer sur le fond. Selon moi le fond repose sur l’adoption de normes et de standards, afin de permettre aux acteurs de la culture et du savoir de s’aligner sur des solutions pratico-pratiques qui enrichissent le rayonnement (tiens, tiens, c’est quoi ça le rayonnement?) de leurs efforts. Pour toi, c’est de revenir aux bases de ce sur quoi doit s’appuyer une publication sur le Web, pour moi, c’est d’activer la découvrabilité d’une œuvre en la documentant adéquatement dans MusicBrainz. L’un ne va pas sans l’autre.

    Enfin, ce que je retiens de fondamental dans ta publication c’est surtout lorsque tu affirmes que « l’amélioration des conditions de repérabilité de l’information ne produit pas de résultat immédiat (…) elle s’inscrit dans la durée ». Alors là, j’allume des lampions pour que le ciel t’entende.

  2. Bonsoir Jean-Robert,
    L’intention de ce billet n’est pas de minimiser la « découvrablité ». Bien au contraire. Il s’agit de l' »augmenter » en mettant en avant des connaissances, pratiques et outils qui répondent aux objectifs des acteurs du milieu culturel et qui rendent ce concept beaucoup moins abstrait.

    C’est d’ailleurs pour cette raison que j’insiste sur la réflexion stratégique: elle permet d’identifier des objectifs et indicateurs de mesure, des publics cibles et les bons moyens. Par exemple, la documentation de codecs numériques dans une base de connaissances répond à un objectif différent de la description d’offres de contenus de type vidéo pour les moteurs de recherche. Il en est de même pour la documentation d’œuvres sur MusicBrainz: cet effort améliorera la repérabilité, l’accessibilité et l’interopérabilité des données en fonction d’objectifs, utilisateurs et usages précis. Cet effort n’aura cependant pas d’incidence sur la repérabilité, l’accessibilité et l’interopérabilité des données structurées sur les sites web et la présence de contenus culturels dans les interfaces des moteurs de recherche.

    Il n’est pas nécessaire de tenir des débats, mais il est important de nommer les choses afin de partager des définitions communes et de pouvoir choisir les outils correspondant aux objectifs et finalités identifiées pour chaque initiative.
    J

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.