Archives par mot-clé : une

Comment améliorer la découvrabilité sur Google?

Pour améliorer la découvrabilité sur Google, mieux vaut utiliser les données là où elles sont vraiment utiles et comprendre les différents types de résultats présentés par le moteur de recherche. En effet, de nouvelles fonctionnalités transforment peu à peu la liste de liens classiques en une interface qui fournit des réponses et des suggestions pour amener les internautes à préciser leurs intentions.

Ces transformations devraient inciter quiconque s’intéresse à la découvrabilité à pratiquer une veille technique (de quoi Google a-t-il besoin maintenant?) et stratégique (pourquoi privilégierait-il ceci?). Ceci n’est apparemment pas le cas: on cherchera en vain de véritables spécialistes de Google au sein des diverses initiatives et comités sur la découvrabilité. Sans être une experte, je m’astreins à rester attentive aux changements.

Voici quelques explications qui permettront de rectifier des interprétations erronées et de réaliser des sites web plus efficaces.

Graphe de connaissances (Knowledge Graph)

Le Knowledge Graph est la base de données factuelles de Google qui est souvent désignée en français par l’expression « graphe de connaissances ».  Un graphe est une façon de représenter des liens entre les données relatives à un domaine ou un sujet. Google peut ainsi répondre à une recherche sur une entité nommée en présentant des données extraites de son graphe de connaissances.

Voici un exemple de graphe de données sur une entité fournit par Google dans un brevet publié en 2022.

En culture, les données du graphe proviennent de sites web, ainsi que de sources publiques et privées choisies par Google comme des réseaux de billetterie, des plateformes d’écoute musicale, des distributeurs du domaine de l’édition et des entreprises de média de masse. Lorsque Google identifie, dans une recherche, une entité faisant partie de son graphe de connaissances, il utilise certaines données pour produire une fiche d’information.

L’illustration ci-dessous contient les résultats d’une recherche sur une illustratrice: «Julie Rocheleau illustration ». Nous avons, à gauche, la liste de liens classiques et, à droite, une fiche d’information. Cette fiche peut accompagner la liste de liens lorsque la question n’est pas suffisamment précise, comme dans ce cas-ci. Ainsi, ces informations extraites du graphe offrent des pistes pour raffiner une recherche.

Recherche sur l'artiste Julie Rocheleau, effectuée sur Google: fiche produite à partir du Knowldege Graph et diverses fonctionnalités intégrées dans la liste de résultats.
Entité nommée identifiée dans une recherche sur l’artiste Julie Rocheleau, avec Google: à droite, la fiche produite à partir du Knowldege Graph et, à gauche, diverses fonctionnalités intégrées dans la liste de résultats.

La fiche d’information est utile pour quiconque cherche une chose ou une personne spécifique. Mais ce n’est évidemment pas le meilleur moyen pour faire découvrir ce que nous ne connaissons ou ne cherchons pas! Et si ceci n’était pas suffisant, voici d’autres raisons pour lesquelles il n’est pas judicieux d’espérer exercer un contrôle sur ce type de résultat:

  • La génération d’une fiche d’information, autre qu’un profil d’entreprise, dépend de plusieurs facteurs comme la présence de l’entité sur différents sites de qualité et le domaine d’activité; mais elle n’est pas automatique et reste à la discrétion de  l’algorithme.
  • Seule une entreprise peut créer sa propre fiche par l’entremise de Google Profil d’entreprise, bien que l’algorithme puisse aussi en générer de son propre chef.
  • Seule une fiche d’entreprise peut contenir un lien vers son site web; une fiche d’artiste n’a donc pas de lien vers un site.
  • Le contenu d’une fiche n’est pas pérenne: le graphe à partir duquel elle est générée peut perdre des attributs. Ceci signifie que des liens ou des images peuvent disparaître suite à un changement tel que la refonte du site où était principalement documentée l’entité sujet de la fiche. Cette mésaventure peut arriver malgré l’existence d’un article sur Wikipédia.

Réponses provenant de contenus web

Sur Google, d’autres types de résultats sont visiblement exploités par les stratégies de contenu d’entreprises commerciales de toutes tailles.  En voici trois qui peuvent accroître la découvrabilité de ce que vous souhaitez faire connaître:

  1. Résultats ou extraits enrichis (Rich snippets);
  2. Extraits optimisés;
  3. Questions connexes (« D’autres personnes ont également demandé »).

1. Résultats ou extraits enrichis (Rich snippets)

Les résultats ou extraits enrichis sont des aperçus, sous forme d’images et de brèves descriptions, offerts par Google pour certains types de contenus comme une recette, un livre ou un produit de consommation. Voici le résultat d’une recherche de bandes dessinées pour adultes.

Découvrabilité: résultats enrichis de Google pour recherche de bandes dessinées pour adultes.
Extraits enrichis générés, en tête de la liste de résultats, en réponse à une recherche de livres de bandes dessinées.

Il est possible d’influencer la probabilité que le moteur de recherche présente une page comme résultat enrichi par l’intégration de balises Schema.org dans le code HTML de la page. Cependant, la génération d’extraits enrichis demeure tributaire des choix de Google pour favoriser les types d’offres et de partenaires qui correspondent au développement de ses affaires.

L’information concernant les bandes dessinées provient de ce que Google appelle des « fournisseurs proposant un large choix de livres ». En d’autres termes, dans la chaîne du livre comme dans d’autres industries, le moteur privilégie les sites d’agrégation comme sources de données. Par conséquent,  les autrices, auteurs et maisons d’édition ont plus intérêt à enrichir leurs sites web qu’à fournir une information indifférenciée sous forme de données.

2. Extraits optimisés

Un extrait optimisé précède parfois la liste de liens résultant d’une question posée dans Google. Il s’agit d’un extrait d’une page web que l’algorithme juge la plus utile pour y répondre à la question d’une . Une vidéo peut également être proposée selon l’interprétation de la requête. Voici un exemple d’extrait obtenu à la suite de cette  recherche précise : « que fait Julie Rocheleau depuis 2020 ».

Découvrabilité: extrait optimisé de Google pour la question "que fait Julie Rocheleau depuis 2020".
Réponse à une question précise sous forme d’extrait optimisé, tiré d’une page web bien construite et bien rédigée. Le moteur de recherche va jusqu’à surligner le passage qu’il juge significatif.

Trois facteurs principaux sont pris en compte pour sélectionner un extrait parmi toutes les pages web mentionnant le même sujet:

  1. Le profil de l’internaute – Il comprend des éléments tels que langue utilisée, localisation, historique de navigation et  intérêts. C’est, entre autres, pour cette raison que Google déconseille d’utiliser les résultats d’une recherche afin d’évaluer l’efficacité générale d’une page web. Plusieurs utilisateurs pourraient tous obtenir des résultats différents.
  2. L’intention exprimée – Elle peut être plus ou moins facile à interpréter par Google selon le degré de précision de la requête et sa rédaction (syntaxe, termes employés, …). Il est également possible que le moteur ne trouve pas de page utile dans la langue de la personne. Il arrive par contre qu’un extrait soit traduit par Google et libellé comme tel. La liste de liens classiques demeure le résultat par défaut.
  3. Les pages web – Essentiellement celles qui, présentant le sujet recherché, sont bien construites (concordance entre URL, balise de titre, meta description…) et bien rédigées (longueur du texte, respect de la hiérarchie des titres…). Malheureusement, ces qualités sont beaucoup plus rares que nous le croyons.

L’extrait précède un lien qui mène directement à la page d’origine de l’information. Si vous souhaitez éviter la tendance zéro clic , il serait préférable de rédiger un texte qui soit à la fois une réponse claire et l’amorce d’explications plus détaillées susceptibles de déclencher la visite.

Conseil aux développeurs : Google utilise également des éléments d’information tirés de listes ou de tableaux en format HTML. Ces tableaux de données auraient de meilleures chances d’être interprètés et utilisés s’ils étaient présentés dans un élément <table>  plutôt que dans une série de <div>.

3. Questions connexes

À la suite d’un extrait optimisé, on trouve souvent, dans la liste de liens, un bloc intitulé « Questions connexes » ou encore « D’autres personnes ont également demandé ». Ce bloc sera affiché lorsqu’on rédigé une demande suffisamment claire pour être bien interprétée comme dans l’exemple ci-dessous: comment créer une bande dessinée en ligne.

Découvrabilité: questions connexes de Google pour la question: comment créer une bande dessinée en ligne.
Questions connexes sélectionnées parmi les requêtes d’autres internautes.

Les réponses à ces questions connexes proviennent des extraits optimisés. Elles sont sélectionnées en fonction de leur proximité avec la requête de l’internaute. La version linguistique utilisée ainsi que la localisationde l’utilisateur sont les principaux facteurs de sélection des questions et réponses.

Pour rédiger des textes plus pertinents pour vos publics, vous pouvez donc vous inspirer de questions adressées à Google par des internautes sur des sujets associés à votre domaine. Une information pertinente et intéressante sera susceptible de générer des visites et de faire découvrir d’autres pages sur votre site.

Conclusion

Miser sur des données pour améliorer la découvrabilité sur Google n’est ni efficace, ni stratégique. Les extraits optimisés et questions connexes sont les types de résultats de recherche qui offrent le plus grand potentiel de découvrabilité, hors publicité payante.

Alors que Google a intégré l’IA dans son interface pour aider les utilisateurs à formuler leurs recherches, il devient important de remettre la rédaction d’information au cœur des stratégies numériques.  Ceci nous oblige à développer une connaissance plus fine des publics et clientèles afin de documenter de manière pertinente et riche les divers aspects d’un domaine ou d’une pratique.

Découvrabilité: sens commun et connaissances partagées

Plan de formation à la gestion de projet stratégique
Gestion de projet stratégique sur fr.wikiversity.org. Illustration: 2KLD, [CC BY-SA 3.0], Wikimedia Commons

Les formations, référentiels, trousses à outils, programmes de financement et experts en découvrabilité abondent. Tous peuvent se saisir des termes et notions qui circulent sans avoir une compréhension approfondie du Web. C’est, à mon avis, préoccupant car il n’existe pas de traité sur ce qu’il faut faire, dans le numérique, pour qu’une information soit vue. À la différence du génie ou de la médecine, par exemple, il n’y a pas de socle commun de connaissances pour les divers métiers du Web. Un projet numérique est souvent une tour de Babel de concepts. Que des non-spécialistes du numérique, comme des directions d’entreprises, soit dépassés n’est pas étonnant.

Voici une proposition pour améliorer les connaissances des personnes, organisations et instances gouvernementales sur un concept aussi vague que la découvrabilité. Tous les secteurs d’activité sont concernés, bien qu’à certains égards, je fais référence à la culture puisque le concept ne semble pas soulever autant d’intérêt dans d’autres domaines.

  • D’abord, mettre sur pied un comité scientifique et pédagogique qui sera chargé d’inventorier et sélectionner les connaissances qui serviront de base à la création du matériel. Il s’agit, plus concrètement d’élaborer un programme qui s’étend sur des domaines d’expertise différents et d’en assurer la mise à jour.
  • Ensuite, différents publics cibles doivent être identifiés en fonction de leurs profils professionnels, secteurs de pratique et pouvoir décisionnel.
  • Enfin, proposer des parcours de formation en fonction d’objectifs concrets afin de réinvestir les connaissances acquises: répondre à un besoin précis ou résoudre un problème. Il ne s’agit pas de former des spécialistes du traitement documentaire ou de l’analyse de données.

Voici quelques éléments de discussion pour un comité scientifique et pédagogique.

Solutionnisme technologique

Lorsque nos formations et projets sont focalisés sur des solutions technologiques, nous nous rendons encore plus dépendants de systèmes que nous ne maîtrisons pas. Nous n’activons pas les transformations que les organismes nés à l’ère numérique n’ont pas eu à faire. Comment dépasser la couche superficielle du problème pour investiguer davantage nos pratiques industrielles et sectorielles? Comment éviter le piège de l’outil providentiel pour développer une pensée stratégique adaptée à un monde numérique?

Découvrabilité: du concret

Les définitions habituelles de la découvrabilité sont vaguement théoriques et rarement mises en contexte. Ce terme est fréquemment invoqué en réponse aux problématiques liées à la visibilité et à l’appétit du public pour des offres culturelles. À quelles intentions ou objectifs fait-on référence? S’agit-il de contrôler ou d’influencer ce qui est présenté sur les écrans des utilisateurs?

Technologies: connaissances de base

Où se passe la découvrabilité? Plateformes de contenus sur abonnement, sites web, réseaux sociaux, bases de données, jeux de données ouvertes, bases de données en graphes: ces technologies ne sont pas des vases communicants. Il est essentiel d’identifier et décrire clairement les caractéristiques et usages spécifiques des différents environnements technologiques qui peuvent être ciblés par des initiatives numériques. Piloter un projet sans bien connaître les particularités des environnements concernés n’est scientifiquement pas acceptable.

Comprendre Google

L’histoire et les évolutions récentes des applications du moteurs sont suivies et documentées par différentes communautés d’experts. Le fonctionnement du moteur de recherche doit être expliqué afin d’aligner des initiatives vers des objectifs réalistes. Alors que la plupart des initiatives visent à influencer les réponses de Google, ce serait l’occasion de définir de bonnes méthodes de conception et pratiques pour le Web.

Pas de culture sans publics

Ou plus généralement: pas de ventes dans clientèles. Sur les plateformes et moteurs de recherche, données et algorithmes sont pourtant mis à profit pour connaître et servir les utilisateurs. Chaînon manquant de la plupart des projets, la connaissance des publics, leurs usages et leurs comportements, ne doit pas être limitée à la production de statistiques. Quelles connaissances et méthodologies appropriées proposer à des non-spécialistes du marketing?

Curiosité, médiation, sérendipité

Quelles autres entités et dispositifs favorisent la découverte sur des temps plus ou moins longs? Quels autres chemins pourrait-on emprunter si des résultats immédiats n’étaient pas exigés?

* * *

Il est temps d’avoir des conversations sur ces sujets afin de développer les parcours d’apprentissage qui manquent à l’émergence d’une force collective, sur le Web et les différents canaux numériques. Comment assurer la cohérence de programmes, initiatives et développement professionnel sans un tronc commun de connaissances? Comment pérenniser des activités de veille et de transfert? Comment concevoir des projets qui sont interdépendants et ont donc, plus d’incidence sur la société et l’économie? Il ne faudrait plus attendre pour élaborer un schéma des connaissances partagées par tous les acteurs du numérique et transversales à tous les secteurs d’activités.

Découvrabilité: comment aiguiller des initiatives numériques vers la bonne voie

Aiguillage pour projets de données numériques
Aiguillage pour projets de données numériques – (SunsetTracksCrop), Arne Hückelheim, [CC BY-SA 3.0], Wikimedia Commons
Il est temps d’apporter un peu de clarté dans le méli-mélo de concepts qui ne sont pas très bien maîtrisés. Voici une petite mise au point qui pourrait être bénéfique pour les promoteurs d’initiatives numériques, ainsi que les organisations qui les financent.

Quel est le but?

Il arrive qu’un projet n’ait pas de but précisément déterminé: on ne sait pas quel problème il résoudra ou quels seront les résultats tangibles. Par exemple, « authentifier une œuvre » est un moyen et non, une finalité.

Il importe de définir un but précis et tangible pour mobiliser des membres et des partenaires. Ceci est aussi essentiel pour déterminer l’espace numérique concerné par le projet et, ainsi, identifier les technologies et structures sémantiques appropriées.

Quel type d’espace numérique?

Il arrive également qu’un projet de données numériques rassemble des concepts et technologies qui appartiennent à des espaces numériques différents. Ces espaces sont:

  1. Web des moteurs de recherche

Le Web que nous connaissons est ce qu’on peut appeler le « Web des documents » parce que des pages sont reliées par des réseaux de liens hypertextes.  Dans cet espace, le texte contenu dans chaque  page est indexé et exploité par des moteurs de recherche.

Wikipédia, tout comme Wikidata, est une des bases de connaissances utilisées par Google pour valider une entité qui a été reconnue sur un site web. Rédiger un article sur Wikipédia est une excellente façon d’enrichir l’encyclopédie avec des éléments historiques et culturels québécois. On peut également s’inspirer de la structure d’un article pour améliorer le contenu d’une page web et ainsi, le rendre utile pour les moteurs de recherche.

Google exploite les balises Schema.org uniquement pour certains types de contenus afin de produire des résultats enrichis, sans toutefois en garantir l’utilisation. Les consignes d’intégration des balises démontrent l’intérêt du moteur de recherche pour le développement d’ententes commerciales (données) avec certains opérateurs et intermédiaires :

  • Musique: Google ne recommande pas de modèle; des ententes ont été conclues avec les plateformes musicales.
  • Livre: le moteur précise que son modèle cible uniquement les « distributeurs à gros volume ».
  • Événement: les balises ne sont pas nécessaires si un site tiers (ex: billetterie, Facebook, Eventbrite) est utilisé.

Attention: les balises sont sans effet si le contenu de la page ne répond pas aux exigences de qualité de Google. Il est donc plus efficace d’améliorer la valeur informative des sites web d’acteurs culturels dans un domaine ou territoire donné que d’insérer des balises.

2. Web des données

Le Web sémantique, appelé aussi « Web des données », est une extension du Web des documents. Des entités ou des ressources sont représentées par des triplets de données (entité – relation – entité). Pour les moteurs de recherche, il n’y a pas de pages à indexer, ni de contenu à exploiter dans cet espace. C’est là que la conception ou, préférablement, l’adaptation d’ontologies de domaine peut être pertinente.

Verser des données dans Wikidata permet d’enrichir une base de connaissances mondiales. Il est alors possible de lier des données de différentes sources sans avoir à investir dans le développement d’infrastructures et de modèles conceptuels pour profiter des avantages du web sémantique.

Mais ceci ne rend pas une offre culturelle plus visible. Les moteurs de recherche indexent le contenu de sites web et peuvent utiliser des ressources comme Wikidata pour valider la reconnaissance d’entités.

3. Plateforme web « privée »

Des plateformes web, qui offrent des contenus et les réseaux sociaux, forment des espaces numériques privés: elles ont leurs langages et règles de représentation et d’utilisation de l’information. Les moteurs de recherche ne peuvent en indexer le contenu, d’autant que plusieurs ne sont accessibles que sur abonnement.

4. Base de données classique

Un autre type d’espace numérique très important est constitué des bases de données. Elles peuvent être interrogées à partir de sites web et également, alimenter le contenu de catalogue en ligne. Mais n’étant pas conçues avec les technologies et standards du Web, celle-ci ne sont pas accessibles aux moteurs de recherche.

5. Et les données ouvertes?

Les données ouvertes ne rendent pas ce qu’elles décrivent plus visible ou repérable pour les moteurs de recherche. Libérer des données permet à ceux qui les utilisent, de créer de la valeur sous forme de services, produits ou nouvelles connaissances. Des données ouvertes sont également nécessaires pour des initiatives de données ouvertes et liées avec les technologies du web sémantique.

Les données ou le contenu?

Les données et le contenu jouent des rôles différent pour la découverte et la repérabilité des offres culturelles selon l’espace numérique visé.

L’amélioration de la repérabilité d’offres culturelles sur le web, pour les moteurs de recherche, repose principalement sur la lisibilité de la structure d’un site web et de son contenu. L’analyse du langage qui permet la reconnaissance d’entités et l’interprétation d’un texte ne se fait pas sur des données, mais du contenu.

Il est donc important de rappeler que les moteurs de recherche indexent du texte. Le contenu leur fournit le contexte et la diversité de termes et de liens nécessaires pour alimenter leurs modèles d’organisation des connaissances. Ceux-ci sont appelés  des graphes de connaissances. Google n’utilise pas d’autre modèle que le sien.

Identifiants:  dans quels espaces?

Les données sont exploitées par une grande variété de systèmes de gestion de bases de données et, également, sous forme de données liées (ouvertes ou non), dans le web sémantique. C’est dans ces types d’espaces numériques que des identifiants uniques sous forme de données sont les plus utiles. Bien que ces derniers puissent enrichir la biographie d’une artiste ou la fiche technique d’une œuvre, sur un site web, ils ne peuvent être interprétés par les moteurs de recherche.

Découvrabilité: ça commence sur un site web

Votre site web devrait être la source d’information numérique  la plus complète et la plus fiable à votre sujet. Pour différencier une offre culturelle, il faut miser sur une description plus riche que de simples informations factuelles. En utilisant des hyperliens pour fournir plus d’information, vous signalez des entités importantes qui aident les moteurs à contextualiser votre offre. En prime: un contenu bien structuré vous permettra de mieux interpréter les statistiques d’usage de votre site.

Les moteurs de recherche améliorent sans cesse leur capacité à interpréter le contenu afin de l’utiliser pour répondre à des questions.  Nous devons réinvestir le domaine du langage sur ces espaces numériques privilégiés que sont nos sites web.