Archives par mot-clé : technologies

Découvrabilité: les données et métadonnées sont-elles toujours utiles?

De façon générale, les initiatives visant à promouvoir une offre culturelle afin de favoriser sa « découvrabilité » concernent les moteurs de recherche comme Google ou des plateformes en ligne, existantes ou à concevoir. Ce sont cependant deux types de projets différents pour lesquels le type d’information à produire détermine des activités, compétences et ressources nécessaires différentes.

Google: rédiger et communiquer

Afin de fournir des réponses sous forme d’extraits, Google exploite le texte de pages HTML bien conçues et avec du bon contenu. Des données, même encodées sous forme de balises, n’ont pas les qualités d’interprétabilité et d’expressivité d’un texte. Ceci est d’autant plus important que, depuis plus d’une décennie, l’algorithme de Google est entré dans le domaine du langage humain. Alphabet, la compagnie propriétaire du moteur de recherche, expérimente Bard, une technologie similaire à ChatGPT.

Pour atteindre les objectifs d’une stratégie numérique, il y aurait donc intérêt à améliorer le contenu rédactionnel du site en tenant compte des intérêts des publics cibles et des principes d’optimisation. On ne répétera jamais assez que la connaissance du marché est la clé de la relation entre une offre culturelle et ses publics cibles.

Balises Schema.org et fonctionnalités de Google

Pour générer des aperçus détaillés liées à des offres culturelles, Google n’utilise que deux éléments du langage de balisage Schema.org: Book et Event.

La balise Book s’applique au livre, mais son usage est cependant limitée aux fournisseurs proposant un large choix de livres. Cette préférence pour des intermédiaires commerciaux concerne aussi la deuxième balise, Event, qui décrit un événement. Il n’est généralement pas nécessaire de la produire car les données sont collectées auprès des billetteries et exploitées uniquement durant une courte période précédant la date du spectacle.

Un contenu rédactionnel riche et pérenne, sur un site bien conçu, est donc essentiel pour se démarquer et se positionner auprès de clientèles ciblées.

Plateformes: documenter et organiser

La production et l’utilisation de données et métadonnées convient à des projets qui ont pour objectif de faciliter la gestion et l’utilisation de l’information. En voici des exemples:

Ajouter des données dans Wikidata les rend découvrables et réutilisables sur cette plateforme. Celle-ci offre également la possibilité de partager et lier des données sans avoir à maîtriser l’architecture complexe du Web sémantique.

Des projets sont également réalisés en exploitant des données de Wikidata en complémentarité avec d’autres sources de données.

D’autres projets centrés sur les données concernent l’adoption d’un modèle de métadonnées pour des plateformes et des catalogues en ligne. Dans un domaine tel que la musique, par exemple, le référencement d’œuvres selon un modèle uniforme sert à harmoniser les données produites par différents acteurs de l’industrie utilisant les mêmes systèmes ou plateformes.

L’adoption de normes et de bonnes pratiques communes pour produire des données permet également d’optimiser des stratégies de promotion et de collecter de l’information plus précise sur la consommation.

On ne devrait cependant pas imposer un seul modèle de métadonnées pour tous les systèmes. Par exemple, une bibliothèque et une librairie ne décrivent pas un livre de la même façon en raison de leurs missions et activités spécifiques. De plus, un modèle est fait de choix et d’exclusions, ce qui soulève d’importants enjeux de diversité culturelle et de décolonisation.

Rédiger un texte ou produire des données?

La rédaction et les données ont des usages et des objectifs spécifiques. Un texte descriptif permet de communiquer de l’information de façon expressive, alors que des données permettent d’organiser et de réutiliser de l’information. Ces deux types de production numérique ne doivent pas être confondus :

Rédaction (Méta)données
Attention d’une audience Réutilisation de l’information
Récit, narration Entités, éléments factuels
Composition éditoriale Structure logique
Créativité, style, ton Standardisation
Signification indépendante du contexte Signification dépendante du contexte
Tableau – Quel type de production choisir selon l’objectif ou l’usage

Un texte à propos d’une création musicale a un plus grand potentiel d’attention et de séduction que des données brutes, surtout pour une personne ne connaissant ni l’œuvre ni ses interprètes. Par conséquent, sur une page web, il aura beaucoup plus de valeur pour l’algorithme de Google, qui pourra l’analyser, le contextualiser et en utiliser les extraits répondant aux questions des utilisateurs.

Comme on l’a vu plus précédemment, les données jouent un rôle central dans une plateforme d’écoute en continu car elles permettent d’en enrichir les fonctionnalités (recherche, tri, recommandation, etc.). Elles ne jouent cependant pas celui d’une campagne de promotion.

  • Rédaction – Par exemple, votre projet repose sur la transmission d’information rédigée à l’intention de vos publics sur un site web, un réseau social, un média numérique ou Wikipédia (dans le respect de ses principes fondateurs).
  • Données et métadonnées – Par exemple, votre projet repose sur l’organisation, le tri et la représentation de l’information dans un catalogue en ligne, une base de données classique, des graphes de données liées avec les technologies du Web sémantique ou un projet comme Wikidata.

En conclusion

Le problème de la découvrabilité, c’est de mettre la solution avant le diagnostic et la stratégie. C’est peut-être aussi, comme le dit Jean-Robert Bisaillon, le résultat du « récupérationnisme politique ». L’emballement qui pousse les individus et organisations à produire des données dans le but d’influencer les moteurs de recherche tient en effet du solutionnisme et nuit au développement d’expertise.

Il faut apprendre à la fois à rédiger pour des publics cibles et à prendre soin des données, là où elles sont utiles. Toute initiative de promotion d’offres culturelles doit reposer sur une réflexion stratégique et une méthodologie de projet spécifique. Également, il ne peut y avoir de progrès sans un suivi constant des technologies numériques que l’on envisage de mettre en œuvre afin de promouvoir l’accès à la connaissance et à la culture. Pour cela, il est nécessaire que les programmes de soutien prévoient des budgets et échéanciers conséquents.

Les données ne sont pas la panacée de la découvrabilité

Dessin original: ArtsyBee via Pixabay

Orienter toute initiative de découvrabilité vers la production de données relève de la pensée magique selon laquelle la technologie est la solution à toute problématique, aussi systémique et complexe soit-elle.

Dans le domaine culturel plus particulièrement, ce solutionnisme est porté par l’espoir d’accroître la visibilité des offres afin d’en encourager la consommation. Ceci a pour conséquence que nous avons des projets numériques sans planification stratégique et dont la méthodologie de réalisation n’est pas adaptée au domaine de l’information.

À ceci s’ajoutent les mécanismes de découvrabilité mentionnés dans de nombreux documents, conférences et vidéos, sans être clairement expliqués. De quels systèmes ou applications parle-t-on? Comment fonctionnent-ils? Quels résultats peut-on en attendre? Mystère…

La méthodologie, talon d’Achille de la découvrabilité

La « découvrabilité » n’est un pas un enjeu de données, mais de maturité des connaissances sur le Web et les différents systèmes qui s’y trouvent. Il y a très peu d’expertise réelle, tant au sein des équipes de projet qu’au sein des ministères et responsables de programmes, sur des sujets comme le fonctionnement de Google, les enjeux du choix d’une norme ou d’un modèle de données et les méthodologies de conception de structures d’information.

On n’a pas encore invité les spécialistes des diverses plateformes, technologies et sciences de l’information à constituer et actualiser une base de connaissances partagées sur ces questions. Par ailleurs, les enjeux de découvrabilité et les nouveaux milieux documentaires ne sont toujours pas des sujets d’intérêt pour le Congrès des professionnel.le.s de l’information.

En conséquence, la méthodologie est le talon d’Achille de la plupart des projets. Lorsque ceux-ci débutent avec des maquettes de pages web ou des interfaces de recherche, on s’interroge sur la prédominance de l’apparence visuelle sur la conception des structures d’information.

Sans une étape préalable d’analyse stratégique, la production de données comme solution-miracle de visibilité est un projet risqué. Celui-ci comporte de nombreux angles morts tels que les préférences et comportements des publics, les changements démographiques ou une vue d’ensemble des productions ou offres d‘un secteur donné. Surtout, l’absence d’objectifs concrets et mesurables comme l’augmentation de la vente de billets ou l’acquisition d’une nouvelle clientèle est un problème récurrent: comment être sûr d’améliorer ce qui n’a pas d’abord été mesuré?

Au final, tout miser sur la production de données ne compense pas l’obsolescence de modèles industriels et commerciaux pré-numériques, ni ne prend en compte la transformation des usages.

Halte au solutionnisme!

Bien identifier un problème ou définir un besoin est un projet en soi. Cette étape essentielle est pourtant souvent escamotée, faute de budget et d’échéancier adéquat. Il est alors difficile de cerner le périmètre du projet, en écartant des options non nécessaires tout en tenant compte des contraintes de l’organisation.

Avant de se lancer dans la production de données et métadonnées, il faut donc impérativement se questionner sur le but du projet afin de l’aiguiller vers l’environnement technologique approprié et, enfin, avoir une bonne visibilité sur le type de travail à réaliser dans cet environnement. Par exemple, la création d’une base de données, d‘éléments de Wikidata et d’un jeu de données ouvertes relèvent de technologies distinctes qui n’ont pas de langages et de structures communes. Ce sont donc des types de projet différents ne visant pas les mêmes objectifs et ne faisant pas appel aux mêmes expertises.

Et mes données, alors ?!?

Dans le prochain article, nous verrons où les données et métadonnées sont vraiment utiles et comment des contenus bien rédigés sont souvent plus efficaces en terme de découvrabilité.

Découvrabilité: sens commun et connaissances partagées

Plan de formation à la gestion de projet stratégique
Gestion de projet stratégique sur fr.wikiversity.org. Illustration: 2KLD, [CC BY-SA 3.0], Wikimedia Commons
Les formations, référentiels, trousses à outils, programmes de financement et experts en découvrabilité abondent. Tous peuvent se saisir des termes et notions qui circulent sans avoir une compréhension approfondie du Web. C’est, à mon avis, préoccupant car il n’existe pas de traité sur ce qu’il faut faire, dans le numérique, pour qu’une information soit vue. À la différence du génie ou de la médecine, par exemple, il n’y a pas de socle commun de connaissances pour les divers métiers du Web. Un projet numérique est souvent une tour de Babel de concepts. Que des non-spécialistes du numérique, comme des directions d’entreprises, soit dépassés n’est pas étonnant.

Voici une proposition pour améliorer les connaissances des personnes, organisations et instances gouvernementales sur un concept aussi vague que la découvrabilité. Tous les secteurs d’activité sont concernés, bien qu’à certains égards, je fais référence à la culture puisque le concept ne semble pas soulever autant d’intérêt dans d’autres domaines.

  • D’abord, mettre sur pied un comité scientifique et pédagogique qui sera chargé d’inventorier et sélectionner les connaissances qui serviront de base à la création du matériel. Il s’agit, plus concrètement d’élaborer un programme qui s’étend sur des domaines d’expertise différents et d’en assurer la mise à jour.
  • Ensuite, différents publics cibles doivent être identifiés en fonction de leurs profils professionnels, secteurs de pratique et pouvoir décisionnel.
  • Enfin, proposer des parcours de formation en fonction d’objectifs concrets afin de réinvestir les connaissances acquises: répondre à un besoin précis ou résoudre un problème. Il ne s’agit pas de former des spécialistes du traitement documentaire ou de l’analyse de données.

Voici quelques éléments de discussion pour un comité scientifique et pédagogique.

Solutionnisme technologique

Lorsque nos formations et projets sont focalisés sur des solutions technologiques, nous nous rendons encore plus dépendants de systèmes que nous ne maîtrisons pas. Nous n’activons pas les transformations que les organismes nés à l’ère numérique n’ont pas eu à faire. Comment dépasser la couche superficielle du problème pour investiguer davantage nos pratiques industrielles et sectorielles? Comment éviter le piège de l’outil providentiel pour développer une pensée stratégique adaptée à un monde numérique?

Découvrabilité: du concret

Les définitions habituelles de la découvrabilité sont vaguement théoriques et rarement mises en contexte. Ce terme est fréquemment invoqué en réponse aux problématiques liées à la visibilité et à l’appétit du public pour des offres culturelles. À quelles intentions ou objectifs fait-on référence? S’agit-il de contrôler ou d’influencer ce qui est présenté sur les écrans des utilisateurs?

Technologies: connaissances de base

Où se passe la découvrabilité? Plateformes de contenus sur abonnement, sites web, réseaux sociaux, bases de données, jeux de données ouvertes, bases de données en graphes: ces technologies ne sont pas des vases communicants. Il est essentiel d’identifier et décrire clairement les caractéristiques et usages spécifiques des différents environnements technologiques qui peuvent être ciblés par des initiatives numériques. Piloter un projet sans bien connaître les particularités des environnements concernés n’est scientifiquement pas acceptable.

Comprendre Google

L’histoire et les évolutions récentes des applications du moteurs sont suivies et documentées par différentes communautés d’experts. Le fonctionnement du moteur de recherche doit être expliqué afin d’aligner des initiatives vers des objectifs réalistes. Alors que la plupart des initiatives visent à influencer les réponses de Google, ce serait l’occasion de définir de bonnes méthodes de conception et pratiques pour le Web.

Pas de culture sans publics

Ou plus généralement: pas de ventes dans clientèles. Sur les plateformes et moteurs de recherche, données et algorithmes sont pourtant mis à profit pour connaître et servir les utilisateurs. Chaînon manquant de la plupart des projets, la connaissance des publics, leurs usages et leurs comportements, ne doit pas être limitée à la production de statistiques. Quelles connaissances et méthodologies appropriées proposer à des non-spécialistes du marketing?

Curiosité, médiation, sérendipité

Quelles autres entités et dispositifs favorisent la découverte sur des temps plus ou moins longs? Quels autres chemins pourrait-on emprunter si des résultats immédiats n’étaient pas exigés?

* * *

Il est temps d’avoir des conversations sur ces sujets afin de développer les parcours d’apprentissage qui manquent à l’émergence d’une force collective, sur le Web et les différents canaux numériques. Comment assurer la cohérence de programmes, initiatives et développement professionnel sans un tronc commun de connaissances? Comment pérenniser des activités de veille et de transfert? Comment concevoir des projets qui sont interdépendants et ont donc, plus d’incidence sur la société et l’économie? Il ne faudrait plus attendre pour élaborer un schéma des connaissances partagées par tous les acteurs du numérique et transversales à tous les secteurs d’activités.

Découvrabilité: oui, mais dans quel environnement technologique?

Quatre environnements technologiques: Web, base de données, données ouvertes et liées, données ouvertes.
Découvrabilité: quel type de projet? Quatre environnements technologiques et types de projets numériques pertinents.

Favoriser la découverte d’une offre pour atteindre un objectif c’est bien, mais dans quel environnement technologique? La réponse à cette question, rarement abordée, pourrait pourtant aiguiller certains projets ciblant les moteurs de recherche vers de meilleures pratiques de conception et de rédaction pour le Web plutôt que vers la création de métadonnées.

Recherchée: méthodologie de projet

Parmi les écueils qui constituent des risques pour la réussite d’un projet, j’ai déjà élaboré sur le but et le solutionnisme technologique. Le but (résultat mesurable) est fréquemment confondu avec les moyens (découvrabilité).  L’énonciation d’un but fait partie d’un exercice stratégique. Celui-ci est escamoté, de même que l’identification des besoins, lorsque des moyens technologiques semblent apporter une réponse simple à une situation pourtant complexe.

Ces écueils pourraient être évités en adoptant une démarche de réalisation de projet qui débute avec une réflexion stratégique. Ce sujet devrait figurer au premier plan des différents coffres à outils proposés, en culture comme dans tous les domaines.

Numérique: différents environnements technologiques

Voici à présent, un troisième écueil qui peut apporter son lot de problèmes: la méconnaissance d’un univers où se croisent, sans nécessairement se connecter, divers domaines d’expertise.

Ce que nous désignons généralement comme « le numérique » rassemble des environnements technologiques qui ont des langages, structures, normes et, surtout, des objectifs et usages bien spécifiques. Voici les environnements que l’on peut retrouver dans des projets

Web (pages)

Celui des moteurs de recherche: c’est à dire les sites et plateformes développés avec les standards du Web et et dont le contenu est accessible et indexable. Seul le contenu de type HTML est exploité pour répondre aux demandes des utilisateurs. Dans cet objectif, des métadonnées comme des identifiants internationaux (par exemple: ISNI) ou locaux (par exemple: numéros uniques d’œuvres) présentent beaucoup moins d’intérêt, pour les algorithmes, qu’une bonne description à la Wikipédia. Ces métadonnées seront, par contre, très importantes dans des environnements centrés sur les données, comme les trois suivants.

Celui des jardins clos, au contenu non accessible aux moteurs de recherche, car il n’est volontairement pas ouvert et conforme aux standards du Web. On y trouve les plateformes accessibles aux détenteurs de compte (payants ou gratuit), comme les réseaux sociaux et les sites d’écoute musicale.

Web sémantique (données ouvertes et liées)

Il s’agit d’une extension du Web qui utilise des technologies, standards et infrastructures différentes de celles du Web auquel nos navigateurs nous permettent d’accéder. Ce type de contenu qui n’est pas du HTML ne peut être indexé, interprété et utilisé par les moteurs de recherche à titre de résultat.

Contribuer à Wikidata peut intéresser des initiatives de données ouvertes et liées qui ne souhaiteraient pas développer leurs propres infrastructure et modèle de représentation.

Base de données relationnelles

Même si celle-ci peut servir à alimenter des pages web, une base données n’est pas « dans le Web » et donc, inaccessible à des moteurs de recherche comme Google. Par contre, un bon modèle de données et des métadonnées appropriées à la mission et aux utilisateurs cibles participent à la conception d’interfaces de recherche et de découverte.

Données ouvertes

Libérer des données est, en soi, un projet comprenant plusieurs étapes importantes afin de rendre celles-ci disponibles sous forme de fichier(s). Ce type de démarche est réalisé en amont d’un projet de données ouvertes et liées. Si des métadonnées permettent de décrire un jeu de données, les données elles-mêmes ne font pas partie du contenu exploitable par les moteurs de recherche.

Quel est l’environnement concerné?

Il est important de bien cerner le problème, ou d’identifier et prioriser les besoins, avant de développer une stratégie et de se pencher sur les outils technologiques. Ceci réduira considérablement les risques et coûts associés à des choix qui ne pas alignés sur le résultat attendu, notamment en raison de l’incompatibilité de plateformes, langages, applications et usages.

Voici, des types de projets qui correspondent aux environnements technologiques présentés précédemment:

Site web
Promotion et visibilité de l’information par l’entremise de moteurs de recherche commerciaux.

Données ouvertes
Réutilisation de données pour la recherche ou le développement d’applications.

Données ouvertes et liées
Réutilisation de données avec les technologies du Web sémantique: bases de connaissances interconnectées, fonctions avancées d’analyse et de recherche.

Base de données relationnelle
Gestion et utilisation  de données, comme celles d’un catalogue d’enregistrements musicaux, par exemple, par des applications.

Il est possible que plus d’un environnement technologique soit concerné par un projet. Dans ce cas, il est impératif de rechercher des expertises, planifier des budgets et gérer des projets qui seront spécifiques à chacun des environnements.

* * *

Il est plus que temps d’améliorer la littératie numérique de tous les acteurs participant à des projets. Et plus précisément, connaître les particularités des différents environnements technologiques. C’est une mise à niveau qui devrait logiquement concerner les bailleurs de fonds, les prestataires de services de conception et les spécialistes des sciences de l’information.  Dans ce contexte, on devrait se demander s’il est souhaitable que les acteurs du domaine culturel soient les seuls à faire des apprentissages essentiels à la transformation numérique de tout l’écosystème.

Découvrabilité: comment aiguiller des initiatives numériques vers la bonne voie

Aiguillage pour projets de données numériques
Aiguillage pour projets de données numériques – (SunsetTracksCrop), Arne Hückelheim, [CC BY-SA 3.0], Wikimedia Commons
Il est temps d’apporter un peu de clarté dans le méli-mélo de concepts qui ne sont pas très bien maîtrisés. Voici une petite mise au point qui pourrait être bénéfique pour les promoteurs d’initiatives numériques, ainsi que les organisations qui les financent.

Quel est le but?

Il arrive qu’un projet n’ait pas de but précisément déterminé: on ne sait pas quel problème il résoudra ou quels seront les résultats tangibles. Par exemple, « authentifier une œuvre » est un moyen et non, une finalité.

Il importe de définir un but précis et tangible pour mobiliser des membres et des partenaires. Ceci est aussi essentiel pour déterminer l’espace numérique concerné par le projet et, ainsi, identifier les technologies et structures sémantiques appropriées.

Quel type d’espace numérique?

Il arrive également qu’un projet de données numériques rassemble des concepts et technologies qui appartiennent à des espaces numériques différents. Ces espaces sont:

  1. Web des moteurs de recherche

Le Web que nous connaissons est ce qu’on peut appeler le « Web des documents » parce que des pages sont reliées par des réseaux de liens hypertextes.  Dans cet espace, le texte contenu dans chaque  page est indexé et exploité par des moteurs de recherche.

Wikipédia, tout comme Wikidata, est une des bases de connaissances utilisées par Google pour valider une entité qui a été reconnue sur un site web. Rédiger un article sur Wikipédia est une excellente façon d’enrichir l’encyclopédie avec des éléments historiques et culturels québécois. On peut également s’inspirer de la structure d’un article pour améliorer le contenu d’une page web et ainsi, le rendre utile pour les moteurs de recherche.

Google exploite les balises Schema.org uniquement pour certains types de contenus afin de produire des résultats enrichis, sans toutefois en garantir l’utilisation. Les consignes d’intégration des balises démontrent l’intérêt du moteur de recherche pour le développement d’ententes commerciales (données) avec certains opérateurs et intermédiaires :

  • Musique: Google ne recommande pas de modèle; des ententes ont été conclues avec les plateformes musicales.
  • Livre: le moteur précise que son modèle cible uniquement les « distributeurs à gros volume ».
  • Événement: les balises ne sont pas nécessaires si un site tiers (ex: billetterie, Facebook, Eventbrite) est utilisé.

Attention: les balises sont sans effet si le contenu de la page ne répond pas aux exigences de qualité de Google. Il est donc plus efficace d’améliorer la valeur informative des sites web d’acteurs culturels dans un domaine ou territoire donné que d’insérer des balises.

2. Web des données

Le Web sémantique, appelé aussi « Web des données », est une extension du Web des documents. Des entités ou des ressources sont représentées par des triplets de données (entité – relation – entité). Pour les moteurs de recherche, il n’y a pas de pages à indexer, ni de contenu à exploiter dans cet espace. C’est là que la conception ou, préférablement, l’adaptation d’ontologies de domaine peut être pertinente.

Verser des données dans Wikidata permet d’enrichir une base de connaissances mondiales. Il est alors possible de lier des données de différentes sources sans avoir à investir dans le développement d’infrastructures et de modèles conceptuels pour profiter des avantages du web sémantique.

Mais ceci ne rend pas une offre culturelle plus visible. Les moteurs de recherche indexent le contenu de sites web et peuvent utiliser des ressources comme Wikidata pour valider la reconnaissance d’entités.

3. Plateforme web « privée »

Des plateformes web, qui offrent des contenus et les réseaux sociaux, forment des espaces numériques privés: elles ont leurs langages et règles de représentation et d’utilisation de l’information. Les moteurs de recherche ne peuvent en indexer le contenu, d’autant que plusieurs ne sont accessibles que sur abonnement.

4. Base de données classique

Un autre type d’espace numérique très important est constitué des bases de données. Elles peuvent être interrogées à partir de sites web et également, alimenter le contenu de catalogue en ligne. Mais n’étant pas conçues avec les technologies et standards du Web, celle-ci ne sont pas accessibles aux moteurs de recherche.

5. Et les données ouvertes?

Les données ouvertes ne rendent pas ce qu’elles décrivent plus visible ou repérable pour les moteurs de recherche. Libérer des données permet à ceux qui les utilisent, de créer de la valeur sous forme de services, produits ou nouvelles connaissances. Des données ouvertes sont également nécessaires pour des initiatives de données ouvertes et liées avec les technologies du web sémantique.

Les données ou le contenu?

Les données et le contenu jouent des rôles différent pour la découverte et la repérabilité des offres culturelles selon l’espace numérique visé.

L’amélioration de la repérabilité d’offres culturelles sur le web, pour les moteurs de recherche, repose principalement sur la lisibilité de la structure d’un site web et de son contenu. L’analyse du langage qui permet la reconnaissance d’entités et l’interprétation d’un texte ne se fait pas sur des données, mais du contenu.

Il est donc important de rappeler que les moteurs de recherche indexent du texte. Le contenu leur fournit le contexte et la diversité de termes et de liens nécessaires pour alimenter leurs modèles d’organisation des connaissances. Ceux-ci sont appelés  des graphes de connaissances. Google n’utilise pas d’autre modèle que le sien.

Identifiants:  dans quels espaces?

Les données sont exploitées par une grande variété de systèmes de gestion de bases de données et, également, sous forme de données liées (ouvertes ou non), dans le web sémantique. C’est dans ces types d’espaces numériques que des identifiants uniques sous forme de données sont les plus utiles. Bien que ces derniers puissent enrichir la biographie d’une artiste ou la fiche technique d’une œuvre, sur un site web, ils ne peuvent être interprétés par les moteurs de recherche.

Découvrabilité: ça commence sur un site web

Votre site web devrait être la source d’information numérique  la plus complète et la plus fiable à votre sujet. Pour différencier une offre culturelle, il faut miser sur une description plus riche que de simples informations factuelles. En utilisant des hyperliens pour fournir plus d’information, vous signalez des entités importantes qui aident les moteurs à contextualiser votre offre. En prime: un contenu bien structuré vous permettra de mieux interpréter les statistiques d’usage de votre site.

Les moteurs de recherche améliorent sans cesse leur capacité à interpréter le contenu afin de l’utiliser pour répondre à des questions.  Nous devons réinvestir le domaine du langage sur ces espaces numériques privilégiés que sont nos sites web.

Deux leviers à ajouter au rapport de la mission franco-québécoise sur la découvrabilité

Leviers de la découvrabilité des contenus culturels francophones (source: MCCQ).
Rapport franco-québécois sur la découvrabilité en ligne des contenus culturels francophones.

Le rapport sur la découvrabilité en ligne des contenus culturels francophones résulte d’une mission conjointe des ministères de la Culture du Québec et de la France. Il dresse un bon état des lieux d’un ensemble de phénomènes et d’actions, sans égarer le lecteur dans les détails techniques. Un excellent exercice de synthèse, donc, réalisé par Danielle Desjardins, auteure de plusieurs rapports pour le secteur culturel et collaboratrice du site de veille du Fonds des médias du Canada.

Cependant, dans le schéma des 12 leviers à activer pour une meilleure découvrabilité des contenus culturels francophones (voir plus haut), il manque à mon avis deux éléments essentiels:

  • Est-ce aux acteurs culturels que revient la charge de rendre l’information concernant leurs créations ou leurs offres numériquement opérationnelle?
  • Quel espace numérique offre les meilleures conditions de repérabilité, d’accessibilité et d’interopérabilité de l’information ?

Premier levier: mises à niveau des métiers du Web

Il est important de sensibiliser les acteurs culturels à l’adoption de pratiques documentaires telles que l’indexation de ressources en ligne. Ceci dit, la mise en application des principes, ainsi que le choix de modèles de représentation de contenus en ligne, sont des compétences qui ne s’acquièrent pas comme on apprend à se servir d’un logiciel. On ne peut pas attendre de toute personne et organisation du secteur culturel de tels efforts d’apprentissage. D’autant plus que la production de l’information pour le numérique fait appel à des méthodes et savoirs relevant des domaines du langage et de la représentation des connaissances autant que des technologies numériques.

Si les données structurées sont perçues comme des solutions pouvant accroître la visibilité d’offres culturelles sur nos écrans, elles appartiennent à des domaines de pratiques pas suffisamment maîtrisés au sein des métiers du Web. C’est pourtant bien vers des spécialistes en développement, intégration, référencement et optimisation que se tournent les acteurs culturels cherchant à rendre le contenu de leurs sites web plus interprétable par des machines. Or, à ma connaissance, il n’existe actuellement pas de formation et de plan de travail tenant compte de l’interdépendance des volets sémantiques, technologiques et stratégiques du web des données.

Il devient de plus en plus impératif d’identifier les connaissances à développer ou à approfondir chez les divers spécialistes contribuant à la conception de sites web aux contenus plus repérables. Il serait également souhaitable de soutenir un réseau de veille interdisciplinaire ayant pour objectif de contextualiser et d’analyser l’évolution de l’écosystème numérique.

Exemple: dans la foulée d’une étape importante de ses capacités d’interprétation (traitement automatique du langage), Google a mis à jour, cet été, ses directives d’évaluation de la qualité de l’information. Il va sans dire que c’est important.

Deuxième levier: modernisation des sites web

Dans le Web des moteurs de recherche intelligents, la reconnaissance des entités passe par l’indexation de pages web et l’analyse des contenus. Les sites web devraient donc être des sources d’information de première qualité, tant pour les internautes que pour les moteurs de recherche.

Est-il normal de ne pas trouver toute l’information, riche et détaillée, sur le site de référence d’une entreprise culturelle? Pour le bénéfice des projets numériques, il est vital de concevoir des contenus pertinents pour les machines, lesquelles évaluent à présent la qualité des sources d’information afin de générer la meilleure réponse à retourner à l’utilisateur.

Pour une productrice ou un artiste, il est beaucoup plus stratégique de faire de son site web une source primaire, en attribuant une page spécifique à la description de chaque œuvre, que de créer un article sur Wikipédia. Rappelons que Wikipédia n’est pas une source primaire pour les moteurs de recherche. De plus, l’usage du vocabulaire (Schema.org) ne leur fournit qu’un signal faible sur la nature d’une offre.

Un savoir commun, entre information et informatique

L’adaptation des contenus culturels à l’environnement numérique repose, avant tout, sur de meilleurs sites web. Ces espaces offrent les conditions optimales d’autonomie, repérabilité, accessibilité et interopérabilité. Leur modernisation requiert des acteurs clés, que sont les spécialistes du Web, une mise à niveau rapide de leurs connaissances et de leurs pratiques.

Finalement, afin d’opérer cette mise à niveau et de développer ces savoirs communs, il faut bien entendu insister sur l’interdisciplinarité entre les métiers du web et, notamment, le domaine des sciences de l’information.

Comment faire un plan de « découvrabilité » pour des résultats mesurables

« La grande absente de la plupart des initiatives numériques, c’est la stratégie. »
Photo: Kelly Sikkema via Unsplash

Depuis peu, en culture, on retrouve un volet « découvrabilité » dans la plupart des appels à projets. S’agit-il d’une application technologique, de techniques de référencement ou d’une campagne de promotion numérique?  L’absence d’explications concrètes et de description des compétences requises met les  demandeurs (ainsi que les bailleurs de fonds!) dans une situation où ils ne disposent pas des guides nécessaires pour savoir ce qu’il faut faire, ni quels résultats escompter.

Un  projet dans un projet

Assurer la repérabilité d’une nouvelle création ou d’une nouvelle offre est un projet à part entière, avec ses ressources, ses objectifs et ses réalisations. Il ne s’agit pas de mettre en commun ce que chacun aura produit de son côté, mais de produire des contributions s’alimentant les unes des autres. C’est pourquoi, dans nos velléités de transformation numérique, le travail en silo est un frein à la réussite de nos projets.

Les mots qui font des connexions

C’est l’information fournie à propos des choses qui est repérable — pas les choses en elles-mêmes. Cette distinction est extrêmement importante puisque c’est le choix des éléments descriptifs qui retient l’attention d’audiences cibles et qui permet aux moteurs de recherche de connecter des offres à des intentions et des profils d’utilisateurs.

Sous le couvert nébuleux de la découvrabilité, il existe en réalité des pratiques et des standards permettant de structurer l’information pour le Web afin d’en assurer la repérabilité, l’accessibilité et l’interopérabilité.

Google ne parle pas web sémantique

Représenter des connaissances avec les technologies du web sémantique (URI, RDF…) et structurer de l’information pour des moteurs de recherche sont des projets différents qui n’ont pas les mêmes finalités.

Si votre objectif est de faire découvrir votre offre culturelle en vous servant, entre autres, des moteurs de recherche pour générer des visites, des visionnements ou des achats, le web sémantique ne vous sera d’aucune utilité!

Google n’exploite que le langage de balisage Schema.org

Pour un plan de découvrabilité plus efficace

Voici les éléments de réflexion qui apporteront plus d’efficacité à votre plan de découvrabilité.  La grande lacune de la plupart des plans de découvrabilité est l’absence ou la faiblesse de la stratégie comment pousser les bons contenus aux bons publics, sur les bons canaux, pour atteindre des objectifs mesurables. Or, ce travail est essentiel à plusieurs titres:

1 – Connaître les publics et fixer des objectifs

À quels besoins et à quels publics votre offre est-elle susceptible de répondre? Les objectifs à atteindre doivent être déterminés en fonction des intérêts et comportements de ces publics cibles ainsi que de leurs possibles relations à l’offre.

2 – Différencier votre offre

Le vocabulaire Schema.org permet de fournir une description détaillée d’une offre culturelle. Google n’en utilise cependant que certains éléments. Baliser une offre de spectacle n’est pas suffisant pour permettre à celle-ci de se différencier de milliers d’autres offres. La connaissance des publics fournit les éléments d’information et le vocabulaire pouvant aider les moteurs de recherche à faire des connexions entre les intentions et profils des utilisateurs et les offres disponibles.

3 – Faire travailler des spécialistes ensemble

Les balises et le référencement par mots clés sont des outils complémentaires s’appuyant sur la stratégie de promotion. Accroître la découverte commence par la présentation de l’offre sur le site web . Ceci a pour but de faciliter le travail des moteurs de recherche et d’améliorer l’expérience de l’utilisateur avec leur interfaces.

4 – Relier les acteurs de l’écosystème

Si un site web est absolument essentiel et stratégique, d’autres présences numériques contribuent au rayonnement d’une offre. Une bonne stratégie met donc à contribution les acteurs de l’écosystème en identifiant des points d’entrée (réseau social, vidéo, site partenaire, etc.) et en multipliant ainsi les parcours de découverte.

5 – Ne pas compter uniquement sur Google

En se contentant de produire des métadonnées sous forme de balises Schema.org, on se conforme aux modèles et directives qui répondent avant tout aux objectifs d’affaires d’un géant du numérique. Bien que le balisage d’offres pour les moteurs de recherche fasse partie des bonnes pratiques web, Google ne garantit aucun résultat (longue lecture, mais excellent billet).

Attention: les métadonnées ne sont pas toujours utiles. Si vous souhaitez améliorer la valeur de votre site pour Google, corrigez les lacunes de conception et améliorez la valeur du contenu rédactionnel.

6 – Mesurer l’atteinte des objectifs

Finalement, la découverte d’offres culturelles sur un moteur de recherche est difficilement mesurable. Elle dépend de plusieurs facteurs extrêmement variables, comme le profil, l’intention présumée par l’algorithme et les usages antérieurs de chaque utilisateur. Ce sont donc les objectifs et indicateurs de mesure ayant été déterminés dans le plan stratégique qui permettront d’évaluer la réussite de celui-ci.

Utiliser des métadonnées sans tomber dans le solutionnisme

Ce ne sont pas les métadonnées qui produisent des résultats, mais les moyens déterminés par la stratégie. Il faut donc proposer des initiatives plus marquantes pour la diffusion et l’appréciation de nos offres culturelles. Par exemple, renouveler l’expérience de recherche sur un site en présentant l’information sous forme de fiches, de façon similaire à Google, mais selon d’autres règles que la popularité et la similarité.

Il n’existe pas de recette. Chaque projet étant unique, il doit se différencier pour se démarquer, et ce grâce au choix des canaux, plateformes, mots, images et liens adressés aux bons publics.

Surtout, il ne faut pas se contenter d’appliquer les consignes de Google. On doit également chercher à comprendre l’interaction complexe des systèmes et identifier les éléments stratégiques que nous pouvons contrôler.

Enfin, nous ne pouvons pas encourager le milieu culturel à se conformer à un système dont nous ne comprenons pas le fonctionnement et dénoncer, dans le même temps, la domination et l’opacité des GAFAM. Cette contradiction en dit long sur les connaissances qu’il nous reste à acquérir…

Et si nous retombions en amour avec nos sites web?

William Moore de la réserve de Mattagami, Ontario, réparant un filet.
John Macfie, 1958, Archives publiques de l’Ontario sur Flickr.

Pourquoi l’évolution de nos sites web s’est-elle arrêtée au document numérique alors que chez des entreprises, comme Amazon ou Spotify, elle se concrétise par le déploiement de plateformes de données?

Les interactions que nous pouvions organiser sur nos domaines se sont atrophiées car nous avons laissé aux algorithmes le soin de faire des liens de proximité, de sens, de popularité ou autres. Ces liens qui favorisent la découverte et le rayonnement, nous ne les contrôlons pas.

Décloisonner les parcours de formation

Est-ce faute de ne pas avoir adapté, en les décloisonnant, des formations comme l’informatique, la communication et les sciences de l’information à la complexité de nouvelles pratiques? Dans le Web, les logiques technologiques, informationnelles et industrielles s’entrecroisent à présent pour former un nouveau champ de connaissances pour lequel il n’existe pas encore de savoir commun.

Entrer dans le domaine du langage

Ou, encore, est-ce faute de n’avoir pas réalisé que la donnée relève  beaucoup plus du langage et de la pensée que du calcul et de la technologie?

Les concepts et particularités propres aux différents domaines de l’activité humaine ne sont pas aisément traduisibles dans la pensée mathématique des machines. L’information n’est plus uniquement un enjeu d’ingénierie, une chose à stocker, à transformer et à faire circuler. Dans le Web, elle relève du domaine du langage, décrivant des choses et des relations entre ces choses. Cette perspective, pourtant essentielle à l’ère de l’intelligence artificielle, est pratiquement absente des méthodes courantes de conception.

S’affranchir du document

Ou, tout simplement, est-ce parce que des solutions d’utilisation facile et très souvent gratuites nous ont été offertes? Avons-nous finalement laissé à d’autres les défis de l’évolution du Web et de nos architectures de connaissances? Cette évolution était pourtant prévisible dès 2009, la nouvelle méthode de conception de sites proposée cette anné-là par la BBC dans un billet de blogue en faisant foi.

Ne plus troquer l’acquisition d’expertise pour la facilité

Je crois bien que nous avons graduellement délégué à des entreprises, par algorithmes interposés, le choix des mots et des liens définissant qui nous sommes et la régulation des flux d’information dans un espace qui n’est pourtant qu’un sous-ensemble du Web. Nous avons renoncé au contrôle sur la découverte et la recommandation dont nous disposions grâce à nos blogues, nos répertoires et même, nos collections de fils RSS — j’utilise encore la mienne!

Alors que nous concevons encore un site web comme un ensemble de documents, les acteurs de la nouvelle économie prospèrent grâce à des sites web conçus comme des plateformes de données. Ces plateformes permettent d’aller beaucoup plus loin que la publication d’information. Par exemple:

  • Trouver, réutiliser et partager des contenus par les utilisateurs et à l’interne;
  • Définir les rôles, responsabilités et règles de gouvernance relatifs à chaque ensemble de données.
  • Faciliter l’accès, de façon transversale, aux connaissances nécessaires pour la recherche de solutions et l’innovation.
  • Et, surtout, relier les métadonnées descriptives des ressources aux données d’usage résultant de l’interaction des utilisateurs avec les contenus.

Réapprendre à faire du Web

Avant de tenter de mesurer le rayonnement de contenus culturels sur les plateformes, il faudrait se demander si nous en maîtrisons les conditions, sur nos sites web et au sein de nos écosystèmes numériques.

Nous avons choisi la gratuité et la facilité des plateformes qui sont la propriété d’entreprises sachant, mieux que nous, exploiter l’information tirée des interactions avec nos contenus. Le contexte actuel de la pandémie semble avoir accentué notre dépendance envers ces services qui entretiennent notre espoir de retrouver nos publics et nos clients.

Nos sites web nous offrent pourtant toujours la possibilité de développer et d’afficher nos écosystèmes de liens et de nommer les choses qui nous rassemblent. Afin de ne pas les laisser s’atrophier, nous devrions nous en servir pour mieux représenter nos domaines d’activité, nos contenus, ainsi que nos réseaux.

Solutionnisme et inégalités: gare aux écueils de la transformation numérique

jeu de mikado
Jeu de mikado, Heurtelions [CC BY-SA], Wikimedia Commons
Le recours au « tout numérique », dans les circonstances de la crise actuelle entraînée par la pandémie, révèle de nombreuses inégalités. Qu’il s’agisse de l’enseignement à distance, de la dématérialisation des services publics ou, même, du traçage des personnes, les propositions de « solutions » tiennent généralement pour acquis que l’informatique connectée est à la portée de tout le monde. Nous devons éviter les écueils de la transformation numériques que sont le solutionnisme et la création d’inégalités numériques.

Imaginer nos propres solutions

J’ai élaboré, dans un précédent billet, sur le piège du solutionnisme technologique:  « Ce ne sont pas des plateformes numériques qui ont permis à Netflix et compagnie de bouleverser l’industrie. C’est d’avoir compris le potentiel du Web et pensé autrement l’accès, la distribution et la production de contenus audiovisuels, en osant remettre en question les modèles établis.»

Cette expression peut s’appliquer au sentiment d’urgence qui nous pousse vers le développement d’un outil avant même d’avoir défini le problème, exploré les causes possibles et analysé les systèmes sociaux et techniques.

Il ne faut pas tomber dans ce piège et nous contenter de reproduire des stratégies et des outils qui ont été conçus pour servir d’autres objectifs que les nôtres.

Internet pour réduire les inégalités

Voici quelques éléments qui favoriseraient la transformation numérique, en commençant par la condition de base:

  • Accès Internet sur tout le territoire.
  • Accès Internet à la maison (gratuit ou à coût modique).
  • Bande passante nécessaire pour l’accès de qualité à du contenu audiovisuel.
  • Ordinateur à la maison (échapper aux coûts de l’obsolescence programmée,  promouvoir les logiciels libres). Équipement en nombre suffisant pour les besoins d’une famille confinée.
  • Connaissances informatiques et habiletés numériques suffisantes (autonomie des utilisateurs, sécurité informatique, protection de la vie privée).
  • Équipement adapté et logiciels et contenus web accessibles aux personnes en situation de handicap temporaire ou permanent.
  • Service de médiation: outils d’accès –et de contribution– à la connaissance et à la culture, littératie de l’information (bibliothèques publiques, initiatives citoyennes).
  • Commerçants, fonctionnaires, profs et professionnels ayant des compétences numériques suffisantes ou les ressources nécessaires pour offrir un bon niveau de services en ligne.
  • Amélioration du niveau d’alphabétisation (compréhension des consignes d’utilisation des services en ligne et des instructions techniques).

Technologies plus simples, accessibles et durables

Dans une tribune, Jean-François Marchandise, cofondateur de la Fondation Internet nouvelle génération, partage ce constat sur le besoin de médiation numérique :

Aujourd’hui, une grande partie de l’innovation numérique repose sur un numérique de luxe. Nous allons vers des « toujours plus », adaptés à un monde en croissance éternelle et en ressources infinies…
A contrario, il va davantage falloir composer avec un numérique moins high tech, qui puisse fonctionner avec trois bouts de ficelle, de manière plus décentralisée, avec une moindre dépendance au lointain, une relocalisation des savoir-faire.

De plus, si tous les citoyens sont égaux, ne devrions-nous pas élaborer des propositions numériques en fonction du plus bas dénominateur numérique commun ?

Pilotage d’initiatives et intelligence collective

Cette pandémie devrait nous faire réaliser que nous devons changer nos méthodes de travail et prendre garde aux inégalités numériques et au solutionnisme technologique.

Si nous souhaitons tirer des apprentissages constructifs de la complexité de cette situation, nos équipes de projets doivent être interdisciplinaires et nos analyses doivent tenir compte de l’interdépendance des systèmes. Les outils de communication et de travail collaboratif peuvent faciliter la circulation des idées. Cependant, seule une réelle transformation du pilotage des initiatives numériques, vers une forme d’intelligence collective, pourrait les rendre plus efficaces et accroître leurs bénéfices.

Pour que le Québec puisse se relever le plus rapidement de cette crise, l’ensemble de la société doit participer à la création de valeur (savoir, culture, industrie). Et pour cela, il faudrait d’abord réparer la fracture numérique, faire de l’accès Internet un service public essentiel et apprendre à piloter des projets dans la complexité.

Solution technologique pour problématiques complexes

Lego Color Bricks par Alan Chia
Alan Chia [CC BY-SA 2.0], Wikimedia Commons
Imiter des géants de l’économie numérique en développant une plateforme peut-il apporter des solutions aux problématiques complexes de la diffusion de contenus francophones dans une industrie traversée par de profonds changements ?

Tout récemment, une solution simple à une problématique complexe a refait surface dans le milieu culturel canadien.

Ottawa investi 14,6 millions dans une nouvelle plateforme de diffusion de contenus francophones, Le Devoir, 7 août 2019.

Mettre en avant une « solution » technologique permet trop souvent d’éviter d’épineux questionnements. Cependant, alors que les règles du jeu et les usages changent, nous ne devrions pas nous soustraire à un examen des conditions de création et de production qui sont soutenues par nos législations et programmes. Nous finissons par maintenir, tant bien que mal, des modèles qui fonctionnent de moins en moins.

Ce ne sont pas des plateformes numériques qui ont permis à Netflix et compagnie de bouleverser l’industrie. C’est d’avoir compris le potentiel du Web et pensé autrement l’accès, la distribution et la production de contenus audiovisuels, en osant remettre en question les modèles établis. Revoir des modèles et des programmes qui demeurent encore très « télévision » demande évidemment beaucoup d’ouverture, de courage et de vision, mais il faut espérer que ce soit encore possible.

Une proposition de plateforme de diffusion de contenus culturels québécois, avait émergée, en 2017.  En évitant de remettre en question les façons de faire, ce type de projet ne fait que reporter les nécessaires adaptations qu’une industrie doit entreprendre pour durer et prospérer.

Il semble que nous ayons encore beaucoup de difficulté à appréhender les problématiques de la production et de la consommation de contenus culturels dans un monde numérique. Ne serait-il pas temps d’adopter, pour les analyser,  d’autres méthodes que celles qui nous font tomber le piège des solutions simplistes ?