Archives par mot-clé : agrégation

Découvrabilité: mythes et réalité

Mise à jour 2019-05-24: ajout d’une question et sa référence, en conclusion.

La recherche du Graal de la découvrabilité, ce moyen qui accroîtra la «consommation» de nos produits culturels, peut-elle nous faire tomber dans le piège de la solution technologique qui nous fait oublier le problème ?

Solution simple et problématique complexe

Appelé « solutionnisme »  par l’historien des sciences Evgeny Morozov, c’est la proposition d’une solution technologique à un problème d’origine complexe. Ceci a pour effet d’escamoter les débats qui sont essentiels à la recherche de solutions pour le bien commun.

Moins de quatre ans se sont écoulés depuis le sommet qui a propulsé le terme « découvrabilité » jusque dans les hautes sphères décisionnelles, en culture. Depuis lors, des événements et programmes de financement de la culture ont intégré cette thématique ou certains de ces éléments les plus emblématiques, comme les métadonnées.

Je réalise, depuis quelques années, des ateliers sur la découvrabilité et les métadonnées, avec les Fonds Bell et Fonds indépendant de production. Une collaboration avec Marie-Ève Berlinger apporte à ma démarche exploratoire la dimension stratégique de la promotion numérique. C’est dans ce contexte que nous avions échangé sur les mythes de la découvrabilité, au cours du Forum avantage numérique.

Voici quelques constats qui se rapportent aux mythes qui sont spécifiques à la production de métadonnées pour les moteurs de recherche.

La découvrabilité n’est pas une finalité

La finalité d’un plan de découvrabilité est le fruit d’une réflexion stratégique. Celui-ci fournit les questions, le contexte et le cadre sans lesquels la découvrabilité n’aurait pas d’autre objectif que de fournir des données à un moteur de recherche. Ce sont les activités de marketing et de promotion qui produisent des résultats mesurables.

L’exploitation des métadonnées par les moteurs de recherche n’est qu’un des piliers de la découvrabilité. Cette approche a été illustrée dansle cadre d’un projet auquel je collabore, avec Véronique Marino et Andrée Harvey (La Cogency).

Illustration des 4 piliers de la découvrabilité, par LaCogency
Illustration tirée d’un projet de découvrabilité numérique de LaCogency.

Il est surprenant de constater que la stratégie et les moyens techniques ne sont pas intimement intégrés dans des projets numériques. Il y a une importante mise à jour des connaissances conceptuelles et techniques à opérer au sein des agences qui conseillent et accompagnent les organismes et entreprises.

La réponse n’est pas une page web

La fiche d’information qui constitue la réponse du moteur de recherche (à la droite de la liste de résultats) n’a pas pour objectif de diriger l’utilisateur vers une page web spécifique. Elle rassemble différents éléments d’information afin de fournir la réponse la plus précise possible. Il faut donc sortir de la logique de la liste de résultats et ne pas penser l’usage des métadonnées en fonction d’une destination.

Les liens entre les éléments d’information qui composent la fiche de réponse construisent des parcours qui orientent la recherche de l’utilisateur, sans nécessairement aboutir sur un site web. Par exemple, chercher une oeuvre de VanGogh, comme la Nuit étoilée, permet de mesurer la distance et les clics qui nous séparent du site web du Museum of Modern Art.

Ceci accroît la collecte des données d’usage qui permettent d’analyser l’intention, le comportement et la consommation de l’utilisateur. Plus les fonctions et choix offerts sont utiles, plus l’utilisateur demeure dans l’interface du moteur de recherche. Les agrégateurs d’information, qui font face à la désintermédiation de leur services, constateront probablement une diminution progressive du volume de données qui sont collectées sur leurs pages.

L’effet des métadonnées est dans la durée

Les résultats de l’utilisation de métadonnées pour décrire des contenus ne sont pas mesurables, au sens strict.

La qualité de l’encodage des métadonnées peut être validée, mais l’outil de test ne peut juger la logique de la description (interprétation des balises uniquement). Une validation que peu de producteurs de métadonnées semblent se donner la peine de faire. Il est également possible d’attribuer un indice de découvrabilité à  une information en fonction de critères spécifiques.

L’effet des métadonnées peut être observé sur un temps long. L’enrichissement progressif de la fiche de réponse illustre le potentiel qu’a une offre d’être liée par le moteur de recherche à d’autres informations. Il n’est pas possible de fournir des résulats immédiats et quantifiables, de façon similaire aux stratégies de référencement organique et payant de pages web.

Schema.org n’est pas le moteur de recherche

Schema est un vocabulaire commun de métadonnées qui a été développé pour les moteurs de recherche. Google recommande l’intégration des métadonnées sous forme de balises dans le code HTML d’une page afin de décrire l’offre qui y est présente. Cependant, les règles de l’algorithme évoluent au fil des expérimentations du moteur de recherche. Les métadonnées Schema qui étaient recommandées pour décrire des offres de type Movie, TVSeries et Music existent toujours. Cependant, Google n’en recommande plus l’usage et invite les entreprises concernées à faire une demande pour devenir des partenaires médias. Jusqu’où, alors, faut-il investir pour indexer une offre si le fonctionnement de l’algorithme et l’évolution du moteur de recherche nous sont inconnus ?

Une réflexion stratégique est nécessaire pour répondre à cette question. Deux avenues s’ouvrent:

1. Rendre des offres interprétables pour les moteurs de recherche (indexation) et appuyer la stratégie de référencement du site

  • Fournir uniquement les métadonnées Schema qui sont obligatoirement requises par le moteur de recherche. Ceci fait partie des bonnes pratiques du développement de sites web.
  • Tout comme pour le référencement, il est important d’assurer une veille sur l’évolution des fonctions analytiques et techniques des moteurs de recherche.

2. Valoriser les éléments d’un catalogue ou d’une collection en produisant un graphe de données liées

  • Fournir des métadonnées très riches selon le vocabulaire Schema.
  • Prévoir un important travail de modélisation (de préférence, par une personne compétente) afin de mettre en valeur des attributs et des liens, en travaillant sur les propriétés et les niveaux hiérarchiques.

Enjeux d’importance pour une stratégie numérique:

  • Aucun résultat garanti sur le traitement des métadonnées par le moteur de recherche. Ceci ne doit donc pas être l’unique objectif d’un tel projet.
  • Vocabulaire et modèle de représentation uniques: uniformisation de la représentation répondant aux objectifs d’affaires des moteurs de recherche.

Précision 2019-05-25: ce billet concerne uniquement le langage de balisage pour moteurs de recherche (métadonnées Schema) et non la représentation des connaissances avec les standards du web sémantique.

Pas de solution, mais quelques questions

L’uniformisation des modèles descriptifs est-elle un risque pour la diversité culturelle ?

La problématique de la «consommation culturelle» ne devrait-elle pas être abordée dans les deux sens ? En orientant nos projets sur la promotion,  nous oublions la relation au public et l’analyse de ce qui rend une oeuvre de création attractive. Ce rapport sur les pratiques culturelles numériques et plateformes participatives, piloté par la chercheuse Nathalie Casemajor, contient des pistes de réflexion à ne pas négliger, dont cellec-ci:

Les efforts de découvrabilité ne suffisent pas à eux seuls à créer l’appétence culturelle, et l’analyse des données consommatoires et comportementales n’est pas la panacée pour agir sur le développement des goûts et des dispositions culturelles en amont.

Nous devrions nous donner des moyens pour définir les modalités et conditions de la découvrabilité que nous souhaitons. Celles-ce se trouvent quelque part, entre le monde vu par une entreprise et celui que nous voyons au travers du prisme de nos cultures et sensibilités, d’une part,  et, d’autre part, entre lier des données pour un objectif de marketing et faire du lien social autour d’objectifs communs.

Moteur de recherche et désintermédiation

Il est possible de passer quelques heures, sur le web, à écouter de la musique et à croiser des artistes, connus et inconnus, en suivant des liens tissés par un algorithme. Et cela, sans quitter l’interface du moteur de recherche.

Désintermédiation des services d’information

Le moteur de rechercher devient une interface qui impose aux utilisateurs sa vision du monde, son algorithme, son modèle de classification et son régime de vérité: la popularité. Une uniformisation de la structure de l’information et des fonctions proposées qui efface la diversité des modèles et des expressions.

Service et application Google Voyages

Avec l’intégration de Google Voyages, grâce aux données collectées auprès des utilisateurs, il connaîtra les intérêts et comportements des voyageurs beaucoup mieux que les organisations touristiques locales et deviendra un partenaire priviliégé des entreprises touristiques. Celles-ci fournissent déjà, par le biais de Google Mon entreprise, les métadonnées qui permettent de lier et classifier les données, en mode hyperlocal. Face à une très probable désintermédiation, les associations touristiques devront mettre l’accent sur une organisation de l’information et des expériences que le moteur ne propose pas.

Nul doute que  cette nouveauté accroîtra l’intérêt pour les technologies de liage de données, tel que cette conférence sur les graphes de données, dans le domaine du tourisme.

Données ouvertes et liées: le web comme base de données

Les données ouvertes et liées (linked open data) sont au cœur des grands projets numériques en culture et leur potentiel va bien au-delà de l’amélioration de la découvrabilité de contenus.

Un web plus intelligent

En 2001,  une décennie après avoir inventé une façon de partager des documents en réseau  (World Wide Web), Tim Berners-Lee propose de renforcer cet espace de collaboration en rendant des données plus facilement utilisables et interprétables par des machines.  Il décrit, dans un article, les objectifs et éléments du web sémantique.  Selon cette extension du web, des données qui sont structurées (par exemple, les métadonnées d’un catalogue de films) peuvent être partagées et réutilisées, indépendamment des enjeux d’interopérabilité technologiques, systémiques et même linguistiques.  D’abord, une mise en contexte sur cette évolution du web qui est également appelée « web de données ».

De stockage centralisé à diffusion décentralisée

La base de données n’est pas conçue pour être interopérable avec toutes les autres bases de données. C’est un mode de gestion centralisée qui date d’avant le web, ses standards et la décentralisation de l’information.  Chaque base de données a une structure et des identifiants qui lui sont spécifiques. De plus, les relations entre les données sont induites, c’est à dire qu’elles ne sont pas exprimées sous forme de données mais par la structure de la base.  Emmagasinées dans une base de données, elle sont donc inaccessibles et difficilement interprétables par des logiciels.  C’est pourquoi, pour que ces données puissent être réutilisées et reliées entre elles, il faut qu’elles soient ouvertes et liées.

Données ouvertes  pour être accessibles

La plupart des données ouvertes qui sont à notre disposition, au Québec et au Canada,  sont disponibles selon des licences qui spécifient les conditions de leur réutilisation. Cependant, celles-ci se trouvent dans des silos qui freinent leur exploitation. Il n’y a pas de structure, de métadonnées et de formats communs entre les jeux de données. Il est donc impossible, pour un agent automatisé, comme une application de recherche, de trouver, parmi les fichiers, les données qui fournissent l’information recherchée.  Il convient alors de les publier « dans le web » sous forme de données liées pour ne pas laisser d’autres sources d’information ou d’autres contenus culturels répondre aux intentions des internautes.

Données ouvertes et liées pour être référencées dans le web

Des données liées sont des données qui sont intelligibles dans un format compréhensible par des machines.  De manière similaire à une page web, on publie une donnée dans le web en lui donnant une adresse ou URI (Uniform Resource Identifier) selon le même protocole de transmission (HTTP). Grâce aux URI qui les identifient, les données ouvertes sont référencées sur le web.  À l’aide des ressources qui sont décrites par les URI, le web sémantique « met en place deux notions très importantes, soit (1) référer à des concepts (et non pas du texte) et (2) faire des liens entre ces concepts. »  Cette distinction entre les recherches navigationnelle (mots clés) et informationnelle (concepts) se trouve dans une très éclairante initiation au web sémantique rédigée par Caroline Barrière, chercheuse en traitement automatique des langues.

C’est en faisant des liens vers ces ressources , à partir de nos propres données, qui sont elles-mêmes sous forme d’URI, que nous créons des réseaux de données. Ces réseaux permettent à notre culture d’être référencée, trouvée et réutilisée.  En voici un exemple:

Croiser Robert Lepage, François Dompierre et Dominique Michel à la Bibliothèque nationale de France

La mise « dans le web » des données de la Bibliothèque nationale de France a débuté en 2011. C’est un des projets de données ouvertes et liées qui sont soutenus par l’État français, conformément à la Feuille de route stratégique sur les métadonnées culturelles.

Auteurs liées à Laurie Anderson dans data.bnf.fr, les données ouvertes et liées des collections de la Bibliothèque nationale de France.
Auteurs liées à Laurie Anderson dans data.bnf.fr, les données ouvertes et liées des collections de la Bibliothèque nationale de France.

La version web sémantique de la Bibliothèque nationale de France fournit de l’information beaucoup plus utile qu’une liste de documents correspondant aux mots recherchés: un nouveau mode d’accès à la connaissance. Grâce à ses données ouvertes et liées, la BnF rend visible les relations entre des ressources, des personnes et des activités.

C’est ainsi  qu’une recherche sur la compositrice et plasticienne Laurie Anderson nous fait naviguer de la musique au cinéma, en passant par les arts de la scène. En suivant les liens des contributions communes avec d’autres auteurs, on croise Yves Jacques et Robert Lepage (La face cachée de la lune). Et chez Robert Lepage, on peut voir les liens pointant vers les oeuvres qui ont influencé sa création, croiser Denys Arcand et jeter un coup sur une partie de sa filmographie pour découvrir les oeuvres du compositeur François Dompierre et une partie de la carrière de l’actrice Dominique Michel.

Dommage qu’il y ait si peu d’images libres de droits pour mieux représenter les personnes et les créations qui font notre culture. Il faudrait prendre l’habitude de contribuer à Wikimedia Commons, la base de données multimédia à laquelle s’alimentent des projets comme celui de BnF.

Connaissance augmentée et distribuée

Nous pouvons accroître la découvrabilité de notre culture de façon pérenne et innovante. Il est également possible d’étendre la connaissance que nous avons de nos propres ressources en liant nos données entre elles. Nous pourrions alors l’enrichir par des liens vers d’autres sources de données ouvertes et liées qui contiennent de l’information à propos de notre culture et de notre patrimoine, comme BnF, Digital Public Library of  America, MusicBrainz ou VIAF.

Ce ne sont pas les moyens qui manquent pour commencer à expérimenter de nouvelles manières de valoriser des données culturelles.  Un de ces moyens est, par exemple,  le téléversement des données dans Wikidata.

Mais, face à la complexité des enjeux techniques des métadonnées (pour preuve: cette typologie des métadonnées pour le patrimoine culturel), il manque une vision d’ensemble des parcours possibles.  Pour cela, il faut rassembler les compétences informationnelles et technologiques nécessaires pour aider des organismes ou des initiatives collectives à faire des choix afin de démarrer des projets rapidement.

Pourrait-on rêver d’un regroupement interdisciplinaire sur les données ouvertes et liées pour accompagner les démarches et projets dans le secteur culturel ?

La culture à l’ère numérique: dans le web des données plutôt que sur une plateforme

Tenter de concurrencer les géants des contenus numériques en proposant nos propres plateformes, comme le proposait Alexandre Taillefer, est une mauvaise bonne idée; surtout dans le domaine culturel. Voici pourquoi:

NON: centraliser l’information dans une base de données

C’est une mauvaise idée, parce qu’il s’agit d’un concept qui va à contre-courant de l’Internet de Tim Berners-Lee: connaissances partagées, production de contenus décentralisée, modèles distributif et collaboratif, données ouvertes et liées, perspectives à la fois locale et globale. Développer une plateforme afin de centraliser dans une base de données l’information concernant des contenus culturels c’est soustraire ces derniers aux connexions potentielles avec d’autres données à travers le monde.

Louis-Jean Cormier dans DBpedia, version sémantique de Wikipédia
Louis-Jean Cormier dans DBpedia, la facette web sémantique de Wikipédia.

Le contenu des bases de données est « sous le web« ,  c’est à dire inaccessible et incompréhensible pour les moteurs de recherche et applications qui ratissent le web en quête de données qui font du sens. La transition d’un web des documents vers le web des données, et, par conséquent, de la préférence visible des moteurs de recherche pour le sémantique (Google et les données structurées), ne font plus de doute. S’exposer dans le web des données ouvertes et liées constitue une bien meilleure stratégie, pour la valorisation des contenus,  le développement de modèles économiques et l’acquisition d’une culture de la donnée, que la reprise d’un concept datant du premier âge du web.

Alors, pourquoi continuer à financer des silos d’information qui interdisent toute possibilité de liens entre nos contenus et l’intention ou le parcours de consommateurs , où qu’ils se trouvent ?

OUI:  mutualiser les ressources pour publier et agréger des données 

La bonne idée est celle de la mutualisation d’équipement et de ressources pour réaliser un projet collectif. Là se trouve le véritable défi de la « révolution numérique »: apprendre à se faire confiance et à collaborer pour développer une valeur collective. Apprentissage d’autant plus difficile que l’offre culturelle est abondante et que notre attention, elle, est limitée.

Publier des données dans le web, comme on le fait pour des pages de sites internet, permet d’éviter les problèmes d’interopérabilité des bases de données tout en préservant l’autonomie des producteurs de données. Il devient, par la suite, possible de collecter et d’agréger ces données afin de les exploiter pour les rendre réutilisables pour des organismes touristiques, pour créer des interfaces d’exploration et, même, pour concevoir des agents intelligents qui feront des suggestions de contenus personnalisées. Mieux que tout autre documentation, cette vidéo produite par la Fondation europeana, explique en 3 minutes ce qu’est le web des données ouvertes et liées et pourquoi il est devenu si important pour la diffusion de la culture.

Le développement de cette infrastructure commune peut être pris en charge par l’État, comme c’est le cas pour Europeana, où l’Union européenne et chacun des états contributeurs, soutiennent les infrastructures et ressources qui permettent aux institutions culturelles de publier leurs données collectivement.  L’État peut également faire appel au milieu académique et au secteur de la recherche, à l’image de l’entente récemment conclue, en France, entre le Ministère de la Culture et de la Communication et l’Inria, afin de soutenir le projet SemanticPedia.

Bien que le web sémantique soit utilisé dans des domaines aussi divers que les services hydroélectriques (Hydro-Québec) et la radiodiffusion (BBCMusic), nous persistons à nous tourner vers des technologies conventionnelles pour diffuser nos contenus culturels. Passer de l’informatique au numérique est clairement un changement difficile à opérer, même dans  une industrie de pointe.

Pour aller plus loin

Pour les technophiles: Le web sémantique en 10 minutes, vidéo produite lors de l’édition 2016 du colloque sur le web sémantique au Québec, dans le cadre du 84e congrès de l’ACFAS.

Libérer le potentiel de nos données culturelles ou laisser d’autres en tirer profit

Silos riachuelo

Tu peux produire de l’excellent contenu, mais s’il ne fait pas partie du web, il ne fait pas partie du discours universel.

Tim Berners-Lee, en entrevue avec Jean-François Coderre pour La Presse.

C’est une affirmation que de nombreux états, institutions et entreprises tiennent désormais pour une réalité. Une réalité que plusieurs expérimentent depuis quelques années déjà et qui s’impose encore davantage à ceux qui observent les transformations qui sont à l’œuvre  dans le web , notamment du côté des moteurs de recherche.

Alors, ne devrions-nous pas élaborer une approche stratégique afin de regrouper et de structurer notre offre culturelle plutôt que d’encourager la production de silos d’informations qui sont difficilement exploitables ?

Comment tirer notre épingle du jeu numérique ?

Il faut nous attaquer à la dispersion de l’offre culturelle, d’une part, et d’autre part, à l’absence de vision transverse sur les données. Autrement, incapables de développer nos propres modèles d’exploitation numériques, nous risquons d’être confinés aux rôles de fournisseurs et de clients de plateformes beaucoup plus attractives et efficaces que nos sites web.

Principal défi: sauf dans des domaines, comme les bibliothèques et  les archives, les organisations ont, en général, peu d’intérêt ou de ressources à investir pour la production de métadonnées standards. Cela pourrait cependant changer.

Données structurées pour moteurs de recherche en quête de sens

Les moteurs de recherche privilégient de façon croissante les contenus web dont la description leur est fournie par des données structurées (appelées quelquefois,métadonnées embarquées). Schema est le modèle de métadonnées soutenu par les grands acteurs du numérique, tels que Google, Microsoft et Apple afin d’alimenter les algorithmes qui fournissent de l’information plutôt que des listes de résultats. Google offre même aux développeurs des modèles descriptifs pour des types de contenus dont la liste s’allonge progressivement.

L’utilisation de la base de connaissance Knowledge Graph, d’un modèle de métadonnées qui est dérivé de la syntaxe du web sémantique (RDF ou Resource Description Framework) et d’un  format d’encodage de données liées (JSON-LD ou Java Script Object Notation for Linked Data) témoigne de la préférence de Google pour le web des données et les liens permettant de générer du sens.

Avec Schema, qui facilite l’intégration des données dans des pages HTML (il existe également des extensions spécialisées pour WordPress), les robot indexeurs et les algorithmes des moteurs de recherche deviennent donc beaucoup plus performants. Il n’est déjà plus nécessaire de quitter leur interface pour trouver une information ou découvrir, par exemple, de nouveaux groupes musicaux.

La production de données structurées est une technique qui deviendra rapidement aussi essentielle que l’optimisation de pages web. Mais une technique, aussi efficace soit-elle, n’est qu’un moyen et ne peut remplacer une stratégie.

Regrouper et structurer notre offre culturelle

Les données doivent pouvoir être extraites des silos existants et reliées entre elles grâce à des métadonnées communes. Les éléments d’information produits par chacun des acteurs du milieu des arts et de la culture peuvent ainsi être reliés de façon cohérente afin de constituer une offre d’information globale et riche et de nous fournir une meilleure visibilité sur les données relatives à l’accès et à l’utilisation de contenus.

Comment accompagner la transition ?

Comment extraire les données descriptives des bases de données et les normaliser ? Comment définir les métadonnées qui formeraient les éléments descriptifs essentiels pour permettre de relier entre eux des ensembles de données qui  utilisent des référentiels standards mais différents ? Et, surtout, comment convaincre les producteurs de données de l’importance de l’interopérabilité et de la structuration intelligente des données ?

Dans cette perspective et afin de travailler collectivement à définir des pistes d’action, nos politiques et programmes devraient jeter les bases d’un projet de mise en commun des données culturelles en soutenant:

  • L’adoption des meilleures pratiques en matière d’indexation de contenu avec des métadonnées et une syntaxe de description qui s’adressent aux machines;
  • L’élaboration d’un un ensemble de métadonnées de base (modèle de médiation) qui permette de « faire la traduction » entre les différents standards et vocabulaires employés selon les domaines (musique, cinéma, arts visuels) et les missions (bibliothèque, archives, commerce, gestion de droits);
  • La libération des données qui décrivent nos créations artistiques, nos produits culturels, nos talents et notre patrimoine. Les données ouvertes constituent une première étape vers la diffusion de données ouvertes et liées.
  • L’acquisition des compétences techniques et technologiques qui sont requises afin de concevoir et de maintenir des outils pour faciliter la saisie et la réutilisation des données par les acteurs concernés.
  • L’harmonisation des différents modèles d’indexation documentaire (référentiels transversaux pour la production des données culturelles, cartes d’identité des biens culturels) au sein du Ministère de la Culture et des Communications.
  • Une étroite collaboration entre les institutions et les organismes producteurs de données autour de la rédaction d’une politique des métadonnées culturelles.

On ne devient numérique qu’en le faisant. Mais c’est un chantier qui repose davantage sur la collaboration et la mise en commun de l’information que sur la technologie.

Industries culturelles: la vraie nature de la transition numérique

Initialement publié dans le blogue de Direction informatique, le 7 décembre 2015.

Le plus grand défi imposé par la révolution numérique aux industries culturelles et créatives n’est pas de nature technologique mais organisationnelle.  Nous ne voyons encore que trop peu d’expérimentations hors des modèles de création et de distribution traditionnels. Qu’est ce qui retient nos entreprises culturelles?

Lors du Sommet sur la découvrabilité, qui était organisé par le CRTC et l’ONF et qui avait lieu à Montréal la semaine dernière, j’ai eu l’impression qu’il fallait encore convaincre les participants que les changements qui bouleversent leur univers sont, non seulement irrémédiables, mais qu’ils s’accélèrent. Pourtant, nous ne sommes plus uniquement en présence de nouveaux usages numériques, mais d’une nouvelle génération de « consommacteurs » autour desquels s’élaborent des services et des outils. Un public plus difficile à joindre et qui a sa propre grammaire, comme le mentionnait Suzanne Lortie, professeur et directrice du programme en stratégie de production culturelle et médiatique à École des médias de l’UQAM, en parlant des YouTubers, ces jeunes créateurs de contenus qui sortent des codes habituels de l’audiovisuel et ont des succès d’audience.

Il y a pourtant plusieurs années maintenant qu’ont été publiés les rapports du CALQ et de la SODEC sur le nécessaire virage numérique.  Il est donc fort probable que tous étaient déjà bien au fait des transformations qui affectent la création, la distribution et la consommation de contenus culturels.  C’est pourquoi les conférences qui composaient la première partie de l’événement n’ont pas déclenché d’électrochoc mais ont rappelé l’urgence d’agir face à des écosystèmes et des modèles qui se mettent en place en ne nous laissant qu’un rôle de fournisseur de contenus.

La table ronde qui réunissait des experts, praticiens et enseignants a permis d’entrevoir, trop brièvement, ce qu’un réseau de compétences et d’expériences diversifiées pourraient apporter à des projets novateurs.  Ces « partenariats improbables » évoqués par Sylvain Lafrance, professeur à HEC Montréal et ancien vice-président exécutif de Radio-Canada, ne seraient-ils pas plutôt des alliances naturelles dont on a ignoré le potentiel ?

Face au rouleau compresseur culturel des grandes plateformes numériques ne faudrait-il pas développer un réseau de partenaires afin de miser sur la mutualisation de ressources et de compétences? Et, pourquoi, tel que le suggérait le conférencier principal et consultant en nouveaux médias, Pascal Lechevallier, ne pas établir des partenariats à l’échelle de la francophonie ? C’est cette même ouverture sur le monde et les marchés francophones, que réclamait Jean-Daniel Nadeau, journaliste au Devoir, en dénonçant la myopie des médias, à la suite du Congrès de la fédération des journalistes du Québec.

Ces questions avaient pourtant déjà été soulevées en 2012, lors d’un forum France-Canada sur les enjeux des contenus numériques, organisé par le Conseil des technologies de l’information et des communications. Plusieurs des participants au sommet de la semaine dernière y étaient d’ailleurs présents.

Le véritable défi pour les contenus culturels à l’ère numérique est de sortir d’un modèle de création et de production qui n’est plus supporté par l’écosystème. Comme je l’ai démontré dans un billet précédent, la vraie nature du changement est culturelle: il faut abattre les silos disciplinaires et organisationnels pour connecter nos réseaux de compétences et mettre en commun nos savoirs.

Ce sont les réseaux collaboratifs qui permettent de décoder les signaux faibles du changement, de varier les perspectives sur une problématique et d’élaborer un prototype de solution. Pourquoi des organisations qui ont des enjeux communs ne collaboreraient-elles pas ensemble pour expérimenter des solutions? Parmi nos créateurs et nos entreprises culturelles, quels sont ceux et celles qui rechercheront ces « partenariats improbables »?

Découverabilité: nos contenus culturels sont-ils visibles?

Initialement publié dans le blogue de Direction informatique, le 20 novembre 2015.

Tout comme dans le commerce électronique, le catalogue est le maillon faible des industries culturelles et créatives au Québec. À lire l’invitation du Sommet sur la découvrabilité, il semble que nous n’ayons pas encore réalisé ce qui fait le succès des plateformes comme Amazon, Netflix, iTunes ou YouTube : une culture de la donnée qui favorise les rencontres entre l’offre et la demande.

Trop rares sont les entreprises qui, quel que soit leur secteur d’activité, exploitent leurs actifs informationnels sur le web ainsi que le font de nouveaux acteurs issus du numérique qui sont ou qui deviendront rapidement leurs plus féroces concurrents. À ceux-ci il faut ajouter les géants technologiques qui ont choisi le modèle de la plateforme, plutôt que celui du produit, et qui captent lors de chaque transaction, une valeur en micropaiement ou données.

Les fonds qui restent au fond des systèmes 

Pourtant, malgré les refontes de sites, les applications et les innovations technologiques, nos contenus culturels et créatifs sont pratiquement absents du web des données. Les répertoires, catalogues, fonds et archives ne sont accessibles aux humains et aux machines que par l’entremise d’un espace de recherche, souvent peu adapté aux besoins des utilisateurs. La diffusion des contenus dépend généralement de campagnes de promotion ponctuelles et plus ou moins bien ciblées dédiées aux nouveautés, laissant dans l’internet profond des actifs riches qui profiteraient bien de la longue traîne s’ils étaient visibles. Ceci expliquerait en partie le phénomène que décrit l’auteure Annie Bacon dans un récent billet intitulé « Une industrie de la nouveauté ».

L’industrie du livre se rapproche ainsi de l’industrie du cinéma dans laquelle les films n’ont plus que quelques fins de semaines pour convaincre les cinéplexes de les garder en salle. Un mauvais premier week-end et le film disparaîtra avant la fin du mois.

Combien de rendez-vous ratés avec le public et d’opportunités de développement de marché nos industries culturelles ont-elles raté sur le web? Combien de contenus n’ont pas rencontré leurs publics faute d’être visibles et découverts, par recommandation algorithmique ou par simple diffusion de métadonnées au bon endroit?

Le catalogue, actif stratégique?

Nous accusons un retard considérable en matière de diffusion et de distribution de contenu parce que nous ne maîtrisons pas les compétences nécessaires pour transformer nos catalogues et répertoires en données exploitables et interopérables. Si nous n’accordons pas la priorité à ces actifs stratégiques, nous risquons de nous confiner au rôle de fournisseurs et clients de l’économie numérique.  Cette économie est celle de la donnée, elle repose sur la diffusion des métadonnées, ces données qui fournissent une description détaillée d’un livre, d’une chanson, d’un film ou tout autre type de contenu. Ces métadonnées facilitent la recherche, favorisent la découverte et permettent aux entreprises d’enrichir leur connaissance du marché en les croisant avec les données résultant de l’interaction des utilisateurs.

La destination, c’est l’utilisateur

Il existe, bien sûr,  des programmes qui soutiennent le développement de sites internet et d’applications, ainsi que l’appropriation de nouveaux outils. Il s’agit cependant d’actions morcelées qui, en perpétuant les silos de données, obligent les consommateurs à multiplier leurs recherches ou limitent la découverte de nouvelles offres. Selon cette perspective, chaque site ou application est une destination. Dans une perspective numérique, l’utilisateur est au cœur du modèle par les requêtes qu’il adresse, directement, aux moteurs de recherche, ou indirectement, par ses actions et ses choix. L’utilisateur est devenu la destination.

Laisser le champ libre à Google et cie?

Être visible dans une économie numérique, c’est donc aller à la rencontre de son marché. Ne pas aller à la rencontre des consommateurs en mettant les contenus à leur portée, c’est laisser le champ libre à ceux qui ont compris comment, à partir du contenu intégral ou des métadonnées d’une oeuvre, on peut générer de l’information qui soit intelligible pour des lecteurs ou des applications. Voici pour preuve, cette observation partagée sur Twitter lors du Congrès des milieux documentaires du Québec qui avait lieu cette semaine, à Montréal :

McGill-GoogleScholar_tweet-cmd2015

La force des grandes plateformes technologiques repose sur la capacité d’agréger et de croiser des données de sources différentes, de les contextualiser à l’aide des données des utilisateurs et d’en faciliter le repérage et l’interprétation pour diverses applications.

Que faire pour entrer dans le web des données?

Il faut édicter une politique visant à encourager l’adoption,  par tous les acteurs des industries culturelles et créatives, d’un modèle de métadonnées harmonisées. En cela, nous pouvons nous inspirer de la Feuille de route stratégique sur les métadonnées culturelles qui a été publiée l’an dernier, par le ministère de la Culture, en France. Ceci permettrait de briser les silos technologiques et de rassembler les entreprises et institutions autour d’un projet numérique commun qui a une véritable portée stratégique.

Une politique de métadonnées culturelles constitue un instrument de gouvernance essentiel dans une économie de la donnée parce qu’elle requiert une collaboration active :

  • Élaboration d’une vision et d’une stratégie numériques qui soient partagées par les acteurs principaux.
  • Compréhension commune des objectifs et besoins de chacun. Définition et priorisation des enjeux sémantiques, techniques, juridiques et organisationnels.
  • Alignement de projets technologiques sur la stratégie (et non l’inverse).

La visibilité des contenus des industries culturelles et créatives devient un enjeu prioritaire pour le Québec qui se prépare à entrer dans l’économie numérique. Nous devrions, sans attendre, nous inspirer des démarches qui ont été entreprises ailleurs et développer nos compétences et notre maîtrise des données.

Entreprises et institutions culturelles, vos contenus sont-ils bien visibles?

Expo67 à l’ère numérique: nos mémoires mises en réseau

Pourquoi s’intéresser aux souvenirs d’Expo67 quand « Internet, c’est une exposition universelle à tous les jours » ?

Écoutez bien Julie Bélanger, fondatrice du groupe Expo67 sur Facebook, et Luc Gauvreau, passionné de culture et d’histoire (et un peu geek à heures). Les valeurs et l’esprit de l’événement qui a fait entrer le Québec dans la modernité sont encore bien présents et ont également marqué l’ADN culturel de Montréal.

En participant au hackathon des Journées de la culture, à Montréal du 25 au 27 septembre 2015, Luc et moi souhaitons attirer l’attention des institutions (bibliothèques, musées, archives) sur les contributions citoyennes à la mémoire collective à l’ère numérique:

  • Comment celles-ci pourraient-elles se connecter à nos souvenirs partagés?
  • Comment pourraient-elles entrecroiser nos mémoires avec leurs propres collections?

Le 50e anniversaire d’Expo67 sera plus qu’une commémoration, ce sera un point de départ pour la mise en réseau de nos mémoires et de nos cultures. Et si l’esprit d’Expo67 se manifestait dans l’île de Montréal, ses bibliothèques publiques et ses lieux de culture lors de cet anniversaire alors que nous soufflerons les 375 bougies de Montréal ?

Vidéo réalisée par Christian Aubry, au Parc Jean-Drapeau (Expo67, Terre des Hommes), le 19 septembre 2015.

Culture participative et mémoire collective: tous curateurs des souvenirs d’Expo 67

Expo 67 c’est plus qu’un événement: c’est un « éveillement ».

Ce mot est de Luc Gauvreau, un spécialiste de littérature et d’histoire québécoise qui devenu un peu geek à force de numériser des documents pour en extraire des données et les passer à la moulinette de Google Refine.

Je ferai équipe avec Luc (et d’autres volontaires) lors de l’édition montréalaise du Hackathon des Journées de la culture, du 25 au 27 septembre prochains.

Plan de l'Expo 67 appliqué sur une vue par satellite (Google Earth) des îles Saine-Hélène et Notre-Dame.
Plan de l’Expo 67 appliqué sur une vue par satellite (Google Earth) des îles Saine-Hélène et Notre-Dame.

En 2017, Montréal célébrera son 375e anniversaire. Il y aura également 50 ans que, dans un Québec tout juste sorti de la Grande noirceur,  une ville accueillait le monde sur des îlots au milieu du fleuve. Nous nous proposons de réutiliser ou adapter des technologies existantes et gratuites afin de cartographier les lieux et pavillons d’Expo 67 et d’enrichir la documentation disponible avec les contributions des citoyens. Cette interface permettra de stimuler la mémoire des visiteurs et des témoins afin de recueillir leurs souvenirs. Réunis dans un grand calendrier collectif des événements, ces témoignages pourront ainsi être partagés avec les générations plus jeunes.

Le web a permis aux passionnés d’histoire et de culture comme Luc de déterrer des documents enfouis dans les répertoires et bases de données, de partager les fruits de leurs recherches et d’accomplir des tâches souvent ingrates et pour lesquelles les institutions ont peu de ressources (ou d’intérêt). Je crois, comme Luc, que nous devons réanimer la mémoire d’un lieu qui, bien qu’aujourd’hui disparu, a tourné définitivement Montréal vers le monde et a activé dans son ADN la curiosité, l’ingéniosité, l’envie de faire autrement et un goût prononcé pour les rassemblements festifs.  Réactiver Expo 67 dans la mémoire de chacun, c’est aussi ouvrir un laboratoire nouveau pour transmettre la culture.

Nous disposons des éléments suivants:

Mises à jour (16/09/2015)

  • Site Villes éphémères, de Roger La Roche qui fait un impressionnant travail de documentation. Un bon exemple de la contribution des citoyens-experts au travail de mémoire collective.
  • Expo67 – Vive le Québec moderne! Ce blogue, signé prettykitsch, est un coffre au trésor. Parmi de très nombreux documents et anecdotes, on y trouve les archives de Claire Cloutier La Chance, qui travaillait au service des relations publiques de l’Expo, à titre de responsable des manifestations spéciales et des cérémonies officielles de la Place des Nations.

Mise à jour (17/09/2015)

  • Expo Lounge, très chouette blogue, en anglais, d’un amateur de la culture populaire de l’époque (et fan de Michèle Richard). Mention spéciale pour les anecdotes et liens vers des trouvailles.

Mise à jour (18-09-2015)

Nous recherchons des équipiers qui pourront contribuer, par leurs connaissances techniques et leurs conseils,  à faciliter la cartographie collaborative du site. Nous souhaiterions, notamment, que les citoyens puissent ajouter (sans programmation) des éléments sur la carte, les enrichir par leurs commentaires et liens vers d’autres ressources.

En complément, voici deux vidéos repérées par Luc, parmi une multitude de documents partagés sur YouTube:

Tout comme Luc, les membres du groupe Expo sur Facebook et tant d’autres ailleurs sur Internet, l’auteur de ces modélisations expose au présent des bribes de notre histoire sociale et culturelle.  Le projet que nous souhaitons concrétiser lors du hackathon est bien plus que de la technologie. Il vise une mise en relation d’éléments qui leur donnera encore plus de sens et une mise en réseau de passionnés autour d’un sujet commun. Nous avons bon espoir que les institutions de la mémoire collective accueillent avec intérêt les initiatives issues des cultures de la participation et du réseau.

Il est primordial que  la mémoire de cet événement ne se perde pas et qu’il soit possible aux générations futures de découvrir ce qui a amener le monde à Montréal et permis aux Montréalais de s’ouvrir sur le monde.

Maîtrise des métadonnées: enjeu culturel et économique majeur

The Semantic Web isn’t just about putting data on the web. It is about making links, so that a person or machine can explore the web of data. With linked data, when you have some of it, you can find other, related, data. Tim Berners-Lee, Linked Data

Les 5 règles des données liées (linked data)

Métadonnées: la France est en retard…

Le numérique est avant tout un espace d’échange de métadonnées : si vous ne contrôlez pas les métadonnées, vous laissez à d’autres le pouvoir d’exposer ou non vos œuvres, de vous rémunérer ou pas… Je trouve que nous gérons collectivement cet enjeu des métadonnées avec beaucoup trop de légèreté, le réveil risque d’être douloureux.

Pendant qu’en France nous enchainons les colloques sur la nécessité de s’intéresser aux métadonnées, le gouvernement anglais investit des millions de livres pour faire émerger le plus rapidement possible des acteurs mondiaux sur la gestion des métadonnées.

ÉlectronLibre, entrevue avec Jean-François Bert, fondateur de Transparency, une société qui agit comme un tiers de confiance pour les ayants droit qui veulent surveiller l’exploitation de leurs oeuvres sur le Net.

Le Québec numérique dans son enfance

Pour réaliser à quel point notre retard va nous mettre à la merci des économies numériquement plus avancées, il suffit de visiter des sites comme semanticweb.com. On retrouve très rarement au Québec et au Canada des postes similaires à celui-ci (extrait) :

Core to the work of Pearson International is excellence in information architecture. Information architecture benefits PI businesses by making content reusable through the application of standards; and « smart » by the use of metadata, taxonomies and semantic technologies.

Candidate Profile

Deep understanding of the complex challenges of information and knowledge management.

• Proven success incorporating Taxonomy and Metadata programs within a large enterprise organisation.

• Experience leading teams on taxonomy and metadata strategy projects

• Experience implementing industry taxonomy standards

• Experience implementing metadata standards such as Dublin Core

Un risque pour la culture et l’économie

Les récentes interrogations de l’industrie de la musique illustrent le retard numérique du Québec, notamment en ce qui concerne le web des données:

Au Québec, les ventes d’albums et de pistes numériques représentent 24 % du total; aux États‐Unis, cette proportion passe à 47 %, un peu plus que les 45 % du marché de la musique enregistrée au Canada. /…/ Non seulement la vente d’albums et de fichiers individuels de produits québécois est‐il significativement plus faible qu’en format physique, mais, contrairement à la tendance générale /…/, elle est en recul depuis deux ans.

/…/

Dans un contexte où le format physique semble condamné à perdre du terrain face au commerce numérique de la musique, il appert essentiel que les produits québécois accroissent leur part de marché au courant des prochaines années pour assurer la pérennité du disque québécois. Comment s’y prendre? Est‐ce que le disque (et le « single ») québécois sont assez bien représentés sur les différentes plates‐formes de téléchargement légal (iTunes, eMusic, Zik)? Peut‐on exiger de ces détaillants du Web qu’ils mettent mieux en valeur les produits québécois, voire qu’ils créent une « boutique Québec » sur leurs plates‐formes? Est‐ce que l’industrie de la musique doit investir davantage dans la publicité sur le Web et dans les réseaux sociaux pour mieux diffuser la musique d’ici?

(Philippe Renaud, Un portrait de la chanson québécoise, janvier 2013, pages 19-20)

S’il se vend moins de musique québécoise, c’est, en grande partie, parce qu’elle n’est pas présente/visible là où vont les consommateurs pour trouver de nouveaux contenus culturels (sur Internet). La découverte de contenus culturels québécois sur le Web passe par des métadonnées de qualité (nos catalogues de produits sont en général pitoyables, sémantiquement). De plus, la multiplication des plateformes aux technologies  propriétaires et aux formats non standards (voir la définition des données liées, au début de ce billet) entraîne une balkanisation de l’offre culturelle au détriment des consommateurs.