Google, je cherche un bon film à regarder

Produire des données : entre outils de marketing et bases de connaissances

La découverte optimisée pour les moteurs de recherche est-elle la  seule solution pour accroître la consommation de contenus culturels locaux ?  Sommes-nous à la recherche de nouveaux outils de marketing ou souhaitons-nous développer des bases de connaissances communes ?  Les résultats attendus à court terme, par nos programmes et partenaires  sectoriels, pèsent sur les choix qui orientent nos actions.

Google, je cherche un bon film à regarder

 

La découverte optimisée pour les moteurs de recherche

Google poursuit son évolution pour devenir notre principale interface d’accès à la connaissance. La tendance zéro clic est une  forme de désintermédiation des répertoires qui est similaire à celle que connaissent les sites des médias. Il y a quelques années que les réseaux de veille prédisent la transition des moteurs de recherche vers des moteurs de réponse.

Alors, est-il stratégique de baliser nos pages web avec des métadonnées (aussi appelées données structurées) pour que des machines comprennent et utilisent nos contenus dans leurs fiches de réponse ?

Améliorer le potentiel d’une information d’être repérée et interprétée par un agent automatisé est une bonne pratique à intégrer dans toute conception web, au même titre que le référencement de site web. Mais se contenter de baliser des pages  pour les seules fins de marketing et de visibilité n’est pas stratégique. Voici pourquoi:

  • Architecture de l’information conçue pour servir des intérêts économiques et culturels spécifiques.
  • Aucun contrôle sur le développement de la base de connaissances.
  • Uniformité de la présentation de l’information, quel que soit le pays ou la culture.
  • Modèle et vocabulaire descriptifs simples, mais adaptés à des offres commerciales (une bibliothèque publique est une entreprise locale).
  • Le moteur de recherche n’utilise que certains éléments du vocabulaire Schema.org et modifie son traitement des balises au gré de ses objectifs commerciaux (voir ce billet sur les mythes et réalité de la découvrabilité).

Des données pour générer de la connaissance

Les plans de marketing et de promotion ont des effets à court terme, mais ponctuels, sur la découverte. Cependant, nous devons parallèlement développer les expertises nécessaires pour concevoir de nouveaux systèmes de mise en valeur des offres culturelles et de recommandation qui répondent à nos propres objectifs. Ne pas également prioriser cette avenue, c’est accumuler une dette numérique et  accroître notre dépendance envers les plateformes et tout promoteur de solution.

Comme je l’ai souligné en conclusion d’un billet rédigé lors de recherches sur la découvrabilité et la “knowledge card” de Google, “, apprendre à documenter des contenus sous  forme de données est  une étape  vers le dévelopement de “nos propres outils de découverte, de recommandation et de reconnaissance de ceux qui ont contribué à la création et à la production d’œuvres.”

Pour cela, il faut élaborer collectivement nos propres stratégies pour faire connaître le contenu de répertoires et  rejoindre de nouveaux publics. Nous serions, alors, en mesure de concevoir des moyens  non intrusifs pour collecter l’information qui permet de comprendre la consommation culturelle.

Adopter une méthode de travail pour une réflexion stratégique

Concevoir et réaliser des projets autour de données liées (ouvertes ou non) demande un long temps de réflexion et d’échanges de connaissances entre des acteurs qui ont des perspectives différentes. L’initiative de la Cinémathèque québécoise peut être citée comme un excellent exemple de transformation organisationnelle par l’adoption d’une nouvelle méthode de travail.  Marina Gallet pilote ce projet qui vise à formaliser les savoirs communs du cinéma en données ouvertes et liées.  Elle a gracieusement partagé cette expérience lors de la dernière édition du Colloque sur le web sémantique.

Représentation de la diversité culturelle et linguistique

Il existe de nombreuses façons de décrire les oeuvres d’un album de musique ou un spectacle de danse. Pour représenter ces descriptions sous forme de données, il existe des modèles et vocabulaires pour différentes missions et utilisateurs.  Une part grandissante de ces vocabulaires est en données ouvertes et liées. Ces descriptions ne sont pas toujours structurées ou conformes aux standards du web, mais leur diversité est essentielle à la richesse de l’information. Il est vital que les vocabulaires utilisés pour décrire des offres et des contenus soient en français pour que la francophonie soit présente dans le web des données et qu’elle soit prise en compte par les systèmes intelligents.

Le Réseau canadien d’information sur le patrimoine annonçait ce printemps, la réalisation de la version française de référentiels en données ouvertes et liées. Philippe Michon, analyse pour le RCIP, explique comment ces référentiels essentiels au patrimoine culturel seront rendus disponibles en données ouvertes et liées.

Recherche augmentée: découverte selon les goût et l’expérience recherchée

Il faut cesser de reproduire des  interfaces et modes d’accès aux répertoires qui sont dépassés. On ne peut cependant améliorer la découverte sans investir le temps et les efforts nécessaires pour sortir de nos vieilles habitudes de conception.

Nos interfaces de recherche sont devenues obsolètes dès l’arrivée du champ unique des premiers moteurs de recherche. Nos stratégies de marketing de contenu pour le référencement de pages web  aident les moteurs de recherche à répondre à des questions, mais  effacent les spécificités en uniformisant l’architecture de l’information.

L’information qui décrit nos productions culturelles et artistiques est trop souvent limitée à des données factuelles. Il faut annoter des descriptions avec des attributs et caractéristiques riches et orientés vers divers publics et usages. Des outils d’analyse et de recommandation peuvent ainsi fournir de l’information ayant une plus grande valeur. Il ne faudrait pas espérer refiler ce travail à des intelligences artificielles: l’indexation automatique ne produira pas nécessairement des métadonnées utiles et pertinentes pour une stratégie de valorisation. De plus, il ne faut pas sous estimer la valeur que l’expérience humaine (éditorialisation, sélection, critique, mise en contexte) apporte à des services qui jouent un rôle prescripteur.

Soutenir le dévelopement de bases de données en graphes

La mise en valeur de répertoires et collections, ainsi que des actifs informationnels (textes, images, sons) d’organisations ne devrait plus reposer sur des bases de données classiques.  Les bases de données en graphes permettent de raisonner sur des données et de générer de la connaissance , en faisant des liens, à l’image de la pensée humaine:

Quelle est le parfum de glace préféré des personnes [qui] dégustent régulièrement des expresso, mais [qui] détestent les choux de Bruxelles ? Une base de donnée Graph peut vous le dire. Comment ? Avec des données de qualité, les bases de données Graph permettent de modéliser les données et de les stocker de la manière dont nous pensons et raisonnons dans le monde réel.

Ceci est tiré d’un bon article de vulgarisation sur les bases de données en graphe.

Choisir des méthodes de travail adaptées aux projets collectifs

Pour qu’un écosystème diversifié de connaissances (multidisciplinaire, multi acteurs) soit durable, il doit reposer sur la distribution des fonctions de production et de réutilisation des données entre des partenaires.  Il faut aussi réunir des initiatives collectives dans une démarche où le développement de connaissances et l’expérimentation ne sont pas relégués au second plan par des intérêts individuels ou commerciaux. Enfin, il faut élaborer et adopter de nouvelles méthodes de travail pour des projets collectifs.

Je reviendrai bientôt sur les éléments nécessaire pour la gestion participative d’une base de connaissances commune.

Architectures et bases de connaissances

Définir les finalités et les modalités des projets de liage de données est un long cheminement qui demande des apprentissages, des efforts concertés et du temps. Nos programmes devraient  être revus.  Mettre en place les conditions de réussite d’un projet collectif est un projet en soi. Il faut tenir compte d’un cadre de formation, d’une nouvelle méthode de travail et d’une progression dans la durée. Exiger des résultats à court terme oriente les projets vers des “solutions” et laisse peu de place à la remise en question des habitudes.

Nos initiatives doivent être conjuguées pour élaborer une architecture commune  de la connaissance.  Parce qu’elle sort du cadre de nos actions habituelles, c’est une avenue qui offre plus de potentiel, à plusieurs titres, que des stratégies de visibilité et de marketing.

6 réflexions sur « Produire des données : entre outils de marketing et bases de connaissances »

  1. Tu soulèves de très bonnes questions dans ce texte Josée.

    Et tu as particulièrement raison de rappeler que les objectifs que nous poursuivons à court terme (souvent induits par les contraintes les programmes de soutien des pouvoirs publics — surtout en culture) conditionnent aussi les résultats à long terme. Et que, pour cette raison, on doit porter une attention particulière à la mise à jour de ces programmes.

    Je crois qu’il faut toutefois reconnaître que certains projets qui apparaissent très imparfaits ou très incomplets peuvent néanmoins avoir une dimension «éducative» importante.

    Malgré toutes leurs limitations, ces projets, s’ils sont bien conçus, peuvent être l’occasion / le lieu d’apprentissages importants (et de nouvelles collaborations) qui permettront par la suite la réalisation de projets avec une plus grande portée stratégique, qui auront une ambition mieux dirigée — et qui permettront d’envisager l’élaboration de bases de connaissances communes, indépendantes de Google et autres géants tentaculaires.

    Qu’en penses-tu?

  2. Je ne connaissais pas les bases de données en graphe. J’avais déjà essayé de créer ce type de structure de données en utilisant les outils d’une base de données relationnelle.
    Merci, Josée, pour cette perspective originale sur la création de contenu web.

  3. Tout à fait, Clément. Je crois que tous les projets de liage de données agissent comme catalyseurs, à divers titres, mais avec des finalités et impacts plus ou moins bien définis. Il y a toujours moyen d’apporter des améliorations et du soutien à l’ensemble des acteurs avec la contribution de quelques spécialistes (dont je ne fais pas partie).

    Il y a plusieurs raisons à ces tatonnements la principale est l’absence, au sein de tous ces projets et pour le secteur culturel, d’une vue d’ensemble des enjeux qui sont critiques pour la transition à opérer: mettre de l’information en commun pour pouvoir réaliser des choses qui ne peuvent être réalisées autrement.

    De plus, rares sont les initiatives dont participants ont un bon niveau de connaissances ou d’un de ces domaines (ou plus): informatique (architecture, bases de données, programmation), sciences de l’information (indexation, représentation de l’information, modèles et standards), sciences cognitives (modélisation des connaissances), Wikidata (production et extraction de données) et ce domaine hybride, à forte composante technologique qu’est le web sémantique. Le projet de la Cinémathèque en est un, sans surprise: c’est un milieu documentaire (méthodologie dans son ADN). Le projet de CAPACOA a la chance immensense d’être inspiré par Beat Estermann, Wikimédien, technophile et excellent modélisateur (et universitaire).

    Tout ceci ne fait pas, en soi, de mauvais projets, mais cela demande beaucoup de temps et de “recommencements”. Le risque d’érosion de l’engagement (incompréhension, déception, surcharge de travail) est présent.

    D’où l’importance, pour que ton dernier paragraphe devienne réalité, de fournir un cadre d’apprentissage pour gérer les attentes et s’assurer que la dimension éducative ait un impact réel et mesurable (indicateur à ajouter à l’évaluation de programmes). Une méthodologie adaptée à des projets collaboratifs est vitale pour nous assurer qu’une partie essentielle (quoi, pour qui: à déterminer) des connaissances soient transférée au sein des équipes et organisations. Sans cadre et mécanismes de transfert (il y a des spécialistes pour cela), les connaissances acquises demeureront superficielles et notre bassin de personnes compétentes ne s’élargira pas.

    Nous pouvons nous inspirer des transferts qui sont plus ou moins présents et formalisés au sein des institutions qui ont porté des projets de DOL, en Europe et aux É.U.

    Nous disposons de tout ce qu’il faut pour que tous ces projets produisent des résultats profitables pour tous. Maintenant, après le iffo: yaka !

  4. Merci Jean, d’avoir pris le temps de commenté ce billet.
    Je vous recommande cette présentation très didactique de Gautier Poupeau, sur les bases de données en graphes. Elle date de presque 10 ans, mais les principes sont toujours les mêmes https://fr.slideshare.net/lespetitescases/lapport-des-technologies-du-web-smantique-la-gestion-des-donnes-structures. Il a contribué à la réalisation de plusieurs grands chantiers de données, en France, et a récemment publié une série de 4 billets pour partager ses perspectives sur les usages du web sémantique: http://www.lespetitescases.net/les-technos-du-web-semantique-ont-elles-tenu-leurs-promesses . Bonne lecture et bons projets.

  5. Merci pour ta réponse. J’en profite pour préciser un peu ma pensée.

    Je pense qu’on est pas mal d’accord sur l’objectif (mettre de l’information en commun pour pouvoir réaliser des choses qui ne peuvent être réalisées autrement.), et sur la nécessité de se doter d’une vision claire et partagée pour pouvoir y arriver.

    Toutefois, je pense que la définition de cette vision fait partie intégrante de la démarche dans laquelle nous sommes collectivement engagés — et que pour y arriver il faut préalablement réussir à mobiliser l’ensemble des parties prenantes — y compris celles qui ont possiblement des intérêts divergents (ou qui le sont en apparence). De mon point de vue, cette mobilisation est l’étape la plus difficile. Et c’est celle sur laquelle on se butte malheureusement le plus souvent.

    Je me réjouis donc de voir des projets ambitieux, précis, d’avant-garde, prendre forme et avoir du succès. On doit les mettre encore plus en valeur. Ils faut en faire des exemples inspirants. Ils doivent guider l’élaboration de notre vision.

    Mais je pense qu’il faut aussi se réjouir aussi de la multiplication de projets plus modestes, plus expérimentaux, voire plus maladroits. Il faut encourager les gens à s’avancer dans des projets sans craindre que leur initiative soit jugée trop durement.

    Ces initiatives jouent, elles aussi, un rôle essentiel dans notre démarche. Elles permettent d’initier le mouvement, nous offre l’occasion d’engager un dialogue et (surtout!) de réunir des gens qui seront, par la suite, susceptibles de se joindre à des projets d’une autre envergure.

  6. J’ai une perspective différente, mais pas irréconciable, puisque j’accompagne certaines initiatives, petites et grandes, qui font partie de ce grand tout.

    Nous faisons de gros efforts, dans des projets collectifs, pour mettre en mots une vision qui rallie des participants avec des intérêts et besoins différents. C’est un long et essentiel exercice sur lequel repose la conception et la réalisation. Ce sont également des discussions qui ont lieu régulièrement au cours du projet parce que le niveau de connaissances des parties prenantes s’améliore. C’est la vision commune qui permet de faire converger leurs intérêts particuliers.

    Il y a des initiatives modestes avec des données qui gagneraient à être liées au reste du web, mais qui n’ont pas la chance d’avoir des méthodes de travail pour savoir ce qu’elles pourraient en faire et comment le faire. Je trouve dommage qu’un tel transfert de connaissances n’ait lieu que dans les projets qui ont eu la chance de s’adjoindre les ressources nécessaires.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.