Archives de catégorie : Sciences de l’info

Nouveaux milieux documentaires en manque de spécialistes des sciences de l’information

Carte de la science de l'information.
Diversité des disciplines et thèmes abordés par la science de l’information. Zythème, [CC BY-SA 3.0], Wikimedia Commons
En culture comme en commerce, les initiatives de mise en commun de données numériques, constituent de nouveaux « milieux documentaires ». Au Québec, pourtant, les compétences et méthodes du domaine des sciences de l’information sont rarement sollicitées. Les institutions d’enseignement et les associations professionnelles concernées devraient pourtant reconnaître, dans ces projets, les notions et enjeux entourant les systèmes documentaires classiques.

Voici quelques lectures récentes illustrant des défis que pourraient relever les spécialistes intéressés par ces nouveaux milieux documentaires.

Taxonomie pour des contenus en mutation

▣ Dominic Tardif. « Ces livres qui se dérobent aux étiquettes ». Le Devoir, 9 janvier 2021.

Cet article introduit certains défis actuels de l’élaboration d’un modèle de métadonnées qui permette de faire des liens entre les ressources de bases de données différentes.

Tout choix est subjectif; il n’y a donc pas de donnée neutre. Un modèle de classement ou de catégorisation peut être porteur d’exclusion, notamment de ce qui peut apparaître inclassable (personne non genrée, pratiques artistiques hybrides…) car il impose le choix d’un descriptif parmi un nombre limité d’options.

Que faire des œuvres qui n’ont pas été pensées et créées dans le cadre d’une pratique déjà bien étiquetée? Et surtout, comment documenter l’intention?

Ça devient un problème à partir du moment où des livres ne reçoivent pas la reconnaissance qu’ils devraient avoir parce qu’on les juge à partir de critères qui n’ont rien à voir avec leur projet littéraire.
Clara Dupuis-Morency, autrice et enseignante en littérature.

Comment, alors, respecter la création, anticiper les biais et éviter que la perspective d’une culture dominante n’occulte celles d’autres cultures?

Un catalogage qui se satisferait de distinguer les textes de fiction des textes entretenant un rapport plus immédiat au réel serait donc inefficace.
ibid.

Algorithmes de recommandation personnalisée

The NYT Open Team. « We Recommend Articles With a Little Help From Our Friends (Machine Learning and Reader Input) ». NYT Open, 14 janvier 2021.

Ce billet publié par l’équipe des produits numériques du New York Times met en lumière le travail d’indexation et de catalogage requis par le développement d’un algorithme de recommandation. Il souligne l’importance d’intégrer la pensée humaine aux processus automatisés de traitement documentaire.

Le nettoyage des données et l’amélioration de la qualité descriptive des métadonnées sont des opérations essentielles à l’exploitation d’une base de données. Elles le sont également dans le cas d’un programme d’apprentissage automatique ayant pour objectif l’entraînement ou le bon fonctionnement d’un algorithme de recommandation.

When we took a deeper look at a few of the incorrect labels, we could often understand why the model assigned the label, but saw that correcting the mistake requires human judgement. It takes knowledge of history and society, as well as the ability to recognize context to intuit that some articles are better suited for some interest categories than others.
The NYT Open Team

(…)

Readers trust The Times to curate content that is relevant to them, and we take this trust seriously. This algorithm, like many other AI-based decision-making systems, should not make the final call without human oversight.
ibid.

De taxonomie à ontologie: un défi de taille!

▣ Heather Hedden. « Hierarchies in Taxonomies, Thesauri, Ontologies, and Beyond ». The Accidental Taxonomist, 20 janvier 2021.

À lire avant de convertir une taxonomie (ou tout autre vocabulaire contrôlé) en ontologie. Il s’agit bien de référentiels ayant des rôles différents et la problématique réside principalement dans les caractéristiques spécifiques de ces différents modes d’organisation des connaissances. Par exemple: l’adaptation de la structure hiérarchique d’une taxonomie à la structure en graphe d’une ontologie de domaine.

The problem is that the definitions and rules for hierarchies vary depending on the kind of knowledge organization system, so you cannot assume that a hierarchy in one system converts to a hierarchy in another system.

(…)

“Hierarchy” can have various types and uses. Not all kinds of hierarchies are reflected in even in taxonomies, which tend to be quite flexible. The rules are stricter when it comes to thesauri. Finally, in ontologies, there is only one kind of hierarchy.
Heather Hedden, taxonomiste, ontologiste, autrice et formatrice.

Culture de l’information et méthodes de travail

▣ Mike Tung. « From Knowledge Graphs to Knowledge Workflows ». Diffbot, 19 janvier 2021.

Le concept de « graphe de connaissance » (knowledge graph), a été popularisé par Google, bien que des structures de données en graphes existaient auparavant dans différents domaines. Ce type de structure est souvent perçu comme une solution qui permette d’imposer un modèle descriptif assurant la visibilité et/ou l’interopérabilité de ressources informationnelles.

L’adoption d’un modèle descriptif unique entraîne cependant une uniformisation des perspectives qui conduit à l’aplatissement des connaissances. C’est également la source de problèmes rarement anticipés. Par exemple: l’adoption d’un vocabulaire commun dans toute l’organisation va-t-elle «pérenniser» vos données ou entraîner des réunions sans fin pour débattre de ses mises à jour des vocabulaires et des ontologies sont discutées?

If we instead listen to the problems information workers have, spend a day shadowing them in their jobs, and design solutions that integrate knowledge-tech in a lightweight way to automate tedium, then we have a shot at solving a larger set of problems, to benefit more of society.
Mike Tung, CEO Diffbot.

Au-delà du solutionnisme technologique, il faut explorer les bénéfices issus du développement d’une véritable culture de l’information au sein des organisations. Cela signifie que la gestion et la qualité de l’information sont des responsabilités devant être partagées dans une organisation et non plus limitées au service des technologies de l’information.

Découvrabilité hors du Web des moteurs de recherche

Greta Bahnemann, Michael Carroll, Paul Clough, Mario Einaudi, Chatham Ewing, Jeff Mixter, Jason Roy, Holly Tomren, Bruce Washburn, Elliot Williams. « Transforming Metadata into Linked Data to Improve Digital Collection Discoverability: A CONTENTdm Pilot Project. OCLC, 2021.

OCLC, un organisme sans but lucratif au service des bibliothèques, rend compte d’un projet pilote sur la transformation des métadonnées de collections en données liées. Il nous rappelle que la découvrabilité recherchée n’est pas celle qui se mesure à l’aulne des résultats de Google ou des cotes de popularité des plateformes de contenus.

Les bases de données en graphe – il faut le répéter – ne sont pas indexées par les moteurs de recherche. Il existe d’autres espaces numériques où l’accès à la culture pourrait fournir des expériences de recherche et découverte pertinentes et efficaces. Exemple: naviguer à travers des collections qui proposent des connexions que des bases de données classiques n’arrivent pas à révéler.

Representing what is locally unique yet making local information legible to outsiders and creating a mechanism where differences can be understood, bridged, and linked is an important part of what public libraries using newer descriptive systems can surface.

À l’image des initiatives de la BnF et d’Europeana, le projet d’OCLC a permis à des institutions de se familiariser avec des méthodes et outils du web sémantique :

The Linked Data project demonstrated the amount of work involved in the transition to linked data, but also that the tools exist and that the workflows can be developed.

Pour une vision systémique du numérique

Les initiatives et projets qui visent à structurer l’information pour le numérique constituent de nouveaux milieux documentaires, hors des lieux habituels que sont les bibliothèques, centres de documentation et fonds d’archives. Les professionnels des sciences de l’information sont formés pour relever les défis inhérents aux « espaces» numériques que sont les sites web, les plateformes commerciales, le Web des données et, même, les jeux de données ouvertes. Il serait temps que la rencontre entre tous ces acteurs se réalise. La réussite de nos initiatives en dépend.

Moteur de recherche et désintermédiation

Il est possible de passer quelques heures, sur le web, à écouter de la musique et à croiser des artistes, connus et inconnus, en suivant des liens tissés par un algorithme. Et cela, sans quitter l’interface du moteur de recherche.

Désintermédiation des services d’information

Le moteur de rechercher devient une interface qui impose aux utilisateurs sa vision du monde, son algorithme, son modèle de classification et son régime de vérité: la popularité. Une uniformisation de la structure de l’information et des fonctions proposées qui efface la diversité des modèles et des expressions.

Service et application Google Voyages

Avec l’intégration de Google Voyages, grâce aux données collectées auprès des utilisateurs, il connaîtra les intérêts et comportements des voyageurs beaucoup mieux que les organisations touristiques locales et deviendra un partenaire priviliégé des entreprises touristiques. Celles-ci fournissent déjà, par le biais de Google Mon entreprise, les métadonnées qui permettent de lier et classifier les données, en mode hyperlocal. Face à une très probable désintermédiation, les associations touristiques devront mettre l’accent sur une organisation de l’information et des expériences que le moteur ne propose pas.

Nul doute que  cette nouveauté accroîtra l’intérêt pour les technologies de liage de données, tel que cette conférence sur les graphes de données, dans le domaine du tourisme.

Définir numérique, données et «IA» est encore un défi

Glossaire, sciences de l'information
Cned-PA [CC BY-SA 4.0], Wikimedia Commons
‘absence de références communes pour une diversité d’acteurs a très probablement un effet négatif sur l’impact et la portée des initiatives numériques.  Elle ne favorise pas, non plus,  de débats interdisciplinaires critiques sur les enjeux de société.  Nous devrions investir davantage dans une meilleure compréhension commune des concepts afin d’être mieux préparés à travailler ensemble pour faire face à des problématiques complexes. Voici quelques pistes pour éclairer notre compréhension:

De quoi le numérique est-il le nom ?

Il y a eu «nouvelles technologies», «nouveaux médias» (suivi de l’abandon progressif de l’adjectif), «virtuel» (bien que l’environnement et les usages numériques soient bien réels), puis, «numérique» (en opposition à «analogique»). Mais de quoi ce concept flou à saveur culturelle et sociale est-il le nom ?

Voici un texte qui pourrait nous aider à discerner les caractéristiques qui sont spécifiquement numériques dans les modèles de production et de circulation des contenus.

Nous sommes obligés de prendre en compte le fait que l’on ne communique pas seulement sur le web: on organise sa journée, on achète des produits, on gère ses comptes en banque, on met en place des manifestations contre le gouvernement, on s’informe, on joue, on éprouve des émotions.
Voilà pourquoi le numérique n’est pas seulement une technique de reproduction qui s’oppose à l’analogique, mais il devient une véritable culture, avec des enjeux sociaux, politiques et éthiques fondamentaux et qu’il est urgent d’analyser et de prendre en compte.

Pour une définition du numérique, Marcello Vitali-Rosati.

Littératie de la donnée: de statistique à statactivisme

La littératie de la donnée est trop souvent restreinte aux capacités numériques, statistiques et techniques nécessaires à  la lecture à à l’exploitation de jeux de données. Cette définition réduit notre capacité à questionner la fabrication des données (elles ne sont jamais neutres), les méthodologies et politiques auxquelles elles sont soumises, ainsi que les pratiques sociales que les bases de données reflètent.

Gaining a sense of the diversity of actors involved in the production of digital data (and their interests, which may not align with the providers of infrastructures that they use) is crucial when assessing not only the representational capacities of digital data but also its performative character and role in shaping collective life.

Jonathan Gray, Carolin Gerlitz, Liliana Bounegru,  Data Infrastructure Literacy.

Intelligence artificielle: sphères technologique et cognitive

J’éviterai d’employer le terme galvaudé d’intelligence artificielle et m’en tiendrai, comme le premier des deux experts [Yann LeCun] à l’expression « science des données », l’intelligence reste une notion encore largement énigmatique aujourd’hui, comme le répète dans toutes ses conférences le second expert [Stéphane Mallat]. Pour apporter mon grain de sel au débat, je tenterai d’y appliquer une approche issue des sciences de l’information pour revenir à A. Desrosières en conclusion.

Jean-Michel Salaün, La science des données en quête du « su ».

Compétences spécifiques aux données: entre savoir et pratique

Or, nous sommes loin d’être tous égaux dans la manipulation des données : dans la compréhension de statistiques, dans la prise en main d’un fichier tableur un peu costaud, dans le bidouillage d’une base de données, dans la compréhension des enjeux… Les compétences requises mêlent à la fois un savoir geek (informatique), expert (statistique), critique (sciences humaines – travailler les corrélations), parfois juridique…

Amandine Brugière, Y a-t-il des compétences « Data » spécifiques?

Web des données: les connexions qui transforment

Web des données depuis 4 ans (2010).

Comme il est possible de le constater en effectuant une recherche avec Google, le web se transforme progressivement et, avec lui, les systèmes d’information.

Nous passons de bases données qui sont conçues pour retrouver une information à des données ouvertes et liées qui, publiées dans le web, permettent à des machines d’établir des connexions et de générer, par inférence, une information qui ne se trouve pas dans notre base de données.

Sélection de lectures parmi mes signets les plus récents sur Diigo:

Connexion

Le web a été conçu pour être exploré par des humains et par des machines. Pour les modèles d’affaires numériques, la découverte de ce que nous ignorions a beaucoup plus de valeur que la recherche de choses que nous connaissons.  C’est, notamment, pour cette raison que les géants du numériques investissent dans les technologies du web sémantique (ou web des données) car elles permettent de représenter les connexions possibles entre différents éléments d’information.

“The value that I see going forward is the linking part of the data environment,” Wiggins added. “You start searching at one point, but you may be linked to things you didn’t know existed because of how another institution has listed it. This new system will show the relationship there. That’s going to be the piece that makes this transformative. It is the linking that is going to be the transformative.”

Searching for Lost Knowledge in the Age of Intelligent Machines – As search engines are radically reinvented, computers and people are becoming partners in exploration.

Curation de données

Nouvelle compétence clé: la curation de données, à la quelle on ajoutera le nécessaire esprit critique qui ne peut être remplacé par les algorithmes.

Avec tous les algorithmes statistiques et tous les outils d’analyse automatique de données (« big data analytics ») du monde, nous aurons encore besoin d’hypothèses causales, de théories et de systèmes de catégorisation pour soutenir ces théories. Les corrélations statistiques peuvent suggérer des hypothèses causales mais elles ne les remplacent pas. Car nous voulons non seulement prédire le comportement de phénomènes complexes, mais aussi les comprendre et agir sur la base de cette compréhension. Or l’action efficace suppose une saisie des causes réelles et non seulement la perception de corrélations. Sans les intuitions et les théories dérivées de notre connaissance personnelle d’un domaine, les outils d’analyse automatique de données ne seront pas utilisés à bon escient. Poser de bonnes questions aux données n’est pas une entreprise triviale !

La litéracie en curation de données

Médiation

Comment éveiller des décideurs aux changements radicaux qui sont annoncés partout, mais qui ne s’expérimentent pas dans le quotidien puisqu’il se transforme de façon beaucoup plus lente et progressive ?

In addition to the artworks and product demos, there are video infographics explaining what companies can and are doing with your data right now, whether it’s credit score calculation, email metadata analysis, or how your wifi-enabled smartphone is basically always snitching on you.

Once you’re thoroughly alarmed by the reality of what we have given up in freedom for the conveniences wrought by our ad-driven world, the team has helpfully created a Data Detox Bar where you can learn about reasserting control over your network existence and limiting your exposure. And the entire exhibit is staffed with all white-wearing “Ingeniouses” who will answer questions or just provide a shoulder to scream into after discovering that there is no such thing as “anonymized data.”

For the truly curious, of which I am one, there are workshops and presentations that provide an even deeper look into the gaping maw of our networked world.

Go to The Glass Room. If Black Mirror Had a Showroom, This Would Be It

Fablabs en bibliothèques: documenter une démarche de cocréation

Cartograhie collaborative des fablabs en bibliothèque.
Cartograhie collaborative des fablabs en bibliothèque à District 3, Université Concordia, Montréal, 23 septembre 2016.

Par leur mission, les bibliothèques contribuent au réseau des communs (voir la définition à la fin de ce billet), ces ressources partagées qui permettent à chacun de créer de la valeur. Comment peuvent-elles se transformer afin d’accompagner leurs différents publics pour qu’ils puissent développer leur potentiel créatif ?

Alors que ces lieux et la profession même de bibliothécaire se transforment, les fablabs, ces laboratoires de fabrication ouverts au public, deviennent des terrains d’expérimentation de choix pour actualiser la fonction de médiation. Mais comment mutualiser les apprentissages et connaissances pour permettre à d’autres bibliothèques et, par extension, de nombreux citoyens, de faire cette expérience ?  C’est sur ce sujet qu’une activité a été offerte dans le cadre de la Semaine québécoise de l’informatique libre (SQIL), en septembre dernier.

Proposée par le Café des savoirs libres (dernière mutation du collectif informel Bookcamp Montréal) et organisée par la Ville de Montréal (direction des bibliothèques publiques), cette activité réunissait des bibliothécaires et des représentants de fablabs québécois dont Monique Chartrand (Communautique).

Bibliothèques et fablabs: mode d’emploi des communs

Documenter une activité est une forme de reconnaissance offerte à ceux et celles qui ont donné de leur temps et partagé leurs connaissances. C’est également une information qui pourrait être partagée avec les citoyens qui sont concernés par ces services, ainsi qu’avec d’autres contributeurs potentiels.

Cahier des participants
Retour sur l’activité de cocréation: scénario, projets choisis, liste des participants, références utiles.

Cartographie collective des fablabs
État des lieux des fablabs en bibliothèques, au Québec: tableau  à compléter.

Projet de collaboration professionnelle
Le Wiki Fabs labs Québec fera une place spéciale aux bibliothèques. Ce projet a pour cofondateur Guillaume Coulombe, qui maîtrise le wiki sémantique et qui a également réalisé une encyclopédie du violon traditionnel québécois.

Documenter pour faciliter la réutilisation

Voilà qui mérite d’être souligné: un excellent travail de documentation d’une démarche de cocréation.  Une habitude à développer par tous les organisateurs d’activités participatives pour lesquelles on attend un résultat: cocréation, hackathon, maker space et même si ne n’est plus tendance, quelquechose-camp.  (si vous n’êtes pas familier avec ce vocabulaire, lire Viens dans mon tiers-lieu, j’organise un hackathon en open source).

Documenter le déroulement d’une activité (scénario), la contribution des participants, les enjeux et propositions formulés, ainsi que, le cas échéant, les engagements pris est un le meilleur moyen pour obtenir des résultats concrets. C’est un effort indispensable pour partager plus largement, mobiliser et, surtout, préparer le passage à l’action.

Les communs, qu’est-ce c’est ?

Valérie Peugeot, présidente de Vecam, une organisation qui milite pour une appropriation des pratiques numériques par les citoyens, explique très clairement, en deux minutes, ce que sont les communs dans cette vidéo. Madame Peugeot a également participé, en présentiel, à la conférence sur les communs numériques.

Nos contenus culturels sont absents du web des données

Ne pas être préoccupé de la présence et de la visibilité des contenus des industries culturelles et créatives sur le web, c’est, pour une institution: attendre d’être obsolète ou, pour une entreprise:  être bientôt ou déjà mise hors jeu par les grands intermédiaires technologiques.

Googlelisation des contenus culturels: captation de l'attention et des données des interactions. Tweet partagé lors du Congrès des milieux documentaires du Québec, 19 novembre 2015.
Googlelisation des contenus culturels: captation de l’attention et des données des interactions. Tweet partagé lors du Congrès des milieux documentaires du Québec, 19 novembre 2015.

 

Mais dans tous les cas de figure, c’est être les grandes perdantes de la guerre que se livrent les grandes plateformes pour occuper nos écrans et promouvoir les contenus qu’elles ont sélectionnés en fonction de leur stratégie. Cette stratégie repose fondamentalement le transfert de la création de valeur du produit à la plateforme. Dans ce modèle, ce sont les règles d’affaires ,et non les produits qui s’adaptent selon les besoins des marchés.  Ces règles d’affaires sont les algorithmes qui  traitent les métadonnées des catalogues, ainsi que les données générées par les interactions avec les consommateurs.

Dans un billet publié la semaine dernière,sur la découvrabilité des contenus culturels, j’ai dénoncé sur la faible exploitation des catalogues, répertoires et archives de contenus et sur la perpétuation des silos de données qui font que nos produits culturels n’ont pas de masse critique, et donc d’existence, dans le web des données.

Parler de découvrabilité sans s’interroger sur les conditions requises pour provoquer la rencontre de l’offre et la demande ou pour favoriser la fortuité du croisement entre une attention disponible et une offre, c’est chercher une médication sans avoir établi de diagnostic médical.

Bien sûr, la découvrabilité est un concept qui ne date pas d’hier. À tout le moins, dans le domaine des sciences de l’information, c’est un élément familier de l’économie du document. Et certainement, il y a différents parcours de découverte pour les contenus: critique, recommandation, promotion, en ligne et hors ligne.

Mais le parcours le plus rentable est celui qui permet de tracer les contenus, de suivre leur consommation, de collecter les données sur lesquelles reposent des décisions tactiques et stratégiques. Ce parcours est celui va de la mise en ligne du catalogue (ou pour les plus avancés, la mise à disposition des données du catalogue en mode public ou ouvert) à l’enrichissement des données d’usage par les consommateurs et, indirectement, par les partenaires.

C’est ce parcours que nos institutions culturelles , comme nos entreprises de la culture et du divertissement, ne perçoivent pas encore comme une condition essentielle de survie, mais surtout, d’autonomie et de contrôle sur le pétrole de l’économie numérique: la donnée.

Comme je le mentionnais, dans le blogue de Direction Informatique,  à propos du commerce électronique:

Le catalogue de produits demeure le maillon faible du commerce électronique au Québec. Pour trop d’entreprises, c’est encore une brochure ou, au mieux, une arborescence de site web. Mais pour les plateformes commerciales à succès, il s’agit plutôt d’un ensemble de données structurées s’adressant aux consommateurs afin de faciliter leurs décisions d’achat. Et pour celles qui sont entrées dans l’économie numérique, c’est aussi la composante d’un système d’information stratégique.

Pour avoir un aperçu de ce que pourrait être ce système d’information stratégique, en culture, il faut absolument lire le 3e cahier Innovation et prospective de la CNIL. Pendant ce temps, nos institutions de mémoire collective (bibliothèques, musées, archives) découvrent le web social et participatif et se demandent s’il faut ouvrir les contenus à la participation du public.

Alors, serons-nous uniquement les clients et utilisateurs des grandes plateformes ou deviendrons-nous les créateurs et bâtisseurs de cette économie numérique?

 

Découverabilité: nos contenus culturels sont-ils visibles?

Initialement publié dans le blogue de Direction informatique, le 20 novembre 2015.

Tout comme dans le commerce électronique, le catalogue est le maillon faible des industries culturelles et créatives au Québec. À lire l’invitation du Sommet sur la découvrabilité, il semble que nous n’ayons pas encore réalisé ce qui fait le succès des plateformes comme Amazon, Netflix, iTunes ou YouTube : une culture de la donnée qui favorise les rencontres entre l’offre et la demande.

Trop rares sont les entreprises qui, quel que soit leur secteur d’activité, exploitent leurs actifs informationnels sur le web ainsi que le font de nouveaux acteurs issus du numérique qui sont ou qui deviendront rapidement leurs plus féroces concurrents. À ceux-ci il faut ajouter les géants technologiques qui ont choisi le modèle de la plateforme, plutôt que celui du produit, et qui captent lors de chaque transaction, une valeur en micropaiement ou données.

Les fonds qui restent au fond des systèmes 

Pourtant, malgré les refontes de sites, les applications et les innovations technologiques, nos contenus culturels et créatifs sont pratiquement absents du web des données. Les répertoires, catalogues, fonds et archives ne sont accessibles aux humains et aux machines que par l’entremise d’un espace de recherche, souvent peu adapté aux besoins des utilisateurs. La diffusion des contenus dépend généralement de campagnes de promotion ponctuelles et plus ou moins bien ciblées dédiées aux nouveautés, laissant dans l’internet profond des actifs riches qui profiteraient bien de la longue traîne s’ils étaient visibles. Ceci expliquerait en partie le phénomène que décrit l’auteure Annie Bacon dans un récent billet intitulé « Une industrie de la nouveauté ».

L’industrie du livre se rapproche ainsi de l’industrie du cinéma dans laquelle les films n’ont plus que quelques fins de semaines pour convaincre les cinéplexes de les garder en salle. Un mauvais premier week-end et le film disparaîtra avant la fin du mois.

Combien de rendez-vous ratés avec le public et d’opportunités de développement de marché nos industries culturelles ont-elles raté sur le web? Combien de contenus n’ont pas rencontré leurs publics faute d’être visibles et découverts, par recommandation algorithmique ou par simple diffusion de métadonnées au bon endroit?

Le catalogue, actif stratégique?

Nous accusons un retard considérable en matière de diffusion et de distribution de contenu parce que nous ne maîtrisons pas les compétences nécessaires pour transformer nos catalogues et répertoires en données exploitables et interopérables. Si nous n’accordons pas la priorité à ces actifs stratégiques, nous risquons de nous confiner au rôle de fournisseurs et clients de l’économie numérique.  Cette économie est celle de la donnée, elle repose sur la diffusion des métadonnées, ces données qui fournissent une description détaillée d’un livre, d’une chanson, d’un film ou tout autre type de contenu. Ces métadonnées facilitent la recherche, favorisent la découverte et permettent aux entreprises d’enrichir leur connaissance du marché en les croisant avec les données résultant de l’interaction des utilisateurs.

La destination, c’est l’utilisateur

Il existe, bien sûr,  des programmes qui soutiennent le développement de sites internet et d’applications, ainsi que l’appropriation de nouveaux outils. Il s’agit cependant d’actions morcelées qui, en perpétuant les silos de données, obligent les consommateurs à multiplier leurs recherches ou limitent la découverte de nouvelles offres. Selon cette perspective, chaque site ou application est une destination. Dans une perspective numérique, l’utilisateur est au cœur du modèle par les requêtes qu’il adresse, directement, aux moteurs de recherche, ou indirectement, par ses actions et ses choix. L’utilisateur est devenu la destination.

Laisser le champ libre à Google et cie?

Être visible dans une économie numérique, c’est donc aller à la rencontre de son marché. Ne pas aller à la rencontre des consommateurs en mettant les contenus à leur portée, c’est laisser le champ libre à ceux qui ont compris comment, à partir du contenu intégral ou des métadonnées d’une oeuvre, on peut générer de l’information qui soit intelligible pour des lecteurs ou des applications. Voici pour preuve, cette observation partagée sur Twitter lors du Congrès des milieux documentaires du Québec qui avait lieu cette semaine, à Montréal :

McGill-GoogleScholar_tweet-cmd2015

La force des grandes plateformes technologiques repose sur la capacité d’agréger et de croiser des données de sources différentes, de les contextualiser à l’aide des données des utilisateurs et d’en faciliter le repérage et l’interprétation pour diverses applications.

Que faire pour entrer dans le web des données?

Il faut édicter une politique visant à encourager l’adoption,  par tous les acteurs des industries culturelles et créatives, d’un modèle de métadonnées harmonisées. En cela, nous pouvons nous inspirer de la Feuille de route stratégique sur les métadonnées culturelles qui a été publiée l’an dernier, par le ministère de la Culture, en France. Ceci permettrait de briser les silos technologiques et de rassembler les entreprises et institutions autour d’un projet numérique commun qui a une véritable portée stratégique.

Une politique de métadonnées culturelles constitue un instrument de gouvernance essentiel dans une économie de la donnée parce qu’elle requiert une collaboration active :

  • Élaboration d’une vision et d’une stratégie numériques qui soient partagées par les acteurs principaux.
  • Compréhension commune des objectifs et besoins de chacun. Définition et priorisation des enjeux sémantiques, techniques, juridiques et organisationnels.
  • Alignement de projets technologiques sur la stratégie (et non l’inverse).

La visibilité des contenus des industries culturelles et créatives devient un enjeu prioritaire pour le Québec qui se prépare à entrer dans l’économie numérique. Nous devrions, sans attendre, nous inspirer des démarches qui ont été entreprises ailleurs et développer nos compétences et notre maîtrise des données.

Entreprises et institutions culturelles, vos contenus sont-ils bien visibles?

Expo67 à l’ère numérique: nos mémoires mises en réseau

Pourquoi s’intéresser aux souvenirs d’Expo67 quand « Internet, c’est une exposition universelle à tous les jours » ?

Écoutez bien Julie Bélanger, fondatrice du groupe Expo67 sur Facebook, et Luc Gauvreau, passionné de culture et d’histoire (et un peu geek à heures). Les valeurs et l’esprit de l’événement qui a fait entrer le Québec dans la modernité sont encore bien présents et ont également marqué l’ADN culturel de Montréal.

En participant au hackathon des Journées de la culture, à Montréal du 25 au 27 septembre 2015, Luc et moi souhaitons attirer l’attention des institutions (bibliothèques, musées, archives) sur les contributions citoyennes à la mémoire collective à l’ère numérique:

  • Comment celles-ci pourraient-elles se connecter à nos souvenirs partagés?
  • Comment pourraient-elles entrecroiser nos mémoires avec leurs propres collections?

Le 50e anniversaire d’Expo67 sera plus qu’une commémoration, ce sera un point de départ pour la mise en réseau de nos mémoires et de nos cultures. Et si l’esprit d’Expo67 se manifestait dans l’île de Montréal, ses bibliothèques publiques et ses lieux de culture lors de cet anniversaire alors que nous soufflerons les 375 bougies de Montréal ?

Vidéo réalisée par Christian Aubry, au Parc Jean-Drapeau (Expo67, Terre des Hommes), le 19 septembre 2015.

Culture participative et mémoire collective: tous curateurs des souvenirs d’Expo 67

Expo 67 c’est plus qu’un événement: c’est un « éveillement ».

Ce mot est de Luc Gauvreau, un spécialiste de littérature et d’histoire québécoise qui devenu un peu geek à force de numériser des documents pour en extraire des données et les passer à la moulinette de Google Refine.

Je ferai équipe avec Luc (et d’autres volontaires) lors de l’édition montréalaise du Hackathon des Journées de la culture, du 25 au 27 septembre prochains.

Plan de l'Expo 67 appliqué sur une vue par satellite (Google Earth) des îles Saine-Hélène et Notre-Dame.
Plan de l’Expo 67 appliqué sur une vue par satellite (Google Earth) des îles Saine-Hélène et Notre-Dame.

En 2017, Montréal célébrera son 375e anniversaire. Il y aura également 50 ans que, dans un Québec tout juste sorti de la Grande noirceur,  une ville accueillait le monde sur des îlots au milieu du fleuve. Nous nous proposons de réutiliser ou adapter des technologies existantes et gratuites afin de cartographier les lieux et pavillons d’Expo 67 et d’enrichir la documentation disponible avec les contributions des citoyens. Cette interface permettra de stimuler la mémoire des visiteurs et des témoins afin de recueillir leurs souvenirs. Réunis dans un grand calendrier collectif des événements, ces témoignages pourront ainsi être partagés avec les générations plus jeunes.

Le web a permis aux passionnés d’histoire et de culture comme Luc de déterrer des documents enfouis dans les répertoires et bases de données, de partager les fruits de leurs recherches et d’accomplir des tâches souvent ingrates et pour lesquelles les institutions ont peu de ressources (ou d’intérêt). Je crois, comme Luc, que nous devons réanimer la mémoire d’un lieu qui, bien qu’aujourd’hui disparu, a tourné définitivement Montréal vers le monde et a activé dans son ADN la curiosité, l’ingéniosité, l’envie de faire autrement et un goût prononcé pour les rassemblements festifs.  Réactiver Expo 67 dans la mémoire de chacun, c’est aussi ouvrir un laboratoire nouveau pour transmettre la culture.

Nous disposons des éléments suivants:

Mises à jour (16/09/2015)

  • Site Villes éphémères, de Roger La Roche qui fait un impressionnant travail de documentation. Un bon exemple de la contribution des citoyens-experts au travail de mémoire collective.
  • Expo67 – Vive le Québec moderne! Ce blogue, signé prettykitsch, est un coffre au trésor. Parmi de très nombreux documents et anecdotes, on y trouve les archives de Claire Cloutier La Chance, qui travaillait au service des relations publiques de l’Expo, à titre de responsable des manifestations spéciales et des cérémonies officielles de la Place des Nations.

Mise à jour (17/09/2015)

  • Expo Lounge, très chouette blogue, en anglais, d’un amateur de la culture populaire de l’époque (et fan de Michèle Richard). Mention spéciale pour les anecdotes et liens vers des trouvailles.

Mise à jour (18-09-2015)

Nous recherchons des équipiers qui pourront contribuer, par leurs connaissances techniques et leurs conseils,  à faciliter la cartographie collaborative du site. Nous souhaiterions, notamment, que les citoyens puissent ajouter (sans programmation) des éléments sur la carte, les enrichir par leurs commentaires et liens vers d’autres ressources.

En complément, voici deux vidéos repérées par Luc, parmi une multitude de documents partagés sur YouTube:

Tout comme Luc, les membres du groupe Expo sur Facebook et tant d’autres ailleurs sur Internet, l’auteur de ces modélisations expose au présent des bribes de notre histoire sociale et culturelle.  Le projet que nous souhaitons concrétiser lors du hackathon est bien plus que de la technologie. Il vise une mise en relation d’éléments qui leur donnera encore plus de sens et une mise en réseau de passionnés autour d’un sujet commun. Nous avons bon espoir que les institutions de la mémoire collective accueillent avec intérêt les initiatives issues des cultures de la participation et du réseau.

Il est primordial que  la mémoire de cet événement ne se perde pas et qu’il soit possible aux générations futures de découvrir ce qui a amener le monde à Montréal et permis aux Montréalais de s’ouvrir sur le monde.

La #charte sur Twitter: les mots dépassent-ils la pensée ?

Analyse du contenu et des interactions à propos de la Charte des valeurs québécoises sur Twitter.

Projet lancé à 00h00 le 12 septembre 2013, avec le logiciel d’analyse de Nexalogy. Données recueillies en français (#charte et charte AND polqc) et en anglais (#charte et charter + (qc OR quebec OR polqc)).

Campagne de recrutement - Lakeridge Health

Depuis jeudi dernier, le grand gagnant (flux français et anglais) de l’agitation sur Twitter est un hôpital en Ontario qui est à la recherche de personnel et qui a rapidement repéré l’opportunité. Les hyperliens menant vers la page Facebook de la campagne, ainsi que les différentes affiches publicitaires se sont rapidement propagées parmi les flux sous observation.

Dans l’ensemble, la cartographie des thèmes et groupes lexicaux présente un enchevêtrement confus d’émotions, d’accusations, de sarcasmes et de liens d’actualité. Les appels à l’unité y sont à peine visibles car trop peu fréquents.

Religion et politique

Parmi les thèmes présents, celui de la religion est prépondérant. C’est de l’Islam, plus que toute autre religion, dont il est surtout question; notamment, au sujet du port du voile.

Depuis samedi dernier, jour de la manifestation contre la charte, une thématique a pris de l’ampleur: les droits des femmes. Le mot « femmes » figure au 7e rang des 200 mots les plus fréquents. En marge des autres groupes lexicaux, celui-ci fait état des enjeux entre féminisme et pratiques religieuses.

La politique provinciale occupe une part importante des contenus. De nombreuses publications sont des déclarations partisanes qui concernent plus le Parti Québécois que le contenu de la charte.

Carte lexicale du flux #charte - en français - sur Twitter
Carte lexicale des contenus du flux #charte, en français, sur Twitter, 12 au 16 septembre 2013 (Nexalogy)

Société distincte ?

À la différence du flux français,  le flux anglais a de nombreux contributeurs hors-Québec. Là aussi, la politique s’est invitée:  les personnalités de 4 partis fédéraux sont très fréquemment mentionnées (au bas de la carte) et le commentaire d’un député conservateur (Jason Kenney, tout en haut de la carte) a abondamment circulé.

L’intégration des immigrants, les valeurs partagées et la laïcité, ne sont pas des sujets de controverse qui sont spécifiques au Québec : de nombreux liens échangés proviennent de sources hors-Québec et font référence à des controverses qui ont lieu dans d’autres provinces.

Carte lexicale du flux #charte - en anglais - sur Twitter
Carte lexicale des contenus du flux #charte, en anglais, sur Twitter, 12 au 16 septembre 2013 (Nexalogy)

Quelles valeurs ?

Des 200 mots les plus fréquents parmi les 16 200 tweets recueillis jusqu’à présent sur le flux français, 4 termes font références à des valeurs :

  • 5.  laïcité (575 fois)
  • 37. inclusif (225 fois)
  • 75. égalité (143)
  • 90. liberté (133 fois)

Des 200 mots les plus fréquents parmi les 11 500 tweets recueillis jusqu’à présent sur le flux en anglais, 6 termes font références à des valeurs :

  • 36. secularism (167 fois)
  • 72. freedom (104 fois)
  • 87. diversity (82 fois)
  • 168. freedoms (50 fois)
  • 183. equality (46 fois)
  • 199. inclusive (43 fois)

Quel débat ?

Dans un billet qu’il a publié ce dimanche, Clément Laberge se demande si l’instantanéité, n’étouffe pas le débat.

On peut-tu prendre un break? Une semaine? Pour laisser retomber un peu la poussière. Pour se donner le temps de lire les documents auxquels on fait référence, pour écouter attentivement les défenseurs et les opposants — et les amener à expliquer ce qu’ils appuient et ce qu’ils dénoncent dans la proposition. Pour sortir des antagonismes et créer un climat plus propice à l’expression des nuances et à la formulation de propositions alternatives — parce que le document peut certainement être amélioré; et qu’il a d’ailleurs été présenté comme tel.

Cette réflexion rappelle le dernier ouvrage de Douglas Rushkoff, Present Schock – When everything happens now, où il présente les effets sur notre comportement, d’une existance en temps réel. Au cours d’une entrevue, il illustre bien l’effet de l’instantanéité sur nos conversations numériques:

Remember those early conversations on the Well? We got to sound smarter than we were in real life, because we had all the time in the world to respond. They were asynchronous conversations, fully consonant with the asynchronous character of digital technology. When we strap this stuff to our bodies and respond to each vibration, we are turning them into something very different.