Archives par mot-clé : sémantique

Web des données: les connexions qui transforment

Web des données depuis 4 ans (2010).

Comme il est possible de le constater en effectuant une recherche avec Google, le web se transforme progressivement et, avec lui, les systèmes d’information.

Nous passons de bases données qui sont conçues pour retrouver une information à des données ouvertes et liées qui, publiées dans le web, permettent à des machines d’établir des connexions et de générer, par inférence, une information qui ne se trouve pas dans notre base de données.

Sélection de lectures parmi mes signets les plus récents sur Diigo:

Connexion

Le web a été conçu pour être exploré par des humains et par des machines. Pour les modèles d’affaires numériques, la découverte de ce que nous ignorions a beaucoup plus de valeur que la recherche de choses que nous connaissons.  C’est, notamment, pour cette raison que les géants du numériques investissent dans les technologies du web sémantique (ou web des données) car elles permettent de représenter les connexions possibles entre différents éléments d’information.

“The value that I see going forward is the linking part of the data environment,” Wiggins added. “You start searching at one point, but you may be linked to things you didn’t know existed because of how another institution has listed it. This new system will show the relationship there. That’s going to be the piece that makes this transformative. It is the linking that is going to be the transformative.”

Searching for Lost Knowledge in the Age of Intelligent Machines – As search engines are radically reinvented, computers and people are becoming partners in exploration.

Curation de données

Nouvelle compétence clé: la curation de données, à la quelle on ajoutera le nécessaire esprit critique qui ne peut être remplacé par les algorithmes.

Avec tous les algorithmes statistiques et tous les outils d’analyse automatique de données (« big data analytics ») du monde, nous aurons encore besoin d’hypothèses causales, de théories et de systèmes de catégorisation pour soutenir ces théories. Les corrélations statistiques peuvent suggérer des hypothèses causales mais elles ne les remplacent pas. Car nous voulons non seulement prédire le comportement de phénomènes complexes, mais aussi les comprendre et agir sur la base de cette compréhension. Or l’action efficace suppose une saisie des causes réelles et non seulement la perception de corrélations. Sans les intuitions et les théories dérivées de notre connaissance personnelle d’un domaine, les outils d’analyse automatique de données ne seront pas utilisés à bon escient. Poser de bonnes questions aux données n’est pas une entreprise triviale !

La litéracie en curation de données

Médiation

Comment éveiller des décideurs aux changements radicaux qui sont annoncés partout, mais qui ne s’expérimentent pas dans le quotidien puisqu’il se transforme de façon beaucoup plus lente et progressive ?

In addition to the artworks and product demos, there are video infographics explaining what companies can and are doing with your data right now, whether it’s credit score calculation, email metadata analysis, or how your wifi-enabled smartphone is basically always snitching on you.

Once you’re thoroughly alarmed by the reality of what we have given up in freedom for the conveniences wrought by our ad-driven world, the team has helpfully created a Data Detox Bar where you can learn about reasserting control over your network existence and limiting your exposure. And the entire exhibit is staffed with all white-wearing “Ingeniouses” who will answer questions or just provide a shoulder to scream into after discovering that there is no such thing as “anonymized data.”

For the truly curious, of which I am one, there are workshops and presentations that provide an even deeper look into the gaping maw of our networked world.

Go to The Glass Room. If Black Mirror Had a Showroom, This Would Be It

Contenus culturels: sous, sur ou dans le web ?

Mise à jour 2016-12-10: Clarifications suggérées par Christian Aubry. Illustration: substitution du terme « lisibles » par « compréhensibles ». Conclusion: clarification du sens du paragraphe.

Sous, sur ou dans le web ? Nos contenus culturels sont-ils dans le web des données ?
Nos contenus culturels sont-ils dans le web des données ? Rapport-synthèse produit pour la SODEC, avril 2016

Où en est le web ? Les signes d’une transformation importante sont bien présents, mais diffus et disséminés parmi les différentes facettes d’un amalgame de technologies, connaissances, modèles de pensée, industries, usages et comportements. L’annonce d’une initiative européenne de valorisation de la connaissance dans un web spatiotemporel, Time Machine, évoque une très proche discontinuité :

La seconde révolution de l’Internet commence maintenant, avec la mort annoncée des moteurs de recherche du présent et l’entrée en scène d’une manière d’indexer l’information.

Nous sommes entrés  dans une ère où il ne sera plus nécessaire de quitter l’interface d’un moteur de recherche pour accéder à la connaissance et où les applications de recommandations s’alimentent à de larges ensembles de données structurées et signifiantes.

De moteurs de recherche à moteurs de réponses et de connaissances

La liste de résultats des moteurs de recherche fait graduellement une place de choix à une réponse ou une proposition. Bien que les machines ne parlent pas le langage des humains, elles peuvent interpréter la syntaxe et les marqueurs qui sont utilisés spécifiquement pour décrire  une chose, une personne ou un concept abstrait.

La fiche qui apparaît dans le coin supérieur droit de l’écran du moteur de recherche Google tend à prendre plus d’espace alors que nous apprenons à publier l’information que nous souhaitons visible, persistante et connectée. Pour cela, il faut aller bien au-delà des techniques d’optimisation de pages web et apprendre à publier les données qui décrivent nos contenus selon des modèles normés. L’information représentée selon un modèle et des métadonnées standards devient alors  compréhensible et exploitable pour les applications qui ratissent le web.

Du web des documents au web des données (et du sens)

Mais où sont les données qui décrivent nos contenus culturels ?Elles sont sous le web, malheureusement Les répertoires, collections, fonds et même, les calendriers de représentations et de tournées sont stockés sous forme de bases données. Celles-ci ne sont pas accessibles aux machines qui repèrent et collectent des données pour les moteurs de recherche, agrégateurs, systèmes automatiques d’archivage et autres moissonneurs de données qui s’activent dans le web. Même si ces machines avaient accès aux bases de données, elles ne disposeraient pas des clés nécessaires pour reconstituer et interpréter l’information.

Les modèles numériques carburent à la donnée

Au constat de l’absence de notre patrimoine et de nos productions artistiques et culturelles du web s’ajoute celui de l’absence d’une culture de la donnée.  Comme je le partageais dans un mémoire sur le renouvellement de la politique culturelle, sans maîtrise de la donnée:

  • Les tenants et aboutissants de la transition numérique accomplie par les précurseurs nous échappent et nous n’en retenons que les manifestations externes.
  • Nous demeurons uniquement les fournisseurs de contenu des plateformes qui tirent dorénavant plus de valeur des données décrivant ces contenus et celles qui sont générées par leur utilisation que des contenus eux-mêmes.
  • Nous ne pouvons pas repérer et interpréter les signaux faibles du changement et nos indicateurs de mesure ne permettent pas une lecture adéquate des multiples facettes de la vie culturelle dans nos univers physiques et numériques.
  • Nous nous limitons à la promotion des nouveautés pendant que nos catalogues, répertoires et collections, échappent à la découverte et à la possible réutilisation qui leur donnera une seconde vie.

Afin d’illustrer mon propos, voici une anecdote: j’ai passé près de deux heures à explorer de nombreuses œuvres musicales en me renseignant sur la musique western. J’ai exploré les chansons des sœurs Boulay et je me suis éparpillée entre des productions commerciales et artisanales. Je n’ai pas quitté Google, en passant de vidéos à des listes de titres populaires.

C’est bien pour la découverte de la musique d’ici, mais:

  • Qui a collecté mes données personnelles et d’usage ?
  • Qui a accru sa connaissance d’un marché en analysant mon comportement et mes préférences ?
  • Qui a engrangé la matière première qui fait de ses services, aussi efficaces qu’attractifs, un modèle d’affaires extrêmement profitable ?

Découvrabilité: pour développer une culture de la donnée

Ce n’est pas la découvrabilité numérique qui fait la réussite des modèles d’affaires des plateformes numériques, c’est ce qui lui permet de réaliser son potentiel: l’exploitation et la valorisation de l’information. Or, dans nos universités, nos programmes de sciences de l’information sont presqu’exclusivment orientés vers la gestion de collections de documents et, du côté des technologies de l’information, le web des données n’est qu’un sujet optionnel du programme de maîtrise. Il serait temps d’élaborer un programme universitaire de deuxième cycle pour allier les perspectives et connaissances en information (indexation et modélisation) et en informatique (web sémantique).

Si nous ne maîtrisons pas les principes et techniques nécessaires à l’exploitation de nos contenus culturels dans le web, comment pourrons-nous soutenir les nouveaux acteurs d’une économie numérique ? Comment répondrons-nous aux besoins d’expertise dans les créneaux émergents comme l’intelligence artificielle, les crypto monnaies (Bitcoin) ou les registres de transactions distribués (Blockchain) ?

 

Nouvelles compétences informationnelles pour modèles numériques

Nous produisons des contenus numériques et nous adoptons de nouveaux outils, mais nos modèles d’affaires et nos stratégies de promotion et diffusion demeurent cependant essentiellement les mêmes. Alors, comment se positionner face aux modèles d’affaires plus rentables et plus attractifs des géants du numérique tels que décrits dans cet article sur une nouvelle classification des entreprises?

/…/ companies that build and manage digital platforms, particularly those that invite a broad network of participants to share in value creation (such as how we all add content to Facebook’s platform or that anyone can sell goods on Amazon’s), achieve faster growth, lower marginal cost, higher profits, and higher market valuations.

Ce qui contribue à leur montée en puissance, c’est la donnée qui leur permet de mettre leurs contenus en avant et de générer de l’information toujours plus précise et pertinente pour la prise de décisions stratégiques.

Exploitation du graphe des connaissances et des données ouvertes et liées par Google
Exploitation du graphe des connaissances et des données ouvertes et liées par Google.

Culture de la donnée? Plutôt, des compétences informationnelles

Malgré les transformations qui accélèrent la mutation des modèles industriels et économiques, les opportunités et enjeux ayant trait à l’exploitation des données sont généralement ignorés dans la plupart des analyses et propositions d’action, qu’il s’agisse de politiques gouvernementales ou d’initiatives entrepreneuriales.

Cette situation s’explique fort probablement par le faible niveau de connaissances en matière d’information; ce qu’on appelle parfois les compétences informationnelles.  En effet, si les technologies de l’information au sein de nos organisations ont un pouvoir, des ressources et des budgets dédiés, la matière première — la donnée, le document, l’information et même la connaissance — ne constitue pas une priorité.

Et pourtant.  Comprendre de quoi sont faites les données (standards et sciences de l’information) et comment évolue leur exploitation (algorithmes, technologies sémantiques, blockchain) permet d’apprécier les modèles numériques d’une toute autre manière qu’en utilisateur de systèmes: en « créateur de valeur ».

Au cours de la préparation d’un atelier pour la SODEC, dans le cadre de la prochaine édition du SODEC_LAB Distribution 360, j’ai répondu à quelques questions concernant le rôle central des données dans la diffusion et la mesure des contenus, et notamment, leur potentiel de découvrabilité.  Deux questions, qui reviennent régulièrement aux cours des présentations, démontrent clairement qu’il est urgent d’élaborer un programme afin de palier le sous développement des compétences informationnelles dans nos organisations, qu’il s’agisse d’une startup ou d’un ministère.

Je partage ici ces questions, ainsi qu’un aperçu des réponses.

Comment peut-on définir simplement ce qu’est une donnée?

Par l’exemple. Voici une donnée:

snow

C’est un « morceau d’information »; la plus petite unité de représentation d’une information. Exploitée individuellement, sans contexte (dont la langue) ou d’autres données, cette donnée peut prendre n’importe quel sens

Nom: Snow
Prénom: Michael
Activité: Artiste
Pays: Canada

Ensemble, des données permettent de produire de l’information, notamment, grâce à la présence de ces données spéciales que sont les métadonnées (meta: auto-référence, en grec).  Nom, Prénom, Activité, Pays permettent de comprendre le sens des données auxquelles elles sont reliées, surtout si elles sont dans des formats difficiles à interpréter comme des numéros d’identification.

Les données peuvent être structurées, comme dans les bases de données ou les feuilles de calcul, ou non structurées, comme des textes sur Twitter et Facebook ou des images-commentaires sur Snapchat.

Les données non structurées sont généralement très riches mais requièrent un traitement manuel ou automatisé.  Mais, en général, l’exploitation des données fait face à un enjeu majeur: leur hétérogénéité. Les technologies, les modèles de représentation et les formats de données sont autant de silos qui empêchent de relier des données de sources diverses entre elles.

À quelles données pouvons-nous avoir accès?

Il y a une abondance de données accessibles à tous les participants d’un écosystème donné. Chaque individu, chaque organisation est une machine à produire des données.

Par exemple, les industries culturelles produisent des données sur les contenus et sur la consommation de contenu.

Les grandes plateformes numériques excellent dans leur domaine en grande partie pour ces raisons:

Exhaustivité. Elles fournissent sous forme de données et métadonnées,  de l’information très détaillée à propos de leurs contenus (description, ambiance, audience, son, couleur, etc.).

Connectivité. Elles savant que les données détaillées qui décrivent leurs contenus génèrent de nouvelles données lorsqu’elles sont liées à des données de consommation ou à d’autres données sur des contenus.

Dévouvrabilité. Elles comprennent le rôle central joué par les données et métadonnées pour la  découvrabilité des contenus. De plus en plus de contenus vont à la rencontre de leurs publics, entre autres, par Google qui donne des réponses plutôt que de fournir des listes de destinations où trouver les réponses. Taper « Best actor oscar 2016 », vous y constaterez que Google exploite de façon croissante le graphe des connaissances (knowledge graph) et des données ouvertes et liées (Linked Open Data).

Pertinence. Elles se servent des données pour cibler des consommateurs, mais, de plus en plus, pour créer des contenus ou permettent à des producteurs de proposer des offres qui trouveront plus facilement leurs publics.

Mesure. Elles utilisent ou expérimentent divers indicateurs de mesure, autres que des transactions ou des faits comme des tendance,  des modèles de comportement ou, encore mieux: la relation au contenu. Elles pratiquent l’écoute sociale en suivant, par exemple, les conversations sur Twitter avant, durant et après le lancement d’un contenu.

La donnée génère l’information qui est au cœur du modèle économique des puissantes plateformes numériques. Celles-ci ont toujours plusieurs trains d’avance sur leurs compétiteurs (et, souvent, également fournisseurs) dont la vision et les modèles relèvent encore des méthodes de l’ère industrielles.  Nos industries culturelles, pour ne citer que cet exemple, disposent d’une masse de données, mais celles-ci sont peu entretenues et exploitées.

Avant de développer un énième silo d’information (plateforme, application), il faudrait peut-être apprendre à connecter nos données et les mettre en réseau pour générer le plus d’effet à long terme pour notre économie et notre culture.

 

 

La donnée est l’élément pivot d’une nouvelle politique culturelle

Nos contenus culturels sont-ils dans le web des données ?

Mémoire déposé dans le cadre de la consultation publique pour le renouvellement de la politique culturelle du Québec, 8 mai 2016.

Représentation du web des données ouvertes liées - 2014

Parmi tous les documents publiés — tant par les gouvernements du Québec et du Canada que par les institutions et organismes préoccupés par le nécessaire renouvellement d’une politique culturelle dans un contexte de transition numérique — il n’est fait aucune mention de la donnée. Celle-ci est pourtant au cœur du « numérique » (peu importe la définition choisie) si bien qu’il est impossible d’élaborer une vision, une politique et des programmes qui soient cohérents et qui aient un impact réel et de longue durée sans une compréhension fine de ce dont il s’agit.

Comprendre la donnée, c’est être en mesure de répondre à la plupart des questions qui se trouvent sous les sept thèmes du document de consultation et, de manière plus générale, à celles-ci :

  • Quels sont les éléments fondamentaux sur lesquels il faut agir pour que la politique culturelle fasse émerger des projets et actions ayant un impact transformateur et durable sur l’économie de la culture?
  • Que devrait-on retenir des orientations qui façonnent les stratégies et les programmes d’états ayant une structure de soutien similaire à celle du Québec?
  • Comment des programmes peuvent-ils avoir une portée transversale sur les trois principaux axes de la politique que sont :
    (1) l’affirmation de l’identité culturelle,
    (2) le soutien aux créateurs et aux arts et
    (3) l’accès et la participation des citoyens à la vie culturelle?

Ces questions ont orienté la rédaction de ce mémoire. Celui-ci a été rédigé à partir d’un rapport-synthèse réalisé à la demande de la SODEC afin de dégager les éléments essentiels à son appréhension du contexte au sein duquel les créateurs et entreprises culturelles vivent désormais.  Lire le mémoire

Commerce électronique: deux bonnes raisons pour aller voir ailleurs

Initialement publié dans le blogue de Direction informatique, le 18 décembre 2013.

Lorsqu’on parle de commerce électronique au Québec, il est souvent question de stratégie et de technologie, mais rarement d’information. Pourtant, qui n’a déjà fait ou entendu ce genre de commentaire : « C’est plus facile à trouver avec Google que sur le site de [XYZ]! »?

Tout comme l’information stratégique, l’organisation et l’exploitation des données concernant l’offre commerciale ne semblent pas encore faire partie des enjeux prioritaires de trop d’entreprises.

Labyrinthe de la Cathédrale de Reims

Une question d’information

Selon une étude récemment publiée par le CEFRIO, malgré la croissance du nombre d’achats en ligne, ceux-ci sont majoritairement effectués à l’extérieur du Québec. Quel dommage pour notre économie! Parmi les raisons qui pourraient expliquer cette préférence, il y en a deux pour lesquelles il serait tout à fait possible d’apporter des correctifs :

1. Le catalogue de produits n’est pas terrible

Les géants du commerce en ligne, ainsi qu’un nombre croissant de grandes marques américaines, investissent dans la mise en valeur de leur offre commerciale sur Internet en ouvrant aux internautes de très efficaces catalogues de produits.

Cela fait plusieurs années que des sites de commerce européens déploient cette force de frappe numérique. Il suffit, lors d’un séjour outre-mer, de chercher un simple appareil électro-ménager en ligne pour se voir proposer différentes marques et prix à même les résultats affichés par Google. Par ailleurs, plusieurs grandes enseignes s’intéressent au web sémantique afin d’ajuster leur moteur de recherche interne aux besoins exprimés de façon non explicite.

Désolée d’insister : les métadonnées descriptives sont au cœur de la recherche sur Internet. Les moteurs de recherche raffolent particulièrement de celles qui s’appuient sur des formats standards car elles sont faciles à interpréter et à contextualiser. Or, la plupart des catalogues en ligne au Québec ne sont constitués que de fiches d’information qui sont fournies par les manufacturiers. Résultat : il y a aucun format commun et on utilise un vocabulaire qui s’adresse davantage au service de l’approvisionnement qu’à la clientèle cible.

Enrichir les données d’une fiche produit avec des métadonnées permet d’ouvrir un catalogue à un grand nombre d’applications de recherche, et ainsi, de diffuser plus largement une offre qui, autrement, restera confinée au site Internet d’origine.

De tous les secteurs d’activité au Québec, par exemple, seule la musique connaît une initiative liée aux métadonnées. Il s’agit de TGiT, qui promeut l’adoption de métadonnées standards incrustées aux fichiers MP3 afin d’intensifier la présence numérique des créations québécoises.

La concertation autour de normes requiert des efforts considérables de la part de l’ensemble des acteurs d’un écosystème, mais c’est à ce prix que s’acquiert une présence forte et une certaine autonomie face aux géants du web comme Amazon et Apple.

2. La recherche sur ce site est une corvée

L’accessibilité et la qualité de l’information concernant les produits et leurs processus d’achat sont à l’origine de l’insatisfaction de nombreux consommateurs.

Si la partie transactionnelle peut être améliorée par des spécialistes de l’interface utilisateur, l’architecture de l’information devrait être élaborée avec les méthodes des sciences de l’information. De trop nombreux catalogues en ligne, incluant ceux des grandes entreprises, n’ont pas de schéma de classification, de catégorisation et de métadonnées cohérents et évolutifs qui permettraient aux moteurs de recherche internes et externes d’être plus efficaces.

Les moteurs de recherche internes sont rarement paramétrés adéquatement et cela constitue le plus grand irritant : il y a trop de résultats ou bien aucun résultat, le tout sans proposition d’alternative.

Un autre sujet d’amélioration est la recherche à facettes, qui permet de trier des résultats en fonction d’attributs spécifiques. Ces attributs se limitent habituellement au prix et à la marque, alors que d’autres informations plus utiles, comme les caractéristiques propres au type de produit, n’y sont pas.

Par exemple : pour un convecteur de 150 watts, on devrait proposer linéaire, thermostat intégré, puissance, spécialité (p. ex. un chauffe-serviettes). C’est un investissement qui permet de faciliter la recherche et, donc, d’accroître les ventes et de rentabiliser ainsi le coût d’acquisition de la technologie.

De plus, ces attributs permettent non seulement de contextualiser l’offre (p. ex. la variété des options), mais également d’enrichir l’analyse des données sur les besoins de la clientèle.

Le catalogue de produits demeure le maillon faible du commerce électronique au Québec. Pour trop d’entreprises, c’est encore une brochure ou, au mieux, une arborescence de site web. Mais pour les plateformes commerciales à succès, il s’agit plutôt d’un ensemble de données structurées s’adressant aux consommateurs afin de faciliter leurs décisions d’achat. Et pour celles qui sont entrées dans l’économie numérique, c’est aussi la composante d’un système d’information stratégique.

Pour Noël 2014, les sites de commerce en ligne seront-ils enfin passés en mode « information » au Québec?

Élections municipales: affiches électorales sur Twitter

Dimanche soir, j’écoutais Twitter dans l’aquarium de CIBL avec l’équipe de journalistes et d’animateurs. Déçue par ce que j’ai observé par la visualisation de données, j’ai terminé ma soirée électorale en commentant, sur Twitter:

50 nuances de beige. Une carte lexicale d’un ennui… Montréal se cherche un administrateur, pas un visionnaire. #mtl2013 #polmtl

Tout au long de la campagne, les thèmes, porteurs de vision, n’avaient laissé que de faibles traces.  La dynamique n’avait pas changé pendant la dernière journée de la campagne.

Où sont les enjeux ?

C’était prévisible. Au cours de la campagne électorale municipale, sur les flux #mtl2013, #polmtl et #cmmtl, les « affiches électorales virtuelles » ont pratiquement dominé le contenu des publications. Les principaux sujets des publications ont très majoritairement été les candidats(tes) des partis. Les mots les plus fréquemment employés ont été des noms propres et des noms de partis. Quelques mots faisant référence à des thèmes et enjeux de la vie municipale émergeaient, ça et là, mais sans aucune mesure, de façon comparable à la promotion des candidats.

Marketing et communication de masse

Les organisations politiques et leurs agences de communication ont ajouté Twitter à la panoplie des outils et s’en servent à la manière d’un média de masse: pour publier et relancer à répétition un message concernant les activités et bons mots des candidats. Trop peu de candidats s’en sont servi pour écouter les échanges et proposer de l’information utile sur des enjeux précis. Il y en a donc peu, dans cette carte lexicale générée à partir des contenus publiés du  1er août à la fermeture des bureaux de vote, le 3 novembre, à 20h00.

Mtl2013_Lexical_FermBurVot
Carte lexicale des flux #mtl2013 #polmtl #cmmtl (conseil municipal de Montréal), du 1er août au 3 novembre 2013, à 20h00- Nexalogy

Toile de fond: transports collectifs

Quels sujets ou enjeux ont-ils été les plus populaires ? Derrière le changement, thème récurrent en période électorale, ce sont les sujets qui ont trait aux transports collectifs (métro, tramway, SRB ou service rapide par bus) qui ont le plus suscité de publications.

Parmi les 200 mots les plus présents dans les tweets publiés durant cette période, voici ceux qui sont liés à des enjeux ou des thèmes de la politique municipale. Les mots sont suivis de leur rang et de la fréquence de publication :

  • Changement (31e) 1174
  • Métro (72e) 707
  • Tramway (85e) 566
  • Parc (99e) 547
  • SRB (108e) 532
  • Idées (112e) 523
  • Familles (115e) 507
  • Quartier (141e) 437
  • Économique (146e) 429
  • Transparence (157e) 399
  • Idée (161e) 392
  • Enjeux (175e) 371
  • Développement (184e) 361
  • Bus (193e) 354
  • Taxes (195e) 352
  • Étudiants (198e) 349

Opinion publique ou opinion médiatique ?

Les médias constituent la source de la presque totalité des liens échangés. Pendant les 48 heures qui ont précédé le vote, les éditoriaux des quotidiens Le Devoir et La Presse ont été parmi les 5 liens les plus populaires.

Élections du 3 novembre – Pour Bergeron, Bernard Descôteaux, Le Devoir, 2 novembre 2013

Denis Coderre à la mairie , André Pratte, La Presse, 1er novembre 2013

Communiquer, oui, mais quoi ?

L’annonce de l’élection de Denis Coderre à la mairie de Montréal a immédiatement généré de nombreux commentaires dont une grande partie étaient négatifs, ironiques et voire même malicieux. Près de 48 heures après cette annonce, ceux-ci ont disparu de la carte lexicale. Seul un commentaire publié par Gabriel Nadeau-Dubois subsiste car il est abondamment repris. Il témoigne de l’insatisfaction d’une partie de l’électorat face à la faiblesse du contenu proposé.

Carte lexicale - 48 heures après la fermeture des bureaux de vote
Carte lexicale – 48 heures après la fermeture des bureaux de vote (Nexalogy)

Gabriel Nadeau-Dubois, "Cette élection marque le triomphe de la communication vide" - Twitter

Soirée électorale et écoute sociale

Carte des interactions sur Twitter - #mtl2013 #polmtl #cmmtl 2 novembre 2013, 21h30
Carte des interactions sur Twitter – #mtl2013 #polmtl #ccmtl 2 novembre 2013, 21h30 (Nexalogie)

Marco Fortier, journaliste pour Le Devoir, a donné un bref aperçu de l’activité des candidats à la mairie de Montréal sur les médias sociaux.  Je ne crois pas qu’il s’en trouve pour nier que les réseaux sociaux constituent un canal de plus à intégrer dans une stratégie de communication.

Mais l’adoption de nouveaux usages ne change pas nécessairement notre façon de voir le monde. Si les tweets et les publications sur Facebook remplacent les communiqués sur les fils de presse, on utilise encore les réseaux sociaux comme un média de masse, c’est à dire, d’abord pour diffuser un message, puis, quelquefois, pour interagir avec d’autres internautes. Rarement est-il question d’écouter ce qui ce dit sur un sujet donné avant de prendre la parole.

L’écoute sociale en quelques cas:

Écouter pour mieux communiquer

Dimanche, 3 novembre, je me joindrai à l’équipe de CIBL (101,5 à Montréal) qui, pour la soirée des élections, ouvrira les portes de son studio au public, au coin des rues Saint-Laurent et Sainte-Catherine.

J’utiliserai le logiciel développé par Nexalogie pour analyser les contenus et les interactions sur les flux #mtl2013, #polmtl et #cmmtl. Je partagerai mes observations avec les animateurs et commentateurs qui seront sur place et, également avec l’audience de CIBL.

Il faut être familier avec les interfaces de requête et de production de rapports, ainsi qu’avec les concepts (et pièges) de l’analyse de données. Cependant, Nexalogie a développé une interface qui s’adresse au grand public. Les internautes peuvent donc dès maintenant visualiser les sujets des tweets, les liens qui sont échangés et les comptes qui sont les plus actifs.

L’activité des flux des principaux mots-clés (hashtag) sur Twitter peut être visualisée en français et en anglais:

Élection Montréal sur Twitter en français

Élection Montréal sur Twitter en anglais

La #charte sur Twitter: les mots dépassent-ils la pensée ?

Analyse du contenu et des interactions à propos de la Charte des valeurs québécoises sur Twitter.

Projet lancé à 00h00 le 12 septembre 2013, avec le logiciel d’analyse de Nexalogy. Données recueillies en français (#charte et charte AND polqc) et en anglais (#charte et charter + (qc OR quebec OR polqc)).

Campagne de recrutement - Lakeridge Health

Depuis jeudi dernier, le grand gagnant (flux français et anglais) de l’agitation sur Twitter est un hôpital en Ontario qui est à la recherche de personnel et qui a rapidement repéré l’opportunité. Les hyperliens menant vers la page Facebook de la campagne, ainsi que les différentes affiches publicitaires se sont rapidement propagées parmi les flux sous observation.

Dans l’ensemble, la cartographie des thèmes et groupes lexicaux présente un enchevêtrement confus d’émotions, d’accusations, de sarcasmes et de liens d’actualité. Les appels à l’unité y sont à peine visibles car trop peu fréquents.

Religion et politique

Parmi les thèmes présents, celui de la religion est prépondérant. C’est de l’Islam, plus que toute autre religion, dont il est surtout question; notamment, au sujet du port du voile.

Depuis samedi dernier, jour de la manifestation contre la charte, une thématique a pris de l’ampleur: les droits des femmes. Le mot « femmes » figure au 7e rang des 200 mots les plus fréquents. En marge des autres groupes lexicaux, celui-ci fait état des enjeux entre féminisme et pratiques religieuses.

La politique provinciale occupe une part importante des contenus. De nombreuses publications sont des déclarations partisanes qui concernent plus le Parti Québécois que le contenu de la charte.

Carte lexicale du flux #charte - en français - sur Twitter
Carte lexicale des contenus du flux #charte, en français, sur Twitter, 12 au 16 septembre 2013 (Nexalogy)

Société distincte ?

À la différence du flux français,  le flux anglais a de nombreux contributeurs hors-Québec. Là aussi, la politique s’est invitée:  les personnalités de 4 partis fédéraux sont très fréquemment mentionnées (au bas de la carte) et le commentaire d’un député conservateur (Jason Kenney, tout en haut de la carte) a abondamment circulé.

L’intégration des immigrants, les valeurs partagées et la laïcité, ne sont pas des sujets de controverse qui sont spécifiques au Québec : de nombreux liens échangés proviennent de sources hors-Québec et font référence à des controverses qui ont lieu dans d’autres provinces.

Carte lexicale du flux #charte - en anglais - sur Twitter
Carte lexicale des contenus du flux #charte, en anglais, sur Twitter, 12 au 16 septembre 2013 (Nexalogy)

Quelles valeurs ?

Des 200 mots les plus fréquents parmi les 16 200 tweets recueillis jusqu’à présent sur le flux français, 4 termes font références à des valeurs :

  • 5.  laïcité (575 fois)
  • 37. inclusif (225 fois)
  • 75. égalité (143)
  • 90. liberté (133 fois)

Des 200 mots les plus fréquents parmi les 11 500 tweets recueillis jusqu’à présent sur le flux en anglais, 6 termes font références à des valeurs :

  • 36. secularism (167 fois)
  • 72. freedom (104 fois)
  • 87. diversity (82 fois)
  • 168. freedoms (50 fois)
  • 183. equality (46 fois)
  • 199. inclusive (43 fois)

Quel débat ?

Dans un billet qu’il a publié ce dimanche, Clément Laberge se demande si l’instantanéité, n’étouffe pas le débat.

On peut-tu prendre un break? Une semaine? Pour laisser retomber un peu la poussière. Pour se donner le temps de lire les documents auxquels on fait référence, pour écouter attentivement les défenseurs et les opposants — et les amener à expliquer ce qu’ils appuient et ce qu’ils dénoncent dans la proposition. Pour sortir des antagonismes et créer un climat plus propice à l’expression des nuances et à la formulation de propositions alternatives — parce que le document peut certainement être amélioré; et qu’il a d’ailleurs été présenté comme tel.

Cette réflexion rappelle le dernier ouvrage de Douglas Rushkoff, Present Schock – When everything happens now, où il présente les effets sur notre comportement, d’une existance en temps réel. Au cours d’une entrevue, il illustre bien l’effet de l’instantanéité sur nos conversations numériques:

Remember those early conversations on the Well? We got to sound smarter than we were in real life, because we had all the time in the world to respond. They were asynchronous conversations, fully consonant with the asynchronous character of digital technology. When we strap this stuff to our bodies and respond to each vibration, we are turning them into something very different.

 

 

 

 

Confiance et engagement dans un débat public : leçons du conflit étudiant

Un an après le début du conflit étudiant, l’utilisation de Twitter par le Service de police de la Ville de Montréal (@SPVM) demeure la meilleure illustration d’un comportement suscitant l’engagement, même dans des échanges polarisés. Tel que démontré lors d’une analyse des conversations sur les flux #manifencours et #ggi, le compte @SPVM se positionnait alors au centre des interactions (graphique généré par Nexalogy Environics).

Carte des interactions - Nexalogie
Crise étudiante – Carte des interactions (comptes Twitter) – Nexalogie

Voici ce que ce nous apprend le comportement du SPVM pour établir la confiance et susciter l’engagement dans un débat public dans l’espace numérique :

  • Écouter activement

Melissa Carroll, la spécialiste des médias sociaux qui opère le compte du SPVM demeure visiblement à l’écoute. Elle est fréquement sollicitée par des interpellations (messages débutant par l’identifiant du compte) et répond.

  • Partager de l’information utile

En transmettant de l’information utile (déplacement de la manifestation, actes commis, fermeture de rues), le compte SPVM a attiré des abonnés, peu importe leurs positions relativement aux actions de la police.

  • Identifier des interlocuteurs réceptifs

En n’interagissant qu’avec des détenteurs de comptes dont le ton est modéré et dont les interpellations sont pertinentes, quel que soit leur position, le compte SPVM évite les conversations polarisées et élargit son audience.

  • Engager la conversation avec ses adversaires

Le compte SPVM ne répondait pas uniquement aux demandes d’information de ceux qui exprimaient leur soutient aux interventions policières.

Maîtrise des métadonnées: enjeu culturel et économique majeur

The Semantic Web isn’t just about putting data on the web. It is about making links, so that a person or machine can explore the web of data. With linked data, when you have some of it, you can find other, related, data. Tim Berners-Lee, Linked Data

Les 5 règles des données liées (linked data)

Métadonnées: la France est en retard…

Le numérique est avant tout un espace d’échange de métadonnées : si vous ne contrôlez pas les métadonnées, vous laissez à d’autres le pouvoir d’exposer ou non vos œuvres, de vous rémunérer ou pas… Je trouve que nous gérons collectivement cet enjeu des métadonnées avec beaucoup trop de légèreté, le réveil risque d’être douloureux.

Pendant qu’en France nous enchainons les colloques sur la nécessité de s’intéresser aux métadonnées, le gouvernement anglais investit des millions de livres pour faire émerger le plus rapidement possible des acteurs mondiaux sur la gestion des métadonnées.

ÉlectronLibre, entrevue avec Jean-François Bert, fondateur de Transparency, une société qui agit comme un tiers de confiance pour les ayants droit qui veulent surveiller l’exploitation de leurs oeuvres sur le Net.

Le Québec numérique dans son enfance

Pour réaliser à quel point notre retard va nous mettre à la merci des économies numériquement plus avancées, il suffit de visiter des sites comme semanticweb.com. On retrouve très rarement au Québec et au Canada des postes similaires à celui-ci (extrait) :

Core to the work of Pearson International is excellence in information architecture. Information architecture benefits PI businesses by making content reusable through the application of standards; and « smart » by the use of metadata, taxonomies and semantic technologies.

Candidate Profile

Deep understanding of the complex challenges of information and knowledge management.

• Proven success incorporating Taxonomy and Metadata programs within a large enterprise organisation.

• Experience leading teams on taxonomy and metadata strategy projects

• Experience implementing industry taxonomy standards

• Experience implementing metadata standards such as Dublin Core

Un risque pour la culture et l’économie

Les récentes interrogations de l’industrie de la musique illustrent le retard numérique du Québec, notamment en ce qui concerne le web des données:

Au Québec, les ventes d’albums et de pistes numériques représentent 24 % du total; aux États‐Unis, cette proportion passe à 47 %, un peu plus que les 45 % du marché de la musique enregistrée au Canada. /…/ Non seulement la vente d’albums et de fichiers individuels de produits québécois est‐il significativement plus faible qu’en format physique, mais, contrairement à la tendance générale /…/, elle est en recul depuis deux ans.

/…/

Dans un contexte où le format physique semble condamné à perdre du terrain face au commerce numérique de la musique, il appert essentiel que les produits québécois accroissent leur part de marché au courant des prochaines années pour assurer la pérennité du disque québécois. Comment s’y prendre? Est‐ce que le disque (et le « single ») québécois sont assez bien représentés sur les différentes plates‐formes de téléchargement légal (iTunes, eMusic, Zik)? Peut‐on exiger de ces détaillants du Web qu’ils mettent mieux en valeur les produits québécois, voire qu’ils créent une « boutique Québec » sur leurs plates‐formes? Est‐ce que l’industrie de la musique doit investir davantage dans la publicité sur le Web et dans les réseaux sociaux pour mieux diffuser la musique d’ici?

(Philippe Renaud, Un portrait de la chanson québécoise, janvier 2013, pages 19-20)

S’il se vend moins de musique québécoise, c’est, en grande partie, parce qu’elle n’est pas présente/visible là où vont les consommateurs pour trouver de nouveaux contenus culturels (sur Internet). La découverte de contenus culturels québécois sur le Web passe par des métadonnées de qualité (nos catalogues de produits sont en général pitoyables, sémantiquement). De plus, la multiplication des plateformes aux technologies  propriétaires et aux formats non standards (voir la définition des données liées, au début de ce billet) entraîne une balkanisation de l’offre culturelle au détriment des consommateurs.