Archives par mot-clé : données

Nouvelles compétences informationnelles pour modèles numériques

Nous produisons des contenus numériques et nous adoptons de nouveaux outils, mais nos modèles d’affaires et nos stratégies de promotion et diffusion demeurent cependant essentiellement les mêmes. Alors, comment se positionner face aux modèles d’affaires plus rentables et plus attractifs des géants du numérique tels que décrits dans cet article sur une nouvelle classification des entreprises?

/…/ companies that build and manage digital platforms, particularly those that invite a broad network of participants to share in value creation (such as how we all add content to Facebook’s platform or that anyone can sell goods on Amazon’s), achieve faster growth, lower marginal cost, higher profits, and higher market valuations.

Ce qui contribue à leur montée en puissance, c’est la donnée qui leur permet de mettre leurs contenus en avant et de générer de l’information toujours plus précise et pertinente pour la prise de décisions stratégiques.

Exploitation du graphe des connaissances et des données ouvertes et liées par Google
Exploitation du graphe des connaissances et des données ouvertes et liées par Google.

Culture de la donnée? Plutôt, des compétences informationnelles

Malgré les transformations qui accélèrent la mutation des modèles industriels et économiques, les opportunités et enjeux ayant trait à l’exploitation des données sont généralement ignorés dans la plupart des analyses et propositions d’action, qu’il s’agisse de politiques gouvernementales ou d’initiatives entrepreneuriales.

Cette situation s’explique fort probablement par le faible niveau de connaissances en matière d’information; ce qu’on appelle parfois les compétences informationnelles.  En effet, si les technologies de l’information au sein de nos organisations ont un pouvoir, des ressources et des budgets dédiés, la matière première — la donnée, le document, l’information et même la connaissance — ne constitue pas une priorité.

Et pourtant.  Comprendre de quoi sont faites les données (standards et sciences de l’information) et comment évolue leur exploitation (algorithmes, technologies sémantiques, blockchain) permet d’apprécier les modèles numériques d’une toute autre manière qu’en utilisateur de systèmes: en « créateur de valeur ».

Au cours de la préparation d’un atelier pour la SODEC, dans le cadre de la prochaine édition du SODEC_LAB Distribution 360, j’ai répondu à quelques questions concernant le rôle central des données dans la diffusion et la mesure des contenus, et notamment, leur potentiel de découvrabilité.  Deux questions, qui reviennent régulièrement aux cours des présentations, démontrent clairement qu’il est urgent d’élaborer un programme afin de palier le sous développement des compétences informationnelles dans nos organisations, qu’il s’agisse d’une startup ou d’un ministère.

Je partage ici ces questions, ainsi qu’un aperçu des réponses.

Comment peut-on définir simplement ce qu’est une donnée?

Par l’exemple. Voici une donnée:

snow

C’est un « morceau d’information »; la plus petite unité de représentation d’une information. Exploitée individuellement, sans contexte (dont la langue) ou d’autres données, cette donnée peut prendre n’importe quel sens

Nom: Snow
Prénom: Michael
Activité: Artiste
Pays: Canada

Ensemble, des données permettent de produire de l’information, notamment, grâce à la présence de ces données spéciales que sont les métadonnées (meta: auto-référence, en grec).  Nom, Prénom, Activité, Pays permettent de comprendre le sens des données auxquelles elles sont reliées, surtout si elles sont dans des formats difficiles à interpréter comme des numéros d’identification.

Les données peuvent être structurées, comme dans les bases de données ou les feuilles de calcul, ou non structurées, comme des textes sur Twitter et Facebook ou des images-commentaires sur Snapchat.

Les données non structurées sont généralement très riches mais requièrent un traitement manuel ou automatisé.  Mais, en général, l’exploitation des données fait face à un enjeu majeur: leur hétérogénéité. Les technologies, les modèles de représentation et les formats de données sont autant de silos qui empêchent de relier des données de sources diverses entre elles.

À quelles données pouvons-nous avoir accès?

Il y a une abondance de données accessibles à tous les participants d’un écosystème donné. Chaque individu, chaque organisation est une machine à produire des données.

Par exemple, les industries culturelles produisent des données sur les contenus et sur la consommation de contenu.

Les grandes plateformes numériques excellent dans leur domaine en grande partie pour ces raisons:

Exhaustivité. Elles fournissent sous forme de données et métadonnées,  de l’information très détaillée à propos de leurs contenus (description, ambiance, audience, son, couleur, etc.).

Connectivité. Elles savant que les données détaillées qui décrivent leurs contenus génèrent de nouvelles données lorsqu’elles sont liées à des données de consommation ou à d’autres données sur des contenus.

Dévouvrabilité. Elles comprennent le rôle central joué par les données et métadonnées pour la  découvrabilité des contenus. De plus en plus de contenus vont à la rencontre de leurs publics, entre autres, par Google qui donne des réponses plutôt que de fournir des listes de destinations où trouver les réponses. Taper « Best actor oscar 2016 », vous y constaterez que Google exploite de façon croissante le graphe des connaissances (knowledge graph) et des données ouvertes et liées (Linked Open Data).

Pertinence. Elles se servent des données pour cibler des consommateurs, mais, de plus en plus, pour créer des contenus ou permettent à des producteurs de proposer des offres qui trouveront plus facilement leurs publics.

Mesure. Elles utilisent ou expérimentent divers indicateurs de mesure, autres que des transactions ou des faits comme des tendance,  des modèles de comportement ou, encore mieux: la relation au contenu. Elles pratiquent l’écoute sociale en suivant, par exemple, les conversations sur Twitter avant, durant et après le lancement d’un contenu.

La donnée génère l’information qui est au cœur du modèle économique des puissantes plateformes numériques. Celles-ci ont toujours plusieurs trains d’avance sur leurs compétiteurs (et, souvent, également fournisseurs) dont la vision et les modèles relèvent encore des méthodes de l’ère industrielles.  Nos industries culturelles, pour ne citer que cet exemple, disposent d’une masse de données, mais celles-ci sont peu entretenues et exploitées.

Avant de développer un énième silo d’information (plateforme, application), il faudrait peut-être apprendre à connecter nos données et les mettre en réseau pour générer le plus d’effet à long terme pour notre économie et notre culture.

 

 

La donnée est l’élément pivot d’une nouvelle politique culturelle

Nos contenus culturels sont-ils dans le web des données ?

Mémoire déposé dans le cadre de la consultation publique pour le renouvellement de la politique culturelle du Québec, 8 mai 2016.

Représentation du web des données ouvertes liées - 2014

Parmi tous les documents publiés — tant par les gouvernements du Québec et du Canada que par les institutions et organismes préoccupés par le nécessaire renouvellement d’une politique culturelle dans un contexte de transition numérique — il n’est fait aucune mention de la donnée. Celle-ci est pourtant au cœur du « numérique » (peu importe la définition choisie) si bien qu’il est impossible d’élaborer une vision, une politique et des programmes qui soient cohérents et qui aient un impact réel et de longue durée sans une compréhension fine de ce dont il s’agit.

Comprendre la donnée, c’est être en mesure de répondre à la plupart des questions qui se trouvent sous les sept thèmes du document de consultation et, de manière plus générale, à celles-ci :

  • Quels sont les éléments fondamentaux sur lesquels il faut agir pour que la politique culturelle fasse émerger des projets et actions ayant un impact transformateur et durable sur l’économie de la culture?
  • Que devrait-on retenir des orientations qui façonnent les stratégies et les programmes d’états ayant une structure de soutien similaire à celle du Québec?
  • Comment des programmes peuvent-ils avoir une portée transversale sur les trois principaux axes de la politique que sont :
    (1) l’affirmation de l’identité culturelle,
    (2) le soutien aux créateurs et aux arts et
    (3) l’accès et la participation des citoyens à la vie culturelle?

Ces questions ont orienté la rédaction de ce mémoire. Celui-ci a été rédigé à partir d’un rapport-synthèse réalisé à la demande de la SODEC afin de dégager les éléments essentiels à son appréhension du contexte au sein duquel les créateurs et entreprises culturelles vivent désormais.  Lire le mémoire

Pourquoi vos métadonnées musicales sont aussi importantes que votre musique

 

TGiT - Tag ta musique: indexation de contenus musicaux

Pourquoi s’investir autant dans la création et la production d’œuvres musicales et les laisser ensuite devenir graduellement invisibles sur le Web, une fois la campagne de promotion terminée ? Pourquoi laisser aux plateformes technologiques le soin d’identifier et de catégoriser les œuvres ? Pourquoi s’insurger d’une part contre la copie illégale et de l’autre, diffuser des fichiers audio sans données détaillées sur les créateurs et les détenteurs des droits ?

Ces questions surgissent depuis que je contribue à des projets de valorisation de métadonnées dans le domaine de la culture. Ce sont également des enjeux vitaux pour la présence numérique de la musique créée et produite au Québec, Ce sont ces même raisons qui m’amenaient à assister à la présentation de Jean-Robert Bisaillon, lors du MusiQClab du 28 janvier dernier, à Montréal.

Lire la suite sur le blogue de MusiQC numériQC.

Industries culturelles: la vraie nature de la transition numérique

Initialement publié dans le blogue de Direction informatique, le 7 décembre 2015.

Le plus grand défi imposé par la révolution numérique aux industries culturelles et créatives n’est pas de nature technologique mais organisationnelle.  Nous ne voyons encore que trop peu d’expérimentations hors des modèles de création et de distribution traditionnels. Qu’est ce qui retient nos entreprises culturelles?

Lors du Sommet sur la découvrabilité, qui était organisé par le CRTC et l’ONF et qui avait lieu à Montréal la semaine dernière, j’ai eu l’impression qu’il fallait encore convaincre les participants que les changements qui bouleversent leur univers sont, non seulement irrémédiables, mais qu’ils s’accélèrent. Pourtant, nous ne sommes plus uniquement en présence de nouveaux usages numériques, mais d’une nouvelle génération de « consommacteurs » autour desquels s’élaborent des services et des outils. Un public plus difficile à joindre et qui a sa propre grammaire, comme le mentionnait Suzanne Lortie, professeur et directrice du programme en stratégie de production culturelle et médiatique à École des médias de l’UQAM, en parlant des YouTubers, ces jeunes créateurs de contenus qui sortent des codes habituels de l’audiovisuel et ont des succès d’audience.

Il y a pourtant plusieurs années maintenant qu’ont été publiés les rapports du CALQ et de la SODEC sur le nécessaire virage numérique.  Il est donc fort probable que tous étaient déjà bien au fait des transformations qui affectent la création, la distribution et la consommation de contenus culturels.  C’est pourquoi les conférences qui composaient la première partie de l’événement n’ont pas déclenché d’électrochoc mais ont rappelé l’urgence d’agir face à des écosystèmes et des modèles qui se mettent en place en ne nous laissant qu’un rôle de fournisseur de contenus.

La table ronde qui réunissait des experts, praticiens et enseignants a permis d’entrevoir, trop brièvement, ce qu’un réseau de compétences et d’expériences diversifiées pourraient apporter à des projets novateurs.  Ces « partenariats improbables » évoqués par Sylvain Lafrance, professeur à HEC Montréal et ancien vice-président exécutif de Radio-Canada, ne seraient-ils pas plutôt des alliances naturelles dont on a ignoré le potentiel ?

Face au rouleau compresseur culturel des grandes plateformes numériques ne faudrait-il pas développer un réseau de partenaires afin de miser sur la mutualisation de ressources et de compétences? Et, pourquoi, tel que le suggérait le conférencier principal et consultant en nouveaux médias, Pascal Lechevallier, ne pas établir des partenariats à l’échelle de la francophonie ? C’est cette même ouverture sur le monde et les marchés francophones, que réclamait Jean-Daniel Nadeau, journaliste au Devoir, en dénonçant la myopie des médias, à la suite du Congrès de la fédération des journalistes du Québec.

Ces questions avaient pourtant déjà été soulevées en 2012, lors d’un forum France-Canada sur les enjeux des contenus numériques, organisé par le Conseil des technologies de l’information et des communications. Plusieurs des participants au sommet de la semaine dernière y étaient d’ailleurs présents.

Le véritable défi pour les contenus culturels à l’ère numérique est de sortir d’un modèle de création et de production qui n’est plus supporté par l’écosystème. Comme je l’ai démontré dans un billet précédent, la vraie nature du changement est culturelle: il faut abattre les silos disciplinaires et organisationnels pour connecter nos réseaux de compétences et mettre en commun nos savoirs.

Ce sont les réseaux collaboratifs qui permettent de décoder les signaux faibles du changement, de varier les perspectives sur une problématique et d’élaborer un prototype de solution. Pourquoi des organisations qui ont des enjeux communs ne collaboreraient-elles pas ensemble pour expérimenter des solutions? Parmi nos créateurs et nos entreprises culturelles, quels sont ceux et celles qui rechercheront ces « partenariats improbables »?

Nos contenus culturels sont absents du web des données

Ne pas être préoccupé de la présence et de la visibilité des contenus des industries culturelles et créatives sur le web, c’est, pour une institution: attendre d’être obsolète ou, pour une entreprise:  être bientôt ou déjà mise hors jeu par les grands intermédiaires technologiques.

Googlelisation des contenus culturels: captation de l'attention et des données des interactions. Tweet partagé lors du Congrès des milieux documentaires du Québec, 19 novembre 2015.
Googlelisation des contenus culturels: captation de l’attention et des données des interactions. Tweet partagé lors du Congrès des milieux documentaires du Québec, 19 novembre 2015.

 

Mais dans tous les cas de figure, c’est être les grandes perdantes de la guerre que se livrent les grandes plateformes pour occuper nos écrans et promouvoir les contenus qu’elles ont sélectionnés en fonction de leur stratégie. Cette stratégie repose fondamentalement le transfert de la création de valeur du produit à la plateforme. Dans ce modèle, ce sont les règles d’affaires ,et non les produits qui s’adaptent selon les besoins des marchés.  Ces règles d’affaires sont les algorithmes qui  traitent les métadonnées des catalogues, ainsi que les données générées par les interactions avec les consommateurs.

Dans un billet publié la semaine dernière,sur la découvrabilité des contenus culturels, j’ai dénoncé sur la faible exploitation des catalogues, répertoires et archives de contenus et sur la perpétuation des silos de données qui font que nos produits culturels n’ont pas de masse critique, et donc d’existence, dans le web des données.

Parler de découvrabilité sans s’interroger sur les conditions requises pour provoquer la rencontre de l’offre et la demande ou pour favoriser la fortuité du croisement entre une attention disponible et une offre, c’est chercher une médication sans avoir établi de diagnostic médical.

Bien sûr, la découvrabilité est un concept qui ne date pas d’hier. À tout le moins, dans le domaine des sciences de l’information, c’est un élément familier de l’économie du document. Et certainement, il y a différents parcours de découverte pour les contenus: critique, recommandation, promotion, en ligne et hors ligne.

Mais le parcours le plus rentable est celui qui permet de tracer les contenus, de suivre leur consommation, de collecter les données sur lesquelles reposent des décisions tactiques et stratégiques. Ce parcours est celui va de la mise en ligne du catalogue (ou pour les plus avancés, la mise à disposition des données du catalogue en mode public ou ouvert) à l’enrichissement des données d’usage par les consommateurs et, indirectement, par les partenaires.

C’est ce parcours que nos institutions culturelles , comme nos entreprises de la culture et du divertissement, ne perçoivent pas encore comme une condition essentielle de survie, mais surtout, d’autonomie et de contrôle sur le pétrole de l’économie numérique: la donnée.

Comme je le mentionnais, dans le blogue de Direction Informatique,  à propos du commerce électronique:

Le catalogue de produits demeure le maillon faible du commerce électronique au Québec. Pour trop d’entreprises, c’est encore une brochure ou, au mieux, une arborescence de site web. Mais pour les plateformes commerciales à succès, il s’agit plutôt d’un ensemble de données structurées s’adressant aux consommateurs afin de faciliter leurs décisions d’achat. Et pour celles qui sont entrées dans l’économie numérique, c’est aussi la composante d’un système d’information stratégique.

Pour avoir un aperçu de ce que pourrait être ce système d’information stratégique, en culture, il faut absolument lire le 3e cahier Innovation et prospective de la CNIL. Pendant ce temps, nos institutions de mémoire collective (bibliothèques, musées, archives) découvrent le web social et participatif et se demandent s’il faut ouvrir les contenus à la participation du public.

Alors, serons-nous uniquement les clients et utilisateurs des grandes plateformes ou deviendrons-nous les créateurs et bâtisseurs de cette économie numérique?

 

Découverabilité: nos contenus culturels sont-ils visibles?

Initialement publié dans le blogue de Direction informatique, le 20 novembre 2015.

Tout comme dans le commerce électronique, le catalogue est le maillon faible des industries culturelles et créatives au Québec. À lire l’invitation du Sommet sur la découvrabilité, il semble que nous n’ayons pas encore réalisé ce qui fait le succès des plateformes comme Amazon, Netflix, iTunes ou YouTube : une culture de la donnée qui favorise les rencontres entre l’offre et la demande.

Trop rares sont les entreprises qui, quel que soit leur secteur d’activité, exploitent leurs actifs informationnels sur le web ainsi que le font de nouveaux acteurs issus du numérique qui sont ou qui deviendront rapidement leurs plus féroces concurrents. À ceux-ci il faut ajouter les géants technologiques qui ont choisi le modèle de la plateforme, plutôt que celui du produit, et qui captent lors de chaque transaction, une valeur en micropaiement ou données.

Les fonds qui restent au fond des systèmes 

Pourtant, malgré les refontes de sites, les applications et les innovations technologiques, nos contenus culturels et créatifs sont pratiquement absents du web des données. Les répertoires, catalogues, fonds et archives ne sont accessibles aux humains et aux machines que par l’entremise d’un espace de recherche, souvent peu adapté aux besoins des utilisateurs. La diffusion des contenus dépend généralement de campagnes de promotion ponctuelles et plus ou moins bien ciblées dédiées aux nouveautés, laissant dans l’internet profond des actifs riches qui profiteraient bien de la longue traîne s’ils étaient visibles. Ceci expliquerait en partie le phénomène que décrit l’auteure Annie Bacon dans un récent billet intitulé « Une industrie de la nouveauté ».

L’industrie du livre se rapproche ainsi de l’industrie du cinéma dans laquelle les films n’ont plus que quelques fins de semaines pour convaincre les cinéplexes de les garder en salle. Un mauvais premier week-end et le film disparaîtra avant la fin du mois.

Combien de rendez-vous ratés avec le public et d’opportunités de développement de marché nos industries culturelles ont-elles raté sur le web? Combien de contenus n’ont pas rencontré leurs publics faute d’être visibles et découverts, par recommandation algorithmique ou par simple diffusion de métadonnées au bon endroit?

Le catalogue, actif stratégique?

Nous accusons un retard considérable en matière de diffusion et de distribution de contenu parce que nous ne maîtrisons pas les compétences nécessaires pour transformer nos catalogues et répertoires en données exploitables et interopérables. Si nous n’accordons pas la priorité à ces actifs stratégiques, nous risquons de nous confiner au rôle de fournisseurs et clients de l’économie numérique.  Cette économie est celle de la donnée, elle repose sur la diffusion des métadonnées, ces données qui fournissent une description détaillée d’un livre, d’une chanson, d’un film ou tout autre type de contenu. Ces métadonnées facilitent la recherche, favorisent la découverte et permettent aux entreprises d’enrichir leur connaissance du marché en les croisant avec les données résultant de l’interaction des utilisateurs.

La destination, c’est l’utilisateur

Il existe, bien sûr,  des programmes qui soutiennent le développement de sites internet et d’applications, ainsi que l’appropriation de nouveaux outils. Il s’agit cependant d’actions morcelées qui, en perpétuant les silos de données, obligent les consommateurs à multiplier leurs recherches ou limitent la découverte de nouvelles offres. Selon cette perspective, chaque site ou application est une destination. Dans une perspective numérique, l’utilisateur est au cœur du modèle par les requêtes qu’il adresse, directement, aux moteurs de recherche, ou indirectement, par ses actions et ses choix. L’utilisateur est devenu la destination.

Laisser le champ libre à Google et cie?

Être visible dans une économie numérique, c’est donc aller à la rencontre de son marché. Ne pas aller à la rencontre des consommateurs en mettant les contenus à leur portée, c’est laisser le champ libre à ceux qui ont compris comment, à partir du contenu intégral ou des métadonnées d’une oeuvre, on peut générer de l’information qui soit intelligible pour des lecteurs ou des applications. Voici pour preuve, cette observation partagée sur Twitter lors du Congrès des milieux documentaires du Québec qui avait lieu cette semaine, à Montréal :

McGill-GoogleScholar_tweet-cmd2015

La force des grandes plateformes technologiques repose sur la capacité d’agréger et de croiser des données de sources différentes, de les contextualiser à l’aide des données des utilisateurs et d’en faciliter le repérage et l’interprétation pour diverses applications.

Que faire pour entrer dans le web des données?

Il faut édicter une politique visant à encourager l’adoption,  par tous les acteurs des industries culturelles et créatives, d’un modèle de métadonnées harmonisées. En cela, nous pouvons nous inspirer de la Feuille de route stratégique sur les métadonnées culturelles qui a été publiée l’an dernier, par le ministère de la Culture, en France. Ceci permettrait de briser les silos technologiques et de rassembler les entreprises et institutions autour d’un projet numérique commun qui a une véritable portée stratégique.

Une politique de métadonnées culturelles constitue un instrument de gouvernance essentiel dans une économie de la donnée parce qu’elle requiert une collaboration active :

  • Élaboration d’une vision et d’une stratégie numériques qui soient partagées par les acteurs principaux.
  • Compréhension commune des objectifs et besoins de chacun. Définition et priorisation des enjeux sémantiques, techniques, juridiques et organisationnels.
  • Alignement de projets technologiques sur la stratégie (et non l’inverse).

La visibilité des contenus des industries culturelles et créatives devient un enjeu prioritaire pour le Québec qui se prépare à entrer dans l’économie numérique. Nous devrions, sans attendre, nous inspirer des démarches qui ont été entreprises ailleurs et développer nos compétences et notre maîtrise des données.

Entreprises et institutions culturelles, vos contenus sont-ils bien visibles?

Données ouvertes: comment améliorer la qualité et l’utilisabilité des ensembles

 

Commission européenne - Formation en ligne sur la qualité des données ouvertes

 

Éléments d’information pour la préparation d’un atelier dans le cadre d’un événement montréalais pour la Journée internationale des données ouvertes, le 21 février prochain, à la Maison Notman.

Voici des enjeux et des exemples qui sont susceptibles de réunir des représentants des gouvernements, des organismes et des citoyens autour d’une démarche constructive.

Littératie de l’information et culture des données

Développer une culture des données pour que la libération de données soit plus qu’une démonstration de transparence : le développement d’écosystèmes actifs et diversifiés.

L’open data est-il un leurre politique ?

Nous avons besoin d’une culture qui fasse bien comprendre qu’une donnée n’est pas quelque chose de naturel, mais de construit. Les données sont construites, produites, et le processus de fabrication est aussi important que la donnée en elle-même.

Curation des données: améliorer le rendement de la libération des ensembles

Il n’est pas suffisant de libérer des données: il faut pouvoir les trouver et comprendre ce à quoi elles peuvent servir. Ceci implique un catalogage précis des ensembles: type d’information, origine, secteurs d’activités concernés, liste des données, période couverte de même qu’une indexation par mots clés contrôlés et par les utilisateurs (folksonomie). L’indexation permet de relier entre eux des ensembles de données quelque soit leur origine et leur classification.

Sorting Through the Government Data Explosion

All the data the American government is pouring onto the Web will be useful only if people can make sense of it. What’s needed are tools for sorting, combining and presenting raw data sets in visual form.

Approche centrée sur l’utilisateur

Accéder à l’information municipale, provinciale et fédérale qui concerne notre lieu de résidence ou la localisation de notre entreprise. Remédier à la dispersion de l’information (qui, quoi, quand, où?) par la standardisation des métadonnées et l’interopérabilité des ensembles de données.

The biggest failure of open data in government

Do you know all the different government bodies and districts that you’re a part of? Do you know who all your elected officials are? Do you know where and when to vote or when the next public meeting is? Now perhaps you’re thinking that this information is easy enough to find, so what does this have to do with open data? It’s true, it might not be too hard to learn about the highest office or who runs your city, but it usually doesn’t take long before you get lost down the rabbit hole. Government is complex, particularly in America where there can be a vast multitude of government districts and offices at the local level.

Interopérabilité des données quelque soit leur origine

Un guide pour favoriser l’interopérabilité des ensembles de données. Métadonnées descriptives de base : organisation, événement, personne, législation.

The Open Civic Data Project – Sunlight Foundation

Using Open Civic Data makes it is easier for governments to share data and for people to engage with their governments. Open Civic Data also provides guidance on how to publish all of this information so it can be shared across city, county and state jurisdictions. Adoption of Open Civic Data can:

  • Make content about local governments easier to find.
  • Provide a clear path for archiving and relating data across years.
  • Help governments make their data more open to citizens and developers alike.
  • Increase data portability across cities, counties and states.

Standards d’interopérabilité : modèles d’approches

Utiliser un langage commun à tous les services du gouvernement qui produisent des données pour la description des ensembles de données. Standards d’interopérabilité de la politique de qualité des données du gouvernement de l’état du New South Wales, Australie.

Data Interoperability Standards

The links below provide access to data standards which support data interoperability and exchange of information by NSW Government agencies.

Standards offer a common language enabling agencies to appropriately share or compare data managed across diverse systems.

  • Standard Approach to Metadata (pdf)
  • Standard Approach to Information Architecture (pdf)
  • Standard for Customer Reference Data (pdf)
  • Standard for Spatially Enabling Information (pdf)
  • Standard for Human Services Classification (pdf)
  • Standard for Data Quality Reporting (pdf)

Facteurs contribuant à la réutilisation des données

Éléments communs des meilleures pratiques de gestion de données ouvertes. Série de présentations du groupe Open Data Support, au sein de la Communauté européenne.

La qualité des Données et Métadonnées Ouvertes

  • Fournir des descriptions appropriées aux données (métadonnées);
  • Utiliser des vocabulaires standards pour les données et métadonnées;
  • Spécifier la licence sous laquelle les données peuvent être réutilisées;
  • Respecter les exigences légales en matière de protection de données personnelles et autres données sensibles;
  • Représenter les métadonnées et les données selon les principes de données libres en utilisant les URIs persistants pour identifier les ressources;
  • Fournir des informations sur la source des données.

 

Littératie des données: transparence et qualité de l’information

Commission européenne - Formation en ligne sur la qualité des données ouvertes
Commission européenne – Formation en ligne sur la qualité des données ouvertes

Nous avons besoin d’une culture qui fasse bien comprendre qu’une donnée n’est pas quelque chose de naturel, mais de construit. Les données sont construites, produites, et le processus de fabrication est aussi important que la donnée en elle-même. Evelyn Ruppert, sociologue spécialiste des données.

Données ouvertes, journalisme de données, intelligence d’affaires et exploitation de la datamasse (big data, au sens de biomasse): les données sont les principales ressources de l’ère numérique. La qualité des données et la normalisation des ensembles de données sont cependant des enjeux qui demeurent généralement ignorés dans les projets numériques.  Il n’est donc pas étonnant que l’information dont nos gouvernants et nos institutions disposent soit difficilement exploitable et peu fiable.

Mémoire déposé à la commission Charbonneau

Le 13 juin 2014, j’ai déposé un mémoire dans le cadre des consultations publiques de la Commission d’enquête sur l’industrie de la construction (commission Charbonneau) qui vise plus particulièrement l’attribution de contrats publics.

Lire  le mémoire que j’ai déposé à la commission Charbonneau.

Mise à jour (14 juillet 2014)

Je tiens à souligner qu’à ma connaissance deux autres mémoires ciblent spécifiquement le rôle essentiel que joue la libération des données publiques dans l’établissement de processus transparents et équitables:

NordOuvert /OpenNorth

Rôle des données ouvertes pour diminuer la corruption et les bonnes pratiques internationales en matière de divulgation des données sur les marchés publics.

Hackons la corruption

Projet de citoyens visant à combattre la corruption en améliorant la transparence des contrats publics publiés sur le site du Système électronique d’appels d’offres (SEAO.ca)

FACIL 

Organisme sans but lucratif dont le mandat est de promouvoir l’adoption, l’usage et la démocratisation de l’informatique libre.  N’ayant pas pu publier de mémoire, FACIL a transmis ses commentaires à la Commission dont en voici un extrait:

Pour le dire sans détour, nous croyons que les systèmes publics d’information à la disposition des citoyens pour l’exercice de leurs devoirs de surveillance des activités de l’État doivent être revus complètement afin de les rendre compatibles avec l’éthique de l’informatique libre. C’est à cette condition qu’ils seront vraiment utiles autant aux citoyens lambda qu’aux élus et aux fonctionnaires.

Les trois documents que nous vous présentons traitent, dans l’esprit du «gouvernement ouvert», des critères que doivent rencontrer les systèmes informatiques de divulgation de l’information sur les marchés publics et le lobbyisme. Le premier a été produit par FACIL, tandis que les deux autres sont des traductions de FACIL. Mathieu Gauthier-Pilote, membre du conseil d’administration de FACIL

Le «Dossier gouvernement ouvert» peut être consulté sur le wiki de FACIL: http://wiki.facil.qc.ca/view/Dossier_gouvernement_ouvert

Il est très encourageant de constater la présence d’acteurs du secteur numérique  parmi les propositions soumises aux consultations publiques dans le cadre de cette commission d’enquête.

Serons-nous clients ou bâtisseurs de la nouvelle économie?

Initialement publié dans le blogue de Direction informatique, le 8 avril 2014.

Program or be programmed - David Rushkoff

Il y a plus d’avantages à être celui qui contrôle un système que celui qui l’utilise.

L’intense compétition entre les acteurs mondiaux des technologies de l’information et l’importance des investissements consentis par plusieurs gouvernements témoignent du passage de l’ère industrielle à celle du numérique.

Malheureusement, il semble qu’au Québec et au Canada, nous ayons choisi d’être des clients plutôt que de figurer parmi les bâtisseurs de la nouvelle économie.

La semaine dernière, on apprenait que Bibliothèque et Archives Canada (BAC) se prépare à remettre la gestion de son catalogue à OCLC, une organisation basée aux États-Unis, faute d’avoir trouvé chez nous un fournisseur capable d’effectuer la modernisation de son système de gestion. Comme c’est le cas dans la plupart des organisations, BAC est aux prises avec un système qui est désuet et ne répond pas aux exigences d’interopérabilité et de flexibilité des réseaux d’information collaboratifs.

Les professionnels des sciences de l’information connaissent bien OCLC (Online Computer Library Center), un organisme à but non lucratif à qui on doit, entre autres, WorldCat, l’agrégation des catalogues de bibliothèques publiques du monde, et Dublin Core, le schéma de métadonnées normalisé qui permet de décrire des ressources numériques. Il ne fait aucun doute que le développement du nouveau système de BAC serait ainsi entre de bonnes mains, même s’il n’est pas souhaitable que les données du patrimoine documentaire et culturel canadien soient hébergées hors de nos frontières.

Cette nouvelle soulève par ailleurs trois enjeux importants pour notre avenir dans une économie numérique :

1. Les systèmes collaboratifs et les données connectées

Il est inquiétant qu’aucune entreprise canadienne du secteur des technologies de l’information ne puisse satisfaire les besoins de BAC. Ce sont des besoins très similaires à ceux des administrations publiques, notamment, dans le contexte des systèmes collaboratifs et du partage de données.

2. L’expertise de l’information

L’exploitation de données n’est pas uniquement une question de technologie. C’est également la maîtrise des principes, méthodes et normes d’organisation des données et des contenus que l’on retrouve en bibliothéconomie et en sciences de l’information. Il y a encore trop peu de spécialistes de l’information là où il le faudrait, notamment en amont des grands projets numériques.

3. La présence numérique

Étrangement, lorsqu’on recherche sur Internet nos créations artistiques et notre patrimoine culturel, les sites des grands acteurs du commerce électronique devancent généralement ceux de nos institutions culturelles. Quand ils ne sont pas inaccessibles aux internautes, les catalogues de nos bibliothèques, musées et autres diffuseurs sont en effet invisibles pour les moteurs de recherche.

4. La dépendance technologique

En sous-traitant la maîtrise d’oeuvre et l’hébergement de projets numériques, les gouvernements privatisent peu à peu l’information, fragmentent des ensembles de données qui devraient être interconnectés et renoncent à développer une expertise interne. De ce fait, en augmentant leur dépendance à des fournisseurs externes, les administrations publiques vont à contre-courant de la nécessaire appropriation des compétences et des usages numériques par les organisations.

Les données, leur valorisation et leur exploitation, sont au cœur de l’économie de l’ère numérique. Nous avons encore le choix entre devenir les bâtisseurs ou rester les clients d’outils technologiques, tout comme nous avons encore le choix entre exploiter nos contenus et en céder le contrôle.

Tout comme le système du catalogue de BAC, combien de temps nous reste-t-il avant de devenir numériquement obsolètes?

Que restera-t-il de la commission Charbonneau?

Initialement publié dans le blogue de Direction informatique, le 10 mars 2014.

La Commission d’enquête sur l’octroi et la gestion des contrats publics dans l’industrie de la construction a récemment invité les citoyens et les organismes à s’exprimer relativement à l’infiltration de la corruption au sein de processus de gestion publique.

La commission qu’on appelle communément « Commission Charbonneau » devrait favoriser, entre autres, l’implantation d’un système plus intègre et plus équitable. Mais est-ce bien suffisant?

Signalisation-Rond-point

Ce ne sont pas uniquement les processus qu’il faut réviser, c’est aussi l’organisation de l’information : ce qui la rend signifiante et qui facilite le repérage des anomalies et des schémas récurrents.

En janvier dernier, avait lieu à Montréal OpenContracting, une première rencontre sur la standardisation des données relatives aux projets d’aide internationale. La normalisation des métadonnées, ces descripteurs qui décrivent un ensemble de données, permet de connecter entre elles des sources d’information et d’améliorer la traçabilité des flux financiers. La Banque mondiale s’intéresse à cette initiative, car les programmes d’aide au développement sont désormais scrutés par des citoyens et des organismes qui attendent une reddition de compte. Il y a partout, au sein des entreprises comme des gouvernements, un urgent besoin d’organisation et de normalisation des données afin de faciliter le travail des vérificateurs.

Quand on parle de normes et standards dans le domaine des technologies de l’information, on pense surtout à la programmation, aux infrastructures ou aux protocoles, mais rarement aux métadonnées. Et pourtant, comment prendre de bonnes décisions quand les données de nos systèmes ne peuvent se connecter entre elles ?

Connecter les ensembles de données

Au sein de processus, comme la gestion de contrats publics, il faudrait une politique de qualité des données et des principes auxquels devraient se conformer les concepteurs de bases de données. Voici quelques exemples :

  • La nomenclature de champs commune
  • Les formats de métadonnées standards
  • Les règles d’intégrité des données (ex.: champ non renseigné et sans explication, valeur incohérente, orthographe inconstante)

Les journalistes qui ont travaillé avec les données comme celles du Système électronique d’appels d’offres (SEAO) du gouvernement du Québec, entre autres, ont pu constater que ces principes ne sont pas appliqués.

Uniformiser les soumissions

Il est beaucoup plus facile d’analyser les renseignements concernant une entreprise, ainsi que les éléments qui sont inclus dans une soumission, lorsque toutes les données requises sont recueillies à l’aide d’un formulaire – d’une façon similaire à une déclaration de revenu. Autrement, les éléments essentiels sont noyés dans un document qui peut dépasser une centaine de pages.

Il faut donc souhaiter l’uniformisation du format des soumissions par l’imposition d’un support numérique, d’une structure et de champs identiques à tous les soumissionnaires d’un même appel d’offres.

La mise à disposition de données fiables, de qualité et à jour est le moyen le plus efficace et le moins coûteux pour contrecarrer la systématisation de pratiques illégales au sein des administrations publiques. Exposer les lacunes du processus et les dérives d’un système est nécessaire, mais il est essentiel, pour une administration publique efficace, vigilante et transparente, d’investir dans la normalisation de ses ensembles de données.

Adopter des principes et des règles communes

Ce qu’il faut retenir des événements de la Journée internationales des données ouvertes, le 22 février dernier, c’est que différentes administrations publiques se préparent à favoriser l’interconnexion des données.

En effet, les villes de Montréal, Québec, Gatineau, Sherbrooke ainsi que le gouvernement du Québec ont convenu de l’adoption d’une licence commune pour la mise à disposition des ensembles de données ouvertes. Il s’agit d’un gros coup de barre vers la normalisation, alors que les silos technologiques, structurels et culturels prévalent au sein des organisations.

Que restera-t-il des révélations de la commission Charbonneau si nous ne nous attaquons pas au cœur du problème qu’est la qualité de l’information?