Archives par mot-clé : normes

La culture à l’ère numérique: dans le web des données plutôt que sur une plateforme

Tenter de concurrencer les géants des contenus numériques en proposant nos propres plateformes, comme le proposait Alexandre Taillefer, est une mauvaise bonne idée; surtout dans le domaine culturel. Voici pourquoi:

NON: centraliser l’information dans une base de données

C’est une mauvaise idée, parce qu’il s’agit d’un concept qui va à contre-courant de l’Internet de Tim Berners-Lee: connaissances partagées, production de contenus décentralisée, modèles distributif et collaboratif, données ouvertes et liées, perspectives à la fois locale et globale. Développer une plateforme afin de centraliser dans une base de données l’information concernant des contenus culturels c’est soustraire ces derniers aux connexions potentielles avec d’autres données à travers le monde.

Louis-Jean Cormier dans DBpedia, version sémantique de Wikipédia
Louis-Jean Cormier dans DBpedia, la facette web sémantique de Wikipédia.

Le contenu des bases de données est « sous le web« ,  c’est à dire inaccessible et incompréhensible pour les moteurs de recherche et applications qui ratissent le web en quête de données qui font du sens. La transition d’un web des documents vers le web des données, et, par conséquent, de la préférence visible des moteurs de recherche pour le sémantique (Google et les données structurées), ne font plus de doute. S’exposer dans le web des données ouvertes et liées constitue une bien meilleure stratégie, pour la valorisation des contenus,  le développement de modèles économiques et l’acquisition d’une culture de la donnée, que la reprise d’un concept datant du premier âge du web.

Alors, pourquoi continuer à financer des silos d’information qui interdisent toute possibilité de liens entre nos contenus et l’intention ou le parcours de consommateurs , où qu’ils se trouvent ?

OUI:  mutualiser les ressources pour publier et agréger des données 

La bonne idée est celle de la mutualisation d’équipement et de ressources pour réaliser un projet collectif. Là se trouve le véritable défi de la « révolution numérique »: apprendre à se faire confiance et à collaborer pour développer une valeur collective. Apprentissage d’autant plus difficile que l’offre culturelle est abondante et que notre attention, elle, est limitée.

Publier des données dans le web, comme on le fait pour des pages de sites internet, permet d’éviter les problèmes d’interopérabilité des bases de données tout en préservant l’autonomie des producteurs de données. Il devient, par la suite, possible de collecter et d’agréger ces données afin de les exploiter pour les rendre réutilisables pour des organismes touristiques, pour créer des interfaces d’exploration et, même, pour concevoir des agents intelligents qui feront des suggestions de contenus personnalisées. Mieux que tout autre documentation, cette vidéo produite par la Fondation europeana, explique en 3 minutes ce qu’est le web des données ouvertes et liées et pourquoi il est devenu si important pour la diffusion de la culture.

Le développement de cette infrastructure commune peut être pris en charge par l’État, comme c’est le cas pour Europeana, où l’Union européenne et chacun des états contributeurs, soutiennent les infrastructures et ressources qui permettent aux institutions culturelles de publier leurs données collectivement.  L’État peut également faire appel au milieu académique et au secteur de la recherche, à l’image de l’entente récemment conclue, en France, entre le Ministère de la Culture et de la Communication et l’Inria, afin de soutenir le projet SemanticPedia.

Bien que le web sémantique soit utilisé dans des domaines aussi divers que les services hydroélectriques (Hydro-Québec) et la radiodiffusion (BBCMusic), nous persistons à nous tourner vers des technologies conventionnelles pour diffuser nos contenus culturels. Passer de l’informatique au numérique est clairement un changement difficile à opérer, même dans  une industrie de pointe.

Pour aller plus loin

Pour les technophiles: Le web sémantique en 10 minutes, vidéo produite lors de l’édition 2016 du colloque sur le web sémantique au Québec, dans le cadre du 84e congrès de l’ACFAS.

Libérer le potentiel de nos données culturelles ou laisser d’autres en tirer profit

Silos riachuelo

Tu peux produire de l’excellent contenu, mais s’il ne fait pas partie du web, il ne fait pas partie du discours universel.

Tim Berners-Lee, en entrevue avec Jean-François Coderre pour La Presse.

C’est une affirmation que de nombreux états, institutions et entreprises tiennent désormais pour une réalité. Une réalité que plusieurs expérimentent depuis quelques années déjà et qui s’impose encore davantage à ceux qui observent les transformations qui sont à l’œuvre  dans le web , notamment du côté des moteurs de recherche.

Alors, ne devrions-nous pas élaborer une approche stratégique afin de regrouper et de structurer notre offre culturelle plutôt que d’encourager la production de silos d’informations qui sont difficilement exploitables ?

Comment tirer notre épingle du jeu numérique ?

Il faut nous attaquer à la dispersion de l’offre culturelle, d’une part, et d’autre part, à l’absence de vision transverse sur les données. Autrement, incapables de développer nos propres modèles d’exploitation numériques, nous risquons d’être confinés aux rôles de fournisseurs et de clients de plateformes beaucoup plus attractives et efficaces que nos sites web.

Principal défi: sauf dans des domaines, comme les bibliothèques et  les archives, les organisations ont, en général, peu d’intérêt ou de ressources à investir pour la production de métadonnées standards. Cela pourrait cependant changer.

Données structurées pour moteurs de recherche en quête de sens

Les moteurs de recherche privilégient de façon croissante les contenus web dont la description leur est fournie par des données structurées (appelées quelquefois,métadonnées embarquées). Schema est le modèle de métadonnées soutenu par les grands acteurs du numérique, tels que Google, Microsoft et Apple afin d’alimenter les algorithmes qui fournissent de l’information plutôt que des listes de résultats. Google offre même aux développeurs des modèles descriptifs pour des types de contenus dont la liste s’allonge progressivement.

L’utilisation de la base de connaissance Knowledge Graph, d’un modèle de métadonnées qui est dérivé de la syntaxe du web sémantique (RDF ou Resource Description Framework) et d’un  format d’encodage de données liées (JSON-LD ou Java Script Object Notation for Linked Data) témoigne de la préférence de Google pour le web des données et les liens permettant de générer du sens.

Avec Schema, qui facilite l’intégration des données dans des pages HTML (il existe également des extensions spécialisées pour WordPress), les robot indexeurs et les algorithmes des moteurs de recherche deviennent donc beaucoup plus performants. Il n’est déjà plus nécessaire de quitter leur interface pour trouver une information ou découvrir, par exemple, de nouveaux groupes musicaux.

La production de données structurées est une technique qui deviendra rapidement aussi essentielle que l’optimisation de pages web. Mais une technique, aussi efficace soit-elle, n’est qu’un moyen et ne peut remplacer une stratégie.

Regrouper et structurer notre offre culturelle

Les données doivent pouvoir être extraites des silos existants et reliées entre elles grâce à des métadonnées communes. Les éléments d’information produits par chacun des acteurs du milieu des arts et de la culture peuvent ainsi être reliés de façon cohérente afin de constituer une offre d’information globale et riche et de nous fournir une meilleure visibilité sur les données relatives à l’accès et à l’utilisation de contenus.

Comment accompagner la transition ?

Comment extraire les données descriptives des bases de données et les normaliser ? Comment définir les métadonnées qui formeraient les éléments descriptifs essentiels pour permettre de relier entre eux des ensembles de données qui  utilisent des référentiels standards mais différents ? Et, surtout, comment convaincre les producteurs de données de l’importance de l’interopérabilité et de la structuration intelligente des données ?

Dans cette perspective et afin de travailler collectivement à définir des pistes d’action, nos politiques et programmes devraient jeter les bases d’un projet de mise en commun des données culturelles en soutenant:

  • L’adoption des meilleures pratiques en matière d’indexation de contenu avec des métadonnées et une syntaxe de description qui s’adressent aux machines;
  • L’élaboration d’un un ensemble de métadonnées de base (modèle de médiation) qui permette de « faire la traduction » entre les différents standards et vocabulaires employés selon les domaines (musique, cinéma, arts visuels) et les missions (bibliothèque, archives, commerce, gestion de droits);
  • La libération des données qui décrivent nos créations artistiques, nos produits culturels, nos talents et notre patrimoine. Les données ouvertes constituent une première étape vers la diffusion de données ouvertes et liées.
  • L’acquisition des compétences techniques et technologiques qui sont requises afin de concevoir et de maintenir des outils pour faciliter la saisie et la réutilisation des données par les acteurs concernés.
  • L’harmonisation des différents modèles d’indexation documentaire (référentiels transversaux pour la production des données culturelles, cartes d’identité des biens culturels) au sein du Ministère de la Culture et des Communications.
  • Une étroite collaboration entre les institutions et les organismes producteurs de données autour de la rédaction d’une politique des métadonnées culturelles.

On ne devient numérique qu’en le faisant. Mais c’est un chantier qui repose davantage sur la collaboration et la mise en commun de l’information que sur la technologie.

Contenus culturels: sous, sur ou dans le web ?

Mise à jour 2016-12-10: Clarifications suggérées par Christian Aubry. Illustration: substitution du terme « lisibles » par « compréhensibles ». Conclusion: clarification du sens du paragraphe.

Sous, sur ou dans le web ? Nos contenus culturels sont-ils dans le web des données ?
Nos contenus culturels sont-ils dans le web des données ? Rapport-synthèse produit pour la SODEC, avril 2016

Où en est le web ? Les signes d’une transformation importante sont bien présents, mais diffus et disséminés parmi les différentes facettes d’un amalgame de technologies, connaissances, modèles de pensée, industries, usages et comportements. L’annonce d’une initiative européenne de valorisation de la connaissance dans un web spatiotemporel, Time Machine, évoque une très proche discontinuité :

La seconde révolution de l’Internet commence maintenant, avec la mort annoncée des moteurs de recherche du présent et l’entrée en scène d’une manière d’indexer l’information.

Nous sommes entrés  dans une ère où il ne sera plus nécessaire de quitter l’interface d’un moteur de recherche pour accéder à la connaissance et où les applications de recommandations s’alimentent à de larges ensembles de données structurées et signifiantes.

De moteurs de recherche à moteurs de réponses et de connaissances

La liste de résultats des moteurs de recherche fait graduellement une place de choix à une réponse ou une proposition. Bien que les machines ne parlent pas le langage des humains, elles peuvent interpréter la syntaxe et les marqueurs qui sont utilisés spécifiquement pour décrire  une chose, une personne ou un concept abstrait.

La fiche qui apparaît dans le coin supérieur droit de l’écran du moteur de recherche Google tend à prendre plus d’espace alors que nous apprenons à publier l’information que nous souhaitons visible, persistante et connectée. Pour cela, il faut aller bien au-delà des techniques d’optimisation de pages web et apprendre à publier les données qui décrivent nos contenus selon des modèles normés. L’information représentée selon un modèle et des métadonnées standards devient alors  compréhensible et exploitable pour les applications qui ratissent le web.

Du web des documents au web des données (et du sens)

Mais où sont les données qui décrivent nos contenus culturels ?Elles sont sous le web, malheureusement Les répertoires, collections, fonds et même, les calendriers de représentations et de tournées sont stockés sous forme de bases données. Celles-ci ne sont pas accessibles aux machines qui repèrent et collectent des données pour les moteurs de recherche, agrégateurs, systèmes automatiques d’archivage et autres moissonneurs de données qui s’activent dans le web. Même si ces machines avaient accès aux bases de données, elles ne disposeraient pas des clés nécessaires pour reconstituer et interpréter l’information.

Les modèles numériques carburent à la donnée

Au constat de l’absence de notre patrimoine et de nos productions artistiques et culturelles du web s’ajoute celui de l’absence d’une culture de la donnée.  Comme je le partageais dans un mémoire sur le renouvellement de la politique culturelle, sans maîtrise de la donnée:

  • Les tenants et aboutissants de la transition numérique accomplie par les précurseurs nous échappent et nous n’en retenons que les manifestations externes.
  • Nous demeurons uniquement les fournisseurs de contenu des plateformes qui tirent dorénavant plus de valeur des données décrivant ces contenus et celles qui sont générées par leur utilisation que des contenus eux-mêmes.
  • Nous ne pouvons pas repérer et interpréter les signaux faibles du changement et nos indicateurs de mesure ne permettent pas une lecture adéquate des multiples facettes de la vie culturelle dans nos univers physiques et numériques.
  • Nous nous limitons à la promotion des nouveautés pendant que nos catalogues, répertoires et collections, échappent à la découverte et à la possible réutilisation qui leur donnera une seconde vie.

Afin d’illustrer mon propos, voici une anecdote: j’ai passé près de deux heures à explorer de nombreuses œuvres musicales en me renseignant sur la musique western. J’ai exploré les chansons des sœurs Boulay et je me suis éparpillée entre des productions commerciales et artisanales. Je n’ai pas quitté Google, en passant de vidéos à des listes de titres populaires.

C’est bien pour la découverte de la musique d’ici, mais:

  • Qui a collecté mes données personnelles et d’usage ?
  • Qui a accru sa connaissance d’un marché en analysant mon comportement et mes préférences ?
  • Qui a engrangé la matière première qui fait de ses services, aussi efficaces qu’attractifs, un modèle d’affaires extrêmement profitable ?

Découvrabilité: pour développer une culture de la donnée

Ce n’est pas la découvrabilité numérique qui fait la réussite des modèles d’affaires des plateformes numériques, c’est ce qui lui permet de réaliser son potentiel: l’exploitation et la valorisation de l’information. Or, dans nos universités, nos programmes de sciences de l’information sont presqu’exclusivment orientés vers la gestion de collections de documents et, du côté des technologies de l’information, le web des données n’est qu’un sujet optionnel du programme de maîtrise. Il serait temps d’élaborer un programme universitaire de deuxième cycle pour allier les perspectives et connaissances en information (indexation et modélisation) et en informatique (web sémantique).

Si nous ne maîtrisons pas les principes et techniques nécessaires à l’exploitation de nos contenus culturels dans le web, comment pourrons-nous soutenir les nouveaux acteurs d’une économie numérique ? Comment répondrons-nous aux besoins d’expertise dans les créneaux émergents comme l’intelligence artificielle, les crypto monnaies (Bitcoin) ou les registres de transactions distribués (Blockchain) ?

 

Stratégie numérique pour le Québec: sur les modèles d’une nouvelle économie

Site de la consultation sur la stratégie numérique, Ministère de l'Économie, de la Science et de l''Innovation, Québec.

Mes contributions, dans le cadre de la consultation sur la stratégie numérique du Ministère de l’Économie, de la Science et de l’Innovation du Québec. Celles-ci témoignent de ma perspective, qui est essentiellement orientée vers les sciences de l’information. Et c’est d’une pluralité de regards et d’expertises sur les enjeux des transformations en cours dont nos dirigeants ont besoin.

C’est malheureusement, pour ceux et celles qui souhaiteraient offrir autre chose qu’une liste de souhaits, une démarche qui appartient plus à la réalisation d’une étude de marché qu’à un processus structuré d’écoute pour enrichir une réflexion (décision?) gouvernementale. Voici mes contributions fournies en quatre temps, compte tenu de l’espace accordé, mais qui sont ici, allongées de quelques mots afin d’en préciser le sens.

Économie numérique 1/4 – Les modèles
Des modèles d’affaires centrés sur l’exploitation de l’information: la donnée a plus de valeur que le produit qu’elle décrit et l’exploitation de données est plus rentable que la production de ressources. Nous n’avons pas de culture de la donnée (absence de normalisation et d’interopérabilité des bases de données, au sein d’un même système d’information et entre organisations apparentées).

Économie numérique 2/4 – Les données
Les données de nos BD sont inexploitables dans le web (normalisation, interopérabilité, sémantique) parce que nous concevons des systèmes sans penser à générer de l’information pour qu’elle soit largement diffusée. Nous formons des professionnels compétents mais nous les confinons à la gestion de bibliothèques.

Économie numérique 3/4 – Les compétences
Nous sommes mal équipés pour comprendre et réagir rapidement aux changements en cours. Nous passons du web des documents au web des données. Nous risquons d’être mis hors jeu par des joueurs qui participent à l’élaboration des règles que nous ne maîtrisons pas, alors que nous focalisons sur le développement d’outils.

Économie numérique 4/4 – Le web des données
La capacité de découvrabilité de nos produits dépend de plateformes étrangères qui, elles, s’enrichissent avec l’exploitation des données que nous générons. Allons-nous continuer à soutenir le développement de silos de données ou apprendre les changements qui  sont à l’oeuvre dans le web  et à quoi servent des métadonnées?

La donnée est l’élément pivot d’une nouvelle politique culturelle

Nos contenus culturels sont-ils dans le web des données ?

Mémoire déposé dans le cadre de la consultation publique pour le renouvellement de la politique culturelle du Québec, 8 mai 2016.

Représentation du web des données ouvertes liées - 2014

Parmi tous les documents publiés — tant par les gouvernements du Québec et du Canada que par les institutions et organismes préoccupés par le nécessaire renouvellement d’une politique culturelle dans un contexte de transition numérique — il n’est fait aucune mention de la donnée. Celle-ci est pourtant au cœur du « numérique » (peu importe la définition choisie) si bien qu’il est impossible d’élaborer une vision, une politique et des programmes qui soient cohérents et qui aient un impact réel et de longue durée sans une compréhension fine de ce dont il s’agit.

Comprendre la donnée, c’est être en mesure de répondre à la plupart des questions qui se trouvent sous les sept thèmes du document de consultation et, de manière plus générale, à celles-ci :

  • Quels sont les éléments fondamentaux sur lesquels il faut agir pour que la politique culturelle fasse émerger des projets et actions ayant un impact transformateur et durable sur l’économie de la culture?
  • Que devrait-on retenir des orientations qui façonnent les stratégies et les programmes d’états ayant une structure de soutien similaire à celle du Québec?
  • Comment des programmes peuvent-ils avoir une portée transversale sur les trois principaux axes de la politique que sont :
    (1) l’affirmation de l’identité culturelle,
    (2) le soutien aux créateurs et aux arts et
    (3) l’accès et la participation des citoyens à la vie culturelle?

Ces questions ont orienté la rédaction de ce mémoire. Celui-ci a été rédigé à partir d’un rapport-synthèse réalisé à la demande de la SODEC afin de dégager les éléments essentiels à son appréhension du contexte au sein duquel les créateurs et entreprises culturelles vivent désormais.  Lire le mémoire

Données ouvertes: comment améliorer la qualité et l’utilisabilité des ensembles

 

Commission européenne - Formation en ligne sur la qualité des données ouvertes

 

Éléments d’information pour la préparation d’un atelier dans le cadre d’un événement montréalais pour la Journée internationale des données ouvertes, le 21 février prochain, à la Maison Notman.

Voici des enjeux et des exemples qui sont susceptibles de réunir des représentants des gouvernements, des organismes et des citoyens autour d’une démarche constructive.

Littératie de l’information et culture des données

Développer une culture des données pour que la libération de données soit plus qu’une démonstration de transparence : le développement d’écosystèmes actifs et diversifiés.

L’open data est-il un leurre politique ?

Nous avons besoin d’une culture qui fasse bien comprendre qu’une donnée n’est pas quelque chose de naturel, mais de construit. Les données sont construites, produites, et le processus de fabrication est aussi important que la donnée en elle-même.

Curation des données: améliorer le rendement de la libération des ensembles

Il n’est pas suffisant de libérer des données: il faut pouvoir les trouver et comprendre ce à quoi elles peuvent servir. Ceci implique un catalogage précis des ensembles: type d’information, origine, secteurs d’activités concernés, liste des données, période couverte de même qu’une indexation par mots clés contrôlés et par les utilisateurs (folksonomie). L’indexation permet de relier entre eux des ensembles de données quelque soit leur origine et leur classification.

Sorting Through the Government Data Explosion

All the data the American government is pouring onto the Web will be useful only if people can make sense of it. What’s needed are tools for sorting, combining and presenting raw data sets in visual form.

Approche centrée sur l’utilisateur

Accéder à l’information municipale, provinciale et fédérale qui concerne notre lieu de résidence ou la localisation de notre entreprise. Remédier à la dispersion de l’information (qui, quoi, quand, où?) par la standardisation des métadonnées et l’interopérabilité des ensembles de données.

The biggest failure of open data in government

Do you know all the different government bodies and districts that you’re a part of? Do you know who all your elected officials are? Do you know where and when to vote or when the next public meeting is? Now perhaps you’re thinking that this information is easy enough to find, so what does this have to do with open data? It’s true, it might not be too hard to learn about the highest office or who runs your city, but it usually doesn’t take long before you get lost down the rabbit hole. Government is complex, particularly in America where there can be a vast multitude of government districts and offices at the local level.

Interopérabilité des données quelque soit leur origine

Un guide pour favoriser l’interopérabilité des ensembles de données. Métadonnées descriptives de base : organisation, événement, personne, législation.

The Open Civic Data Project – Sunlight Foundation

Using Open Civic Data makes it is easier for governments to share data and for people to engage with their governments. Open Civic Data also provides guidance on how to publish all of this information so it can be shared across city, county and state jurisdictions. Adoption of Open Civic Data can:

  • Make content about local governments easier to find.
  • Provide a clear path for archiving and relating data across years.
  • Help governments make their data more open to citizens and developers alike.
  • Increase data portability across cities, counties and states.

Standards d’interopérabilité : modèles d’approches

Utiliser un langage commun à tous les services du gouvernement qui produisent des données pour la description des ensembles de données. Standards d’interopérabilité de la politique de qualité des données du gouvernement de l’état du New South Wales, Australie.

Data Interoperability Standards

The links below provide access to data standards which support data interoperability and exchange of information by NSW Government agencies.

Standards offer a common language enabling agencies to appropriately share or compare data managed across diverse systems.

  • Standard Approach to Metadata (pdf)
  • Standard Approach to Information Architecture (pdf)
  • Standard for Customer Reference Data (pdf)
  • Standard for Spatially Enabling Information (pdf)
  • Standard for Human Services Classification (pdf)
  • Standard for Data Quality Reporting (pdf)

Facteurs contribuant à la réutilisation des données

Éléments communs des meilleures pratiques de gestion de données ouvertes. Série de présentations du groupe Open Data Support, au sein de la Communauté européenne.

La qualité des Données et Métadonnées Ouvertes

  • Fournir des descriptions appropriées aux données (métadonnées);
  • Utiliser des vocabulaires standards pour les données et métadonnées;
  • Spécifier la licence sous laquelle les données peuvent être réutilisées;
  • Respecter les exigences légales en matière de protection de données personnelles et autres données sensibles;
  • Représenter les métadonnées et les données selon les principes de données libres en utilisant les URIs persistants pour identifier les ressources;
  • Fournir des informations sur la source des données.

 

Littératie des données: transparence et qualité de l’information

Commission européenne - Formation en ligne sur la qualité des données ouvertes
Commission européenne – Formation en ligne sur la qualité des données ouvertes

Nous avons besoin d’une culture qui fasse bien comprendre qu’une donnée n’est pas quelque chose de naturel, mais de construit. Les données sont construites, produites, et le processus de fabrication est aussi important que la donnée en elle-même. Evelyn Ruppert, sociologue spécialiste des données.

Données ouvertes, journalisme de données, intelligence d’affaires et exploitation de la datamasse (big data, au sens de biomasse): les données sont les principales ressources de l’ère numérique. La qualité des données et la normalisation des ensembles de données sont cependant des enjeux qui demeurent généralement ignorés dans les projets numériques.  Il n’est donc pas étonnant que l’information dont nos gouvernants et nos institutions disposent soit difficilement exploitable et peu fiable.

Mémoire déposé à la commission Charbonneau

Le 13 juin 2014, j’ai déposé un mémoire dans le cadre des consultations publiques de la Commission d’enquête sur l’industrie de la construction (commission Charbonneau) qui vise plus particulièrement l’attribution de contrats publics.

Lire  le mémoire que j’ai déposé à la commission Charbonneau.

Mise à jour (14 juillet 2014)

Je tiens à souligner qu’à ma connaissance deux autres mémoires ciblent spécifiquement le rôle essentiel que joue la libération des données publiques dans l’établissement de processus transparents et équitables:

NordOuvert /OpenNorth

Rôle des données ouvertes pour diminuer la corruption et les bonnes pratiques internationales en matière de divulgation des données sur les marchés publics.

Hackons la corruption

Projet de citoyens visant à combattre la corruption en améliorant la transparence des contrats publics publiés sur le site du Système électronique d’appels d’offres (SEAO.ca)

FACIL 

Organisme sans but lucratif dont le mandat est de promouvoir l’adoption, l’usage et la démocratisation de l’informatique libre.  N’ayant pas pu publier de mémoire, FACIL a transmis ses commentaires à la Commission dont en voici un extrait:

Pour le dire sans détour, nous croyons que les systèmes publics d’information à la disposition des citoyens pour l’exercice de leurs devoirs de surveillance des activités de l’État doivent être revus complètement afin de les rendre compatibles avec l’éthique de l’informatique libre. C’est à cette condition qu’ils seront vraiment utiles autant aux citoyens lambda qu’aux élus et aux fonctionnaires.

Les trois documents que nous vous présentons traitent, dans l’esprit du «gouvernement ouvert», des critères que doivent rencontrer les systèmes informatiques de divulgation de l’information sur les marchés publics et le lobbyisme. Le premier a été produit par FACIL, tandis que les deux autres sont des traductions de FACIL. Mathieu Gauthier-Pilote, membre du conseil d’administration de FACIL

Le «Dossier gouvernement ouvert» peut être consulté sur le wiki de FACIL: http://wiki.facil.qc.ca/view/Dossier_gouvernement_ouvert

Il est très encourageant de constater la présence d’acteurs du secteur numérique  parmi les propositions soumises aux consultations publiques dans le cadre de cette commission d’enquête.

Serons-nous clients ou bâtisseurs de la nouvelle économie?

Initialement publié dans le blogue de Direction informatique, le 8 avril 2014.

Program or be programmed - David Rushkoff

Il y a plus d’avantages à être celui qui contrôle un système que celui qui l’utilise.

L’intense compétition entre les acteurs mondiaux des technologies de l’information et l’importance des investissements consentis par plusieurs gouvernements témoignent du passage de l’ère industrielle à celle du numérique.

Malheureusement, il semble qu’au Québec et au Canada, nous ayons choisi d’être des clients plutôt que de figurer parmi les bâtisseurs de la nouvelle économie.

La semaine dernière, on apprenait que Bibliothèque et Archives Canada (BAC) se prépare à remettre la gestion de son catalogue à OCLC, une organisation basée aux États-Unis, faute d’avoir trouvé chez nous un fournisseur capable d’effectuer la modernisation de son système de gestion. Comme c’est le cas dans la plupart des organisations, BAC est aux prises avec un système qui est désuet et ne répond pas aux exigences d’interopérabilité et de flexibilité des réseaux d’information collaboratifs.

Les professionnels des sciences de l’information connaissent bien OCLC (Online Computer Library Center), un organisme à but non lucratif à qui on doit, entre autres, WorldCat, l’agrégation des catalogues de bibliothèques publiques du monde, et Dublin Core, le schéma de métadonnées normalisé qui permet de décrire des ressources numériques. Il ne fait aucun doute que le développement du nouveau système de BAC serait ainsi entre de bonnes mains, même s’il n’est pas souhaitable que les données du patrimoine documentaire et culturel canadien soient hébergées hors de nos frontières.

Cette nouvelle soulève par ailleurs trois enjeux importants pour notre avenir dans une économie numérique :

1. Les systèmes collaboratifs et les données connectées

Il est inquiétant qu’aucune entreprise canadienne du secteur des technologies de l’information ne puisse satisfaire les besoins de BAC. Ce sont des besoins très similaires à ceux des administrations publiques, notamment, dans le contexte des systèmes collaboratifs et du partage de données.

2. L’expertise de l’information

L’exploitation de données n’est pas uniquement une question de technologie. C’est également la maîtrise des principes, méthodes et normes d’organisation des données et des contenus que l’on retrouve en bibliothéconomie et en sciences de l’information. Il y a encore trop peu de spécialistes de l’information là où il le faudrait, notamment en amont des grands projets numériques.

3. La présence numérique

Étrangement, lorsqu’on recherche sur Internet nos créations artistiques et notre patrimoine culturel, les sites des grands acteurs du commerce électronique devancent généralement ceux de nos institutions culturelles. Quand ils ne sont pas inaccessibles aux internautes, les catalogues de nos bibliothèques, musées et autres diffuseurs sont en effet invisibles pour les moteurs de recherche.

4. La dépendance technologique

En sous-traitant la maîtrise d’oeuvre et l’hébergement de projets numériques, les gouvernements privatisent peu à peu l’information, fragmentent des ensembles de données qui devraient être interconnectés et renoncent à développer une expertise interne. De ce fait, en augmentant leur dépendance à des fournisseurs externes, les administrations publiques vont à contre-courant de la nécessaire appropriation des compétences et des usages numériques par les organisations.

Les données, leur valorisation et leur exploitation, sont au cœur de l’économie de l’ère numérique. Nous avons encore le choix entre devenir les bâtisseurs ou rester les clients d’outils technologiques, tout comme nous avons encore le choix entre exploiter nos contenus et en céder le contrôle.

Tout comme le système du catalogue de BAC, combien de temps nous reste-t-il avant de devenir numériquement obsolètes?

Que restera-t-il de la commission Charbonneau?

Initialement publié dans le blogue de Direction informatique, le 10 mars 2014.

La Commission d’enquête sur l’octroi et la gestion des contrats publics dans l’industrie de la construction a récemment invité les citoyens et les organismes à s’exprimer relativement à l’infiltration de la corruption au sein de processus de gestion publique.

La commission qu’on appelle communément « Commission Charbonneau » devrait favoriser, entre autres, l’implantation d’un système plus intègre et plus équitable. Mais est-ce bien suffisant?

Signalisation-Rond-point

Ce ne sont pas uniquement les processus qu’il faut réviser, c’est aussi l’organisation de l’information : ce qui la rend signifiante et qui facilite le repérage des anomalies et des schémas récurrents.

En janvier dernier, avait lieu à Montréal OpenContracting, une première rencontre sur la standardisation des données relatives aux projets d’aide internationale. La normalisation des métadonnées, ces descripteurs qui décrivent un ensemble de données, permet de connecter entre elles des sources d’information et d’améliorer la traçabilité des flux financiers. La Banque mondiale s’intéresse à cette initiative, car les programmes d’aide au développement sont désormais scrutés par des citoyens et des organismes qui attendent une reddition de compte. Il y a partout, au sein des entreprises comme des gouvernements, un urgent besoin d’organisation et de normalisation des données afin de faciliter le travail des vérificateurs.

Quand on parle de normes et standards dans le domaine des technologies de l’information, on pense surtout à la programmation, aux infrastructures ou aux protocoles, mais rarement aux métadonnées. Et pourtant, comment prendre de bonnes décisions quand les données de nos systèmes ne peuvent se connecter entre elles ?

Connecter les ensembles de données

Au sein de processus, comme la gestion de contrats publics, il faudrait une politique de qualité des données et des principes auxquels devraient se conformer les concepteurs de bases de données. Voici quelques exemples :

  • La nomenclature de champs commune
  • Les formats de métadonnées standards
  • Les règles d’intégrité des données (ex.: champ non renseigné et sans explication, valeur incohérente, orthographe inconstante)

Les journalistes qui ont travaillé avec les données comme celles du Système électronique d’appels d’offres (SEAO) du gouvernement du Québec, entre autres, ont pu constater que ces principes ne sont pas appliqués.

Uniformiser les soumissions

Il est beaucoup plus facile d’analyser les renseignements concernant une entreprise, ainsi que les éléments qui sont inclus dans une soumission, lorsque toutes les données requises sont recueillies à l’aide d’un formulaire – d’une façon similaire à une déclaration de revenu. Autrement, les éléments essentiels sont noyés dans un document qui peut dépasser une centaine de pages.

Il faut donc souhaiter l’uniformisation du format des soumissions par l’imposition d’un support numérique, d’une structure et de champs identiques à tous les soumissionnaires d’un même appel d’offres.

La mise à disposition de données fiables, de qualité et à jour est le moyen le plus efficace et le moins coûteux pour contrecarrer la systématisation de pratiques illégales au sein des administrations publiques. Exposer les lacunes du processus et les dérives d’un système est nécessaire, mais il est essentiel, pour une administration publique efficace, vigilante et transparente, d’investir dans la normalisation de ses ensembles de données.

Adopter des principes et des règles communes

Ce qu’il faut retenir des événements de la Journée internationales des données ouvertes, le 22 février dernier, c’est que différentes administrations publiques se préparent à favoriser l’interconnexion des données.

En effet, les villes de Montréal, Québec, Gatineau, Sherbrooke ainsi que le gouvernement du Québec ont convenu de l’adoption d’une licence commune pour la mise à disposition des ensembles de données ouvertes. Il s’agit d’un gros coup de barre vers la normalisation, alors que les silos technologiques, structurels et culturels prévalent au sein des organisations.

Que restera-t-il des révélations de la commission Charbonneau si nous ne nous attaquons pas au cœur du problème qu’est la qualité de l’information?

Données ouvertes : transformer le gouvernement

Initialement publié dans le blogue de Direction informatique, le 27 janvier 2014.

Si on peut s’interroger sur la qualité des ensembles de données ouvertes, comme c’est le cas pour celles du Système électronique d’appel d’offres (SEAO), que penser de celle des bases de données de l’appareil gouvernemental?

Jusqu’à présent, les professionnels des sciences de l’information étaient pratiquement absents des projets informatiques. Pourtant, la libération de données constitue une opportunité pour les spécialistes de l’organisation et de l’indexation de contenu, mais aussi pour les administrations qui souhaitent passer en mode numérique.

Principes de l'ouverture des données
Principes de l’ouverture des données – Portail des données ouvertes de la Ville de Montréal

Vecteur de changement

Le parlement de l’État du New South Wales en Australie, qui décrétait en novembre dernier que les données gouvernementales seraient ouvertes par défaut, a publié une politique pour assurer la qualité de ses données. Cette politique comprend des normes, des directives et des procédures pour une gestion des données et de l’information de manière sécuritaire, structurée et uniforme.

En libérant ses données par défaut, ce gouvernement oblige l’ensemble de ses ministères, agences et institutions à prendre les mesures nécessaires pour que les systèmes d’information soient conformes. Un tel changement en profondeur soutenu par le ministère des Finances.

Et ici?

De nombreux organismes, réseaux et initiatives citoyennes interagissent avec des représentants des administrations provinciale et municipales qui sont convaincus du rôle central des données pour le développement socioéconomique du Québec.

Voici deux activités d’intérêt qui auront lieu sous peu :

1. Des normes mondiales pour les contrats publics

Le 31 janvier prochain aura lieu à Montréal un atelier sur le développement de normes pour la divulgation des données des contrats publics.

L’adoption de normes communes est essentielle parce qu’elle permet de connecter des ensembles de données et d’analyser de l’information pour prendre de meilleures décisions.

C’est un événement auquel se devraient d’assister les représentants de l’administration, des technologies, des sciences de l’information, du monde des affaires.

2. Des données ouvertes pour se faciliter la ville

Le 22 février prochain, des événements auront lieu simultanément au Québec pour souligner la Journée internationale des données ouvertes. Pour l’occasion, la Ville de Montréal accueillera dans ses locaux de la rue Brennan une rencontre organisée par Québec Ouvert.

Les citoyens, les fonctionnaires, les entrepreneurs, les développeurs et les chercheurs qui souhaitent se tenir à jour sur les récents développements, échanger des informations, présenter des projets ou étendre leur réseau de contacts sont les bienvenus.

Harout Chitilian, le vice-président du comité exécutif de la Ville de Montréal, qui est responsable de la réforme administrative, du dossier de la Ville intelligente ainsi que des technologies de l’information, sera présent.

Amélioration ouverte

Dans le foulée de précurseurs comme les États-Unis et plusieurs pays d’Europe, de nombreuses administrations publiques libèrent des ensembles de données qu’elles mettent à la disposition des citoyens et entreprises.

En plus de la transparence, de telles initiatives permettent d’atteindre plusieurs objectifs, comme favoriser le développement d’applications, améliorer l’accès à l’information, accroître l’offre de services gouvernementaux, contribuer à la recherche et au démarrage d’entreprises.

Surtout, libérer des données c’est améliorer ses processus internes par l’adoption de normes reconnues et de meilleures pratiques. La libération de données est un vecteur de transformation organisationnelle.