Passer au contenu

OGGO Rapport du Comité

Si vous avez des questions ou commentaires concernant l'accessibilité à cette publication, veuillez communiquer avec nous à accessible@parl.gc.ca.

PDF

CHAPITRE QUATRE : POSSIBILITÉ D’UTILISATION UNIVERSELLE

Il ne suffit pas de publier des données pour qu’elles soient nécessairement considérées comme un exemple par excellence de données ouvertes […] [L]e principe des données ouvertes, c’est d’avoir des formats plus facilement réutilisables.
Lyne Da Sylva, professeure agrégée, École de bibliothéconomie 
et des sciences de l’information, Université de Montréal

Le troisième principe des données ouvertes, utilisation universelle, vise la diffusion du plus grand nombre de données dans le plus grand nombre de formats possibles. Tout au long de l’étude du Comité, des témoins ont suggéré des façons d’améliorer les formats de données et les fonctions de recherche afin que les données ouvertes soient réellement utilisables par tous, des chercheurs et des universitaires aux membres du grand public. Ces commentaires ont inspiré les recommandations du Comité sur des façons dont le gouvernement pourrait rendre ses données ouvertes plus accessibles et plus utilisables.

A. Formats de données

Avant l’avènement des données ouvertes, le gouvernement fédéral publiait plusieurs sources de données. Toutefois, celles‑ci n’étaient pas nécessairement présentées dans un format lisible par machine et étaient souvent protégées par des conditions de licence restrictives. Selon la DPI du gouvernement du Canada, les données ouvertes permettent aux utilisateurs de chercher et de télécharger des données dans des formats lisibles par machine afin de pouvoir élaborer des programmes et des systèmes d’information qui peuvent manipuler les données et produire d’autres utilisations.

Un des obstacles à l’utilisation de données ouvertes est les restrictions imposées par les licences d’utilisation. À cet égard, l’élaboration d’une licence d’utilisation des données ouvertes est essentielle. Le gouvernement fédéral a publié sa licence d’utilisation des données ouvertes en juin 2013. Pour sa part, M Deslauriers a expliqué que le gouvernement du Québec et les villes de Québec, de Gatineau, de Montréal et de Sherbrooke ont publié leur licence commune d’utilisation des données ouvertes en février 2014. Ces quatre villes et le gouvernement québécois ont aussi fusionné leurs portails de données ouvertes afin de créer un guichet unique. Mme Miller a signalé que les licences devraient être formulées de façon à permettre aux gouvernements de diffuser de l’information tout en demeurant propriétaires de l’information en question.

Selon un représentant du SCT, même si les ministères et organismes fédéraux sont « propriétaires » des données, « [c]ertaines lois n’autorisent pas le partage des données ». De son côté, Mme Ubaldi a déclaré qu’il y a aussi certaines restrictions du point de vue juridique qui concernent le partage de données dans le secteur public. Elle a expliqué que « [p]arfois, des groupes de données liées peuvent appuyer l’analyse des données, ce qui peut contribuer à relever des tendances pour l’amélioration des politiques et la prestation des services, mais il n’en demeure pas moins que certaines restrictions juridiques interdisent différents secteurs de l’administration à accéder à divers jeux de données »

Certains témoins ont même proposé des changements législatifs. Par exemple, de l’avis de M Eaves, le Canada devrait penser à ses jeux de données essentiels chaque fois qu’il adopte une nouvelle loi, et répondre à la question suivante : « Quels sont les ensembles de données essentiels qui permettent la transparence, de sorte que le public puisse déterminer si la loi fonctionne? » De plus, il a recommandé au gouvernement fédéral de mettre à jour sa Loi sur l’accès à l’information afin d’obliger ses ministères à répondre aux demandes de données avec des jeux de données présentés dans un format lisible par machine.

Plusieurs témoins, y compris Mme Ubaldi, pensent que les difficultés techniques que doivent surmonter les gouvernements en matière de données ouvertes incluent l’interopérabilité et l’intégration des données et les façons d’encourager l’établissement de liens entre les jeux de données qui seront diffusés en formats ouverts. Une représentante du gouvernement du Nouveau-Brunswick a déclaré que « [l’]un des problèmes, c’est qu’aujourd’hui, les données existent dans le format de chaque gouvernement, et que très peu d’entre eux utilisent les normes internationales ». Pour sa part, un représentant de la Ville d’Ottawa a confié au Comité qu’« [i]l est difficile d’établir des formats de données communs pour des sujets en particulier à tous les ordres de gouvernement, et la raison est simple : dans bien des cas, on doit composer avec différents types de données ». Au sujet de ce manque de normalisation, M Sharma pensait que le gouvernement fédéral a un rôle à jouer pour normaliser les formats et les protocoles afin que les applications créées localement puissent être utiles à d’autres gouvernements, à l’intérieur ou à l’extérieur du Canada.

Un représentant du SCT a expliqué que le gouvernement fédéral a intégré une échelle d’ouverture internationale sur son portail pour indiquer le degré d’ouverture des jeux de données. Cette échelle indique dans quelle mesure les données sont disponibles dans un format bien structuré et s’il faut un logiciel exclusif pour les lire. Les États-Unis, le Royaume-Uni et d’autres pays utilisent aussi cette échelle.

Le Comité a entendu plusieurs suggestions sur les formats les plus utiles pour la diffusion des données ouvertes. Selon M Chui, les formats de données devraient être lisibles par machine et bien que la plupart le soient déjà, « certaines formes de données sont plus faciles à utiliser [et] à traiter, comme les fichiers délimités par des virgules ».

De l’avis de quelques témoins, le meilleur format pour les données ouvertes est le Cadre de description des ressources (RDF). Mme Da Sylva a expliqué au Comité que le format RDF est le champion de la « réutilisabilité ». Elle a déclaré que le format RDF est très simple, mais aussi très structuré. Quoiqu’il soit difficile pour une personne d’écrire et de lire ce format, il peut être facilement manipulé par un ordinateur. Comme l’a dit un représentant du gouvernement de la Colombie-Britannique, « le format RDF est très intéressant et très performant, parce qu’il peut créer des interfaces entre différents jeux de données ».

Les valeurs séparées à l’aide de virgule (CSV) sont un autre format très répandu. Mme Da Sylva estimait qu’il est très facile de produire des données dans le format CSV et qu’aucune barrière technologique ne l’empêche. En outre, le format CSV peut être facilement manipulé par un ordinateur et peut être converti en format RDF.

Du côté des pratiques exemplaires internationales, Mme Da Sylva a déclaré au Comité que le Royaume-Uni diffuse bon nombre de ses jeux de données en format RDF. D’autres gouvernements diffusent leurs documents sous forme d’images PDF compressées, qui ne constituent pas un format souhaitable pour les données ouvertes. Elle a signalé aussi que certaines données fédérales sont présentées dans des fichiers textes compressés (fichiers « ZIP »), ce qui n’est pas non plus souhaitable étant donné que les données ne sont pas structurées et qu’elles sont beaucoup plus difficiles à analyser au moyen d’un ordinateur. En ce qui concerne les progrès du gouvernement fédéral, le président du Conseil du Trésor a fait remarquer que l’harmonisation des formats de données se poursuit.

Certains témoins ont exprimé des inquiétudes quant à la convivialité des données ouvertes des gouvernements pour le grand public. Un représentant du gouvernement de la Colombie-Britannique a dit que les données doivent être accessibles et utilisables. Selon Mme Francoli, « [l]e format brut dans lequel des jeux de données sont diffusés privilégie en fait les scientifiques des données, qui ont une grande expertise en données brutes. Bien d’autres organisations non gouvernementales, par exemple, pourraient avoir grand avantage à utiliser les jeux de données mais ne le peuvent pas tout simplement par manque de ressources et d’expertise » Un représentant du gouvernement de la Colombie-Britannique a renchéri en disant qu’« [i]l est donc important de s’assurer que les utilisateurs ont accès aux données, d’une façon conviviale et adaptée à leurs besoins ». Selon Mme Da Sylva, « [l]e site canadien est si énorme – on y trouve tant de choses – que cela peut prendre beaucoup de temps pour décider ce qui peut être utile ». En ce qui concerne la convivialité, un représentant du gouvernement de l’Ontario a suggéré que des outils de visualisation pourraient servir à corriger ce problème afin que l’information « soit plus facile à comprendre ».

B. Possibilité de trouver des données

Plusieurs témoins ont suggéré que le gouvernement fédéral mette au point une fonction de recherche fédérée, par l’entremise d’un moteur de recherche national, qui s’appliquerait aux données ouvertes des gouvernements fédéral, provinciaux et municipaux. Ce guichet unique faciliterait la recherche de données ouvertes sur des sujets précis provenant de tous les paliers de gouvernement au Canada. Un représentant du gouvernement de l’Ontario a déclaré que cette fonction « contribuerait à l’adoption et à l’utilisation des données ouvertes, puisqu’elle les rendrait plus accessibles ». Les représentants du gouvernement de la Colombie-Britannique, de la Ville de Toronto et de la Ville d’Ottawa étaient d’accord pour dire qu’il devrait y avoir une fonction de recherche fédérée pour les données ouvertes de gouvernements au Canada.

Une fonction de recherche fédérée permettrait également à chaque gouvernement ou administration de réaliser des économies d’échelle. Un représentant du gouvernement de l’Ontario a suggéré que les autres gouvernements pourraient collaborer et s’unir pour mettre au point un moteur de recherche commun. De cette façon, peu importe où sont les données, les utilisateurs pourraient effectuer des recherches dans les données gouvernementales fédérales, provinciales et municipales. Un représentant de la ville d’Ottawa était d’accord et a indiqué que le gouvernement fédéral pourrait prendre l’initiative de cet effort conjoint.

Le gouvernement fédéral est conscient de la valeur d’une fonction de recherche fédérée. La DPI du gouvernement du Canada a fait remarquer qu’« [i]l serait certainement très utile pour la société civile d’être capable d’utiliser des jeux de données provenant de partout au Canada sans rencontrer d’obstacles quant à leur utilisation ou à leurs modalités de licence ». Plus particulièrement, un représentant du SCT a expliqué que « dans nos collaborations internationales et dans notre collaboration nationale avec les provinces et les municipalités, nous avons découvert que c’est quelque chose qui est en demande chez les usagers […] Ainsi, au cours des prochaines années, nous allons travailler à créer le plus de liens possible entre les différents portails ainsi qu’entre les différents accès de façon à permettre une navigation assez transparente entre ces sites »

Par ailleurs, plusieurs témoins ont suggéré que les capacités de recherche soient élargies afin de permettre aux usagers d’effectuer des recherches par région géographique et par thème. Un représentant du gouvernement de la Colombie-Britannique a admis qu’il faudrait améliorer la capacité de trouver des données sur les portails de données ouvertes. La DPI du gouvernement du Canada a indiqué au Comité que son ministère travaille à l’échelle internationale avec le Royaume-Uni pour développer les capacités de recherche.

C. Informer le public

Pour ce qui est d’informer le public de l’existence du portail de données ouvertes, la DPI du gouvernement du Canada a déclaré au Comité qu’il n’y a pas de budget publicitaire distinct pour l’initiative de données ouvertes du gouvernement fédéral. Toutefois, elle a affirmé que le portail de données ouvertes fait l’objet d’activités de promotion en ligne par l’entremise de consultations et de moteurs de recherche. Plusieurs témoins conviennent que le gouvernement fédéral devrait faire de la publicité à propos de son portail de données ouvertes, mais ils avaient plusieurs suggestions quant à la meilleure façon de s’y prendre.

Certains témoins ont suggéré que la démarche à prendre devrait dépendre des utilisateurs que le gouvernement cible. Par exemple, M Stirling a dit que, au lieu de payer pour de la publicité, la meilleure façon de faire connaître le portail de données ouvertes serait d’envoyer des lettres à certains organismes de bienfaisance ou organisations de la société civile pour leur demander d’en informer leurs membres.

Plusieurs autres témoins ont convenu qu’il faudrait mettre l’accent sur la sensibilisation, la mobilisation et le dialogue. À leur avis, s’il peut compter sur un groupe mobilisé d’individus, le portail de données ouvertes pourrait devenir un outil beaucoup plus utile. À ce sujet, Donald Lenihan, du Forum des politiques publiques, a mis l’accent sur l’importance de mobiliser le public, de le consulter au sujet des données publiques et de l’en informer. Pour sa part, Mme Ubaldi a dit « qu’il est important […] de savoir ce qui existe avant que la publicité soit faite, et il est essentiel de fournir de l’information ». Elle a ajouté que « [c]ela touche les entreprises en tant qu’acteurs, mais il y a aussi d’autres groupes de la société qui sont parties prenantes. Il est donc essentiel d’informer et de mobiliser les gens »

En ce qui concerne les formats de données et les licences, le Comité recommande :

RECOMMANDATION 13

Que le gouvernement du Canada évalue s’il existe des restrictions dans la législation fédérale qui empêchent la diffusion de certains jeux de données sur son portail de données ouvertes, et envisage d’apporter des changements législatifs, si nécessaire. De plus, que le gouvernement du Canada considère les exigences relatives aux données ouvertes lors de l’introduction d’une nouvelle loi.

RECOMMANDATION 14

Que le gouvernement du Canada mette à jour sa Loi sur l’accès à l’information afin d’obliger les agences et ministères fédéraux à fournir des jeux de données présentés dans un format lisible par machine en réponse aux requêtes d’accès à l’information liées à des données.

RECOMMANDATION 15

Que le gouvernement du Canada intensifie ses efforts pour harmoniser les formats de données en consultant des tables rondes sectorielles, auxquelles participent les gouvernements provinciaux, territoriaux et municipaux ainsi que d’autres intervenants.

RECOMMANDATION 16

Que le gouvernement du Canada continue d’accorder la priorité à la diffusion de jeux de données de grande valeur et qu’il en harmonise le format à celui de ses partenaires du G8.

RECOMMANDATION 17

Que le gouvernement du Canada mette ses politiques d’approvisionnement à jour pour exiger que les achats en technologie de l’information soutiennent les données ouvertes et qu’il inclue dans ces politiques une exigence à l’égard des formats de données, par exemple RDF et CSV, afin d’appuyer la diffusion de données ouvertes en formats lisibles par machine.

Afin d’offrir un point d’accès unique aux données ouvertes du gouvernement du Canada, le Comité recommande :

RECOMMANDATION 18

Que le gouvernement du Canada, en collaboration avec les gouvernements provinciaux, territoriaux et municipaux, mette au point une fonction de recherche fédérée permettant aux utilisateurs d’accéder à des données ouvertes provenant des trois ordres gouvernementaux à partir d’un point d’accès unique.

Afin d’informer le public à propos du portail de données ouvertes du gouvernement fédéral, le Comité recommande :

RECOMMANDATION 19

Que le gouvernement du Canada continue à promouvoir son portail de données ouvertes grâce à une promotion plus étendue envers le public.