Dix ans d’ouverture des données publiques : l’open data amorce une nouvelle étape

Publié par Programme Société Numérique
Dossiers 12.05.2021

Au tout début des années 2010, quelques acteurs publics s’engageaient volontairement dans l’ouverture des données publiques, des métropoles, principalement.

Le 21 février 2011 paraissait le décret portant création d’une “Mission Etalab”. Son rôle : créer le portail unique interministériel des données publiques : data.gouv.fr

10 ans plus tard, la plateforme data.gouv.fr a donné lieu à nombreuses déclinaisons sectorielles) ainsi qu’à API.gouv.fr et le partage des données.

La reconnaissance, en 2016, par la loi pour une République numérique du principe d’ouverture des données publiques par principe a marqué une étape importante. Dorénavant, l’open data n’est plus seulement un choix de quelques-uns, c’est devenu une obligation pour l’ensemble des acteurs investis d’une mission de service public.

L’open data a joué un rôle central dans la gestion de crise au service de l’information aux citoyens et au pilotage des politiques publiques. L’intérêt du public pour les données ouvertes et leurs usages n’a sans doute jamais été aussi fort.

Les entreprises s’emparent du sujet, en tant qu’utilisatrices des données bien sûr, mais aussi parfois en ouvrant leurs propres données.

A la suite du rapport du député Eric Bothorel sur la politique publique de la donnée, des algorithmes et des codes sources, le Premier ministre  rappelle, le 21 avril 2021, dans une circulaire à destination des ministères et des préfets de régions, que la politique de la donnée constitue  « une priorité stratégique de l’État dans ses relations avec tous ses partenaires, notamment les collectivités territoriales et les acteurs privés ». Il invite les différents ministères à nommer d’ici le 15 mai prochain un administrateur ministériel des données.

Nouveaux enjeux, nouvelles ambitions : l’ouverture des données amorce une nouvelle phase.

Actualités 09.06.2020

La plateforme de données ouvertes Data.gouv.fr a enregistré 1,8 million de visites en mai 2020

Covid et données publiques : un foisonnement de tableaux de bord et d’outils de visualisation pour suivre la pandémie

Début mars 2020, les seules données disponibles sur l’épidémie étaient éparpillées dans les communiqués de presse des ARS et de Santé Publique France. Éclatées et fragmentaires, ces données ne permettaient pas de tracer des courbes et de suivre l’évolution de l’épidémie.

C’est un groupe de citoyens qui va s’en charger. En quelques jours, un collectif (l’initiative « OpenCOVID19 ») puis une communauté de 200 datascientists s’organisent pour extraire manuellement les données issues de 20 ARS et de 100 préfectures et les intégrer dans un tableur. Une charge très lourde : tout est à refaire chaque jour[1]. Le tableau de bord veille-coronavirus.fr ( prend forme et propose une première vision consolidée des données officielles. La mise en œuvre de cet outil contributif reçoit rapidement l’appui de développeurs d’Etalab, puis le soutien du ministère de la santé. Consécration : le 28 mars, Édouard Philippe et Olivier Véran, en conférence de presse, s’appuient sur les infographies de veille-coronavirus.fr.

En avril 2020, 177 jeux de données relatifs au Covid-19 étaient en ligne sur data.gouv.fr.

Depuis le 18 mars, Santé Publique France publie chaque jour des jeux de données actualisées sur et sur la plateforme de données publiques data.gouv.fr. et sur Geodes, l’observatoire cartographique de Santé publique France.

Cette ouverture des données a nourri les travaux des chercheurs et ouvert la voie à une myriade de visualisations dans la presse. Les datavisualisations de Gouvernement.fr et des tableaux de bord comme tableaux de bord (comme Covidtracker, Coronaboard.fr, Covinfo.fr ou Vaccinator.fr) s’appuient sur les données de Geodes.

Début mars 2021, SPF proposait sur son site Geodes 123 indicateurs, à toutes les échelles (nationale, régionale, départementale, territoriale).

Actualités 09.06.2020

La plateforme de données ouvertes Data.gouv.fr a enregistré 1,8 million de visites en mai 2020

Lancement du 10e printemps de data.gouv.fr

A l’occasion de ses 10 années d’existence, Etalab organise toute une serie d’evenements pour faire le point sur ses actions, ses réussites et ses échecs … et pour imaginer les 10 prochaines années. C’est un dialogue que nous voulons lancer avec vous.

«Nous sommes bien conscients que le paysage du numérique public a beaucoup changé au cours de la dernière décennie. De nouvelles questions émergent, qui appellent aussi de nouvelles réponses : comment utiliser, collectivement, les données au service de l’intérêt général ? Comment tirer parti de l’intelligence artificielle sans sacrifier l’éthique et les libertés publiques et individuelles ? Quels sont les profils dont doit se doter, aujourd’hui et demain, le service public pour poursuivre sa transformation numérique ? Que peut-on apprendre des homologues d’Etalab en Europe et dans le monde ? »

  • Le mois d’avril a été consacré à la qualité des données.
  • Le mois de mai est celui des réutilisations de données.
  • Le mois de juin sera dédié à la découvrabilité des données.

« La politique de la donnée,  une priorité stratégique de l'État dans ses relations avec tous ses partenaires »

Dans une circulaire datée du 27 avril 2021, adressée aux  ministres et préfets de région,  le Premier ministre rappelle que les administrations « devront rechercher en permanence la meilleure circulation de la donnée, des algorithmes et des codes, dans des formats ouverts et exploitables par les tiers. Cette ambition renouvelée implique, en outre, un renforcement de l’ouverture des codes sources et des algorithmes publics, ainsi que de l’usage du logiciel libre et ouvert, et l’extinction, à horizon 2023, des redevances perçues pour la réutilisation des données ».

Il invite les ministres a designer d’ici le 15 mai un administrateur ministériel des données et les préfets de region a designer un référent « données, algorithmes et codes sources »

S’agissant enfin des relations avec les acteurs privés détenant des données dites d’« intérêt général » à forte valeur ajoutée pour la puissance publique, il annonce  la creation prochaine d’une fonction de médiateur de la donnée d’intérêt général.

Une stratégie interministérielle pour la filière numérique incluant les compétences liées aux données et aux algorithmes sera proposée par le ministre de la transformation et de la fonction publiques d’ici le 15 mai 2021.

Les objectifs d’ouverture des données et des codes des ministères doivent se traduire dans une feuille de route finalisée au plus tard le 15 juillet et publiée d’ici le 15 septembre. Celle-ci devra afficher les priorités des ministères en matière d’ouverture des données et des codes et intégrer un volet formation des agents et cadres aux enjeux de la donnée.

Les administrations sont par ailleurs incitées à référencer systématiquement leurs données sur data.gouv.fr ou api.gouv.fr, la Dinum étant chargée de faire monter en qualité les portails gouvernementaux. Le site code.gouv.fr, répertoriant les logiciels et les algorithmes ouverts par les administrations, complétera bientôt le dispositif.

Open Data Impact: neuf défis pour la prochaine décennie de l’ouverture des données publiques

Le programme Open Data Impact, animé par la Fing, a entrepris de dresser un bilan crtique de ces deux années d’ouverture des données publiques  proposé de faire un travail de bilan critique. « Qu’est-ce que l’open data aujourd’hui ? Quels ont été les impacts des actions menées des huit dernières années ? Qu’est-ce qui a été réussi avec l’open data ? Les promesses ont-elles remplies ? »

Dans une premiere étape, les auteurs de ce rapport se sont attachés à « factualiser le diagnostic » : « l’open data, “combien de divisions ? ».

  • La France compterait à ce jour plus de 40 000 jeux de données publiés (plus de 35 000 recensés sur data.gouv.fr). En nombre, plus des trois quarts proviennent des collectivités, qui publient essentiellement des jeux de petites et moyennes tailles.
  • L’État publie comparativement moins de jeux, en nombre, mais, par nature, de grandes quantités en volume, notamment à travers de grands jeux de référence dont la couverture est nationale.
  •  Une vision thématique des données montre un ensemble très varié. Certains domaines sont particulièrement bien couverts : géographie, économie, transports, etc.
  • On ne trouve ainsi que peu d’angles morts ou de domaines pauvres en données : thématique sociale, justice et dans une moindre mesure, l’éducation ou la culture.

« Certains portails », notent les auteurs de ce bilan,  « proposent judicieusement aux usagers, pour chaque jeu de données, de publier les résultats de leurs usages. Par exemple, tel jeu de données a permis la création de telle application. Cette pratique présente un intérêt évident pour valoriser les usages et promouvoir toujours plus d’usages à venir. Le nombre de réutilisations de chaque jeu donne un indicateur, certe partiel, mais révélateur de la demande de certains jeux. La plateforme data.gouv.fr donne justement la liste des jeux ayant le plus fait l’objet d’usages référencés ».

  • Parmi les jeux de données ayant donné lieu à des reutilisations, on retrouve, pour un gros tiers, des données de l’État publiées de longue date et traditionnellement très utilisées comme les données INSEE,  la base des codes postaux, ou certaines données spécifiques au travail et fonctionnement de grands ministères : Intérieur (résultats des élections, accidentologie), Santé (Finess, démographie des médecins, médicaments), Économie et finance (Fantoir, Valeurs foncières)… « L’open data a plus encore démocratisé leur usage et les réutilisations publiées montrent des usages nouveaux de ces données ».
  • On y trouve aussi « de nombreuses données d’un usage précédemment limité à certains publics, que l’Open Data a fait sortir de l’ombre. La base des prix des carburants est un exemple emblématique : précédemment vendue pour plusieurs de dizaines de milliers d’euros annuels, sa mise en Open Data en a développé les usages ».
  • Enfin, pour un quart, cette liste fait ressortir le succès rapide de jeux de données directement nés de la dynamique Open Data, comme la Base Adresse Nationale (BAN), projet impulsé par Etalab, mettant en partenariat l’IGN, La Poste et OpenStreetMap.

Quels impacts ?

Dans une seconde étape, les auteurs du rapport passent en revue  cinq grandes familles d’impacts de l’ouverture des données publiques :

  • « les impacts économiques: l’open data a-t-il fait émerger un marché de la réutilisation des données ? peut-on évaluer quantitativement ce marché ? quels sont les acteurs économiques privés qui se sont emparés du sujet ?
  • les impacts démocratiques: l’open data a-t-il renforcé la transparence de la vie publique ? est-ce un outil de surveillance des acteurs de la vie publique (élus, agents des administrations, …) et/ou un outil de capacitation des citoyens ?
  • les impacts sur les organisations qui ont ouvert des données ou les utilisent, et leurs relations avec des tiers: l’open data a-t-il permis de nouer des relations avec des écosystèmes nouveaux ? En quoi les données ouvertes modifient-elles les relations existantes, par exemple avec les délégataires de service public ?
  • les impacts sur les métiers, les fonctions et les méthodes de travail: quels sont les métiers principalement impactés par l’ouverture des données ? Voit-on émerger de nouvelles fonctions, voire de nouveaux métiers ? L’open data a-t-il modifié les méthodes de travail au sein des organisations ?
  • enfin, les impacts sur la diffusion d’une culture de la donnée au sein des organisations: l’open data comme brique première de la littératie des données ? La donnée ouverte a-t-elle ouvert la voie à des sujets comme la ville intelligente (smart city) ? »

Neuf défis

En conclusion, les auteurs du rapport identifient neuf défis pour la prochaine décennie de l’ouverture des données publiques, classés en trois thématiques principales: donner à voir / donner envie de se saisir de l’open data, développer une offre vraiment adaptée à la demande et réinterroger les frontières de l’open data.

Donner à voir, donner envie de se saisir de l’open data

Défi 1 : se donner des métriques pertinentes. Comment “mesurer” ce que produit l’ouverture des données publiques ? Les deux types de métrique aujourd’hui utilisées (le nombre de réutilisations et la mesure de l’audience des portails open data) sont insuffisantes pour capter tout ce que produit l’open data. Il est temps d’imaginer et de tester d’autres métriques.

Défi 2 : les données ouvertes, pilier des villes et territoires intelligents, enfin expliquées et expérimentées par le plus grand nombre. Comment raconter les usages ? Comment les faciliter, les rendre encore plus accessibles ? Beaucoup d’acteurs s’y essayent, partiellement, en ordre dispersé. Les portails intègrent progressivement plus de services. Ce défi propose de mieux donner à voir, de donner envie et de faciliter le passage à l’action. 

Développer une offre de données vraiment adaptée à la demande

Défi 3 : rendre les données vraiment réutilisables. Faut-il redire que la préparation représente 80% du temps consacré à l’usage de données ouvertes ? Et qu’un nombre considérable de jeux de données n’est quasiment pas réutilisable. Faut-il redire que sans standardisation, sans qualité de service, un usage professionnel régulier des données ouvertes n’est pas envisageable ? La facilité d’usage des données, un des plus grands défis de l’open data aujourd’hui ?

Défi 4 : pour un open data tiré par la demande ! L’énergie consacrée à ouvrir un maximum de données a probablement atteint ses limites. Il suffit d’observer ces nombreux jeux jamais utilisés. Peut-on imaginer à l’inverse un open data tiré par la demande ? par ce que l’on sait déjà avoir du succès ? Comment identifier, écouter cette demande ? Comment y répondre dans de bonnes conditions ?

Défi 5 : comment inciter les producteurs à s’engager durablement, autrement que par la contrainte ? Un écueil possible de l’introduction du principe d’open data dans la loi serait de perdre le sens de cette obligation pour les acteurs publics. Ce qui est en jeu ici, c’est l’incitation durable des producteurs dans une démarche d’ouverture, parce qu’il nous semble que c’est l’une des clés du sujet pour la prochaine décennie. Les réutilisateurs attendent plus que le simple respect des obligations légales, ils attendent aussi un véritable engagement (sur l’amélioration des données, la pérennité de l’offre, l’effort de montée en qualité, etc.).

Réinterroger les frontières de l’open data

Défi 6 : Tracer l’utilisation sans l’entraver ? Conditionner les usages à une identification est une des lignes jaunes initiales de l’open data. Est-il pourtant possible de tracer plus finement et plus systématiquement les usages sans les entraver ? Faut-il suivre les utilisateurs … ou les utilisations ?

Défi 7 : Des données à l’information. La notion de “donnée brute” s’est imposée très tôt comme la condition première de données “open data”. Cette notion est pourtant fragile et nous savons depuis bien longtemps qu’une donnée a nécessairement subit des transformations avant d’être publiée. En allant plus loin on s’interroge sur la possibilité de publier des informations, plus faciles à comprendre et interpréter, en complément des données soit-disant brutes. Sans doute pouvons-nous aller plus loin encore en publiant des informations ciblées, raffinées, adaptées à des usages pratiques et immédiats, etc. Sans pour autant remettre en cause l’intérêt des données brutes.

Défi 8 : L’open data sans plateforme ni application. Peut-on se suffire des portails open data ? Les données ouvertes ont-elles toujours vocation à produire une application ? Nous pensons que d’autres formes d’open data peuvent apparaître, en dehors des plateformes et des usages traditionnels.

Défi 9 : Des données qui grattent : pour un open data qui ne soit pas inoffensif ! Les pionniers de l’open data avaient intuitivement fait oeuvre de prudence et les publications courageuses comme les usages “poils à gratter” sont plutôt rares. Comment les susciter ? Quelles données posent problème ? Egalité femmes-hommes, lutte contre les discriminations, lutte contre le changement climatique: comment les données contribuent-elles utilement aux grands débats de société ?

L’Union européenne fusionne ses portails pour favoriser le partage de données publiques

À ce jour, l’Union européenne dispose de deux portails Open Data. Le portail européen des données recueille les métadonnées des données publiques disponibles sur les portails Open Data des pays de l’UE. Quant au portail des données ouvertes de l’UE, il met à disposition les jeux de données des institutions et des organes de l’UE.

Au cours du printemps 2021, l’Europe fusionnera ces deux portes d’entrées aujourd’hui séparées au sein d’un même site Open Data. Ce nouveau portail donnera accès à plus d’un million de jeux de donnée, issus de 36 pays, 6 institutions et 79 organes et agences européennes.

Consultation publique de l’IGN sur la coproduction et l’ouverture des géo-communs

« En France comme à l’étranger, les pouvoirs publics sont de plus en plus nombreux à se saisir de la dynamique des « communs » comme tierce dimension au public et au privé. Les initiatives mobilisant des communautés sur le terrain en dehors de toute structure, y compris associative, se multiplient. Parallèlement, les données géolocalisées ont investi notre quotidien et ont donné naissance à de multiples services et applications. Grâce aux smartphones et au GPS, l’information géographique s’est largement démocratisée.

Ce contexte offre un terrain de jeu plus ouvert et plus collaboratif pour l’institut : celui des géo-communs ».

Après l’ouverture et la gratuité de l’essentiel des données de l’IGN depuis le 1er janvier 2021, l’institut souhaite s’inscrire plus largement dans cette dynamique de construction des communs et bâtir, avec son écosystème, sa nouvelle stratégie autour du concept de géo-communs : un ensemble de bases de données d’information géographique (production) et d’outils numériques (diffusion) accessibles au plus grand nombre.

La consultation publique en ligne « L’IGN et les communs » invite professionnels, utilisateurs de l’information géographique, collectivités locales et institutions partenaires à participer à l’élan collectif de construction des géo-communs

Programme Société Numérique

Le Programme Société Numérique de l’Agence Nationale de la Cohésion des Territoires est une mission d’appui aux collectivités et aux acteurs de proximité sur les questions liées au numérique. Il met en œuvre un programme d’actions pour favoriser l’autonomie et la capacité de tous à saisir les opportunités du numérique et favoriser le développement numérique des territoires. Il pilote la stratégie nationale pour un numérique inclusif du Gouvernement.

Articles en lien

Actualités 09.06.2020
Actualités 10.04.2020
Outils 19.02.2021
Éclairages 26.10.2020
Dossiers 19.11.2019