Open Data / Données Ouvertes : principes généraux

Open data, données ouvertes, quésaco ?

Les données ouvertes ou open data sont des données numériques dont l'accès et l'usage sont laissés libres aux usagers, qu'elles soient d'origine privée comme publique. Elles sont diffusées de manière structurée, selon une méthode, et par le biais d'une licence ouverte garantissant leur libre accès et leur réutilisation par tous, sans restriction technique, juridique ou financière.
Une explication en image ici

Un peu d'histoire...

1789 : L'article 15 de la Déclaration des Droits de l’Homme et du Citoyen de 1789 mentionne que la société a le droit de demander des comptes à tout agent public de son administration. Cet article constitue le fondement juridique du droit d'accès aux informations publiques.
1978 : L'Open Data est dans le prolongement de la démarche initiée par la Loi du 17 juillet 1978 relative à l'accès aux documents administratifs même si celle-ci n'impose ni de publier des données numériques, ni de publier de manière proactive des informations. Elle reconnaît simplement le droit d'obtenir communication des documents détenus par une administration, quels que soient leur forme ou leur support.
2003 : Dans l'Union européenne, la Directive 2003/98/CE (« Informations du secteur public » (PSI = Public Sector Information) du Conseil de l'Union européenne du 17 novembre 2003 sur la réutilisation des données publiques et la directive INSPIRE en 2008 encouragent l'open data.
2016 : En France, la Loi pour une République numérique du 7 octobre 2016 en France, qui pose le principe d'ouverture par défaut des données publiques communicables et crée la notion de service public de la donnée, donne à l'open data un fondement législatif.

Pourquoi une telle démarche ?

L'accès aux données vise d'une part à permettre aux citoyens de mieux connaître les actions de l'administration, d'autre part d'exploiter ces données, ce qui implique que ce droit d'accès s'accompagne d'un droit à la réutilisation des données.
Ces droit d'accès et de réutilisation contribuent à considérer l'information publique comme un bien commun dont la diffusion est d'intérêt public et général.
Certaines collectivités comme Lyon ont expliqué la démarche en image.
L'ouverture des données est ainsi à la fois une philosophie de l'accès à l'information, un mouvement de défense des libertés et une politique publique.
Cependant, l'ouverture de ces données ne peut être valorisée que si certaines règles sont respectées, notamment une attention particulière à la qualité des données.

Qu'est-ce qu'un jeu de données de qualité ?

Comme le rappelle data.gouv.fr [https://www.data.gouv.fr/fr/posts/nos-reflexions-sur-la-qualite-des-donnees/], plusieurs éléments permettent d'évaluer le niveau de qualité d'un jeu de données. Nous mentionnerons ici les plus importants d'entre eux.

Des éléments sur les données elles-mêmes et leur structure :

  • Le format de fichier : dans le monde de l'open data, certains formats de fichier sont plus présents que d'autres. C'est le cas notamment des formats CSV ou JSON. Ces formats permettent de facilement récupérer les données pour les réutiliser de la manière souhaitée. Ces formats sont à favoriser par rapport à d'autres formats propriétaires (Excel par exemple).
  • La structure du fichier : la façon dont est structuré un fichier est également importante. Le nom des propriétés du fichier doit être explicite, compréhensible rapidement, et interprétable facilement par des machines (par exemple l'usage d'espaces, d'accents ou de majuscules dans le nom des propriétés est déconseillé).
  • Le contenu : faire attention aux données elles-mêmes est également essentiel. Le contenu d'une donnée particulière doit être le plus épuré possible, avec un type de donnée simple (un nombre, un pourcentage, une chaîne de caractère, une date...) et un sens "métier" le plus clair possible.

Des éléments attestant du potentiel de réutilisation et de croisement des données

  • Le respect de standards, référentiels et schémas déjà établis ;
  • La présence de données et colonnes pivots pour lier les données à un référentiel (Le code SIRET ou SIREN par exemple).

Des éléments méthodologiques qui accompagnent les données :

  • une documentation claire et rigoureuse avec des métadonnées sur le format du fichier, les versions et les référentiels ;
  • La gestion des versions et des mises à jour des données ;
  • Des échanges entre producteurs et réutilisateurs du jeu de données avec si possible des mécanismes de contribution aux données.
Si vous êtes intéressé par la réutilisation de tout ou partie des données Acceslibre, c'est ici
Exporter en PDF
Copier le lien
Sommaire
Open data, données ouvertes, quésaco ?
Un peu d'histoire...
Pourquoi une telle démarche ?
Qu'est-ce qu'un jeu de données de qualité ?