OpenData : La moyenne pour un data.gouv.fr sous formats propriétaires

Dimanche 4 décembre 2011

spacer

Mise-à-jour du 5/12/11 à 8h40 : Les 500 jeux de données évoqués dans cet article ont apparemment été éclatés en plus de 350 000 notamment en divisant les données de l’INSEE commune par commune, mais notre analyse reste la bonne, série de données par série de données.

Alors que Regards Citoyens semble tenu à distance de la sortie du portail data.gouv.fr, nous avons réussi à consulter des documents de travail de la mission ÉtaLab nous permettant d’évaluer le contenu de la plateforme OpenData française qui sera présentée ce lundi matin en conférence de presse.

Tout d’abord, Regards Citoyens ne peut que se réjouir de la sortie d’un portail référençant les données publiques librement réutilisables. C’est un effort à notre sens indispensable de l’État pour un renouveau démocratique et citoyen. Moins d’un an après son installation, l’objectif que s’est fixé ÉtaLab est donc globalement atteint. Conformément aux principes reconnus au niveau international, la gratuité et l’absence de barrière juridique sont bien au rendez-vous. Concernant les formats, le bilan semble en revanche nettement plus mitigé.

Formats propriétaires : le point noir d’ÉtaLab

spacer
Répartition des données par format
sur les données tabulaires identifiées (≈300)

Rappelons-le : sur l’échelle à 5 étoiles de Sir Tim Berners Lee mesurant le degré d’ouverture d’un jeu de données, la troisième étoile impose des formats non-propriétaires, c’est-à-dire « libres et ouverts », comme le requérait d’ailleurs le gouvernement à l’annonce du projet. Pourtant, en examinant le catalogue, nous n’avons pu recenser que quelques dizaines de données en CSV et XML contre plusieurs centaines sous des formats propriétaires de Microsoft, loin de respecter les objectifs fixés par le gouvernement. Un sérieux effort reste donc encore à faire par ÉtaLab sur ce point. Suivant la norme édictée par l’inventeur du web, ce n’est qu’une petite moyenne que l’on peut simplement accorder à data.gouv.fr pour sa sortie.

Data.gouv.fr devrait référencer à sa sortie environ 500 jeux de données accessibles et librement réutilisables par tous, si le contenu n’a pas trop évolué d’ici lundi. À titre d’exemple, on peut noter que l’Angleterre, qui a beaucoup inspiré l’équipe d’Étalab et avait travaillé dans les même délais, proposait 2 500 jeux de données lors de l’ouverture de son portail data.gov.uk. L’éclatement des données réalisé par certains ministères illustre cependant la difficulté à raisonner simplement en termes quantitatifs sur les jeux de données.

Une majorité de données déjà accessibles, mais d’intéressants efforts

spacer
Répartition des avancées sur les données

De manière assez logique, beaucoup des données référencées étaient déjà accessibles sur les sites respectifs des ministères (et donc déjà référencées notamment par Data-Publica). Une bonne centaine de jeux de données ont cependant fait l’objet d’un véritable effort de reformatage, permettant à des données auparavant seulement consultables de devenir réutilisables. Parmi celles-ci, nous nous réjouissons de trouver notamment de nombreux tableaux disponibles auparavant exclusivement en PDF, comme par exemple différents « jaunes budgétaires », mais aussi les questions écrites parlementaires ou encore les recettes et dépenses de l’État. Rappellons que le manque criant de plusieurs de ces données avait déjà été comblé par différentes initiatives citoyennes et référencées au sein de NosDonnees.fr, notre data-gov.fr citoyen.

Enfin, data.gouv.fr référencera quelques dizaines de jeux de données auparavant totalement inaccessibles. C’est par exemple le cas de données de répartition des effectifs des administrations centrales et à l’étranger (Ministère des Affaires Étrangères), les données d’activités des services fiscaux depuis 2004 (Ministère du Budget) ou celles relatives à l’aide au développement accordée par la France (Ministère de l’Économie).

Les ministères de l’Éducation et de l’Agriculture les plus pro-actifs

spacer
Répartition des données par ministère
Les jeux de données du Ministère de l’enseignement suppérieur ont été agrégés à ceux de l’Education nationale

Les documents auxquels nous avons pu avoir accès permettent également d’évaluer les administrations les plus motivées pour proposer leurs données ou les enrichir. En novembre, le Ministère de l’Éducation nationale était le ministère qui référençait le plus de données sur la version Alpha de data.gouv.fr, mais la très grande majorité de ces données étaient déjà présentes sur le site du ministère. Venaient ensuite le Ministère de l’Agriculture, celui du Travail, de l’Écologie, du Budget et de la Culture, lesquels semblent avoir fait plus d’efforts pour améliorer la qualité des données ou rendre disponibles pour la première fois certains jeux de données. Les services du Premier Ministre, qui comprennent de nombreuses administrations détentrices de données, semblaient en revanche plutôt restés en retrait et ce malgré leur proximité statutaire avec ÉtaLab. Il est ainsi décevant que la DILA n’ait pas fait la preuve d’une volonté forte en proposant par exemple les bases de données du Journal Officiel ou des Marchés Publics. On regrettera enfin, sans trop de surprise, la pauvreté en termes de données issues de l’INSEE ou de l’IGN (données altimétriques de qualité moindre à celles déjà fournies pour la France par la NASA…).

La sortie de data.gouv.fr devrait également être l’occasion de disposer de jeux de données soumis jusqu’à présent à des redevances de plusieurs milliers d’euros : l’historique de la cotation des produits agricoles ou les subventions PAC versées au niveau national (Ministère de l’Agriculture), la base des établissements scolaires (vendue 120 000 € par an par le Ministère de l’Éducation nationale), la dotation budgétaire globale et les éléments d’imposition locale de chaque collectivité territoriale (vendus 123 000 € par la DGFIP), ou encore la base des questions écrites (vendue 6 480 € par la DILA jusque récemment). Nous espérons que la mise en ligne de data.gouv.fr sera l’occasion pour ÉtaLab de publier, comme annoncé par le décret de mai, la liste publique des données reconnues officiellement et de manière justifiée comme payantes.

L’avenir de l’OpenData Français entre les mains des réutilisateurs et de l’Europe

Alors que la Commission Européenne doit dévoiler dans les prochains jours sa proposition de révision de la directive PSI relative à l’OpenData, en élargissant notamment le cadre d’ouverture aux données culturelles, un effort intéressant est à noter du côté du Ministère de la Culture avec la libération de diverses données relatives aux pratiques culturelles des français (entrées en salles de cinéma, achats moyens, …). Notons d’ailleurs que celles-ci ont d’ores et déjà été exploitées par deux des applications gagnantes du concours étudiants d’Etalab.

L’ouverture du portail data.gouv.fr, prenant la suite de collectivités territoriales pionnières, officialise l’entrée de la France dans le monde de l’Open Data. Mais cette ouverture n’est qu’une première étape : si de nombreuses données pourraient encore être intégrées, cela ne sera possible que si un maximum de citoyens, d’associations, de journalistes, d’entreprises et d’universitaires s’emparent des données déjà existantes.

Les documents préparatoires à partir desquels cette analyse est basée datant de quelques semaines, il est possible que les chiffres avancés soient légèrement différents à la sortie, nous proposerons alors bien évidemment un rectificatif.
Télécharger la synthèse en CSV des documents préparatoires

Publié dans Le blog, Open Data |


16 réponses à “OpenData : La moyenne pour un data.gouv.fr sous formats propriétaires”

  1. Open Data : le portail Data.gouv.fr est lancé - Actu High Tech dit :
    5 décembre 2011 à 10 h 09

    [...] indispensable de l’Etat pour un renouveau démocratique et citoyen« . Mais dans son analyse, il pointe du doigt certains faiblesses, notamment le recours à des formats propriétaires (en [...]

  2. chauvat dit :
    5 décembre 2011 à 10 h 15

    En recherchant des données en RDF sur le portail Etalab, on trouve… un seul résultat, à savoir le site de la Bibliothèque nationale de France: data.bnf.fr/

  3. L’open-data ouvre son portail officiel en France | Blog de la DE dit :
    5 décembre 2011 à 11 h 33

    [...] Citoyens, un collectif de promotion de l’open-data se félicite de l’entrée de la France dans l’open-data, dénonçant cependant la trop grosse [...]

  4. Le gouvernement à data sur les données dit :
    5 décembre 2011 à 20 h 59

    [...] Répartition de la nouveauté des données mises à disposition à l’ouverture de Data.gouv selon Regards citoyens [...]

  5. Data.gouv.fr: «Comprendre comment se prend une décision publique» | 20 Minutes | Actualités des Journaux dit :
    6 décembre 2011 à 2 h 42

    [...] en ligne de partage des données publiques. Pour Tangui Morlier, cofondateur du collectif «Regards Citoyens», si ce n’est «pas une révolution», l’open data à la française «peut mener à un certain [...]

  6. Open Data, jusqu’où ? « Les coulisses de Juan (Sarkofrance) dit :
    6 décembre 2011 à 5 h 38

    [...] site Regards Citoyens a livré une première analyse du site, qui, rappelons-le, est encore en version Beta. Il critique [...]

  7. data.gouv.fr : première pierre de l’opendata français, et tout à construire | Buzz Modedemploi dit :
    6 décembre 2011 à 16 h 17

    [...] disponible sur les sites des « producteurs ». Selon l’association Regards Citoyens, seuls 5 % auront été spécialement publiées par Etalab pour la sortie du [...]

  8. De l’ouverture des données publiques par l’État ou Open Data | ithink.fr dit :
    6 décembre 2011 à 17 h 48

    [...] territoriales (Longjumeau, Saint-Quentin, Coulommiers, le Loir-et-Cher). Néanmoins, selon le blog regardscitoyens.org, la majorité de ces données était déjà accessible par d’autres moyens à disposition. [...]

  9. Trop d’information (publique) tue-t-elle l’information ? | A tech's life dit :
    7 décembre 2011 à 19 h 09

    [...] guerre française des licences s’achève ! – regardscitoyens.org – 19 Oct. 2011 /// OpenData : La moyenne pour un data.gouv.fr sous formats propriétaires – regardscitoyens.org – 4 Déc. 2011 /// Étude sur le redécoupage électoral – [...]

  10. Data Publica salue la naissance de Data.gouv.fr | Data Publica dit :
    9 décembre 2011 à 9 h 56

    [...] recommandons aussi à ceux qui veulent comprendre cet ensemble de jeux de données la lecture de l’article de Regards Citoyens qui a fait une analyse antérieure à l’annonce du lancement du [...]

  11. open data - Pearltrees dit :
    16 décembre 2011 à 15 h 29

    [...] OpenData : La moyenne pour un data.gouv.fr sous formats propriétaires « Regards Citoyens L’ouverture du portail data.gouv.fr, prenant la suite de collectivités territoriales pionnières, officialise l’entrée de la France dans le monde de l’Open Data. Mais cette ouverture n’est qu’une première étape : si de nombreuses données pourraient encore être intégrées, cela ne sera possible que si un maximum de citoyens, d’associations, de journalistes, d’entreprises et d’universitaires s’emparent des données déjà existantes. Les documents préparatoires à partir desquels cette analyse est basée datant de quelques semaines, il est possible que les chiffres avancés soient légèrement différents à la sortie, nous proposerons alors bien évidemment un rectificatif. [...]

  12. La France entr’ouverte » OWNI, News, Augmented dit :
    4 janvier 2012 à 13 h 03

    [...] que dans les documents de travail que nous avons pu consulter, et dont Regards Citoyens s’est également fait l’écho, l’ouverture des données concerne à ce jour, avant tout, la quantité des informations. [...]

  13. L’Open Data à la croisée des chemins juridiques » OWNI, News, Augmented dit :
    7 juin 2012 à 12 h 17

    [...] publiques à l’ouverture des données et le constat de lacunes persistantes, que ce soit au niveau technique ou de retombées réelles pour les [...]

  14. Quelles évolutions juridiques pour l’Open Data en France et en Europe ? | :: S.I.Lex :: dit :
    8 juin 2012 à 17 h 34

    [...] publiques à l’ouverture des données et le constat de lacunes persistantes, que ce soit au niveau technique ou de retombées réelles pour les [...]

  15. L’OPEN DATA À LA CROISÉE DES CHEMINS JURIDIQUES « SAM7BLOG dit :
    15 juin 2012 à 21 h 28

    [...] publiques à l’ouverture des données et le constat de lacunes persistantes, que ce soit au niveau technique ou de retombées réelles pour les [...]

  16. La France entr’ouverte | YRUQT dit :
    27 septembre 2012 à 15 h 52

    [...] que dans les documents de travail que nous avons pu consulter, et dont Regards Citoyens s’est également fait l’écho, l’ouverture des données concerne à ce jour, avant tout, la quantité des informations. [...]

Laisser un commentaire

Cliquez ici pour annuler la réponse.

spacer
Refresh



spacer
spacer
*

Regards Citoyens est fièrement propulsé par WordPress - Mentions légales

Contenu sous spacer sauf mention contraire.

gipoco.com is neither affiliated with the authors of this page nor responsible for its contents. This is a safe-cache copy of the original web site.