Appuyez sur Entrée pour voir vos résultats ou Echap pour annuler.

Les petits noms des nouvelles bases : "Décisions de la justice administrative" et "Judilibre"

Open data : coup d’envoi de l’ouverture des décisions de la Cour de cassation et du Conseil d’Etat
Et le nouveau site de la Cour de cassation

[billet publié le 1er octobre 2021 et mis à jour]

NB : l’association Juriconnexion fait un suivi du sujet sur son wiki : Open data des décisions de Justice. Cette page peut être utile pour mettre à jour ou compléter ce billet.

Le décret

Au JO du 1er octobre 2021, un texte très attendu par les éditeurs et les legal tech :

Décret n° 2021-1276 du 30 septembre 2021 relatif aux traitements automatisés de données à caractère personnel dénommés « Décisions de la justice administrative » et « Judilibre », JORF n° 229 du 1 octobre 2021 texte n° 14

Ce texte précise les modalités de fonctionnement de deux traitements automatisés de données à caractère personnel qui ont pour objet la mise à la disposition du public des décisions de justice rendues par les juridictions judiciaires et administratives. Ces traitements sont créés au Conseil d’Etat et à la Cour de cassation et sont respectivement dénommés "Décisions de la justice administrative" et "Judilibre".

L’implémentation technique, concrète de l’open data des cours suprêmes

Concrètement, d’après nos constatations et les tweets d’Emile Marzolf, journaliste à Acteurs publics :

  • « les moteurs de pseudonymisation (ex-anonymisation) développés par les deux juridictions (à partir des travaux de la Cour de cassation et aidés par Etalab) approchent les 100% de succès dans l’identification et l’occultation des noms et prénoms dans les décisions. C’est moins pour les autres informations identifiantes (numéros de tél., adresses, dates de naissance, plaques d’immattriculation) qui doivent être occultées uniquement quand leur divulgation "est de nature à porter atteinte à la vie privée ou à la sécurité des personnes" »
  • pour les arrêts de la Cour de cassation :
    • « la Cour de cassation a publié un stock » de 480 000 « décisions sur le portail PISTE, avec une API (Application Programming Interface : ensemble de définitions et de protocoles qui facilite la création et l’intégration de logiciels d’applications) pour permettre un accès automatisé aux décisions publiées »
    • ce portail PISTE semble débordé : en effet, depuis jeudi 30 septembre, il n’arrive pas à créer de nouveaux comptes (tests par nos soins). Le 5, j’ai eu un retour positif
    • la page Open data et API du nouveau site de la Cour précise que « les décisions sont versées dans la base Judilibre le jour même de leur prononcé pour les arrêts publiés au Bulletin (arrêt B) et dans un délai maximal d’une semaine après leur prononcé pour les autres arrêts de la Cour de cassation »
    • « le ministère de la Justice a reçu 67 000 euros du plan de relance pour l’ouverture des décisions judiciaires. Le descriptif n’est pas très précis, mais cela semble porter sur le processus de pseudonymisation/anonymisation ». Avec un montant pareil, heureusement que le système des EIG (entrepreneurs d’intérêt général) existe ...
    • ces nouveaux API et jeux de données sont abordables techniquement pour les seuls éditeurs et legal tech. La logique de diffusion et de défense du droit français sur des portails s’est arrêtée avec le nouveau Légifrance, qui repose désormais sur des API. C’est la même logique à l’oeuvre sur cet open data
  • pour les arrêts du Conseil d’Etat :
    • les arrêts open data sont sur le nouveau portail Open Data du CE
    • le format est celui de fichiers quotidiens compressés au format ZIP, une technique beaucoup plus abordable que l’API mais à terme difficilement cherchable
    • « pas de stock publié », uniquement le flux quotidien depuis le 30 septembre. « Elles seront publiées sur un site dédié deux fois par mois »
    • pas d’API — en tout cas pour l’instant
    • le Conseil d’Etat promet qu’ « un moteur de recherche sera prochainement intégré à la plateforme lorsque le stock de décisions sera plus important ». Honnêtement, et à titre personnel, Ariane Web me va assez bien
    • « au total, la masse de décisions diffusées par le Conseil d’Etat devrait augmenter sensiblement : jusqu’à présent, environ un tiers des 10 000 décisions rendues chaque année étaient publiées en ligne »
    • NB : au 6 octobre, depuis deux semaines, le flux quotidien des arrêts du Conseil d’Etat et des CAA trouvé dans data.gouv.fr est plus important que d’habitude. Je me demande si les nouveaux fonds du CE ouverts en open data ne sont pas livrés sur Data.gouv.fr. On constate aussi sur Ariane des améliorations du fonds.

La communication avec une API est propre à chaque langage de programmation (Php, Js, Python...). Le principe reste le même à chaque fois : il faut utiliser une librairie qui permet de faire des requêtes sur un site tiers et de récupérer les données issues de la réponses (XHR pour Js ou cURL pour Php ou Python par exemple). Mais le codage doit être appris pour chaque langage [1].

Pour une explication plus détaillée des API Judilibre, ArianeWeb et Hudoc, voir le billet de Xavier Aurey sur Fondamentaux.org : Open data des décisions de justice et API des cours françaises et européennes.

Les décisions "nouvelles" [2] parmi ces nouveaux jeux de données devraient plus ou moins rapidement [3] se retrouver sur les plateformes des éditeurs et legal tech. Au 4 octobre, c’est déjà fait sur Jurisprudence.ninja, grâce à l’association Cybertron, une association de promotion du logiciel libre (open source) constituée en 2020 à l’initiative de sept avocats du Grand Est [4] qui a mis en ligne sur Jurisprudence.ninja les données de l’open data de la Cour [5].

Rappelons que le Conseil constitutionnel et la Cour des comptes publient déjà sur leurs sites respectifs l’intégralité de leurs décisions.

Open data prévu des juridictions de 2nde et 1ère instance

En ce qui concerne l’open data des décisions des autres juridictions administratives, le Conseil d’Etat précise dans une actualité du 1er octobre que « les décisions des cours administratives d’appel seront disponibles sur cette même plateforme à partir du 31 mars 2022, celles des tribunaux administratifs le 30 juin 2022 ».

La Cour de cassation, elle, rappelle que « avril 2022 : open data des décisions des cours d’appel (hors matière pénale). »

Pour l’avocat publiciste Eric Landot, l’open data des décisions de première instance devra inclure les ordonnances de référé [6].

Nouveau site web et nouveau moteur de recherche de décisions pour la Cour de cassation

La Cour en a profité pour :

  • publier la nouvelle version de son site web, en version "responsive" (Responsive Web Design ou RWD), c’est-à-dire dont la mise en page s’adapte automatiquement aux smartphones et tablettes
  • changer de logiciel de gestion de site web (dit CMS pour "content management system") : la Cour abandonne le logiciel français SPIP pour un autre acteur de l’open source plus connu : Drupal, qui équipe un nombre croissant de sites web publics [7] comme le nouveau site de l’AMF, et qui est plus un framework à partir duquel on fait un peu ce qu’on veut, par rapport à SPIP qui est d’abord pensé pour gérer une publication [8] et pas forcément un site institutionnel complet [9]. Enfin, Drupal est recommandé par l’Etat et la Direction Interministérielle du Numérique, pour la création de contenu web : tout comme Typo3 et SPIP, il fait partie du Socle interministériel de logiciels libres (SILL)
  • et lancer *son* moteur de recherche de *ses* décisions (en évidence sur la page d’accueil du nouveau site), venant ainsi enfin au même niveau de prestation que le site du Conseil d’Etat. Un conseil après test : sauf si vous êtes avocat aux conseils, laissez tomber les champs d’affinage de la requête (colonne de gauche).

Hélas, le passage sous Drupal a eu un dommage collatéral : les fils RSS (produits par défaut par SPIP) ont disparus, ce qui gêne beaucoup les juristes veilleurs. Un flux des arrêts de la Cour existe toutefois dans le site Juricaf proposé par l’AHJUCAF.

Cette coïncidence voulue montre bien que les cours suprêmes entendent, avec l’open data, ne pas perdre pour autant le contrôle de leurs décisions, ne pas se faire virtuellement déposséder de leur production. Si vous publiez en clair et mettez à jour quotidiennement sur votre propre site, il y a de bonnes chances pour que ce soit chez vous qu’une majorité vienne faire les recherches et récupérer les documents les plus récents [10].

Toutefois, et contrairement à ce que j’anticipais, tant le Conseil d’Etat que la Cour de cassation laissent Google indexer leur décisions dans leurs sites propres — mais pour le CE il semble que ce ne soit qu’une partie d’entre elles [11].

NB : le ministère de la Justice, à cette occasion, a ouvert une enquête (jusqu’au 30 novembre 2021) pour appréhender au mieux les usages et la réutilisation des données issues des décisions.

Il reste à vérifier si tous les anciens documents ont bien été remis en ligne sur le nouveau site de la Cour de cassation. La communauté des documentalistes et veilleurs s’y emploie, mais a priori, peu de choses manquent : pour retouver rapport annuel, lettre d’une chambre, panorama annuel de jurisprudence d’une chambre, Bull. civ. ou crim., BICC, acte de colloque ou étude, il faut passer par Kiosque > Tout voir puis préciser le type de document désiré. Les avis, eux, sont considérés par le nouveau site comme des décisions (heu ...) et sont cherchables (exemple : avis rendus par la 3e ch.) dans le moteur de recherche Judilibre en sélectionnant "Demande d’avis" dans le champ Nature de la décision. Parmi les manques, par exemple, la décision de non-renvoi QPC Cass. Com. 8 juillet 2021 n° 21-11.169 [conformité à la Constitution des articles L.145-15 et L.145-39 du Code de commerce]. Elle figurait sur l’ancien site.

On peut aussi passer par la WayBack Machine d’Archive.org : ça marche pour les versions HTML des rapports annuels de la Cour, même le plus ancien (1997). Pour les versions PDF, passer par le lien "Télécharger le document entier" sur la page HTML du rapport (exemple du rapport 2003). Le lien direct dans la liste des rapports ne marche pas.

Open data/API v. publication sur Légifrance


Les décisions de la Cour de cassation en ligne sur Légifrance ce 1er octobre


Les décisions de la Cour de cassation en ligne sur sa base Juridilibre (disponible sur le nouveau site de la Cour) ce 1er octobre


Les décisions du Conseil d’Etat en ligne sur Ariane Web ce 1er octobre


Les décisions du Conseil d’Etat en ligne sur Légifrance ce 1er octobre

On peut pour l’avenir proche se demander si le double système publication des arrêts sur Légifrance + diffusion open data pour les tech et les éditeurs par API va perdurer. Désormais, la tendance semble être :

  • diffusion par API : en hausse
  • diffusion par Légifrance : en baisse. Les derniers arrêts de la Cour de cassation sur Légifrance ont une semaine de retard. On constate aussi que la base Ariane Web publie les arrêts du Conseil d’Etat du jour alors qu’ils ne sont généralement pas présents le jour même sur Légifrance (voir copies écran du jour supra).

Et puis, est-ce que les juridictions suprêmes vont avoir l’envie et les moyens de faire un double travail ? Arriver au point actuel a déjà été un travail long et difficile pour elles.

Sans oublier qu’à partir de 2025, elles devront diffuser en open access plusieurs millions de décisions chaque année [12].

Emmanuel Barthe
juriste documentaliste, veilleur, spécialiste des données publiques juridiques

Notes

[1Oui, ça, on me l’a expliqué. Je ne l’ai pas inventé.

[2Autrement dit les décisions non présentes sur Ariane et Légifrance (JADE CASS, INCA).

[3Il faut quand même que leurs informaticiens se familiarisent avec les formats puis dédoublonnent avec leurs fonds de jurisprudence existants.

[4Dont Lionel Vest, l’avocat et développeur autodidacte créateur du logiciel de gestion de cabinet d’avocats open source Optimus. Lionel Vest et Cybertron étaient déjà derrière Societe.ninja.

[5Voir le GitLab de ce site.

[6NB : je ne partage pas la critique par Me Landot de la "lenteur" du ministère de la Justice et des juridictions suprêmes dans l’open data des décisions de justice. Cette lenteur a en effet surtout à voir avec les moyens financiers, techniques et humains limités des juridictions. Et de par le RGPD comme de par les risques d’atteintes à la vie privée des particuliers, il était inenvisageable de ne pas pseudonymiser le fonds et le flux.

[7Entre autres : Gouvernement.fr, ministère de l’Economie et des finances (Bercy), ministère de l’Ecologie, Impots.gouv.fr, ministère de l’Agriculture (Alim’agri), Caisse des Allocations Familiales (CAF), portail de la Fonction publique, MonCompteActivité, MonCompteFormation, Région Ile-de-France, ville de Clermont Ferrand. Source : Pourquoi choisir le CMS et framework Drupal ?, Naes.

[8Comme le dit son nom. En effet, SPIP signifie Système de publication pour l’Internet.

[9Voir sur ce blog [archive] Refonte du site AMF : attention !. Pour un comparatif détaillé SPIP v. Drupal, voir celui-ci, certes orienté, écrit par une SSLL nantaise.

[10Ce qui, dans une économie et une société de l’information, rend les visiteurs de votre site dépendants de vous. CQFD.

[11Au 16 décembre 2021 : seulement 19 700 résultats à la requête site:courdecassation.fr inurl:decision sur Google dont des arrêts très récents et d’autres de 1970. Mais au 7 juin 2023 : 780 000 résultats. Contre seulement 25 900 résultats pour le CE, toujours au 7 juin.

[12Plus de 3,5 millions, en théorie, du moins si on se base sur le nombre de décisions de justice rendues en France chaque année selon la publication Références Statistiques Justice.