Appuyez sur Entrée pour voir vos résultats ou Echap pour annuler.

Les limites de la diffusion des décisions de justice

L’open data des décisions des cours d’appel et tribunaux n’est pas pour demain
Quelles voies emprunter pour y arriver — sans créer un casier judiciaire bis ? Faut-il tout anonymiser ou juste pseudonymiser ?

[NB : l’open data des décisions judiciaires de première et deuxième instance a finalement été réalisé — partiellement en réalité : de l’ordre de 70% pour les CA — en 2022 pour l’appel et fin 2023-2025 pour les jugements de première instance.
Mais bien qu’inséré en 2016 dans la loi République numérique et poussé par les legaltech, il n’a été réalisé que 10 ans après, comme annoncé — et expliqué — ici.]

Roseline Letteron, professeur de droit public à l’Université Paris-Sorbonne, a publié le 28 novembre 2016 sur son blog Liberté Libertés Chéries le billet suivant : Le mythe de la liberté d’accès aux décisions de justice. NextINpact, écrivant sur les futurs décrets d’application de la loi Numérique, titraient quant à eux le 29 décembre 2016 : Loi Numérique : la mise en Open Data des décisions de justice prendra "plusieurs années".

Avec le développement ces dernières années de l’open data [1], le thème de l’imperfection de la diffusion des décisions de justice est devenu une "tarte à la crème". Répondre à ces deux articles me donne l’occasion de l’analyser ici en détail.

Sommaire

Précisions à apporter au billet du professeur Letteron
Pseudonymisation : un nouveau mot. Anonymisation : un nouveau sens
Pourquoi l'open data de la jurisprudence du fond restera longtemps en "stand-by"
La loi Lemaire et les moyens nécessaires
Pseudonymiser et anonymiser : un travail énorme et difficile
La responsabilité juridique des pouvoirs publics
La délicate question des décisions pénales et des tribunaux de commerce
Un calendrier prévisionnel mais incertain
Conclusion - Mission impossible pour les pouvoirs publics ? - Et les acteurs privés ?

Précisions à apporter au billet du professeur Letteron

J’aimerais déjà apporter plusieurs précisions au billet du professeur Letteron :

 Sur l’application de la directive "PSI" aux décisions de justice

A propos de la directive 2003/98 du 17 novembre 2003 concernant la réutilisation des informations du secteur public (dite "PSI") qui mentionne que son champ d’application s’étend aux « documents [...] de la filière judiciaire [2] et de la filière administrative », ce qui justifie l’open data de *toutes* les décisions de justice judiciaire, il faut apporter plusieurs précisions :

  • cette mention est dans le considérant 16 de la directive. Elle n’est pas affirmée par un article de celle-ci
  • de surcroît, ce n’est que tout récemment, dans le débat autour du projet de loi Lemaire pour une République numérique, que ce considérant a commencé à être invoqué
  • pour bien faire comprendre l’importance de cette précision : ce considérant tend à dire que les décisions de justice sont des données publiques *réutilisables*. Or, jusqu’ici, le droit français classait la jurisprudence dans des données non administratives (séparation des pouvoirs ...) et donc, ipso facto, non réutilisables au titre du droit français résultant de la transposition de la directive.
    Seule la CADA, dans un avis peu connu Ministre de la justice n° 20103040 du 27 juillet 2010 que Mme Letteron cite, avait jusqu’ici tenté d’aller contre cette position restrictive, sans d’ailleurs évoquer le considérant 16 mais l’article 11-3 de la loi n° 72-626 du 5 juillet 1972 selon lequel « les tiers sont en droit de se faire délivrer copie des jugements prononcés publiquement ».
    A l’origine de cette position restrictive sur la réutilisabilité de la jurisprudence au titre de la directive, il y avait la façon très française de transposer la directive PSI initiale, en associant étroitement, par la rédaction de la "loi CADA" du 17 juillet 1978, communicabilité des documents administratifs et réutilisabilité des informations (données) publiques. Pour simplifier : document administratif = document communicable = document réutilisable. Donc, selon cette conception peu partagée par les autres Etats membres de l’UE, si des données publiques étaient contenues dans un document non administratif, elles n’étaient pas réutilisables ...
    La saisine de la CADA réagissait probablement contre l’arrêt Bertin du Conseil d’Etat rendu seulement deux mois et demi mois auparavant et d’ailleurs cité dans l’avis (CE n° 303168 du 7 mai 2010) : en définissant de manière extensive la notion de document juridictionnel et en affirmant sa non-communicabilité, il pouvait menacer la réutilisation de la jurisprudence par les licences Legifrance, tant gratuite pour une réutilisation ponctuelle, que payantes, en place à cette époque depuis 2002.

 Accès à JuriCA

Selon Mme Letteron :

« Les décisions des cours d’appel figurent dans une base de données gérée par la Cour de cassation, JuriCA, souvent présentée comme "un outil de communication et de recherche" indispensable à la "construction des savoirs juridique et sociologique. C’est sans doute vrai pour les magistrats qui bénéficient, heureusement, d’un accès direct et gratuit par l’intranet Justice. Pour les autres, leur curiosité scientifique n’est pas suffisante pour justifier un accès à JuriCA. Il faut aussi de l’argent, et même beaucoup d’argent. »

Pourtant, la curiosité scientifique, si elle émane d’une équipe ou d’un chercheur universitaire, peut être suffisante pour justifier un accès *gratuit* à JuriCA et ce, depuis au moins 2009, grâce aux conventions de recherche entre équipes de master et Cour de cassation [3].

 La position de la CADA sur les décisions de justice

Le professeur Letteron écrit :

« Dans un conseil du 27 juillet 2010, [la CADA] s’estime compétente pour rendre un avis sur toute décision défavorable en matière de réutilisation des informations publiques contenues dans des jugements ou arrêts judiciaires. En revanche, dans un avis du 28 avril 2016, elle déclare irrecevable une demande dirigée contre le refus opposé par la Cour de cassation à un accès aux décisions contenues dans JuriCA, en vue de leur réutilisation. Celles-ci ne sont pas considérées comme des "documents administratifs" au sens de la loi du 17 juillet 1978. Autrement dit, la CADA est incompétente pour se prononcer sur l’accès aux décisions de justice [...] »

Le refus de la CADA de reconnaître le caractère de document administratif — donc communicable — aux décisions de justice ne date pas de 2010 : il remonte au minimum à 2005 [4].

Quant à son avis du 27 juillet 2010, comme nous l’avons vu plus haut, il s’agit selon toute probabilité, vu le contexte, d’une décision d’exception au sens premier du terme, destinée à protéger les licences Legifrance potentiellement menacées par l’arrêt Bertin précité.

Ajoutons enfin que la CADA ne rend que des avis — c’est le Conseil d’Etat qui tranche. Et justement, jusqu’à aujourd’hui, le Conseil d’Etat ne s’est jamais prononcé sur la réutilisation de décisions de justice en tant que données publiques, uniquement sur la communicabilité de documents juridictionnels qui n’étaient pas des décisions de justice

 La loi Lemaire pour une République numérique du 7 octobre 2016 est allée un peu plus loin que l’état du droit décrit dans le billet du professeur Letteron : ses articles 20 et 21 créent un principe de mise à disposition gratuite de toutes les décisions de justice, administrative comme judiciaire, et de tout niveau (de la 1ère instance aux cours suprêmes).

 Mme Letteron félicite Doctrine.fr pour son action pro-open data. lI est toutefois difficile de penser que cette action pro-open data soit totalement désintéressée. L’intérêt des legal techs françaises dans le débat actuel est en partie d’ordre financier : si l’Etat se met à diffuser même les jugements des tribunaux et paye pour ces traitements de données, les barrières d’entrée sur ce marché tomberont et les entrants sur le marché n’auront plus à faire de lourds investissements. Il n’est pas question que d’open data ici, il est aussi question de concurrence.

Pseudonymisation : un nouveau mot. Anonymisation : un nouveau sens

Dans ce billet, nous utiliserons le terme anonymisation dans son nouveau sens fort d’impossibilité de réidentification des personnes physiques. Le simple remplacement des noms par des lettres porte désormais le nom de pseudonymisation.

Pour deux raisons :

  • parce que ce qu’on appellait communément "anonymisation" (remplacer des noms par des lettres) n’assure qu’un anonymat très relatif : bien souvent les circonstances, les faits relatés dans la décision de justice permettent par recoupement de retrouver l’identité des parties. Pire, les pseudonymes ne sont pas supprimés selon les règles actuellement utilisées [5] et les noms de personnes dans les noms de sociétés non plus [6]. Pour être plus précis, on utilise donc désormais le terme de pseudonymisation
  • l’autre raison de ce changement de vocabulaire et la plus importante, est le Règlement général de protection des données du 27 avril 2016 (RGPD) [7] qui s’appliquera à partir de mars 2018. Selon le RGPD [8], l’anonymisation consiste à empêcher une réidentification selon l’état actuel de l’art. Si une décision de justice laisse possible une réidentification indirecte, alors elle n’est pas réellement, véritablement anonymisée. Et si elle n’est pas anonymisée, alors elle est soumise au droit des données personnelles institué par le RGPD et doit donner lieu à déclaration, être soumise au consentement des personnes physiques citées etc., traitement lourd et impraticable dans le cadre de l’Open data.
    Autrement dit et en une phrase, le RGPD exige, pour ne pas appliquer toute la rigueur du droit des données personnelles, que la base soit anonymisée au sens fort où, en l’état actuel de l’art, la réidentification est impossible. On peut contester cette position, qui est la nôtre et s’inspire de l’esprit du RGPD, principalement en jouant sur la lettre : voir le débat dans les commentaires en bas de page.

Pourquoi l’open data de la jurisprudence du fond restera longtemps en "stand-by"

Maintenant, sur le débat de fond :

 Si l’on tient pour le principe de transparence et pour l’objectif de diffusion du droit, la mise à disposition gratuite de toute la jurisprudence au format numérique est LA position, dans l’idéal.

 Mais même dans l’action publique, le nerf de la guerre (je n’ai pas dit le principe de toute chose) reste l’argent. Surtout en ces temps de recettes fiscales — et donc de budgets publics — en baisse.

Les montants disponibles à la DILA, au Ministère de la Justice, à la Cour de cassation et dans les juridictions du fond pour structurer, traiter, pseudonymiser (a fortiori anonymiser) et diffuser les arrêts des cours d’appel (base Jurica) sont limités (cela dit, ces montants étaient bien plus limités avant l’arrivée de Legifrance). C’est d’abord pour cette raison que les éditeurs ont longtemps eu de facto le monopole de la diffusion de la jurisprudence : leurs clients avaient les budgets pour financer indirectement ce travail.

La loi Lemaire et les moyens nécessaires

La loi du 7 octobre 2016 pour une République numérique parle d’open data des décisions du fond (articles 20 et 21).

Mais les moyens nécessaires, tant techniques (ils sont aujourd’hui connus des experts : XMLisation de tous les documents avec DTD ou schéma XML, rénovation massive du parc informatique et augmentation très importante du débit des connexions intranet et internet) que humains (augmenter les effectifs des greffiers, aujourd’hui débordés), et également financiers, ne sont pas du ressort de cette loi — ni d’aucune autre d’ailleurs :

 En réalité, aujourd’hui, une décision facile à structurer (pour qu’elle soit aisée à mettre en base de données) et à pseudonymiser serait, idéalement, un fichier XML balisé avec une centaine de champs minimum [9] et doté de liens vers d’autres fichiers XML. C’est difficile mais réaliste : depuis 2010, le format XML est utilisé par le système PACER d’accès aux décisions de justice des cours fédérales des État-Unis [10]. Produire de la jurisprudence judiciaire de 1ère et 2ème instance structurée supposerait donc :

  • élaboration par les services informatiques de la juridiction judiciaire suprême et ceux de la chancellerie, avec les magistrats, d’une DTD ou d’un schéma XML (il existe une première version pour les arrêts de la Cour de cassation) et sa validation par le ministère
  • des moyens en infrastructure (connexion, matériel, logiciels) pour l’instant indisponibles en juridiction
  • une révolution (très contraignante) dans la façon pour les magistrats de rédiger une décision.

 Pouvoir gérer les volumes en cause : si les juridictions administratives ne rendent "que" 230 000 décisions par an, les juridictions judiciaires en produisent, elles, près de 3,8 millions par an dont 1,2 million en matière pénale ... Le tout avec 32 000 ETP [11] seulement en greffiers et magistrats [12].

 Numériser les décisions de première instance. Ronan Guerlot, adjoint au directeur du Service de documentation, des études et du rapport (SDER) de la Cour de cassation [...], cité par Libération, estime qu’il faudra patienter quatre à cinq ans une fois que le décret d’application de la loi sera entré en vigueur pour informatiser toutes les décisions de justice. « Le plus difficile sera de faire remonter les décisions de première instance du TGI. Nous disposons souvent de minutes [original d’un acte de justice, ndlr] papier, il faudra donc créer des outils informatiques », explique-t-il. En revanche, pour la justice administrative, c’est déjà prêt : les décisions des cours administratives d’appel sont déjà sur Legifrance et celles des tribunaux administratifs sont déjà en base de données — mais cette dernière n’est pas accessible au public et n’a in fine pas été mise en vente aux éditeurs.

 Les institutions, très logiquement, étaient axées sur les juridictions suprêmes et non sur les cours d’appel et les tribunaux. Sans compter un refus très latin de la "case law". Praticiens et éditeurs ont toujours su, eux, l’importance de la jurisprudence et particulièrement des arrêts d’appel. Pour autant, et comme le souligne le premier commentaire sous l’article de NextINpact (commentaire laissé par un avocat, de toute évidence), la grande masse des décisions des tribunaux est et restera « inintéressante au possible » [13].

Pseudonymiser et anonymiser : un travail énorme et difficile

Sur l’obligation de pseudonymisation [14] (on ne parle plus d’anonymisation mais de pseudonymisation, voir en introduction de ce billet) avant de publier une décision de justice sur Internet :

 Jurisprudence administrative : peu ou pas de problème pour pseudonymiser (replacer les noms par des lettres) les décisions des juridictions administratives : les noms de parties dans leurs décisions sont balisés/taggués dans le XML.

 Jurisprudence judiciaire :

  • le Service de documentation, des études et du rapport de la Cour de cassation (SDER) doit reprendre en 2017 les tâches confiées jusque là à la DILA [15]
  • il faut distinguer ici trois, voire quatre chantiers d’anonymisation : 1. celui des arrêts de la Cour de cassation (25 600 affaires terminées en 2015) — déjà réglé, pour les inédits (base CASS) comme pour les publiés au Bulletin (base INCA) —, 2. celui des arrêts civils de cour d’appel (base Jurica) (236 000 décisions en 2015), 3. celui des jugements des tribunaux civils (2,55 millions sans compter les tribunaux de commerce [16], mais en incluant TGI, TI, juridictions de proximité, TASS et Conseils de prud’hommes) et 4. celui de la jurisprudence pénale du fond [17] (1,2 million) [18].
    En effet, les décisions de la Cour sont la plupart du temps brèves et sobrement motivées, donc relativement faciles et rapides à anonymiser. Les arrêts d’appel, eux, sont nettement plus prolixes et donc plus complexes et plus longs à anonymiser. Et la masse des décisions de civiles de première instance, même si elles sont souvent brèves et très sobrement motivées comme bizarrement celles de la Cour de cassation (mais pas pour les mêmes raisons), est écrasante. Enfin, les décisions du fond en matière pénale, jusqu’ici diffusées ni par Legifrance ni par JuriCA, nécessitent du fait même de la matière plus de précautions, même si elles sont souvent peu ou pas motivées
  • en première instance, il restera, une fois celui-ci numérisé, à anonymiser l’énorme stock purement papier évoqué par M. Guerlot du SDER (voir supra).

 L’absence de schéma ou DTD XML rend l’anonymisation extrêmement difficile. Plus encore sur les décisions judiciaires dont la structure et le langage sont beaucoup moins systématiques et réguliers qu’en jurisprudence administrative.

 Pseudonymiser, en effet, ne se limite pas à faire du Rechercher Remplacer sur les seuls noms de personne contrairement à ce qu’on pourrait croire à première vue [19]. C’est beaucoup plus compliqué que ça.

D’abord parce que les logiciels ont souvent du mal à traiter de nombreux cas. Autrement dit, « il est extrêmement difficile d’avoir plus de 90% des décisions parfaitement pseudo-anonymisées, sauf à employer des moyens humains très importants pour la relecture » (dixit Michael Benesty, fiscaliste, spécialiste et praticien du machine learning en droit avec son site Supra Legem [20]) :

  • deux exemples classiques en une seule proposition (fictive) : « le président de la société Robert, M. Franck Robert ». Certains logiciels experts vont anonymiser la "société Robert" en "société X..." parce que Robert est un prénom alors que les noms de personnes morales ne se pseudonymisent pas [21], d’autres vont laisser le nom de famille du président intact parce qu’il s’écrit comme un prénom, aboutissant ainsi à laisser intact les nom et prénom d’une partie personne physique [22]
  • autre exemple, fréquent lui aussi (noms fictifs) : « la caissière Jeanine Plombeit, employée à la supérette Zaz dans la commune de Tiersset, a été licenciée pour faute grave le 14 juin 2015 ». Il se trouve que la commune ne compte que 500 âmes : même en pseudonymisant le nom de famille, la combinaison de son nom, du nom de la commune et de la raison sociale de son ex-employeur indiquera à tous les habitants des alentours, y compris les employeurs potentiels de Mme Plombeit, de qui il s’agit et ce qui lui est arrivé. Il va donc falloir, exceptionnellement, anonymiser le prénom et la commune : ce n’est pas la recommandation de la CNIL qui le l’exige mais le respect de l’esprit de la loi Informatique et libertés et surtout de la lettre du RGPD, texte européen ultérieur à la loi I&L
  • on consultera d’autres types de difficultés dans le billet de Michael Benesty (Supra Legem) intitulé Techniques d’anonymisation (pseudonymisation) des décisions de justice et leurs limites [23]
  • même la toute dernière technologie, autrement dit le machine learning (ML), échoue, de l’aveu même de M. Benesty, à atteindre un taux de succès suffisant. Pour le citer [24] : « Même en affichant un taux de 96% de mentions correctement identifiées, on se retrouve avec un taux de décisions effectivement (c’est-à-dire complètement) anonymisées d’à peine plus de 60% ! [...] On voit bien que l’approche anonymisation à 100% via le machine learning (c’est-à-dire sans aucune intervention humaine) se heurte à un plafond de verre. »

On retombe donc sur l’importance de la vérification humaine. Mais avec 3,8 millions de décisions par an à vérifier, il est évident que le coût en ETP d’un contrôle systématique sera hors de portée.

Encore n’a-t-on parlé ici que de pseudonymisation "classique". Avec la loi République numérique et le RGPD, il faut aller plus loin. Comme nous l’avons vu en introduction, le règlement général de protection des données, encore plus exigeant que la loi République numérique, s’il est appliqué conformément à son esprit (la lettre, c’est différent, voir commentaire infra de Bruno Mathis), exige une véritable anonymisation, c’est-à-dire une impossibilité quasi-impossibilité de ré-identification, en tout cas de réidentification massive ou facile (ce qui suppose de suivre l’état de la technique ...) [25]. À cet esprit du RGPD, il faut ajouter le lobbying des magistrats [26] et des greffiers [27] pour être également anonymisés et la position du Sénat, clairement défavorable à l’open data en général et à l’open data judiciaire en particulier [28]. Il faudrait donc repérer et supprimer les mentions de métier/profession, presque tous les noms de lieu et tous les passages permettant une ré-identification par recoupement avec d’autres informations et bases de données ... Autant dire qu’"on n’est pas arrivé".

La responsabilité juridique des pouvoirs publics

Cette exigence de véritable anonymisation, au sens fort du terme, est renforcée par la responsabilité des pouvoirs publics.

Selon M. Benesty, avec la loi Lemaire, la responsabilité de l’administration pourrait être engagée pour chaque décision de justice mal anonymisée. En effet, la loi Lemaire prévoit qu’en plus de la pseudonymisation, le risque de réidentification devra être pris en compte. Très exactement, selon le texte : « [les] jugements sont mis à la disposition du public à titre gratuit dans le respect de la vie privée des personnes concernées. Cette mise à disposition du public est précédée d’une analyse du risque de ré-identification des personnes ». M. Benesty propose une vérification humaine dans les matières "sensibles", telle que sélectionnées par la CNIL [29].
Confirmation, sur la base principalement de la loi Informatique et libertés (donc sans même invoquer la loi Lemaire), par le TA de Paris, qui condamne le 7 novembre 2016 l’Etat pour défaut d’anonymisation sur Legifrance d’un arrêt d’appel en matière de divorce [30].

Pour finir, le RGPD prévoit de lourdes sanctions pour les producteurs de données personnelles soumis au droit des données personnelles et ne respectant pas leurs obligations. Ici, ce serait la DILA, autant dire l’Etat ...

La délicate question des décisions pénales et des tribunaux de commerce

C’est sur les chantiers 3 et 4 évoqués supra (collecte et anonymisation 3. des décisions civiles et commerciales de première instance et 4. des décisions pénales de 1ère et 2e instances) que le travail sera le plus long, pour les raisons citées plus haut. Le paragraphe important dans l’article de NetxINpact est la citation du ministère de la Justice à propos des décisions pénales du fond et des jugements de première instance (notez le conditionnel dans les deux phrases et le "moyennant" ...) :

« En matière pénale, le déploiement de Cassiopée dans les cours d’appel permettrait d’intégrer les arrêts rendus en matière pénale moyennant le développement d’un applicatif adapté. Les décisions de première instance seraient intégrées à la base de données dans un second temps. »

Enfin, il y a la question des jugements des tribunaux de commerce. Le fonctionnement des Tcom est pris en charge par les greffiers de commerce et leur personnel. Les greffiers des tribunaux de commerce sont certes des officiers publics et ministériels nommés par le garde des sceaux mais ils exercent dans un cadre libéral : ce sont de véritables chefs d’entreprise [31] La saisie et le stockage des décisions ne sont donc pas pris en charge par le ministère de la Justice. D’ailleurs, les greffes des Tcom *vendent* leurs décisions.

Un calendrier prévisionnel mais incertain

Est paru dans le Recueil Dalloz du 20 juillet 2017 un article de MM. Buat-Ménard et Giambiasi, tous deux magistrats et travaillant au ministère de la Justice, intitulé « La mémoire numérique des décisions judiciaires. L’open data des décisions de justice de l’ordre judiciaire ».

On peut y lire différents développements sur l’anonymisation des décisions judiciaires et la place et le rôle de la jurisprudence à l’aune de l’Open data.

Une partie de l’article nous intéresse plus particulièrement, qui s’intitule « Les perspectives de mise en œuvre » où les auteurs confirment les délais déjà donnés en janvier par le ministre de la Justice d’alors [32] : cet open data judiciaire pourrait être mis en œuvre en trois étapes : la mise à disposition des décisions de la Cour de cassation (de 6 mois à un an après l’entrée en vigueur du décret à venir), puis celle des Cours d’appel (près de 36 mois seraient nécessaires, toujours après l’entrée en vigueur du décret) et enfin celle des décisions de premier degré (dans un délai de 3 à 8 ans).

Ainsi le ministère de la Justice émet-il l’hypothèse d’un open data complet en … 2025. Pour mémoire dans un article des Echos du 22 mars 2017, il était question d’un open data effectif sous 5 ans.

Deux autres choses sont à souligner dans cet article :

  • un aspect crucial du projet : l’article paru au Dalloz parle d’anonymisation — forte — et non de simple pseudonymisation (qu’on appelait anonymisation jusqu’à la publication du nouveau règlement européen de protection des données personnelles dit RGPD qui entrera en vigueur en 2018). Le nouvel objectif et critère promu par le RGPD est bien d’empêcher toute dé-anonymisation (ou ré-identification) en l’état actuel de la technique. Or on sait re-personnaliser des données bancaires ou hospitalières pseudonymisées. Il faut donc ne plus se limiter à la solution actuelle, où l’on remplace les noms par des lettres — solution anciennement dénommée anonymisation et qu’on appelle depuis le RGPD pseudonymisation
  • ce texte est l’adaptation écrite d’une intervention de M. Buat-Ménard, préparée conjointement par les auteurs, le 9 mars 2017, lors de la journée d’étude consacrée à La mémoire numérique de la justice, co-organisée par la Sous-direction de la statistique et des études du ministère de la Justice et l’Institut des hautes études sur la justice. Et il ne comporte aucun avertissement comme quoi il ne serait qu’une position personnelle des deux magistrats. On semble donc avoir là une prise de position publique du ministère, bien établie car réitérée tant sous présidence Hollande que sous celle d’Emmanuel Macron.

On peut donc déduire de cet article au Recueil Dalloz qu’au vu du RGPD et des obligations qui lui échoient, le ministère de la Justice a fait le choix pour l’avenir et pour la mise en open data de l’ensemble de la jurisprudence de l’anonymisation (au sens nouveau du terme, donc forte), non de la simple pseudonymisation mais carrément de l’anonymisation [mise à jour au 7 septembre 2019 : la suite, et tout particulièrement l’élaboration et la publication de la loi du 23 mars 2019, montrera que cette interprétation extensive du RGPD n’était finalement pas totalement celle des pouvoirs publics, voir aussi le débat infra avec B. Mathis. Il n’en reste pas moins que le ministère de la Justice et les juridictions suprêmes resteront très attachés à une réelle pseudonymisation à défaut d’une parfaite anonymisation].

Conclusion - Mission impossible pour les pouvoirs publics ? - Et les acteurs privés ?

Avec tous les écueils listés supra, on peut estimer que des retards supplémentaires ou pour le moins une réalisation partielle sont possibles voire probables.

Que va-t’il se passer sur le terrain entre-temps, est une question à laquelle je me garderais bien de répondre. Mais la réponse pourrait bien définir le futur de facto (et non de juro ; c’est le genre de situation qu’on a longtemps connu en matière de données personnelles dans la jurisprudence) si les pouvoirs publics se situent dans des délais aussi longs. Espérons que les acteurs (qui incluent les éditeurs juridiques et les institutions tout autant que les legal tech) suivront la position que vient de prendre le ministère.

Emmanuel Barthe
bibliothécaire documentaliste juridique
spécialiste des données publiques juridiques

Notes

[2Le gras est de nous.

[3Evelyne Serverin, Plaidoyer pour l’exhaustivité des bases de données de décisions du fond (à propos de l’ouverture à la recherche de la base JURICA), Rec. Dalloz 2009.2882. Voir sur ce blog : Tout (ou presque) sur Jurica. Serge Bories, JuriCA : un outil de communication et de recherche, Rec. Dalloz 2011.1242. Rapport 2015 de la Cour de cassation > Activité du SDER > C > 9e paragraphe.

[4Avis CADA n° 20053620 du 3 novembre 2005 Maire de Lyon (délégation générale au service au public et à la sécurité). Voir sur le site de la CADA : L’accès aux documents administratifs > L’étendue du droit d’accès > La notion de document administratif > Les documents juridictionnels. Extrait pertinent : « La CADA, saisie d’une demande d’avis concernant de tels documents, se déclare incompétente. Il s’agit en particulier :

  • des jugements, ordonnances, décisions ou arrêts rendus par les juridictions de l’ordre judiciaire ou par celles de l’ordre administratif ».

[5Vous pouvez le constater par exemple dans le texte de cet arrêt de la cour d’appel de Paris 5è chambre, section C du 23 juin 2000 n° RG1999/00336, où le pseudonyme d’un chanteur célèbre est en toutes lettres.

[6Pour un exemple, voir infra dans le texte.

[7Règlement (UE) 2016/679 du Parlement européen et du Conseil du 27 avril 2016 relatif à la protection des personnes physiques à l’égard du traitement des données à caractère personnel et à la libre circulation de ces données, et abrogeant la directive 95/46/CE (règlement général sur la protection des données), JOUE L 119 du 4 mai 2016, pp. 1-88.

[8Point 2.2. de la Synthèse du règlement sur la protection des données, Wiki de la Quadrature du Net (consulté le 19 mars 2017).

[9Un travail collaboratif dans le cadre du forum Open Law en 2017 a permis de dégager une quarantaine de champs et d’annoter environ 400 décisions extraites de Legifrance.

[10Le XML de PACER ne balise toutefois pas le texte même de la décision mais ce qu’on pourrait appeler ses métadonnées — et là, il est assez complet, voir ce fichier PDF. Il ne balise pas, notamment, les noms des parties dans le rappel de la procédure et des faits, ni dans les motifs ni dans le dispositif.

[11ETP : équivalent temps plein. Expression utilisée en RH dans la fonction publique.

[12Source : Chiffres clés de la Justice 2016, qui donne les chiffres de 2015. Version PDF complète.

[13Cette masse, en revanche, ne sera peut-être pas inintéressante pour les outils dits de "justice prédictive". Voir notre article Intelligence artificielle en droit : derrière la "hype", la réalité.

[15Rapport 2015 de la Cour de cassation > Livre 4 : Activité de la Cour > II. Service de documentation, des études et du rapport de la Cour de cassation > Activité 2015 du [SDER] > A. Le SDER > 2. Les autres missions de support du SDER.

[16Les tribunaux de commerce ne comptent pas de magistrats du ministère de la Justice et ce sont les greffiers de commerce, profession indépendante, qui gèrent eux-mêmes la production des décisions des Tcom.

[17I.e. hors Cour de cassation.

[19Les commentateurs sous l’article de NextINpact précité se font des idées quand ils estiment (très majoritairement) que la pseudonymisation est déjà faite ou est facile.

[21La loi Informatique et libertés, tout comme le Règlement général de protection des données, ne concernent pas et ne protègent donc pas les personnes morales, comme les sociétés ou les administrations. Toutefois, "société Robert" permet une réidentification aisée : une interprétation ne respectant pas la lettre de la recommandation CNIL mais l’esprit de la loi recommande donc d’anonymiser — pardon, pseudonymiser — "société Robert" en "société X...".

[22Violant ainsi non seulement la recommandation CNIL mais aussi la loi ...

[23Blog de Supra Legem 5 septembre 2016.

[25Pour citer l’intervention au colloque de 2016 sur l’open data de la jurisprudence de Jean-Paul Jean, alors président du Service de documentation, des études et du rapport (SDER) de la Cour de cassation et à ce titre au coeur du problème : « De nombreuses décisions, et plus encore celles de décisions des juges du fond, contiennent tant de détails liés aux faits de l’espèce que des personnes connaissant les protagonistes d’un procès pourront les reconnaître à la lecture d’une décision, même si les éléments d’identification directe sont occultés.
L’enjeu ne saurait donc être d’empêcher toute ré-identification, ce qui est impossible (à moins de rendre les décisions illisibles et inexploitables), mais d’évaluer ce risque, de le limiter, donc de définir un niveau de risque acceptable, doublé d’un mécanisme de correction, au regard des bénéfices attendus par l’open data. »

[26Avec l’accès gratuit à toute la jurisprudence, des magistrats réclament l’anonymat, par Caroline Fleuriot, Dalloz Actualité, 6 février 2017.

[30TA Paris 2e ch. 7 novembre 2016 n° 1507125. Ce jugement a été publié in extenso dans la Lettre du tribunal administratif de Paris fin janvier 2017 (PDF) p. 116. Lire notre billet Défaut d’anonymisation d’un arrêt sur Legifrance : l’Etat condamné à 1000 euros de dommages-intérêts.

[31Statut et rôle du greffier, site du greffe du tribunal de commerce de Bobigny, consulté le 28 juillet 2017.

[32L’accès aux décisions anonymes ne fait pas l’unanimité parmi les magistrats, par Caroline Fleuriot, Dalloz actualité, 6 février​ 2017 (accès réservé). L’information donnée par le ministre de la Justice Jean-Jacques Urvoas est également reprise en bas de page d’un autre article de Dalloz Actualité, en accès libre, lui : L’utilisation de l’outil Predictice déçoit la cour d’appel de Rennes, 19 octobre 2017.