Appuyez sur Entrée pour voir vos résultats ou Echap pour annuler.

Open data judiciaire : les soucis de la Cour de cassation
Compte-rendu de deux colloques à sept ans de distance

En 2016, la Cour de cassation organise un premier colloque sur l’open data des décisions de justice. On est alors dans les débuts de la diffusion et rediffusion libres et gratuites des données publiques judiciaires. En 2023, rebelote. Entre-temps, la loi République numérique est passée et l’open data effectif des arrêts des juridictions suprêmes et cours d’appel a commencé. On est rentré dans le dur, dans l’implémentation. De nombreux soucis perdurent vis-à-vis de l’open data (common law, absence de hiérarchie ...), même si certains ont disparu comme la mention du nom des juges.

Infra vous trouverez mes notes, mon compte-rendu de l’époque, telles quelles. Ces peurs sont-elles toutes fondées ? A vous de vous faire votre opinion.

Emmanuel Barthe

— -

Colloque Cour de cassation open data, 14 octobre 2016 : La jurisprudence dans le mouvement de l’open data : compte-rendu

Vidéos. Actes publiés à la Semaine juridique édition Générale, supplément au n° 9 du 27 février 2017.

Il y a une semaine la CEPEJ a mis en ligne toute la jurisprudence de ses membres.

Jean-Paul Jean (président du SDER) :
Entrée en vigueur de la loi République numérique : diffusion des décisions du fond, d’où obligation d’anonymisation
Stock Jurica 1 500 000 (150 000 arrêts de CA par an sur 10 ans).
A terme 1,5 millions de décisions par an.
Questions :

  • sélectionner ou exhaustivité ? Certains pays sélectionnent
  • quelle part entre le public et le privé ?
  • quelles conséquences sur les juges ? Le profilage de leurs décisions devient possible. Leurs noms ne sont pas anonymisés ... Contra : transparence. Lex Machina propose depuis peu un comparateur de juges (mais aussi d’avocats)
  • la ré-identification va devenir possible. Le problème devient : comment la limiter ?
    Arbitrer par la finalité : RGPD : principe de minimisation des données.
    Le moteur établira sa propre hiérarchie des décisions -> aux juridictions et à la Cour de maintenir, améliorer et valoriser le système de titrage et sommaire.

Professeur William Gilles :
Il n’existe pas de droit de l’open data en réalité, mais un droit de la réutilisation des données publiques.
La finalité, la logique du droit de la réutilisation des données publiques selon le droit européen c’est la croissance du marché intérieur donc les entreprises .
La logique américaine est différente : assurer la transparence pour contrôler les institutions.
La 2e directive réforme en obligeant les Etats membres à laisser réutiliser. Mais derrière ce nouveau principe il y a des exceptions dont certaines liées aux Etats membres eux-mêmes.
Les Etats membres disposent dans ce cadre européen d’une réelle marge de manoeuvre. La preuve : la France a créé un principe de gratuité de la réutilisation des données publiques.
Regrette l’absence de licence unique et obligatoire (celle d’Etalab lui semble suffisamment souple).

Thomas Lesueur (DSJ) :
Deux enjeux techniques :

  • le rôle central du SDER doit être préservé et renforcé sans que ces évolutions le fragilisent
  • l’anonymisation, par la Cour de cassation, qui est coûteuse. Le projet prescrit dans la durée, plusieurs années.
    Espère un allègement de la charge de travail des juridictions par le biais du développement des transactions qui résulterait du traitement des décisions de justice par le Big data et l’IA.

Christian Vigouroux (président de section au Conseil d’Etat) :
Faut-il tout diffuser, y compris les ordonnances de désistement ?
Question : faut-il traduire les décisions ?
Faut-il diffuser les avis consultatifs du CE ?
Le CE est intéressé par les informations que donnent/révéleront l’analyse des décisions
La grandeur du juge est aussi de ne pas se laisser enfermer par l’open data (i.e. la justice prédictive).
L’open data va pousser le juge à une meilleure motivation surtout s’il diverge de la jurisprudence dominante.
L’open data va faciliter la barémisation des sanctions.
C. Vigouroux n’a pas peur des études de M. Benesty.

Adnène Trojette (Cour des comptes) :
Le problème est que certaines administrations ont, faute de budget suffisant, pris l’habitude de faire payer les utilisateurs. Cf la QPC de Regards Citoyens.
La redevance était un instrument de régulation
Les acteurs émergent étaient exclus d’autant que les redevances étaient dégressives.
Les données des administrations, selon le droit public, ne leur appartiennent pas.
Il y a un débat sur le type de licence à adopter par les administrations et sur l’utilité d’avoir ou pas une licence unique.

Question de Bruno Mathis : l’obligation de transparence des algorithmes intervenant dans les décisions individuelles concernant les citoyens peut-elle amener à publier les règles d’anonymisation ? Et quid si le logiciel fonctionne en machine learning.
Réponse de M. Lucchesi (Etalab) : le décret d’application est en cours d’élaboration. De plus, il faudra pouvoir auditer les algorithmes.

Professeur Anne Debet :
Des arrêts même anonymisées comportent suffisamment d’informations surtout les noms de société, pour les dé-anonymiser.
Vie privée : article 8 Code civil, article 9 Conv. EDH.
Droit à l’oubli : spécialiste Agathe Lepage.
100 000 demandes françaises de déréférencement sur Google dont 49% accordées par Google. Les sites de presse peuvent invoquer la liberté d’expression mais pas Google.
Arrêt Cour de cassation 12 mai 2016.
Recommandation CNIL de 2001 : parallèle avec le casier judiciaire, refus anonymisation à la demande car pas assez protecteur.
Loi Lemaire : art L 322-2 CRPA.
RGPD.
Loi CNIL : intérêt légitime, données sensibles, donnés infractions et condamnations pénales et civiles.
Droit d’opposition important : il doit pouvoir être respecté. Cf affaire Lexeek.

Alain Lacabarats, président de chambre maintenu en activité, ancien dirigeant du SDER, ancien président de la 3e chambre civile puis de la chambre sociale :
Les décisions cassées devraient disparaître d’Internet.
Les questions liées à l’anonymisation des décisions se posent aussi sur l’intranet justice.

Édouard Gevrey (CNIL) :
Fait distribution entre le contexte de la décision CNIL de 2001 et celui actuel : l’open data c’est la diffusion massive.
La loi Lemaire dit la même chose que la loi Informatique et libertés : la réutilisation des donnés est soumise à la loi CNIL.
Distinguer pseudonymisation (qui est le véritable terme décrivant ce qu’on fait aujourd’hui sous le nom d’anonymisation) et (véritable) anonymisation (absence totale de données permettant une ré-identification).
Caveat CNIL rajouté à la licence : la réutilisation ne doit pas avoir pour but de dé-anonymiser/ré-identifier.
Loi Lemaire -> la CNIL va homologuer une méthodologie d’anonymisation + faire des contrôles à posteriori + inventer des dispositifs permettant de toucher les milliers de réutilisateurs.
Pack de conformité en cours d’élaboration.

Nathalie Métallinos (avocate) :
Le RGPD parle en fait d’impossibilité de ré-identification en l’état de l’art.
Le justiciable ne doit pas hésiter à agir en justice parce que se constituerait un casier judiciaire bis.
Attention à retirer date de naissance, numéro de sécurité sociale etc. (sur Legifrance, arrêt de Nîmes 9 août 2011).
Les règles juridiques sur la publicité des décisions de justice continuent de s’appliquer, en amont de leur réutilisation.
CEDH 1997 affaire finlandaise séropositivité révélée dans une décision de justice : la CEDH a estimé que la juridiction aurait dû supprimer tous les motifs.
Le caveat de la CNIL est un voeu pieux.
C’est donc lors de la production de la décision que la non diffusion doit être signalée.

Michaël Benesty : quelle méthode d’anonymisation la CNIL va recommander ? Machine Learning ou cas par cas ? Réponse Édouard Gevrey : pas d’appréciation au cas par cas ; la CNIL travaile sur la détermination du niveau de granularité.

INPI : attention, si on anonymise les décisions en propriété intellectuelle, elles peuvent devenir incompréhensibles.

N. Métallinos, A. Lacabarats : pour anonymiser, il faut distinguer selon les matières.

— -

Colloque Cour de cassation open data, 27 novembre 2023 : Quelle jurisprudence à l’ère des données judiciaires ouvertes ? : compte-rendu

Vidéos

[E. Barthe : quelques remarques générales sur ce colloque de 2023 :

  • contrairement à son prédécesseur de 2016, il réunit peu de "contestataires" (aucune legaltech n’est invitée ni n’est intervenue). C’est un colloque plus communicationnel et verrouillé que celui de 2016 sur le même sujet
  • bien que faisant directement et expressément suite au 2e rapport Cadiet sur l’open data judiciaire (juin 2022) [1], le colloque de 2023 s’avère beaucoup moins audacieux que les propositions de ce rapport
  • les termes "masse" et "hiérarchisation" n’ont pas cessé de revenir tout au long de ce colloque, ce qui montre bien le souci de la Cour avec l’open data
  • les propos sur les méthodes de recherche de décisions de justice semblent un tantinet passéistes et donnent l’impression que la Cour lutte contre la marée [de la recherche par mot-clé et un jour prochain par l’IAG]
  • l’ensemble des interventions manque cruellement de sociologie juridique et d’études quantitatives (justement) des décisions de justice actuelles. Même Mme Sayn n’en a évoque aucune
  • enfin, aucun propos un tant soit peu détaillé lors de ce colloque sur les performances des IA génératives en droit.]

Extraits des interventions :

Professeur Mitchell Lasser (USA) : En deux mots : aucun mouvement important d’open data n’est encore survenu aux États-Unis dans le domaine des jugements judiciaires. L’accès aux jugements et l’organisation des précédents restent dans les mains des grandes maisons d’édition.
L’open data des décisions de justice pourrait en théorie réduire l’influence des éditeurs puisqu’il n’y a plus de sélection. Mais quels en sont les effets réels sur le fonctionnement du système juridique américain ? Car les juristes américains font très peu de recherches booléennes et essentiellement des recherches en langage naturel, sur des plateformes en ligne appartenant aux éditeurs donc passant par les filtres humains des éditeurs : Shepard’s pour West, algos de LN pour Lexis Advance. Noter de plus que les différents moteurs produisent peu de chevauchements entre éditeurs : un tiers de chevauchement seulement entre Lexis et Westlaw. Le juriste moyen est trop confiant ... Les anciens systèmes de Lexis et West étaient un système *commun* : les nouveaux systèmes déstabilisent cela, mais n’établissent pas pour autant un accès démocratique à la jurisprudence. Cet accès reste toujours intermédié — du moins aux USA.

Fernando Gascon Inchausti, professeur de droit à l’Université de Madrid :
En Espagne, le changement n’a pas été un bouleversement parce que le niveau d’accès à la jurisprudence était élevé et les prix pas exorbitant et qu’il n’y avait pas d’IAG à l’époque. Le débat était économique et non politique.
Conséquence de l’open data en Espagne : les avocats espagnols ont tendance à citer beaucoup plus de jurisprudence mais sans les avoir trop étudiées (pas d’analyse de la ratio juris). Réaction : les règles tendent à imposer des limites à la longueur des documents (25 pages pour les pourvois en cassation). Les juges ont espagnols ont trop de travail pour tout lire ... Pour les tribunaux : « de nombreux arrêts ont tendance à être plus longs, avec des fragments de décisions antérieures copiés-collés, mais sans qu’il y ait toujours une analyse comparative de la ratio iuris dans chaque cas. [...] En réalité, il n’y a pas de véritable dialogue entre les juridictions. Ce sont plutôt les jugements antérieurs qui sont cités comme des précédents faisant autorité, ce qui permet d’économiser l’effort d’un raisonnement individualisé. Ce phénomène est plus net en première instance et en appel, heureusement moins en cassation. »
En Espagne « [les éditeurs] ont du mal à vendre [leurs outils d’IA générative en JP] ».

Professeur Pascale Deumier : voit-on un intérêt se développer pour les "petites décisions" (1ère et 2e instance) en Espagne ? Fernando Gascon Inchausti : non, les cours supérieures ne regardent pas trop les décisions des cours inférieures. Professeur Frédérique Ferrand : en droit allemand, la Cour suprême cite de temps en temps les décisions de 1ère instance mais pour montrer qu’elle connaît le terrain et clarifier le débat. M. Lasser : aux USA, on ne publie qu’entre 10 et 25% des décisions des CA fédérales, c’est encore moins en 1ère instance fédérale et encore encore moins pour les décisions fédérées.

François Molinié, président de l’Ordre des avocats au CE et à la Cour de cassation : « Rentrer dans la jurisprudence de la Cour de cassation par le plan de classement du Bulletin force, lorsque vous faites une recherche, à d’abord qualifier votre problème juridique [...] Il n’y a que le plan de classement qui permet de le faire de manière efficace. [...] Le Bulletin est publié désormais beaucoup plus vite. »
[E. Barthe : loin de moi l’idée de minorer l’utilité du plan de classement du Bulletin des arrêts, mais je constate que de nombreuses "branches" du plan aboutissent à des arrêts uniques, isolés. Le plus utile dans ce plan, ce sont les mots-clés qui le composent, dits "titrage", car ceux des deux, voire trois premiers niveaux peuvent être utilisés dans une requête sur une base de données de jurisprudence.]

Jean-Baptiste Parlos, Premier président de la CA Rennes :
« J’étais conseiller référendaire au moment où la révolution de Jurinet s’est développé [...] : à la question de savoir si nous regardions dans les mémoires des avocats au Conseil la jurisprudence citée, la réponse est non. Nous nous référions à Jurinet uniquement, pour ensuite peut-être confronter le résultat de nos recherches aux arrêts cités par les mémoires afin de vérifier que nous n’en avions pas oublié un qui était important. La difficulté majeure pour nous était d’avoir un système de recherche à peu près efficient alors que avions abandonné le système des références. [....] Il arrivait souvent après une recherche qui nous paraissait approfondie que nous apprenions que des arrêts essentiels nous avaient échappé et que nous avions donné à des décisions un poids qu’elles n’avaient pas. [...] On se faisait tancer par un doyen de chambre ou des conseillers plus anciens. L’accès à une masse de documents, à une masse d’informations n’est rien s’il n’est pas accompagné de l’apprentissage de la recherche et de l’apprentissage de la hiérarchisation qu’on peut donner entre telle et telle décision [...]
La recherche des précédents n’est pas la première préoccupation d’un juge du fond. Sa première préoccupation, c’est le flux, c’est à dire la pile qui est à gauche qu’il va falloir faire passer à droite, c’est -à-dire le nombre de jugements qu’il doit rendre. Et sa seconde voire égale préoccupation, c’est la trame : des blocs de motivation, une efficacité pour absorber les flux qui ne cessent d’arriver dans les juridictions du fond. [...] La succession des réformes est vécue par les juges du fonds comme une sorte de harcèlement. La recherche de jurisprudence en première instance *peut* arriver mais ce n’est pas la première préoccupation de nos collègues du fond, d’autant qu’ils ne sont pas toujours formés à la détermination de la décision qui peut faire jurisprudence. Les choses sont sans doute en train de changer un peu avec l’évolution des fonds documentaires. »

Edouard Rottier, chef du pôle diffusion de la jurisprudence et open data au SDER : une des utilisations de l’open data par les magistrats peut être de « regarder, en matière d’appréciation des faits, la jurisprudence de leur propre cour d’appel. [...] 10 à 15 000 décisions de cours d’appel sont diffusées tous les mois sur la base Judilibre. [...] Les apports de Judilibre par rapport à Légifrance : la gratuité d’accès aux arrêts d’appel (i.e. diffusion de la base JuriCA [E. Barthe : sauf erreur de ma part, uniquement à partir du 15/04/2022, pas avant]), la réutilisation, [...] Dans quelques semaines, Judilibre permettra d’accéder aux décisions civiles rendues par 9 tribunaux judiciaires. » Réponse au professeur Zénati-Castaing : en substance, pas encore de modélisation fiable possible des décisions des juges, mais sur les contentieux chiffrés comme la prestation compensatoire, ça marche [NB E. Barthe : cf les modules de Case Law Analytics].

Véronique Lebreton, Première présidente de chambre à la cour d’appel de Bordeaux : « Faible alimentation de Jurinet [les magistrats du fond] [...] Sélectionner et mettre en lumière une décision n’est pas la priorité pour les magistrats du fond et ces magistrats ne sont pas certains en outre de la qualité et de la valeur de leur production pour la construction des normes. » Autrement dit : les magistrats du fond n’ont pas le temps de sélectionner et signaler leurs décisions.

Isabelle Sayn, directrice de recherche, IERDJ : « Les décisions en open data [sont] une base inépuisable d’exemples, notamment dans l’argumentation que pourront utiliser les professionnels [du droit] [...] La question de l’harmonisation : comment justifier que deux affaires comparables conduisent à des décisions différentes, notamment en terme de quantum, dans le mesure où cela va être rendu visible par l’open data. [E. Barthe : merci à Mme Sayn d’avoir au moins exposé en deux phrases le point de vue intéressé des avocats sur l’open data.] [...] Pourquoi ne pas réserver Légifrance à la norme, y compris jurisprudentielle, y compris issue des décisions du fond, et Judilibre à des analyses transversales ? Les outils mis à disposition pour faire ces analyses transversales sont des outils qui pour le moment sont promus par des legaltech qui sont créées sans aucun contrôle de l’autorité publique et il serait très bien que ces outils fassent l’objet d’un contrôle [E. Barthe : on peut estimer que ce souhait n’aura aucune postérité]. »

Le professeur Zénati-Castaing fait un exercice de prospective judiciaire :
« Sur la nature de la Cour de cassation, j’avais soutenu la thèse suivante (qui n’a rien de nouveau) : la jurisprudence de la Cour n’est rien d’autre qu’une production législative, un peu mâtinée de doctrine. Son rôle principal est de transformer la production du contentieux en norme abstraite et contraignante. Je ne m’attendais pas à revenir ici un jour pour au fond dire le contraire. Parce que c’est ce qui est en train de se passer. On voit se tisser une cinématique des événements qui nous entraîne vers un état du droit, vers une organisation de la justice qui nous rapproche du système du précédent. Bien sûr, ce n’est pas du jour au lendemain qu’on va rayer d’un trait de plume le droit romano-germanique mais l’alerte est sérieuse. [...] Mon approche n’est de sauver le système mais de faire de la prospective. Je n’ai aucun a priori. [...]
Aujourd’hui, rendre visible la manière dont la justice est rendue, à travers les jugements, à travers les arrêts, c’est mettre sur le devant de la scène une culture qu’on ne connaît pas quand on ne fait pas partie de milieu. Et cette culture est totalement différente de celle qu’on pratique à la Cour de cassation et dans les facultés de droit. Ce n’est pas du tout une vision abstraite du droit, ce n’est pas une vision normative du droit, c’est une vision discursive du droit. La manière dont les tribunaux fonctionnent quotidiennement, c’est la discussion, la persuasion, l’appréciation des faits et l’élaboration d’une décision à partir du fait. C’est-à-dire que le plus souvent, le juge motive sa décision en droit à partir du sentiment de justice qu’il s’est confectionné dans l’examen des faits. Et cela est complètement refoulé, tant par la Cour de cassation que par l’Université. Et c’est cela qui est subversif aujourd’hui. [...] La Cour de cassation se nourrit des décisions des juges du fond. Si vraiment la Cour [du fait de l’open data des décisions de première instance] s’intéresse à la pratique judiciaire, elle va découvrir la manière dont fonctionnent les juges du fond. Je suis convaincu que la Cour s’en pénétrera, que cela remettra en cause son attachement à la Loi et transformera sa jurisprudence. »
[E. Barthe : Le professeur Zénati-Castaing pense donc que le juge du fond juge en réalité en équité, selon les valeurs du moment, et maquille sa décision avec du droit. Si seulement le professeur Zénati pouvait prouver ce qu’il dit, quel dommage qu’il n’ait pas été sur le terrain justement et n’ait pas des centaines de jugements à présenter en exemples de sa thèse. La thèse du prof. Zénati-Castaing ne nous semble pas prouvable en l’état. Plus largement, sur la définition toute personnelle de la jurisprudence par le professeur Zénati-Castaing, voir à la fin de notre analyse du 2e rapport Cadiet [2].]