Appuyez sur Entrée pour voir vos résultats ou Echap pour annuler.

Tests et réactions

Le nouveau Légifrance : analyse raisonnée de la nouvelle version
Le 12 septembre 2020, le nouveau Légifrance a remplacé l’ancien

NB : si vous voulez vous plaindre de Légifrance, c’est par là : Legifrance ou la critique, rançon du succès. Ici, c’est un article technique.

A signaler : le tutoriel des principaux cas d’usage, le support du webinaire animé par la DILA le 17 décembre 2020, a été mis en ligne.

Résumé

En résumé pour les lecteurs pressés (TL ;DR), le nouveau Légifrance, c’est :

  • en terme de conception :
    • le nouveau Légifrance est conçu comme une base unique et non plus comme une plateforme regroupant plusieurs bases de données. Ce qui n’empêche pas qu’il demeure difficile de mélanger les torchons et les serviettes. Autrement dit, il n’est pas recommandé d’interroger l’entièreté du site si on peut l’éviter. Sauf à le faire par Google (exemple de la puissance de l’interrogation de Légifrance par Google) mais à ce moment, attention : les recherches d’articles de Codes via Google seront erronées, le temps que leur bot réindexe entièrement les Codes
    • le nouveau Légifrance est également conçu à base d’API. Autrement dit, il est fait d’abord pour être réutilisé (par les éditeurs juridiques, les legal tech et les geeks qui auront le courage de s’y attaquer [1])
  • en terme de contenus :
    • le recul chronologique du JORF s’améliore nettement, à 1869, grâce au fonds numérisé par la BNF
    • mais les traductions (certes non tenues à jour depuis fort longtemps) disparaissent
  • en terme de fonctionnalités : beaucoup de pertes (plan de classement des arrêts du Conseil d’Etat et de la Cour de cassation, thésaurus SARDE, infos complémentaires sur le texte ...)
  • "Silence vaut acceptation" quitte Légifrance pour passer chez Service-Public
  • en terme de mise en page : une meilleure lisibilité sous smartphone (RWD), mais moins lisible sur ordinateur. Et encore des gros pâtés de texte (largement résolu)
  • en terme de moteur de recherche :
    • arrivée du type-as-you-search et maintien de la recherche par expression et par proximité
    • maintien de la troncature droite illimitée (*) et limitée (?) dans certains champs à condition d’interroger un seul fonds/base (fragile)
    • mais il n’y a pas de tri par date des résultats sur la recherche multi-fonds, le classement des résultats par pertinence a de grosses lacunes et l’interface de recherche avancée est peu pratique car pas assez compacte et très "confusionnante". Au point que la recherche d’arrêts de la Cour de cassation par leur n° au Bulletin ou de pourvoi peut devenir ardue [2]
    • disparition de l’interface de recherche des mesures nominatives
  • en terme de veille : toujours pas de fil RSS
  • en terme de logiciel bibliographique : perte des métadonnées RTF
  • en terme d’open data et de legal tech : des API pour les rediffuseurs et les développeurs, enfin !

Soyons clair :

  • une partie importante des disparitions n’est pas liée à l’arrivée du nouveau Legifrance mais apparemment à un manque de moyens. Les outils qui vont disparaître ne sont en fait plus mis à jour depuis des années. Il fallait trancher
  • la recherche par le plan de classement de la jurisprudence administrative (PCJA) reste disponible dans le base Ariane web sur le site du Conseil d’Etat.

Si vous avez le temps, lisez la suite.

Sommaire

Introduction


Page d’accueil de la bêta de la nouvelle version de Légifrance, vue sous smartphone

La DILA, le Secrétariat général du Gouvernement et la SSII Sword, qui sont les "auteurs techniques" de Légifrance (sans parler des institutions producteurs des contenus comme le Conseil constitutionnel, la Cour de cassation, le Conseil d’Etat, la CNIL etc.) ont sorti en octobre 2019 une version bêta de Légifrance. Autrement dit une vue assez proche de ce sera Légifrance dans un futur très proche. La nouvelle version de Légifrance remplacera en effet l’ancienne le 12 septembre 2020. Un webinaire (tutoriel) a été mis en ligne par la DILA, il dure 36 minutes. Ainsi qu’un guide PDF de prise en main rapide.

Cette nouvelle version aura été en bêta 11 mois. Comme nous l’écrivait la DILA, elle « souhaitait en effet avoir pris en compte les retours (évalués comme les plus "irritants ") des bêta testeurs dans les itérations ». Cette réponse de la DILA, ainsi que les notes de version de la bêta, si elle illustre leur souci d’améliorer le "produit", montre aussi qu’il n’était pas question de changer la conception initiale du produit, ni les principaux choix faits. Une bêta n’est pas selon la DILA une re-conception. On peut sur un certain nombre de points le regretter.

Pour mémoire, en dehors de publier l’essentiel du droit français brut (hors commentaires [3]), Légifrance est la plateforme juridique publique *la plus consultée en France* avec Servicepublic.fr. En effet, depuis 2012, ces deux sites sont désormais parmi les deux premiers de la toile gouvernementale ou sinon juste derrière Bercy [4].

La précédente version avait été mise en place en 2008 [5]. Censée disparaître entre début janvier et fin mars 2020 [6], elle aura vu sa vie prolongée jusqu’au 11 septembre. Elle aura donc tenu 12 ans.

Selon le site web du syndicat CFTC Territoriaux 78, « la conception du nouveau site, engagée en 2017 pour un coût total de 3,3 millions d’euros, a été confiée à 7 prestataires : Sword, puis Sopra Steria pour les développements, Ecedi pour le webdesign, Worldline pour l’hébergement, Adelan pour l’expertise sur le moteur de recherche, Elastic pour l’édition du moteur et CDN Tech pour la protection du site, avec un dispositif anti-déni de service ».

La DILA, à qui nous avons transmis une partie importante des remarques infra en octobre 2019 (le reste a été ajouté par les mises à jour de ce billet après le lancement de la nouvelle version le 12 septembre 2020), nous a répondu fin novembre 2019, juste après leur première mise à jour de la bêta. Leurs réponses sont en italique, après nos remarques, et précédées de la mention "DILA nov. 2019".

DILA nov. 2019 : Il est prévu de ne pas figer le site après bascule pour continuer à proposer de nouvelles fonctionnalités en réponse aux attentes exprimées et/ ou aux évolutions des usages.

Les nouveautés

Voici les principales nouveautés signalées par les articles publiés le lendemain du lancement officiel de la bêta le 7 octobre [7] — et dûment constatées par nos soins. La source la plus exhaustive et la plus intéressante est bien sûr le guide de la bêta.

- Nouvelle interface

  • comme l’écrit le Monde du Droit, « le site abandonne son aspect de portail pour un accès simplifié aux contenus » : le moteur de recherche devient global et central. A l’expérience, il prend en quelque sorte le pouvoir au sein du site.
  • conçue nativement pour les appareils mobiles (smartphones et tablettes). C’est ce qu’on appelle le "responsive web design" (RWD, traduit généralement par design adaptatif) [8]


    Ce petit bonhomme stylisé, c’est le futur accès à un compte/profil personnel

  • création de l’espace personnel permettant d’enregistrer des recherches et de personnaliser des alertes. D’où la présence de l’icône "bonhomme" en haut à droite des pages de la bêta
  • des travaux seront consacrés à l’intégration des liens de Légifrance (les liens dans le sens inverse existant déjà) vers les fiches de Service-public.fr.

DILA nov. 2019 : Les deux fonctions précédentes ne sont pas encore disponibles et seront mises en place à partir du second semestre 2020.

- Nouveaux contenus

  • le plus notable est la mise en ligne des versions numérisées de tous les Journal officiel Lois et décrets papier, les plus anciens datant de 1869. Ces JORF anciens sont des PDF texte (derrière l’image, le texte a été OCRisé) accessibles uniquement via la recherche par date. La recherche dans les fichiers PDF des JO est possible mais uniquement numéro par numéro
  • les tables analytiques du JO jusqu’en 2015
  • sinon, la nouvelle version inclut les études et fiches d’impact des lois, ordonnances, décrets et arrêtés et les avis du Conseil d’État rendus sur les projets de loi. Cependant, ces contenus étaient déjà disponibles sur les sites web de l’Assemblée nationale et du Sénat et des liens dans les dossiers législatifs y menaient.

- Nouvelles fonctionnalités

  • recherche :
    • le moteur de recherche est désormais le très populaire moteur open source Elasticsearch [9]
    • la fonction de recherche du site modernisé se décline en trois types :
      • une nouvelle recherche multi fonds a été mise en place avec un classement par pertinence et des "facettes" (colonne de gauche pour affiner les résultats par fonds documentaire (textes consolidés, codes, jurisprudence judiciaire ...). On ne peut sélectionner/affiner que par un seul fonds. A noter que dans les résultats de cette recherche globale, les textes consolidés sont privilégiés par rapport à leurs versions initiales (version JO)
      • la recherche précise (équivalent de la recherche simple du site actuel)
      • la recherche avancée (équivalent de la recherche experte du site actuel)
    • il est désormais possible de saisir les numéros d’articles avec différents formats. Exemple : saisir L 112-2, L.112-2 ou L. 112-2 permet désormais dans tous les cas de trouver l’article L112-2
    • il est également désormais possible d’effectuer des recherches avec une chaîne de caractères tronquée (ex : 112-* pour les articles ou EIN ?14*L pour un NOR) dans les champs spécifiques tels que les numéros textes, NOR, numéros d’articles, etc.
    • le moteur propose des "pré-résultats" : une liste de titres (sans extraits donc) supposés être les plus pertinents
  • le "Chrono Légi" permet de suivre l’évolution dans le temps de la rédaction d’un article de loi, de décret ou de code avec un comparateur de versions qui met en évidence les modifications apportées
  • une fonction de comparaison/visualisation des ajouts/suppressions/modifications entre 2 versions d’un article d’article jusqu’au niveau de l’alinéa (bouton "Comparer" dans l’onglet "Versions" des articles)
  • selon le Monde du Droit : « pensé nativement pour l’opendata, le nouveau site a une architecture technique fondée sur des API de consultation (interface de programmation applicative), qui vont faciliter l’accès et la réutilisation des données juridiques par d’autres sites ou applications tierces. Il est ainsi possible de créer une recherche vocale via ces API ».

DILA nov. 2019 : Les APIs ont été ouvertes le 29 novembre après-midi lors d’une présentation dans le cadre de la semaine de l’innovation publique. Vous pouvez retrouver les éléments sur la page suivante : https://www.legifrance.gouv.fr/contenu/pied-de-page/open-data-et-api

- Statistiques et suivi des utilisateurs

Le nouveau Légifrance utilise :

  • l’outil français de statistiques de consultation de site/pages web AT Internet
  • les services de Hotjar, basée à Malte, « afin de deviner les besoins des utilisateurs et d’optimiser le site. Hotjar utilise des cookies et d’autres technologies pour collecter des données sur le comportement des utilisateurs et leurs appareils (en particulier l’adresse IP (capturée et stockée uniquement sous forme anonyme), la taille de l’écran, le type d’appareil (identifiants uniques), les informations du navigateur, l’emplacement géographique (pays uniquement), langue préférée utilisée pour afficher notre site Web). Hotjar stocke ces informations dans un profil utilisateur pseudonymisé. Hotjar et Légifrance s’engagent à ne jamais utiliser ces informations pour identifier des utilisateurs individuels ou pour les faire correspondre à d’autres données sur un utilisateur individuel »
  • le service reCAPTCHA de Google pour protéger l’accès aux informations nominatives concernant des particuliers présentes dans les Journaux officiels. Autrement dit, hors nominations de fonctionnaires : changements de nom, naturalisations. Là aussi, un tracking existe : « Vos données seront communiquées à Google et utilisées par leurs services. Toutefois, votre adresse IP sera préalablement raccourcie par Google dans les États membres de l’UE ou de l’EEE (Espace économique européen) – et sera ainsi anonyme. Dans certains cas exceptionnels, votre adresse IP complète sera transmise à un serveur de Google aux États-Unis et raccourcie ensuite. Au nom de l’exploitant de ce site web, Google utilisera ces informations pour évaluer votre utilisation de ce service. L’adresse IP fournie par reCAPTCHA par votre navigateur ne sera pas fusionnée avec d’autres données de Google. Cette collection des données est sujette à la Charte de confidentialité de Google. »

Nos tests et nos réactions

En vrac, voici nos impressions et réactions, complétées par celles de collègues documentalistes juridiques. Elles datent pour l’essentiel d’avant la première mise à jour de la bêta, faite le 27 novembre, mais, vérifications faites, très peu de choses ont changé depuis sur les points évoqués. NB : vous pouvez retrouver les principales évolutions de la bêta ayant été mises en place ou en cours de mises en place à l’adresse suivante : https://beta.legifrance.gouv.fr/contenu/pied-de-page/informations-de-mise-a-jour

- Donner son avis

Il est possible de donner son "feedback" directement depuis la version bêta : sur chaque page du site, l’outil « Votre avis » est disponible pour faire son retour. Il permet d’enregistrer la page consultée. Très bonne idée, d’autant que si version actuelle reste en ligne jusqu’en mars 2020, cela laisse suffisamment de temps pour collecter une grande masse de retours et améliorer ce qu’il faut.


Le feedback possible sur chaque page : profitez-en !

- Pseudonymisation

Il reste encore un certain nombre d’arrêts incomplètement pseudonymisés. Il suffit hélas d’une seul oubli dans une décision pour que toute celle-ci perde son respect du RGPD et de la loi Informatique et libertés. Exemple :

- Coût et performances

  • coût : l’article de GNT parle d’un coût de 3,3 millions d’euros sur deux ans pour cette nouvelle version. Le rapport Assemblée nationale sur les publications officielles annexé au projet de loi de finances pour 2019 et rédigé par Marie-Christine Dalloz parlait d’ « un coût estimé à 3,8 millions d’euros » [10]. Pas de dérapage, donc semble-t-il. Un très bon point pour les équipes ayant travaillé sur ce projet
  • une partie importante de ce cette somme est passée dans 18 mois de développements et 6 mois de tests utilisateurs et de réglages, expliquent les Actualités du droit (Lamy)
  • il est possible qu’une autre partie de ce coût soit passée dans l’hébergement (les serveurs web), assuré par Atos, et la connexion. En effet, la charge est importante : plus de 12 millions de visiteurs uniques pour Legifrance en 2005, 15 millions en 2006, 84 millions de visites en 2012 et 117,5 millions en 2016. En 2018, Légifrance enregistrait 120 millions de visites
  • le chargement de la page d’accueil du site est rapide voire très rapide sous Chrome pour Android avec un smartphone de base à 200 euros (Samsung Galaxy gamme J), plus laborieux sous Firefox. Mais on sait que le navigateur de Google pré-charge pages et liens dans le navigateur et sur ses serveurs, ce qui biaise la comparaison.

- Interface

  • passage en "responsive web design" (RWD). Il était temps, mais en même temps il ne fallait pas aller trop vite sur un site aussi complexe. D’un côté, tous les web mag’, les sites d’actualité et les versions web des réseaux sociaux sont au format adaptatif depuis des années, du fait que les consultations par mobile sont devenues majoritaires en 2015. Et, comme mentionné sur ce blog, Lextenso est passé en RWD en 2017, Lexis 360, EUR-Lex, Dalloz-Avocats et Lamyline en 2018 ... [11]. De l’autre côté, basculer Légifrance en site adaptatif sans réflexion globale ni redesign complet aurait probablement été très difficile (et un gâchis d’argent public) quand on voit l’ensemble des fonctionnalités logées en haut et dans la colonne de gauche et toutes ces bases très différentes.
    Sur ce sujet de l’adaptation aux appareils mobiles, mes pensées vont vers le travail d’un pionnier de l’informatique juridique française, doté d’une véritable compétence web : Georges-André Silber, le président fondateur de Luxia, revenu depuis à l’enseignement. C’est lui qui développa Légimobile, le prédécesseur de ce nouveau Légifrance. Je ne dirais pas l’ancêtre, car la légèreté du code HTML, la rigueur de la mise en page, le côté portail de Légimobile (et d’autres choix) le différencient beaucoup du nouveau Légifrance
  • accessibilité : Légifrance se soucie depuis 2012 d’accessibilité aux personnes handicapées (cf rapport d’activité 2012 de la DILA et la déclaration de conformité publiée sur le site) et c’est franchement méritoire. Car l’obligation pour un acteur public de rendre ses sites web et applications conformes au RGAA, le référentiel général d’accessibilité pour les administrations, est très relative. En effet, comme l’explique la Gazette des communes, la notion de « charge disproportionnée » à l’article 4 du décret n° 2019-768 du 24 juillet 2019 [12] permet à un acteur de ne pas se mettre en conformité avec le RGAA [13]. Des sanctions sont certes prévues pour les organismes qui ne respecteraient pas le décret. Mais hélas, non pas parce que leurs sites et applications ne sont pas accessibles aux personnes handicapées, mais parce qu’ils ne feraient pas figurer une « déclaration de conformité » à la réglementation. En clair, pour éviter l’amende – de 2000 à 20 000 euros – il suffit de d’annoncer sur son site que celui-ci n’est pas "accessible" [14]. Donc chapeau au SGG et à la DILA [15]
    A rebours de cette tendance, avec l’ensemble de ses pages s’adaptant aux écrans de portables, Légifrance, peut-être poussé par son statut de 2e site public de France, progresse heureusement sur ce chemin
  • pour choisir une base de données (un "fonds") dans le nouveau Legifrance, ce serait bien d’avoir comme avant juste à cliquer sur un lien (un seul clic) dans la page d’accueil, au lieu de :
    • soit devoir dérouler le menu déroulant des bases puis en choisir une (deux clics). Sans compter qu’on perd la vue d’ensemble des bases
    • soit passer par le menu dans le bandeau supérieur. En effet, en version ordinateur, il serait optimal d’améliorer sa visibilité et en version smartphone (RWD), il est encore moins pratique, caché dans le menu "hamburger" (trois barres en haut à droite) (trois clics)


      Liste des fonds indexés (i.e. cherchables) dans Légifrance

  • lisibilité / ergonomie du texte : le texte des décisions de justice et des textes officiels est généralement devenu beaucoup plus lisible sous smartphone. La lecture sur appareil mobile devient facile alors qu’elle était un chemin de croix (redimensionner et déplacer le texte en permanence était nécessaire pour le lire). C’est une grande amélioration.
    En sens inverse, sur ordinateur (grand écran, donc), comme il n’y a plus qu’une seule mise en page du texte (celle pour smartphone), la même page devient beaucoup plus longue. Sur un sommaire de Journal officiel ou une grosse réforme, c’est même carrément gênant.
    Par ailleurs, de gros blocs de texte sans aucun saut de ligne restent présents et deviennent très difficiles à lire. Or les exemples sont nombreux. Ainsi l’article 2 de cet arrêté du 26 octobre 1995 relatif aux prestations supplémentaires et aux aides financières attribuées par les caisses primaires d’assurance maladie. Et même avec des sauts de ligne (simples, pas doubles), ça peut devenir dantesque. On le voit sur les grandes lois et ordonnances, comme les articles 1er et 2 de l’ordonnance n° 2020-1144 du 16 septembre 2020 relative à l’harmonisation et à la simplification des polices des immeubles, locaux et installations. Ce problème n’est toutefois pas nouveau et découle souvent de la mise en page initiale.
    Ces problèmes ont en partie été réglés par le correctif apporté le 30 septembre par la DILA (« correction du défaut d’affichage de certains alinéas dans les articles »).
    Par ailleurs, certains utilisateurs se plaignent de la taille des caractères sous ordinateur. La taille de la police de caractère par défaut n’a pas changé, en fait. En revanche, le problème vient en partie de ce qu’elle n’est plus noire sur blanc, autrement dit le contraste est moins net [16].
    Dans son navigateur web, l’utilisateur peut régler la taille des caractères pour un site web donné (et lui seul) une bonne fois pour toutes (CTRL + molette de la souris, ou Menu > Zoom). Sinon, la DILA pourrait grossir un peu la taille des caractères par défaut pour les appareils non mobiles et augmenter le contraste. Personnellement, j’y suis favorable.


Un gros bloc de texte sans aucun saut de ligne : à la limite de l’illisible (cas signalé par le maître de conférences et docteur en droit Clément Cousin)

  • sous-sections de Codes très longues : les pages web deviennent trop longues et il devient impossible en pratique d’imprimer un article seul. Un redécoupage des pages web des sous-sections à partir d’un certain nombre d’articles serait utile. Exemple : article 39 terdecies du Code général des impôts (CGI) :
    • la page web est extrêmement longue et on se retrouve un peu perdu dedans :
      • on ne voit plus dans quelle partie du code on se situe, le plan étant tout en haut
      • si on se déplace verticalement un peu trop loin ou trop vite, on quitte l’article recherché et revenir dessus peut devenir délicat. Certes, il y a le lien "Naviguer dans le sommaire du code", mais il n’est pas évident de comprendre sa fonction du premier coup et il faut encore se déplacer dedans et faire deux clics supplémentaires pour retrouver son article 39 terdecies (sachant que la plupart des internautes ignorent hélas la fonction Chercher dans la page : sur ordinateur Windows Ctrl + F ou sur smartphone menu du navigateur web > Chercher dans la page)
        DILA nov. 2019 : Un travail ergonomique va avoir lieu pour améliorer la visibilité des informations comme le positionnement du contenu consulté dans le sommaire ainsi que la date de la version. Il est noté aussi qu’il est prévu de réactiver le surlignage du contenu recherché.
    • surtout, comment faire pour imprimer juste cet article de code ? Il faut apparemment remonter tout en haut de la page pour accéder au bouton "Imprimer" mais dans ce cas, on perd de vue son article et ... on imprime une bonne partie du Code (89 pages A4 !)
      DILA nov. 2019 : La vision d’un seul article et donc son impression sera disponible très bientôt.
  • cette version réécrit Légifrance uniquement pour les smartphones. C’est bien de s’adapter à son époque et aux usages, mais attention à ne pas prendre un train de retard. En effet, l’actualité 2019 laisse penser que ce format va évoluer. Samsung a sorti en 2019 son smartphone pliable, deux fois plus grand que d’habitude donc, le Fold. Et Huawei lui colle aux basques avec son Mate X, qui se présente une fois ouvert comme une mini-tablette [17]. Les autres fabricants ne vont pas tarder ...
  • dans la bêta, les liens ELI ne fonctionnaient pas. Exemple : https://beta.legifrance.gouv.fr/eli/ordonnance/2019/7/17/2019-741/jo/texte aboutit pour l’instant à une erreur 404
    DILA nov. 2019 : Les liens ELI fonctionnement maintenant.
  • l’intégration des liens des textes officiels présents sur Légifrance vers les fiches de Service-public.fr sera un grand service rendu aux particuliers. En effet, Servicepublic.fr présente de manière courte et "grand public" les grandes réformes (lois, ordonnances).
    DILA nov. 2019 : L’intégration des liens vers service-public.fr n’est pas encore disponible et elle sera mise en place à partir du second semestre 2020.

- Contenus

  • recul du JORF à 1869 : les années 1871 à 1948 étaient déjà disponibles sur la base Gallica de la BNF, mais il est clair que :
    • le "trou" (IIIe République) du JORF Lois et décrets sur Légifrance est réparé. Jusqu’ici, Légifrance ne reculait en HTML que jusqu’en 1990 mais les PDF chargés reculaient jusqu’au début de la IVe République
    • ce sera mieux mis en valeur et plus facile à retrouver sur Légifrance
    • enfin, il est cohérent d’avoir le maximum de recul réuni avec le maximum de fraîcheur
    • JORF anciens :
      • je suppose donc que la BNF a accepté de "prêter" ses PDF
        DILA nov. 2019 : Un travail en commun a été réalisé entre la DILA et la BNF pour la numérisation et la reconnaissance de caractère (97% de reconnaissance sur l’ensemble du fond).
      • le texte intégral de ces JO ajoutés n’est pas cherchable. Tout au plus pourra-t-on accéder à la table analytique année par année. L’expression"JO anciens" désigne ici selon toute vraisemblance la période pré-1990 puisque actuellement le texte intégral des textes officiels pré-1990 n’est disponible qu’en PDF (exemple avec une loi de 1988 [18] : sa fiche au format HTML, son texte intégral au format PDF ; exemple avec une loi de 1948 : fiche, texte PDF [19]). C’est une grosse limite. On aurait aimé trouver les JO anciens en HTML (pages web classiques) et indexés. On me dira : c’est beaucoup de travail pour des numéros peu demandés. Peu demandés ? Par les juristes, peut-être. Mais par les généalogistes et autres chercheurs d’ancêtres ainsi que les historiens, certainement pas
        DILA nov. 2019 : Suite à la présence d’information personnelle dans ces Journaux officiels, il a été demandé, après une analyse juridique, de ne pas permettre une recherche globale dans le contenu.
      • le rapport Assemblée nationale sur les publications officielles annexé au projet de loi de finances pour 2019, lorsqu’il évoquait le projet de modernisation de Légifrance en cours, parlait de recul jusqu’en 1939 seulement. Le rapport du Sénat sur le même sujet parlait bien, lui, de 1869. Les promesses ont donc été tenues, voire améliorées
  • à noter l’ajout des Documents administratifs (une édition spéciale du JORF, rare et publiée sous forme d’un cahier supplémentaire) et du Bulletin officiel des conventions collectives (BO CCN). Mais, tout comme les réponses ministérielles et le JO depuis 1869, on pouvait les retrouver ailleurs
  • l’absence de liens hypertextes entre jurisprudence et textes officiels, même si c’est une demande récurrente des documentalistes juridiques et de certains juristes geeks, est malheureusement peu étonnante. C’est la continuation de la mythique ligne jaune (ne pas trop enrichir les données, et pas de commentaire), évoquée dit-on lors d’un des comités SPDDI des débuts de Légifrance
  • les échéanciers des décrets d’application des lois ne sont pas du tout faciles à trouver, en tout cas par le menu. Le lien Echéancier est certes écrit en majuscule, mais il reste minuscule, n’attire pas du tout l’attention et n’est atteignable que par un chemin complexe et peu intuitif pour le non juriste/grand public : Autour de la loi > Législatif et réglementaire > Dossiers législatifs > Lois publiées > Année > Loi ... > Echancier, soit 8 clics (exemple) [20]
    DILA nov. 2019 : L’accès est optimisé en passant directement par le texte de la loi suite à une recherche par exemple. Le lien sur l’échéancier est directement accessible au début du texte.


Le long chemin vers les échéanciers

  • la page Application des ordonnances est vide (pour l’instant). Son titre similaire à celui de page Application des lois peut faire penser qu’elle ne consistera pas en (ni ne renverra vers) un échéancier des décrets d’application des ordonnances, un contenu qui manque à Légifrance
    DILA nov. 2019 : L’échéancier des ordonnances sera bien mis en place.
  • les "Informations complémentaires concernant le texte" (lien "En savoir plus sur ce texte") ont disparu, notamment :
    • a) les très utiles mots-clés. Ces mots-clés sont des descripteurs pris ni dans le texte ni dans le thésaurus SARDE. Ils comportent parfois des mots techniques et non juridiques notamment en anglais et pouvant utilement aider lors d’une recherche thématique sur les textes officiels. Par exemple : les dérivés sont un type de produits financiers dont il est souvent question depuis la crise de 2008. Le principal organisme qui "fait" les normes dans cette industrie est l’ISDA, basé à Londres. Or, dans le texte des lois, ordonnances, décrets et arrêtés, le mot "dérivés" n’apparaît quasiment jamais (et ISDA, qui est un sigle, encore moins). Les mots-clés des "informations complémentaires" réparent ces inévitables absences, assurant ainsi une bien plus grande pertinence au moteur de recherche de Légifrance
    • b) et les précieux (bien que pas toujours exhaustifs) "textes d’application". Les "textes d’application" dans "En savoir plus... " s’avèrent particulièrement précieux dans le cas des ordonnances : en effet, contrairement aux lois, celles-ci n’ont pas d’échéancier des décrets d’application dans Légifrance — et ceci ne change hélas pas dans la bêta (cf remarque juste supra).

DILA nov. 2019 : Suite à une analyse globale sur SARDE et sur les mots clefs, il a été identifié un défaut très important de complétude ainsi qu’un vocabulaire non contrôlé, cela a pour conséquence que 70% des recherches faites sur SARDE ne renvoient aucun résultat et quand il y a des résultats sur cette recherche ou en utilisant les mots clefs, la liste n’est pas complète. Aussi pour le Légifrance modernisé, il a été décidé d’implanter les fonctions suivantes pour couvrir le besoin et essayer de ne pas mal orienter l’internaute :

  • mise en place de la gestion des singuliers/pluriels et masculin/féminin (fonction implémentée à travers une liste sur lequel des mises à jour régulières seront réalisées)
  • mise en place d’un gestion de synonymes et acronymes, par exemple Code général des impôts fonctionne aussi avec l’acronyme CGI (fonction implémentée à travers une liste sur lequel des mises à jour régulières seront réalisées)
  • mise en place des textes dits (Fonction en cours d’implémentation permettant de couvrir le type de recherche suivante loi macron renverra entre autres la loi 2015-990)


En cliquant sur le lien En savoir plus ..., dans le Légifrance actuel, on obtient des informations complémentaires utiles sur le texte, particulièrement la liste des décrets d’application pris et les "mots-clés". Tout cela devrait disparaître

  • les traductions ont disparu.
    Certes, cela fait très longtemps qu’elles n’étaient plus tenues à jour (depuis 2005, 2006 ou 2013 pour les Codes) [21].
    Mais elles pouvaient quand même aider, surtout pour les Codes "bougeant" peu comme le Code civil. Et puis, c’est la confirmation de l’abandon définitif par l’Etat de cet effort de défense du droit français dans un environnement de « forum shopping » permanent en droit des affaires.
    Il reste toutefois une archive sur Archive.org [22].

Les anciennes traductions sur Légifrance n’étaient plus à jour. Elles sont encore disponibles sur Archive.org

  • la liste des cas où "Silence vaut acceptation" quitte Légifrance pour passer chez Service-Public (décret n° 2020-1119 du 8 septembre 2020 relatif à la modernisation du service public de diffusion du droit par l’internet, article 2)

- Les problèmes spécifiques des Codes

Les Codes concentrent une part importante des reproches faits à la nouvelle version de Légifrance :

  • pâtés/blocs de texte ans interligne, illisibles : il n’y avait pas de saut de ligne entre les alinéas. Problème résolu [23]
  • la fonction ChronoLégi (le calendrier en haut à droite) est mal comprise et peu utilisée : les juristes se servent uniquement du bouton "Versions" sous un article donné alors que ChronoLégi permet de remonter le temps pour une section entière du Code. De plus, mes test montrent un bug fréquent avec ChronoLégi : aucun texte n’apparaît pour une date donnée alors qu’il y en avait bien un
  • pour les juristes, sur un article donné d’un Code, la mention en haut à droite "Modifié par [texte date article]" [24] est au mieux perturbante, au pire incompréhensible. Il vaudrait mieux écrire : "A jour au [date]".

- La recherche et le tri des résultats

  • comme le fait remarquer le compte Twitter Marc-Antoine, l’interface spécialisée de recherche des mesures nominatives a disparu [25].
    En effet, que ce soit en recherche simple ou en recherche avancée (sur le fonds JORF), il n’y a plus de recherche spécialisée "Mesures nominatives". Dommage mais je parie que cette interface ultra-spécialisée était peu, voire très peu utilisée. On cherche dès lors dans tout le Journal officiel et on n’a plus la possibilité de chercher par fonction (toutefois, tant le champ Fonction que celui Ministère étaient en saisie libre, ce qui signifie que l’interface ne proposait pas de liste et qu’il fallait donc savoir déjà ce qu’on cherchait). Il faut donc comme avant avoir une idée précise de ce qu’on cherche, et en plus savoir aller dans la recherche avancée, puis sélectionner le fonds Journal officiel puis, soit choisir une institution émettrice (autorité ou ministère) pour réduire le champ de la recherche, soit taper directement un nom de fonctionnaire.
    Pour rechercher uniquement sur les mesures nominatives, il existe la page Nominations au Journal officiel de la République française sur le site Steiner Triples de Nathann Cohen [26]. Elle fonctionne sur le nouveau Légifrance et la recherche par tag s’approche du champ Fonction de l’ancien Légifrance.
    Quand vous cherchez par ministère, attention aux changements de compétences et d’appellation des ministères à travers les âges. Si vous devez remonter à plus de quelques années, je dirais, vérifiez d’abord que le ministère ne portait pas un autre nom sous le précédent Gouvernement ou président de la République. Un grand classique à cet égard est Bercy. Le ministère/secrétariat d’Etat au Budge, dans les années 2000,change trois fois d’appellations en cinq ans : « ministère du budget et de la réforme budgétaire » en 2002, « ministère du budget et de la réforme de l’État » en 2005 et « ministère du budget, des comptes publics et de la fonction publique » en 2007. Quant au ministère des finances, il est rebaptisé en 2007 « ministère de l’économie, des finances et de l’emploi », et absorbe le tourisme.
  • comme le signale Cyprien Caraco (BIU Cujas) sur la fiche Légifrance du Jurisguide, « La recherche tronquée * est permise. Exemples : "112-*" ou "EIN ?14*L" pour un NOR ». Pour être précis, les troncatures marchent uniquement si on sélectionne une base et un champ (et encore, pas tous les champs). En jurisprudence judiciaire, dans le champ abstract, ça ne marche pas. Mais toujours en jurisprudence judiciaire, ça marche dans le champ texte (plus précisément, il faut saisir dans la zone intitulée "Dans le contenu des textes") . De fait, c’était déjà le cas de l’ancien Légifrance, mais c’était obligatoire de choisir une base, il n’y avait pas de recherche globale.
    NB : le "stemming" d’Elasticsearch (qui consiste à étendre la recherche d’un mot à tous ceux de sa racine) a été désactivé. En effet, il causait des résultats absurdes [27]. Le nouveau Légifrance utilise également un dictionnaire de synonymes (pas un thésaurus) et la DILA envisage de le mettre à jour [28]
    La DILA a le projet d’étendre la troncature droite à tous les champs [29]. Ce qui faciliterait son utilisation car là, on ne sait pas si elle va marcher, on hésite


La troncature droite ne marche dans Légifrance que si on choisit une base et un champ : ici la base Jurisprudence judiciaire et le champ Texte

  • avec le nouveau moteur de recherche Elasticsearch, deux bénéfices :
    • le temps de réponse du moteur de recherche a été nettement amélioré. Le délai d’affichage du résultat cliqué est lui, plus variable
    • et on voit une partie (pas tout, attention !) des résultats s’afficher au fur et à mesure que l’on tape ("search-as-you-type" [30])


      Grâce au moteur Elasticsearch, des résultats s’affichent dès le 3e caractère tapé : vive le "search-as-you-type" !

  • une vraie perte : les plans de classement du Bulletin de la Cour de cassation et de la jurisprudence administrative, si pratiques pour arriver à une grande pertinence (100 fois mieux que la recherche en plein texte) — mais hélas non tenus à jour par leurs institutions respectives —, ont disparu
    DILA nov. 2019 : Les travaux sont en cours pour permettre l’accès aux plans de classement mis à jour
    E. Barthe : remercions la DILA de ne pas avoir oublié ce point, mais à mon humble avis, il ne faut pas trop compter revoir un jour les plans de classement des juridictions suprêmes dans Légifrance
  • très gênant (découvert tardivement par nos soins en mars 2021) : en recherche avancée, il est impossible de combiner des opérateurs logiques (ET ou OU) différents. C’est soit ET entre tous les mots-clés soit OU. Cela bride fortement les possibilités du moteur. Les recherches complexes deviennent très difficiles. Un travail d’Elastic et la SSII Sopra Steria (successrice de Sword) sur ce point nous semble nécessaire. Tout le monde ne peut pas se payer une plateforme d’éditeur à plusieurs milliers d’euros ...
  • si on sélectionne un fonds en particulier (page d’accueil : Tous les contenus > Sélectionner un fonds), cliquer à nouveau dessus ne le désélectionne pas, ce qui est inhabituel et contre-intuitif. En fait, pour revenir à l’interrogation de la totalité du site, il faut sélectionner le fonds "Tous les contenus" [31]. Et on ne peut sélectionner qu’un seul fonds à la fois. En revanche, comme on ne peut sélectionner qu’un seul fonds, si on clique sur un autre fonds, cela désélectionne le premier
  • le bouton Modifier la recherche, présent dans les résultats de recherche avancée sur le nouveau Légifrance, n’est pas obligatoire mais pratique selon la DILA ; il évite de surcharger l’écran [32]. Mais il est hélas contre-intuitif : ce type de fonctionnalité avait disparu du paysage des bases de données, et il faut être un professionnel de l’information pour penser à l’utiliser


« It’s the button "Modify", stupid ! Click on the big red button ! » ;-)

  • contre-intuitif également : taper sur la touche Entrée ne lance pas systématiquement la recherche. Par exemple, si le curseur est dans un petit champ en bas de l’interface de recherche judiciaire avancée, ça ne lance pas. C’est regrettable. En effet, ce comportement par défaut :
  • le moteur simple devrait pouvoir être amélioré. Il a du mal avec des recherches a priori simples et le tri par pertinence a lui aussi des ratés.
    Exemple 1 (test en octobre 2019, refait le 1er septembre 2020, rien n’a changé) : Chambre criminelle 30 octobre 1996 Bulletin criminel 389 sur Tous les contenus dans Tous les champs ne trouve que deux résultats, mais pas l’arrêt Cass. crim. recherché (Bull. crim. 1996 n° 389 p. 1131), pourtant présent. Si on tape — encore plus simple — Chambre criminelle 30 octobre 1996, on obtient 1600 résultats, mais le premier résultat est un arrêt du 30 janvier 2019, l’arrêt n’est pas dans les 10 premiers et si on affiche les 100 premiers résultats, les arrêts inédits du 30 octobre 1996 apparaissent avant les publiés (ce devrait être l’inverse, les publiés étant a priori plus importants). En revanche, la recherche par le numéro de pourvoi (n° 94-83650) aboutit sans problème à un seul résultat : le bon. Attention toutefois à saisir le n° avec le point. NB : la recherche simple par le n° 94-83.750 renvoie deux résultats et non un seul.
    Exemple 2 (test fin août 2020) : on tape dans la Jurisprudence judiciaire rupture brutale des relations commerciales. Le premier résultat est un arrêt Cass. soc. du 8 juillet 2020 or la chambre sociale n’est pas compétente dans ce domaine et l’expression "rupture brutale des relations commerciales" n’apparaît d’ailleurs pas dans le texte de l’arrêt, juste les mots en ordre dispersé.
    Ce problème dans le moteur simple est moins présent sur les textes officiels. Les pré-résultats de loi 2019-486 ne trouvent la loi PACTE du 22 mai 2019 qu’en 3e position mais si on lance la recherche, la loi PACTE est bien en premier sur les 104 résultats, suivie très logiquement de son rectificatif. En revanche, les décrets d’application de la loi comportant le n° de la loi dans leur titre n’apparaissent pas juste après le rectificatif, comme ce devrait être le cas, mais après trois textes n’ayant rien à voir avec la loi PACTE, l’un étant une décision n° 2019-486 [33] — une décision, pas une loi.
    Exemple 3 (début octobre 2020) : recherche par n° de pourvoi : on cherche l’arrêt Cass. AP 16 décembre 2016 n° 08-86.295. On sélectionne le fonds Jurisprudence judiciaire. On tape n° 08-86.295 dans le moteur simple, on trouve 4 résultats, dont le bon arrêt. Mais il est en 3e position. Il devrait être en 1ère position, d’autant que le numéro est présent dans le "titre" même du document. Après tout, ça marche bien avec l’arrêt Cass. civ. 1 n° 11-19.530 du 11 avril 2013 [34].
    Exemple 4 : recherche tous fonds de article 1er Code civil. Le 1er résultat est l’article 61-6 du Code civil et le 2e résultat est le chapitre 1er de l’annexe II du Code de l’aviation civile. Oui (et sans aucun sous-entendu péjoratif), c’est bien ça : le terme 1er dans "chapitre 1er" et l’adjectif "civil" au féminin ont une influence exagérée sur le classement par pertinence des résultats du moteur Elastisearch, paramétré ici à mon sens de manière trop laxiste pour le droit. Inutile de rappeler que Google, même avec des fautes d’orthographe, tombe pile, lui.

En résumé : dans le classement par pertinence :

  • les informations présentes dans les références du document devraient se voir donner nettement plus de poids . Dans l’exemple de l’arrêt donné en exemple supra, ces informations sont : Cour de cassation Chambre criminelle 30 octobre 1996 n° 94-83.650 Bulletin criminel n° 389 p. 1131
  • le poids donné à la proximité — et particulièrement aux expressions (proximité de 0 mots) — devrait être encore accru. Dans l’exemple de recherche supra, les arrêts comportant l’expression "rupture brutale des relations commerciales" devraient être listés en premier. Ceux comportant les mots proches (3 mots et moins) mais pas sous forme d’expression, juste après. Enfin, ceux comportant les mots encore plus éloignés en dernier. La présence des mots et plus encore de l’expression dans l’abstract (titrage des arrêts publiés au Bulletin de la Cour de cassation) devrait être un critère de pertinence supplémentaire systématiquement respecté
  • l’orthographe exacte des termes saisis devrait être mieux respectée. La synonymie automatique singulier=pluriel et masculin=féminin devrait à notre sens être désactivée. Le droit, c’est précis. Les juristes sont précis. Et les particuliers ne font pas de la recherche sur Légifrance, mais de la consultation de textes. Ce qui n’est pas pareil.

Ce sont là des points clés selon nous, voire critiques. En effet, si le nouveau Legifrance est conçu principalement comme une base de données globale et non comme plus un portail avec des rubriques — ce qui semble être le choix fait — alors la pertinence des résultats du moteur sera LA clé de la réussite du nouveau site.
DILA nov. 2019 : La présence du point ne sera plus nécessaire avant la fin de période bêta pour les numéros de pourvois. Les exemples remontés par les testeurs vont aussi nous permettre de continuer à améliorer la pertinence.

  • un point gênant relevé par mon collègue veilleur et formateur Serge Courrier : il n’existe aucune possibilité de trier par date les résultats d’une recherche multi-fonds — type de recherche pourtant promu par le nouveau Légifrance ! Le classement antéchronologique, si pratique et si nécessaire en droit et pour les veilleurs, n’existe que sur la recherche sur un fond particulier. En fait, rien ne change sur ce point : dans l’ancien Légifrance, qui ne connaissait pas la recherche multi-bases, la recherche sur chaque base individuelle incluait le tri par date.
    Comme le dit Serge lui-même (et je souscris) : « cela parait tellement une fonction de base, présente dans *toutes* les bases de données documentaires modernes. Sauf erreur, par exemple, les bases Theses.fr et Gallica (BNF) sont sous Elasticsearch et permettent bien sûr un classement chronologique. »
    La recherche transverse étant justement au centre du nouveau Légifrance, ce serait bien en effet que d’offrir le tri par date sur la recherche globale. Cela participerait à la fiabilisation de ses résultats (cf nos réticences à utiliser ce type de recherche).
    Mais il y a une explication rationnelle à cette absence de tri par date en recherche multi-fonds : simplement, certains document n’ont pas de date. Notamment les articles de Code — ils ont une date de dernière modification, c’est tout, mais ils peuvent parfaitement avoir été modifié il y a des années et être encore à jour au d’aujourd’hui ... La DILA réfléchit à des alternatives à terme [35].


Tri par date sur un fonds : la jurisprudence judiciaire

  • NB : pour être sûr de trouver un arrêt Cass’ par son n° au Bulletin, il FAUT passer par la recherche avancée et, patiemment et soigneusement :
    • cliquer sur Tous les contenus sous "Rechercher dans"
    • sélectionner le fonds Jurisprudence judiciaire
    • cocher Cour de cassation sous "Par juridiction"
    • cocher Décisions publiées au Bulletin
    • saisir le Numéro au bulletin
    • saisir l’année du Bulletin (= l’année de l’arrêt)
    • cocher la chambre de la Cour sous Formation
    • descendre tout en bas
    • et cliquer sur Lancer la recherche.

Soit 10 opérations, alors que dans Google, on saisit simplement Cass com Bull 1995 127 et le tour est joué.

Dans le moteur simple, même en tapant Cour de cassation chambre commerciale 1995 Bulletin 127, l’arrêt recherché (ici Cass. com. 11 avril 1995 n° 93-16.064 Bull. 1995 n° 127) ne se trouve pas dans les 10 premiers résultats.

  • la recherche avancée :
    • elle est presque cachée. Pourtant, quoi qu’en disent les éditeurs juridiques avec lesquels nous discutons, elle reste indispensable pour les recherches fines et tout autant pour les veilles
    • son implémentation pourrait être nettement améliorée :
      • pourrait-on mettre un bouton lancer la recherche en haut aussi, s’il vous plaît ?
      • l’opérateur de proximité est toujours là et c’est heureux. Le nombre de mots est réglable. Mais ce réglage est caché et peu facile à utiliser : il faut d’abord sélectionner Tous les mots, puis cliquer dessus, puis cliquer sur le chiffre 2 et taper le nombre de mots désirés et enfin valider en cliquant dehors
      • l’opérateur expression exacte est toujours là elle aussi. Heureusement ! Ces deux opérateurs sont ESSENTIELS (je pèse mes mots) pour obtenir des résultats pertinents et pas trop nombreux. La preuve en copies écran avec cette recherche sur rupture brutale des relations commerciales, en bonne partie ratée en recherche simple, et qui en recherche avancée, en spécifiant que rupture brutale des relations commerciales est une expression, permet de n’obtenir que des arrêts pertinents
      • changer d’opérateur logique (ET ou OU) entre les groupes de mots est tout sauf évident
      • en version ordinateur, si on ne cherche que dans Jurisprudence judiciaire, l’affinage spécifique à la Cour de cassation dans la colonne de gauche est honnêtement peu pratique. Sans compter que la faible largeur de la colonne le rend peu attrayant. Bizarrement, une partie du problème disparaît si on passe en version smartphone puisque les champs qui étaient dans la colonne de gauche prennent alors toute la largeur de l’écran


Sous ordinateur : Recherche > Jurisprudence judiciaire > Cour de cassation > Affiner (colonne de gauche)


Sous smartphone : Recherche > Jurisprudence judiciaire > Cour de cassation > Affiner


Recherche avancée > Jurisprudence judiciaire > Cour de cassation > rupture brutale des relations commerciales > Expression exacte


Recherche avancée > Jurisprudence judiciaire > Cour de cassation > rupture brutale des relations commerciales > Expression exacte > résultats pertinents


Recherche avancée > Jurisprudence judiciaire > Cour de cassation > rupture brutale des relations commerciales > Tous les mots > Proximité : 5 mots > résultats pertinents et exhaustifs

      • toujours dans cette recherche de jurisprudence judiciaire de la Cour de cassation, on note la présence de quatre zones de recherche sous "Publication au bulletin", "Nature de la décision", "Formation" et "Décision attaquée". Mais on n’en voit pas trop l’utilité puisque ce sont les cases à cocher qui font le travail et que faire défiler leurs options est rapide, la longueur des listes étant limitée — sauf peut-être pour "Décision attaquée".


Recherche > Jurisprudence judiciaire > Cour de cassation > Affiner : les quatre zones de saisie inutiles

      • les plans de classement interrogeables de la Cour de cassation et du Conseil d’Etat sont des outils d’une pertinence remarquable dans les résultats de recherche. Et pour cause : ils correspondent aux tables thématiques des recueils de jurisprudence respectifs des deux juridictions suprêmes. Ils disparaissent pourtant, leur technologie n’ayant pas permis leur mise à jour sur Legifrance.

Concernant le PCJA (plan de classement de la jurisprudence administrative), comme le fait remarquer mon collègue François Lemaître (documentaliste au TA de Montreuil) :

« Cet outil est à la fois très ancien, très stable, et très utilisé par les magistrats eux-mêmes ; c’est dire son utilité. 
Mais celui-ci a évolué à plusieurs reprises et continue d’évoluer. Or, il se trouve que celui présent sur Legifrance n’est pas à jour. Il est donc source d’erreur si l’on recherche directement dedans.
Pour rechercher correctement dans la jurisprudence administrative, il vaut mieux utiliser Ariane web, entre autres pour deux raisons : la recherche sur le (bon) PCJA est possible et très stable (il fait même le lien avec les thèmes abandonnés) mais surtout le fonds de jurisprudence est plus à jour que celui de Legifrance, puisqu’il faut entre 3 et 5 jours pour qu’une décision soit versée sur Legifrance.
Il n’y a aucune raison que la recherche sur le PCJA ne soit pas possible sur la prochaine base. »


Le plan de classement de la jurisprudence administrative (PCJA) interrogeable depuis la base Ariane web sur le site du Conseil d’Etat

Pour la Cour de cassation, il n’est pas exclu qu’un plan de classement interrogeable des arrêts publiés au Bull. Civ. et Crim. réapparaisse un jour sur le site de la juridiction suprême. En attendant, on en trouve une version simplifiée sur le site de la Cour (Jurisprudence > Arrêts classés par rubrique), hélas très lente à s’afficher.

      • enfin, graphiquement, et en termes de logique, dans la recherche avancée, l’emboîtement des options et des lignes est très "confusionnant", particulièrement sous smartphone. Comme si on avait voulu trop bien faire. Deux suggestions alternatives :
        • ne garder que la boîte des opérateurs booléens
        • ou revenir à la ligne de commande : on note les opérateurs et les champs en mode texte (ET, OU, SAUF, proximité [36], parenthèses, troncature à droite). Puisqu’on dit que la recherche avancée est essentiellement un truc de spécialistes de la recherche, pourquoi ne pas leur faciliter le travail et leur laisser la bride sur le cou ?

DILA nov. 2019 : Le retour des internautes sur la recherche avancée sont très divers, aussi nous prévoyons d’abord de traiter en priorité les bugs remontés puis de travailler par étape sur l’ergonomie.

E. Barthe : demandée dans les retours des internautes, la troncature droite a in fine été implémentée, mais avec d’importantes limites (voir supra).


Sous smartphone : l’interface (non déployée) de la recherche avancée : un emboîtement de petits blocs confusionnant

  • les "pré-résultats" (suggestion de résultats déclenchés par le type-as-you-search) présentaient sur la version bêta certains inconvénients :
    • ils n’étaient pas forcément pertinents. Par exemple, on cherche le décret n° 2014-1036 du 11 septembre 2014 portant publication de l’accord sous forme d’échanges de lettres entre le gouvernement de la République française et le gouvernement du Royaume d’Arabie Saoudite sur doubles impositions en matière d’impôts sur le revenu et sur les successions. On saisit : échange de lettres Arabie Saoudite et dans la liste déroulante on se retrouve avec 6 résultats dont les deux décrets antérieurs (1989 et 1995) mais pas celui de 2014. Il faut lancer la recherche pour obtenir le décret de 2014 (qui se présente en premier et là, c’est très pertinent). Mais l’absence du décret recherché dans la pré-liste de résultats est un peu déroutante. Une personne qui penserait avoir toutes les réponses sur cette liste indicative n’irait peut être pas plus loin
    • si on cliquait sur un des pré-résultats (ou même si on passe simplement sa souris par-dessus sous ordinateur — sans cliquer —, ce qui là est carrément un bug), Légifrance bêta considérait qu’on avait cherché exactement ce document-là et non les mots-clés saisis. On ne pouvait donc plus revenir en arrière, i.e. on perdait sa recherche, elle était effacée. C’était franchement gênant, surtout s’il s’avérait qu’on avait cliqué sur un résultat non pertinent ou qu’en réalité il y avait plusieurs résultats intéressants ou pertinents

DILA nov. 2019 : Le bug a été corrigé sur la suggestion et pour l’instant elle a été désactivé sur la version mobile. Dans un second temps, nous allons travailler sur la pertinence de la suggestion.


La pré-liste de résultats (suggestion de résultats) sur la recherche "échange de lettres Arabie Saoudite" ne trouvait pas le dernier décret publié

  • le thésaurus SARDE a été retiré. Dommage. Même s’il n’était plus tenu à jour, c’est une perte sèche car c’était un outil très puissant et très pertinent dans le maquis des termes utilisés par l’administration
    DILA nov. 2019 : Explication plus en amont de la raison de la suppression de SARDE


Avant le nouveau Legifrance, le thésaurus SARDE, qui certes n’était plus tenu à jour, répondait encore et aidait à la recherche thématique. Ici, tapez rivière et SARDE vous fait comprendre qu’il faut utiliser "cours d’eau"


Avec le nouveau Legifrance, le thésaurus SARDE disparaît : sur des recherches thématiques, plus d’aide, il faut se débrouiller avec Google

  • la nouvelle recherche multi-fonds évite d’avoir à savoir dans quelle base de données juridique chercher. Certes. Mais, comme nous l’avons déjà maintes fois écrit — encore récemment sur Twitter —, et comme nous le rappelons à chaque formation :
    • Légifrance est une *plateforme*, un *portail*, une *collection* de bases très différentes. *Pas* une base de données en elle-même. Ce moteur global a donc les limites inhérentes à ce genre d’exercice. Les éditeurs juridiques, confrontés depuis longtemps à ce problème, tentent — comme ici ce nouveau Légifrance — de le résoudre en offrant ce qu’on appelle les facettes : une colonne (à gauche en général) avec des cases à cocher permet de choisir le type de source du droit désiré (jurisprudence, textes, doctrine ...) ou des domaines du droit (affaires, sociétés, concurrence ...).
      Mais pour autant, les méga-bases ne sont pas la réponse miracle aux difficultés de la recherche d’informations en ligne. Au contraire, savoir segmenter sa recherche et n’interroger qu’un seul type de source du droit (la doctrine, typiquement), une seule matière (cas de le base Navis, qui est structurée par domaine du droit) ou une seule base est la clé. La pertinence des résultats de Google crée des illusions chez les concepteurs de plateformes : cette pertinence découle directement des liens hypertextes créés par les auteurs, les internautes et les webmestres. C’est certes dommage, mais Légifrance ne peut pas et ne pourra pas en faire autant
      DILA nov. 2019 : C’est pour cela que nous gardons la recherche simple et avancée sur un fond et que l’internaute peut choisir à ce moment des types de tri autre que par pertinence.
  • la possibilité de saisir les numéros d’articles avec différents formats (L 112-2, L.112-2, L. 112-2, L112-2) peut paraître un détails. Mais avant, ce n’était opas possible. IL *fallait* savoir que le L, le D ou le R devait être tapé collé contre le numéro, ce qui n’était ni évident ni intuitif et constituait une source majeure d’incompréhension et d’échec des utilisateurs dans la recherche
  • les termes saisis dans le moteur de recherche n’y restent pas lorsque les résultats apparaissent. Ils sont déportés dans une boîte sur le côté gauche. Heu ... C’est :
    • anti-intuitif
    • contraire à une pratique établie et hyper-répandue
    • et anti-pratique. Parce qu’il faut faire ça dans une fenêtre toute petite et qu’on se retrouve à devoir gérer deux zones différentes au lieu d’une. Parce qu’en RWD, l’interface vous amène sur cette zone alors que vous voudriez changer de requête
  • textes officiels : le champ Titre est sélectionné par défaut : tant mieux si les mots-clés tapés y figurent, mais ce n’est pas toujours le cas. Loin de là, même ...

DILA nov. 2019 : Pour des raisons d’uniformité, "Tous les champs" sera bientôt sélectionné par défaut pour "Tous les fonds".


Les descripteurs dits "Mots-clés" ont disparu. Définitivement semble t-il

  • comme on pouvait le penser suite à la disparition des "Informations complémentaires concernant le texte", le champ de recherche Mots-clés (les fameux descripteurs non pris dans SARDE ni dans le texte intégral) a lui aussi disparu de la recherche avancée. Un rapide mais optimal test me laisse penser que ces descripteurs ne sont pas non plus restés cachés "par derrière" (la preuve par le Mot-clé Brexit ET Nature du texte = loi OU décret). Adieu Mots-clés. Il va falloir chercher par "retrait du Royaume Uni de l’Union européenne", car par "Brexit" on ne peut plus — mais qui va y penser ? A part les juristes, je ne vois pas
  • il reste une question importante : clairement, le tri des résultats se fait par pertinence. Mais quels sont les critères exacts de cette « pertinence » ?
    DILA nov. 2019 : Nous réfléchissons à donner plus d’information sur le calcul de la pertinence.

- Veille : aucun fil RSS

L’absence de fil RSS est regrettable. Un nouveau Légifrance était l’occasion idéale pour cela.

Cette technologie de veille est parfaitement connue, simple et extrêmement peu gourmande en ressources. Dommage, dommage.

- Perte des métadonnées RTF

Les utilisateurs des logiciels de gestion de références bibliographiques, type Zotero ou Mendeley, font face à un problème.

Comme l’explique une pétition lancée par des utilisateurs de Zotero, « le nouveau Légifrance ne propose plus de fonction d’enregistrement des métadonnées des fichiers au format RTF (décisions jurisprudentielles ; lois ; articles de codes...). L’absence de maintien de cette fonction est une réelle perte pour la recherche et la rédaction juridique. L’enregistrement au format RTF des métadonnées des fichiers permet leur lecture et utilisation par des logiciels bibliographiques.

« Concrètement, la perte de la fonction d’enregistrement des métadonnées en RTF sur Légifrance empêche l’automatisation des citations de centaines, voire de milliers de décisions jurisprudentielles et de dispositions législatives. Elle obligera à la citation manuelle de ces éléments dans les travaux de recherche, ce qui constitue une perte de temps énorme et ajoutera à la complexité de la rédaction et de la recherche juridique. »

La réponse de la DILA est en plusieurs points :

  • le format RTF était devenu obsolète, d’où le retrait des fichiers RTF
  • elle n’abandonne pas définitivement les "Zotéristes [37]. La DILA réfléchit déjà à une amélioration des copier coller, à une version PDF du document téléchargeable et "logotée" Légifrance et, à terme, à permettre la récupération des métadonnées. Car oui, ils les ont toujours :-)

- API

Les API [38] : la voilà la grande innovation ! Elle est proposée via le portail PISTE et son utilisation est soumise à certaines conditions : licence ouverte 2.0, CGU de PISTE, CGU spécifiques de l’API Légifrance et quotas détaillés sur le portail PISTE. Acteurs de l’open data et legal tech, il vous est recommandé de bien lire tout cela. On note par exemple dans la licence ouverte 2.0 l’obligation des réutilisateurs — même hors API — de citer la source et une date de mise à jour (cf extrait de la licence infra).

Comme je l’ai déjà écrit sur ce blog, le simple fait de proposer une API est déjà un grand progrès [39]. Cela dit, elle est réclamée et attendue depuis longtemps (2016 au bas mot) [40]. Cette API avait été prévue dès l’annonce en 2017 dans un "bleu" budgétaire que des crédits allaient être consacrés à la refonte du site [41].

La DILA note d’ailleurs que de 20 000 par mois il y a un an, les requêtes sur les API sont passées à 70 000 en septembre 2020 [42].

Pour compléter, lire aussi La modernisation du service public de diffusion du droit, vers l’instauration d’une législation plateforme, par Bertrand Cassar sur Dalloz Actualité. L’auteur confirme que les deux grandes améliorations du nouveau Légifrance (et là où les efforts principaux ont semble-t-il portés) sont bien le passage en version mobile (RWD pour les initiés, voir supra) et la mise en service des API. Avec les API, le travail des legal tech — mais aussi potentiellement des éditeurs juridiques — est grandement facilité.

Comme l’écrit B. Cassar :
« Il existe une différence notable entre des données ouvertes mises à disposition sur une plateforme dédiée (l’open data) et les données dynamiques transmises par API. La première est une forme d’archivage complet d’un ensemble d’informations. Afin de réutiliser ces données, la base se doit d’être téléchargée, de manière intégrale ou incrémentale, avant d’être exploitée. Le taux de rafraîchissement de l’information dépend alors du dernier dépôt effectué dans l’espace de stockage. À l’inverse, les données dynamiques sont transmises en fonction d’une demande précise. Seule l’information demandée sera retournée par l’interface de programmation, sans devoir parcourir l’ensemble de la base. De plus, les éléments reçus sont à jour, à l’heure précise de la demande.
« De nombreuses entreprises peuvent ainsi utiliser ces interfaces de programmation afin de proposer de nouveaux services innovants. L’APIsation des données juridiques de Légifrance est un avantage considérable pour le développement des legaltech de l’Hexagone et participe indirectement au rayonnement du droit français. »

A noter, enfin, que d’après la DILA [43], le développement des API n’a pas représenté un surcoût.

Pourquoi ? parce qu’en fait, la totalité du nouveau Légifrance est produit par ces API. Autrement dit, les API, c’est le site et le site, c’est les API. C’est pour la DILA la garantie que les API afficheront exactement la même chose que le site. Si, en revanche, les API avaient été développées par dessus le site, elles auraient coûté très cher et représenté un double coût.


Extrait de la licence ouverte 2.0

- Statistiques et suivi des utilisateurs

Ce type d’engagement (anonymisation, non croisement des données ...) peut laisser quelque peu dubitatif au vu de son caractère, en pratique, essentiellement déclaratif, et si on se place sur le long terme, notamment au vu des évolutions très importantes des politiques et des pratiques de confidentialité des grands de l’Internet. Vous pouvez activer DoNotTrack (DNT) dans les paramètres de votre navigateur pour éviter ce "tracking" et surtout utiliser un bloqueur de publicités, de traçage et de pop-ups comme Ublock Origin ou ABP (AdBlock Plus) ou encore un navigateur pro-vie privée comme Brave [44].

DILA nov. 2019 : Des évolutions vont avoir lieu pour prendre en compte les dernières recommandation de la CNIL et les dernières décisions de jurisprudence sur ce sujet.

Conclusion

Rien à faire : Légifrance ne se réduit pas à des contenus, un moteur de recherche et des API. Et des fonctionnalités utiles ont été perdues. Mais le portage sous smartphone est une nette amélioration et il fallait le faire. C’est ce que je retire en premier lieu de ces tests.

Tout gain de la future version de Légifrance en facilité d’utilisation sera un gain pour la diffusion du droit français et son effectivité. Les suggestions et remarques supra veulent y aider.

Il reste pas mal de chantiers sur le nouveau Légifrance (mise en page, ergonomie de l’interface de recherche avancée ...). J’espère que toute la communauté pourra y aider.

En effet, aucune initiative privée ne refera gratuitement ce qui coûte une vingtaine de millions d’euros par an [45]. La diffusion, le respect et l’effectivité du droit dans une société de l’information et la défense du droit français dans un monde de forum shopping sont à ce prix. Surtout avec l’inflation législative [46] et la complexification réglementaire. Légifrance en tant que Service public de la diffusion du droit par Internet (SPDDI) a permis que la connaissance du droit et partant son respect ou son interprétation ne soient plus un privilège. Ses statistiques de consultation et ses citations dans la presse le prouvent à l’envi.

En même temps, quand on voit les importants abandons sur Legifrance précédemment listés et la disparition de la Base de donnés juridiques de la fonction publique (BJFP, fermée en 2017), une possibilité à moyen terme serait que Légifrance ne diffuse plus que Journal officiel, circulaires et Constitution.

Si la RGPP/MAP et l’open data allaient jusqu’au bout, chaque institution, selon ses moyens, reprendrait ses billes, le top étant la base Ariane web du Conseil d’État. La Cour de cassation, la Cour des comptes, la CNIL reprendraient chacune leurs décisions. Le Conseil constitutionnel pourrait même reprendre la Constitution, non ? (humour noir)

Il n’y aurait alors plus aucun point central pour la diffusion de l’information juridique. Ce qui ne serait pas du tout dans l’intérêt du grand public et des associations. Les éditeurs juridiques pourraient y perdre mais s’adapteraient. Les réutilisateurs de l’Open data suffiraient-ils ? A titre personnel, j’en doute. Science-fiction juridique ou réalisme ?

Emmanuel Barthe
juriste, documentaliste, veilleur

Notes

[1Même si c’est plus facile qu’avant, ça n’est pas, techniquement, à la portée du premier venu.

[2Sur la recherche d’un arrêt Cass’ par sa référence de publication au Bull. Civ. ou Crim., voir le billet de notre collègue bibliothécaire documentaliste juridique Carole Guelfucci : Le nouveau Légifrance, chantier toujours en cours, Serendipidoc, 10 février 2021.

[3Fréquemment appelés « doctrine » par les juristes, les commentaires des textes officiels (lois, décrets, arrêtés, Codes ...) et des décisions de justice sont majoritairement publiés par les éditeurs juridiques dans des publications papier ou bases de données payantes, à l’exception notable des mémoires et thèses publiés en open access sur des plateformes comme theses.fr ou TEL et d’un nombre grandissant de revues en accès libre.

[5Rapport sur le projet de loi de finances pour 2008 : Annexe N° 14 : Direction de l’action du Gouvernement : Publications officielles et information administrative, par Jean-Pierre Brard, député, document Assemblée nationale n° 276, 11 octobre 2007. Chapitre III : L’information administrative et la diffusion publique > III.– Les Journaux officiels > A.– La poursuite de la modernisation des Journaux officiels > 1.– Les missions des Journaux officiels > b) L’évolution des publications et des modes de diffusion. Extrait : « Le marché a été notifié à la société Sword le 5 janvier 2006. Le calendrier de la réalisation prévoit la vérification d’aptitude à partir du 4 octobre 2007, la bascule du nouveau système de production devrait intervenir au cours de la première quinzaine de décembre 2007 et la nouvelle version du site Légifrance sera mise en ligne le 5 janvier 2008. »

[6Source : Actualités du droit, 8 octobre 2019.

[7Principaux articles et documents disponibles à ce jour sur cette bêta :

[8Lectures recommandées sur le design adaptatif : Qu’est-ce que le responsive web design ou adaptative design ?, blog Usabilis, 15 mai 2018. C’est quoi le Responsive Web Design ?, par Raphael, Alsacréations, 25 février 2014, mis à jour le 25 janvier 2017. NB : n’allez pas consulter la page française de Wikipedia sur le RWD, elle n’est pas à jour/incomplète.

[9Sur Elasticsearch et ses concurrents, lire sur ce blog Search-as-you-type : la rapidité est un atout pédagogique, mais pas une martingale. L’ancien moteur, Exalead, était en voie de disparition du marché. Et quand une application disparaît du marché, ça veut dire que bientôt il n’y aura plus de prestataire pour faire le support/maintenance et les évolutions.

[10Rapport n° 1255 : annexe n° 15, Assemblée nationale, 11 octobre 2018.

[12La base légale actuelle de l’obligation de rendre accessibles aux personnes mal ou non-voyantes les sites web et applications est l’article 47 de la loi n° 2005-102 du 11 février 2005 pour l’égalité des droits et des chances, la participation et la citoyenneté des personnes handicapées, dans sa rédaction issue des articles 106 de la loi Lemaire n° 2016-1321 du 7 octobre 2016 pour une République numérique et 80 de la loi n° 2018-771 du 5 septembre 2018 pour la liberté de choisir son avenir professionnel, tel qu’appliqué par le décret n° 2019-768 du 24 juillet 2019 relatif à l’accessibilité aux personnes handicapées des services de communication au public en ligne (JORF n° 171 du 25 juillet 2019 texte n° 38).

[13Légifrance n’est pas concerné, mais de surcroît, l’article 3 du décret du 24 juillet 2019 exclut de l’obligation d’accessibilité les contenus vidéo et audiovisuels, alors que ces contenus sont de plus en plus répandus (« y compris sur les services en ligne de l’Etat » souligne le Conseil national du numérique).

[14Voir Accessibilité numérique : un pas en arrière pour les personnes handicapées ?, par Isabelle Raynaud, La Gazette des communes, 22 août 2019. Voir aussi ces deux billets de la société Koena : Décret RGAA (1/3) : charges disproportionnées, et Décret RGAA (2/3) : contrôle et sanctions à l’échelle nationale. Koena est très clair sur le décret : « Le problème fondamental avec le décret, c’est qu’il ne permet pas à la loi d’être appliquée. »

[15Et merci pour le passé à Anne.

[16Entretien DILA avec l’auteur, 8 octobre 2020.

[17Après Samsung, Huawei dévoile son très futuriste smartphone pliable, par Nicolas Six, Le Monde.fr, 24 février 2019. Extrait : « Plus séduisant encore que celui de son concurrent, il se déplie comme un livre pour révéler un écran digne d’une petite tablette. »

[18Loi n° 88-1261 du 30 décembre 1988 complétant la loi n° 75-633 du 15 juillet 1975 relative à ‎l’élimination des déchets et à la récupération des matériaux, JORF du 4 janvier 1989 p. 113.

[19Loi n° 48-2010 du 31 décembre 1948 sur le statut du fermage et du métayage, JORF du 4 janvier 1949 p. 182.

[20Même si la règle des 3 clics maximum n’a aucun fondement scientifique ni professionnel, il n’en demeure pas moins que 8 clics, ça fait du temps perdu et des risques d’erreur. Pour citer in extenso l’"engineering psychologist" américain Michael Zuschlag sur StackEchange le 17 mai 2019 (traduction automatique DeepL revue par nos soins), « Si vous tenez vraiment à maximiser une expérience utilisateur positive, il est très important de minimiser le nombre de clics. [...] Une bonne UX, c’est plus qu’éviter à l’utilisateur d’être mécontent. Les clics sont mauvais parce qu’ils font perdre du temps aux utilisateurs. Il faut compter plusieurs secondes par clic, surtout pour un site web. Les clics sont mauvais parce qu’ils demandent un effort. L’utilisateur doit s’arrêter, réfléchir (au moins les premières fois) et agir. Les clics sont mauvais parce qu’ils introduisent des erreurs. Chaque fois que vous avez besoin d’un clic, vous donnez une chance à l’utilisateur de mal cliquer. Cela signifie encore plus de temps et d’efforts pour l’utilisateur. Perdre l’effort et le temps des utilisateurs est une mauvaise UX, que les utilisateurs s’en rendent compte ou non. Ils ont mieux à faire dans leur vie que perdre du temps avec votre produit ».

[21Les crédits venaient essentiellement du ministère des Affaires étrangères.

[22Je n’en ai pas trouvé de preuve, mais Archive.org semble avoir un partenariat de facto avec les institutions françaises pour archiver les anciennes versions de leurs sites. On y retrouve ainsi les anciens sites web de la COB, de l’AMF etc. (voir Les archives du Web : gouvernance et identités, Gazette des archives, 2017, 245 pp. 203-215). On sait toutefois qu’un partenariat au moins de facto existe entre Archive.org et la BnF, celle-ci utilisant pour son archivage du Web français le logiciel open source Heritrix développé et utilisé par Archive.org.

[23Correctif apporté le 30 septembre 2020 : « Correction du défaut d’affichage de certains alinéas dans les articles » (voir la page A propos de cette version).

[24Exemple pour l’article R 561-7 du CMF : "Modifié par Décret n°2020-118 du 12 février 2020 - art. 4".

[25NB : dans Archive.org, les moteurs de recherche ne fonctionnent plus.

[26jorfsearch affiche un lien vers le texte d’origine. Il n’apparaît cependant pas sur les petits écrans, pour des raisons de place.

[27Entretien DILA avec l’auteur, 8 octobre 2020.

[28Entretien DILA avec l’auteur, 8 octobre 2020.

[29Entretien DILA avec l’auteur, 8 octobre 2020.

[31Ce qui revient à présenter la totalité des fonds comme un fonds particulier, ce qui sur plan logique ne tient pas.

[32Entretien DILA avec l’auteur, 8 octobre 2020.

[33Décision n° 2019-486 du 9 octobre 2019 autorisant la SAS Blackbox à exploiter un service de radio de catégorie B par voie hertzienne terrestre en mode numérique dénommé Blackbox.

[34NB : l’arrêt Cass. crim. 1er septembre 2020 n° 20-80.281 n’est pas présent dans la base.

[35Entretien avec l’auteur, 8 octobre 2020.

[36Selon mon expérience, en documentation juridique, une proximité fixe de 5 mots est suffisante dans l’immense majorité des cas.

[37Entretien avec l’auteur, 8 octobre 2020.

[38Application programming interface (anglais) : en français, interface de programmation d’application. Pour une défintion très (trop ?) rapide, voir Qu’est-ce qu’une API ? sur api.gouv.fr. Pour plus de détails, voir l’article Interface de programmation sur Wikipedia.

[40Git et Loi (Open Law), fil de discussion créé par julien_c, forum Etalab, 12 février 2016. Ouverture des données Légifrance, fil de discussion créé par Datajuristes, forum Etalab, 11 août 2017. Open Data juridique : l’utilisation de la base LEGI, par Florent Gallaire, 12 novembre 2016 (voir notamment le commentaire de Carl Chenet).

[41"Bleu" budgétaire interprété un peu trop vite par NextINpact comme une annonce de réalisation du nouveau site dès 2017. D’où le titre trompeur de l’article.

[42Entretien avec l’auteur, 8 octobre 2020.

[43Entretien avec l’auteur, 8 octobre 2020.

[44Pour plus de détails et de conseils pratiques sur la protection de votre vie privée sur Internet, voir sur ce blog Comment se protéger de la curiosité de Facebook, Google, Amazon, LinkedIn etc..

[45En 2013, selon ce document budgétaire, le coût annuel de Légifrance était de 19,6 millions d’euros. Par ailleurs, les projections jusqu’en 2017 étaient à une augmentation du nombre de visites mais aussi à une baisse du coût unitaire par visite.