Appuyez sur Entrée pour voir vos résultats ou Echap pour annuler.

Les licences Legifrance deviennent gratuites. L’UNESCO lance son Open Access Repository

Comme les choses changent ... dans l’édition juridique
Et le futur ? : La bataille du référencement

Deux révolutions toutes fraîches

Comme les choses changent depuis quelques années dans l’édition juridique. Parfois, on se frotte les yeux, tant on a du mal à y croire. Côté éditeurs publics, juste deux exemples, littéralement "incroyables" il y a 10 ans, voire même 6-7 ans [1] :

  • les bases de données juridiques publiques (CASS, INCA, JADE, JORF etc.), autrement dit le contenu de Legifrance devient librement et gratuitement réutilisables. Fin des licences payantes Legifrance (donc pas de celles des bases Jurica ni Ariane Intégrale [2]).
    Quelques conséquences a priori prévisibles :
    • comme l’écrit Michel Vajour pour le GFII : « Cette élimination totale [3] des barrières à la réutilisation des bases juridiques, qui place la France parmi les pays les plus innovants en matière de réutilisation, devrait permettre un développement des usages de l’information juridique, en particulier pour des applications analytiques basées sur des technologies de "text mining" et de "data mining" ». Google et al. ne devraient pas être longs à saisir l’opportunité.
    • cela sert la diffusion du droit français face au "forum shopping"
    • le marché de l’édition juridique ne devrait à mon avis pas voir de baisse de prix dans les bases de données, mais en revanche les petits acteurs et les futurs entrants seront en situation (un peu) plus favorable qu’auparavant
  • et — tiens ! comme par hasard, et comme quoi le mouvement est global — du côté international, l’UNESCO vient de lancer son Open Access Repository (OAR) en rendant plus de 300 livres, rapports et articles en ligne accessibles gratuitement. L’OAR opérera sous une nouvelle licence ouverte développée par les Creative Commons (CC) spécifiquement pour les organisations internationales (communiqué UNESCO du 10 décembre 2013).

Le problème/la clé est que désormais, c’est la visibilité — autrement dit l’indexation par les moteurs publics et la duplication par les grands acteurs — qui comptent dans une société mondiale de l’information de plus en plus concurrentielle — et, pour le systèmes juridiques, dans un monde de "forum shopping" croissant. Et cette tendance était déjà à l’oeuvre depuis des années. Quelques exemples :

  • Legifrance avait pris un virage notable lorsqu’il devint facilement indexable par les moteurs de recherche (notamment par Google) grâce aux URLs (adresses web) fixes des documents. Autrement dit, plus besoin de se rendre sur la page d’accueil de Legifrance, on reste sur son moteur favori, ce qui facilite l’interrogation du fonds. Il est vrai toutefois que ça fonctionne beaucoup mieux avec les textes officiels qu’avec la jurisprudence [4]
  • mi-2012, déjà, les licences Legifrance avaient failli devenir gratuites
  • autre exemple : le travail de l’Université de Bielefeld, une démonstration toute simple de l’utilité des entrepôts institutionnels moissonnables.

Pour reprendre — en la tordant quelque peu — une célèbre expression, ne tendrait-on pas à aller vers : « Publish freely online or perish » ? A titre d’exemple dans le milieu avocats, le site et newsletter associée Lexology [5] assure justement cette meilleure /indexation/diffusion/visibilité en reprenant les articles d’actualité et newsletters [6] publiés par les cabinets d’avocats d’affaires internationaux.

Et le futur alors ? Les fonds ...

Puisque 10 ans plus tôt, on n’aurait pas cru, faisons alors un peu de prospective sur les 5 à 10 ans.

On peut envisager un fonds français en doctrine comparable au Legal SSRN grâce à :

  • la libération des œuvres scientifiques financées par l’Etat et la mise en open data des données et métadonnées (titre, auteur, date, mots-clés etc.) sous le site d’archives "ouvertes" HAL [7], deux événements qui se produiront probablement d’ici 5 ans
  • les revues libres juridiques qui seront à ce moment indexées/interrogeables sous Isidore.

Pour les petits acteurs, l’exemple de Cairn est topique. Ce type de portail de revues scientifiques permet à des petits fonds scientifiques peu diffusés d’augmenter leur référencement et en proposant tant rediffusion et de la vente à la pièce qu’abonnement annuel forfaitaire pour tel ou tel "paquet" de revues. Pourquoi ? Parce qu’ils regroupent les petites revues et parce que leurs métadonnées sont moissonnées (récoltées et mises en base de données automatiquement) par Isidore.

Les profondes modifications de Google Scholar [8] sont aussi un signe de l’usage de plus en plus admis de la recherche intelligente, profonde, croisée, "décomplexée", tout ce qui est permis par les normalisations et les nouvelles puissances de calcul. Evidemment, cela pose des problèmes (vie privée, concurrence...) mais ce n’est pas nouveau en tant que tel, on ne peut pas dire qu’on est pris par surprise : ces problèmes juridiques changent juste d’échelle, et cela permet incidemment de régler d’autres difficultés (plagiat, archivage pérenne, preuve...).

On peut aussi suivre l’action plus modeste mais assez efficace d’Helinia qui communique beaucoup par réseaux sociaux (Twitter, Facebook) et qui contribue à mettre en valeur des colloques, des mélanges ou des thèses en accès libre. En revanche Pages de Doctrine, du fait de son obligation de connexion pour consultation, n’est pas pertinent puisque cela empêche de moissonner leurs métadonnées.

A noter que là, on n’est plus dans l’édition juridique publique mais chez les petits acteurs privés.

A signaler qu’une thèse juridique primée (prix 2014 de la CNIL) [9] a été pour la première fois mise et laissée en accès libre. Il va donc y avoir de plus en plus d’œuvres juridiques scientifiques en accès libre sur Internet. 2014 et 2015 risquent d’être déterminantes à cet égard.

... et leur référencement (portails et moteurs)

A propos de la bataille du référencement, il est de l’intérêt bien compris des laboratoires de recherche juridique de :

  • savoir se déclarer dans HAL (la publication et le rayonnement scientifique sont parmi les critères d’évaluation de l’AERES) et dans le Legal SSRN (y compris pour les publications payantes, puisqu’on leur demande juste les métadonnées)
  • savoir utiliser Zotero et Cairn, Revues.org et Isidore.

Un travail qui pourrait et devrait être mené par les bibliothèques universitaires (BU).

On peut aller un cran plus loin : le moteur de recherche et le référencement devenant des passages obligés, de là, il faut envisager la nécessité d’utiliser des concurrents du moteur dominant (Bing en tant que consommateur, Ixquick et surtout sa version "anonymisée" de Google, Startpage, YaCy) et d’avoir à terme ses propres outils face à Google, Twitter et leurs homologues chinois, Baidu et Sina Weibo.

Idéalement, seraient indispensables :

  • des outils au code "ouvert" pour éviter toute tentation de détournement (autrement dit, publicité des sources et des algorithmes)
  • la confidentialité des recherches, parce que rien que par la liste des mots clefs ramenée à sa plage d’adresses IP, on peut déduire la stratégie d’une entreprise (qui peut d’ailleurs influencer à son tour en orientant ses recherches de façon à induire telle ou telle analyse ...).

Voir pour cela deux billets récents : Les moteurs de recherche anonymes, libres et décentralisés (septembre 2013) et Petit aperçu des moteurs de recherche libres sur Internet (sept. 2012).

Bien évidemment, le débat n’est pas clos, surtout sur le rôle des éditeurs — qui ne sera pas en baisse à mon avis [10]. Les commentaires sont les bienvenus.

Notes

[1Si vous suivez ce deuxième lien, lisez bien jusqu’en bas.

[3Pas totale, ni JuriCA ni Ariane 2 ne sont concernées ... Jurica n’est pas produite par la DILA, ex DJO, mais pas la Cour de cassation, également responsable de sa commercialisation auprès des éditeurs. Et Ariane Intégrale, qui inclura non seulement les décisions du Conseil d’Etat et des cours administratives d’appel (CAA) comme dans Legifrance mais aussi celles des tribunaux administratif (TA) est produite et vendue par le Conseil d’Etat.

[4Pour autant, le fichier robots.txt de Legifrance n’interdit pas l’accès aux bases CASS et INCA et toutes les bases de jurisprudence de Legifrance sont dotées d’URLS fixes. La — toute relative — moins bonne indexation de Legifrance par Google en ce qui concerne la jurisprudence me semble liée à la moindre fréquence des liens vers les arrêts publiés sur le portail officiel. Les décisions de justice, notamment, ne font pas l’objet d’un véritable sommaire sur Legifrance, contrairement au JORF.

[5Son éditeur est Globe Business Publishing, connu également sous le nom de Globe Law & Business quand il publie des livres de droit comparé de type "Q&A country by country" sur un thème rédigés par des cabinets locaux spécialistes du domaine. Restera t-il longtemps indépendant ?

[6Attention, faux ami : l’anglais utilise le terme "bulletins" pour nos newsletters françaises, terme pourtant "angliciste".

[7NB : il y a encore trop peu de juristes qui référencent leurs travaux sous HAL, pourtant disponibles en accès libre. Un exemple : Franck Macrez. Pourtant, il se signale sur le site de la FFII France (chapitre français de l’Association pour une infrastructure informationnelle libre (FFII).

[9Extrait du communiqué de la CNIL : « Le jury du Prix de thèse Informatique et Libertés, présidé par M. Jean-Marie Cotteret, membre de la CNIL, a attribué le 5ème prix Informatique et Libertés à Francesca Musiani, postdoctorante au centre de Sociologie de l’Innovation à MINES ParisTech, et affiliée au Berkman Center for Internet and Society de l’Université de Harvard, pour sa thèse intitulée « Nains sans géants. Architecture décentralisée et services Internet ». Le prix récompense ses travaux consacrés à l’exploration du développement des architectures pair-à-pair (P2P). L’objectif de cette thèse est très ambitieux puisqu’il s’agit d’étudier le développement des architectures P2P sous des angles très différents : technique, juridique, économique et sociologique. »

[10Certain éditeur a déjà pris le virage de la mise en valeur pour moissonnage OAI des métadonnées des articles de ses revues. Avis aux concurrents.