Appuyez sur Entrée pour voir vos résultats ou Echap pour annuler.

Search-as-you-type : la rapidité est un atout pédagogique, mais pas une martingale
Les éditeurs juridiques et une fonctionnalité de recherche plébiscitée

[ NB : publié initialement le 7 décembre 2018, cet article a peu été mis à jour depuis. Comme anticipé, le search-as-you-type a reculé au profit du suggest-as-you-type, particulièrement sur Légifrance et ServicePublic.fr.. ]

Le search-as-you-type (appelé parfois find-as-you-type ou incremental search) est une technique de recherche mais aussi d’affichage (ça produit aussi le code HTML de la page de résultats) devenue très populaire sur certaines plateformes juridiques françaises.

Elle consiste à afficher les résultats en même temps temps que vous tapez vos mots-clés. Fini l’attente. Concrètement, l’objectif est de descendre sous le dizième de seconde.

Search-as-you-type : les grands moteurs

Importé dans le monde de l’édition juridique privée française par Doctrine.fr puis Alinea by Luxia en 2016, le search-as-you-type a été adopté par Open Dalloz Jurisprudence en 2017, puis Lextenso et Lexbase à leur tour en 2018. Si on considère l’ensemble de l’édition juridique française, en incluant donc l’éditeur officiel public qu’est la DILA, c’est le site Service-Public.fr qui fut le premier à implémenter cette fonctionnalité, en septembre 2015 [1].

Si on se réfère au marché juridique français, trois acteurs dominent le marché du search-as-you-type :

 Elasticsearch. Bien qu’open source, Elasticsearch est en pratique développé et largement commercialisé par la société du même nom (au S près : le nom de la société s’écrit ElasticSearch). Elasticsearch s’installe principalement sur les serveurs de l’entreprise qu’elle doit "motoriser" — toutefois, une offre SaaS [2] s’est mis en place depuis quelques années (notamment les offres Elastic Cloud et Bonsai). Quelques billets instructifs sur Elasticsearch :

 Algolia. Algolia est une application hébergée (une "SaaS API" [3] pour être précis) sur les serveurs externes d’Algolia même (pas en cloud, donc) et développée par des Français. Conçue au départ pour servir de moteur aux applications mobiles conçues pour les smartphones, Algolia a changé de business plan en cours de route. Son atout principal, semble-t-il, réside dans sa capacité de montée en puissance ("scalability" [4]), une capacité clairement liée à son caractère SaaS. J’ai trouvé moins de choses niveau initiation sur Algolia, probablement du fait que c’est une application propriétaire mais aussi qu’elle est venue après Elasticsearch, dont elle est devenue le challenger n° 1. Voir tout de même ceci :

 Solr. Moteur de recherche open source lui aussi, mais de facto plus proche de la philosophie du libre (i.e. modifié par d’autres que ses auteurs initiaux) qu’Elasticsearch, Solr s’appuie sur la bibliothèque de recherche Lucene, créée par la fondation Apache. C’est un produit moins fini que les deux supra, plus une base sur laquelle il faut construire. Il équipe des sites connus et à fort trafic, comme l’Internet Archive ou le site américain de commerce électronique Zappo’s. Un peu de littérature sur Solr :

Pour une comparaison de popularité entre les trois moteurs (et d’autres) de type Search, voir sur le site DB Engine. On y voit très bien la place de challenger d’Algolia [5]. Pour une comparaison des performances et des cas d’utilisation typiques recommandés, lire :

  • ce billet écrit par un consultant américain en "search", toutefois un peu biaisé parce que spécialisé dans les moteurs de recherche open source [6]
  • ce bref comparatif sur Stackshare.

Comment le search-as-you-type fonctionne

Le principe est qu’à chaque fois qu’on tape un caractère (il y a des exceptions, voir infra), cela envoie une requête au serveur.

Techniquement, le search-as-you-type n’est pas à proprement parler une technique de recherche nouvelle, mais simplement le fait de lancer la recherche pour chaque nouveau caractère ajouté ou supprimé par l’utilisateur, avec la phrase de recherche courante. Par exemple, si on recherche “travail”, le moteur de recherche va successivement renvoyer des résultats pour t, tr, tra, trav, trava, travai, travail... Donc, au lieu de soumettre une seule requête au moteur, on va en soumettre sept.

Le search-as-you-type demande donc plus de ressources processeur au serveur et plus de bande passante que la recherche non-incrémentale, du fait des requêtes incessantes.

Mais on peut aussi faire du search-as-you-type uniquement sur une liste finie de termes, ce qui diminue fortement la consommation serveur, et ne faire un affichage qu’après 2, 3 ou 4 caractères tapés. C’est ce qui est semble-t-il recommandé et c’est ce que le moteur search-as-you-type de Service-Public.fr a implémenté : tant que vous tapez un ou deux caractères, il ne vous propose pas de compléter vos caractères par des mots. Au troisième caractère, il commence à proposer.

Cette technique a été rendue possible par la puissance de calcul accrue des machines et la hausse des débits des connexions Internet.

C’est une des raisons de son adoption tardive par les éditeurs : avec des millions de documents sur une plateforme, le serveur qui l’héberge est pas mal sollicité à chaque requête. Mais les performances actuelles des réseaux et des ordinateurs l’ont rendu possible.

NB : pour afficher les résultats en temps quasi-réel, il faut aussi un rendu des pages web (une écriture du code HTML si vous préférez) extrêmement rapide.

La réalité sur le search-as-you-type

Les jeunes juristes ne jurent que par cette technique et la réclament souvent à cor et à cri.

La réalité sur le search-as-you-type :

  • primo, c’est très impressionnant dans un monde obsédé par le temps et donc par la vitesse. Et c’est très ludique. En un mot : très marketing
  • secundo, c’est très pédagogique : en permettant de voir ce que fait l’ajout ou le retrait d’un mot, la vitesse incite à taper plein de mots qu’on n’aurait pas tapés sinon. En un mot, elle "forme" l’utilisateur
  • tertio, pour autant, ce n’est qu’une technique de recherche et d’affichage. Elle n’a aucun effet sur la qualité du contenu de la plateforme ni non plus sur la pertinence des résultats.

Ce dernier point est évident mais vaut le coup d’être rappelé tant les jeunes juristes semblent ne jurer que par la vitesse. Certes, ils sont sous pression car ce sont eux qui font une bonne partie des recherches dans les structures. Mais, comme le dit tant le proverbe que 25 ans d’expérience en recherche juridique, il ne faut pas confondre vitesse et précipitation [7].

Bien réfléchir à ses mots-clés et d’autres aspects *avant* de commencer à taper quoi que ce soit, employer des opérateurs booléens, choisir sa plateforme en fonction de ses points forts, éviter d’interroger tout le contenu : tout cela compte.

Moralité : le jour où Lexis 360, Lamyline, Dalloz.fr et ELnet auront implémenté cette technique, certaines comparaisons globalement non justifiées cesseront aussitôt.

Implémenter le search-as-you-type prend du temps et représente un investissement financier important après un contexte difficile [8].

Pour autant, il y a fort à parier que d’ici décembre 2019, les retardataires parmi les grands éditeurs juridiques y seront passés. Le search-as-you-type est attractif, réclamé et en voie de généralisation. Il est devenu impossible de l’ignorer.

La preuve ? Legifrance lui-même va s’y mettre : la prochaine version de Legifrance (sortie prévue pour la fin du 1er trimestre 2020), aura pour moteur Elasticsearch. Comme on peut le constater sur la version bêta en test depuis le 7 octobre 2019, ce nouveau moteur est de type "search-as-you-type".

Search-as-you-type v. suggest-as-you-type


La fonctionnalité suggest-as-you-type du site Service-Public.fr en action

Pourtant, après l’avoir adopté en 2012, Google a abandonné le search-as-you-type en 2017, officiellement parce qu’inadapté au mobile, devenu entretemps le support de 50% des requêtes de recherche envoyées au moteur [9].

Le search-as-you-type va contre une autre tendance des moteurs de recherche : suggérer des mots-clés — en essayant de deviner ce que l’utilisateur a en tête et le lui proposer. Google a de facto remplacé depuis 2017 le search-as-you-type par une autocomplétion mêlée de suggestions — suggestions qui existaient déjà chez lui [10]. Les suggestions, concrètement, c’est une liste d’expressions suggérées sous la requête/question de l’utilisateur. Ces expressions suggérées sont souvent différentes des termes que l’utilisateur est en train de taper [11]. Les suggestions vont donc plus loin, et théoriquement, elles devraient être plus intéressantes pour l’utilisateur.

Pour l’instant, je constate que les suggestions disponibles sur les moteurs internes actuels des éditeurs sont généralement peu pertinentes dès que la requête se complexifie (essentiellement le cas où elle comprend plus d’une notion/expression). Google a d’ailleurs "calmé" les suggestions, car nombre d’entre elles étaient non pertinentes et surtout révélaient voire étalaient au grand jour des problèmes de réputation.

La grande exception, c’est Service-Public.fr, dont le moteur search-as-you-type date de la refonte du site de 2015. Mais il y a des raisons à cette pertinence, cette avance sur les autres : Service-Public.fr a moins de contenu, beaucoup plus d’utilisateurs et beaucoup plus d’expérience (le temps a rodé ce moteur). Des avantages dont les moteurs d’éditeurs ne bénéficient pas.

Le search-as-you-type, lui, n’a pas de problèmes de pertinence ou de révélation de réputation. De plus, il offre de plus une alternative intéressante aux suggestions, car il permet de tester rapidement tous les mots-clés (et leurs variantes) auxquels l’utilisateur peut penser.

En attendant l’arrivée d’un suggest-as-you-type fortement pertinent et performant sur le droit français, le search-as-you-type est une étape utile, en tout cas plus efficace in fine sur le résultat de la recherche que l’état actuel (probablement temporaire) des moteurs de recherche des éditeurs juridiques traditionnels.

Emmanuel Barthe
documentaliste juridique, veilleur, testeur

Notes

[1Le nouveau service-public.fr, une nouvelle relation à l’usager, blog de Service-Public.fr, 22 septembre 2015. Je cite (le gras est de nous) : « Les champs sont en auto-complétion et suggèrent des accès directs aux fiches les plus consultées, les résultats de recherches sont présentés plus clairement, avec un premier tri correspondant aux parcours des usagers (fiches pratiques, services en ligne, annuaire). »

[2Software as a Service.

[3Software as a Service application programing interface.

[4Capacité de faire face sans dégradation des performances à des augmentations très importantes et très rapides du nombre d’utilisateurs et de requêtes.

[5Eviter la comparaison sur Google Trends, car Elasticsearch comme Solr étant open source — donc tout le monde peut y toucher un peu —, leur popularité dans les discussions et sur les sites web est évidemment beaucoup plus importante qu’Algolia. Google Trends n’est pas un indicateur de parts de marché. A noter à cet égard qu’Algolia a réalisé en octobre 2019 une nouvelle levée de fonds de 110 millions de dollars.

[6Thoughts on Algolia (vs Solr & Elasticsearch), par Doug Turnbull, OpenSource Connections, 1er juin 2016. Le domaine de compétence d’OpenSource Connections selon leur page About us est : Elasticsearch, Solr, pertinence dans les résultats et machine learning.

[8Voir l’Etude du marché de l’information juridique électronique réalisée par SerdaLAB pour l’association Juriconnexion, et publiée en janvier 2016 (chiffres 2014).

[10How Google autocomplete works in Search, par Danny Sullivan, Google Blog, 20 avril 2018. 3 Ways to Use Google Search Suggestions, par Elisa Gabbert, WordStream, 19 septembre 2017. On peut désactiver cette fonctionnalité.

[11C’est ce qui distingue les « Suggestions » de l’« Autocomplete » (autocomplétion en français). L’autocomplétion elle-même ne doit pas être confondue avec le search-as-you-type : l’autocomplétion ne modifie pas à elle seule les résultats, elle attend que vous choisissiez une forme complète de votre requête pour lancer la recherche.