Appuyez sur Entrée pour voir vos résultats ou Echap pour annuler.

Métamoteurs : the end ?
Pour les annuaires de sites, en tout cas, c’est déjà plié

Tout est parti d’une question posée sur twitter de Sébastien Billard (compte Twitter @sbillard), responsable SEO chez Auchan.fr et dans le référencement en tant que consultant depuis 2001 :
« Les pros de la veille, demandait-il : existe-t-il encore des méta-moteurs dignes d’intérêt en 2019 ? Le concept même de méta-moteurs (généralistes) est-il encore pertinent selon-vous ? »

TL ;DR : la réponse/conclusion tient en peu de mots :

Les métamoteurs ont largement perdu de leur intérêt (comme l’évolution d’Ixquick vers StartPage le montre) :

  • non pas à cause d’eux-mêmes, mais d’abord et avant tout parce qu’ils se reposent sur des moteurs généralistes de qualité et qu’il n’y en a plus que deux (Google et Bing).
  • aussi parce que les bases de données spécialisées (payantes, certes) ont entièrement basculé sur Internet et que dans beaucoup de domaines, on ne peut pas en faire l’impasse si on veut être rigoureux, complet et à jour
  • et sinon, accessoirement, parce qu’il est techniquement impossible d’utiliser les opérateurs avancés sur un métamoteur.

Maintenant, voici les débats, les arguments et les détails :

Pourquoi les métamoteurs ont perdu la guerre du search

Serge Courrier (TW @secou) estime que « pour ce qui est de leur intérêt, il est modeste pour les fanatiques des opérateurs avancés et ils ne font qu’ajouter leur propres algorithmes de classement à ceux des moteurs interrogés ». Je vais dans son sens.

Christophe Deschamps (TW @crid), lui, « conseille encore (entre autre possibilités) d’utiliser un métamoteur lorsqu’on démarre une recherche de sources thématiques. C’est ce [qu’il] appelle l’effet Top 50. Mais à part ça ... »

A propos de recherche de sources thématiques, il me revient que Béatrice Foenix-Riou (TW @BFoenix) recommandait en 2012 de chercher (par Google) des annuaires thématiques et autres pages de liens (correctement maintenues évidemment). Exemple sur l’industrie textile en Allemagne

Mais comme le fait remarquer Serge Courrier, « les répertoires et sélections de liens se font malheureusement de plus en plus rares. IPL2, les signets de la BNF, Unesco Library Portal, l’excellent annuaire de signets du CERIMES bourré de flux RSS etc., tous ont disparus ou sont en sommeil. Car chronophages, coûteux à maintenir ... et rarement visités ».

Exact, hélas, mais cela n’empêchait pas les moteurs de recherche (dont Google, qui "pompait" allègrement — et légalement — le grand annuaire DMOZ) d’en profiter, et pour le plus grand bien de tous. Et puis, il reste des annuaires maintenus, comme celui de la BU de Sc-Po Paris. Mais globalement, la messe est dite : les annuaires sont morts.

Pierre-Yves Debliquy (Euresis, blog, TW @Euresis_ie), « pour sa part, privilégie l’examen en profondeur des listes de résultats (ce qui l’affranchit des impacts des algorithmes de ranking ...). Pas de méta-moteurs pour [lui], donc. »

Pour Renaud Joly (TW @renaudjoly), « l’info circule plus vite et plus facilement. La question est plus de filtrer ou de chercher dans des bases (ou de suivre des experts) spécialisées que de chercher large ».

Dans sa pratique perso, et en tant que chercheur avancé, Sébastien Billard estime qu’il « est rarissime qu’il doive aller ailleurs que Google pour trouver ce qu’il cherche. Sinon, il va des fois directement dans des moteurs spécialisés (genre PubMed). »

En effet. Et quand on parle de moteurs spécialisés, il faut inclure le payant. Les bases spécialisées, notamment payantes, font beaucoup plus que compléter Google [1]. Sur les sujets "pro" et quand on veut du détail, de l’argumenté, le plus souvent, les résultats du web gratuit, donc de Google, manquent très largement de fiabilité et/ou de mise à jour. Ca dépend des domaines, mais en droit, en veille économique et financière ou en sciences de l’ingénieur, par exemple, on ne peut pas faire l’impasse sur les bases payantes. Sinon, on prend le risque bien réel (et important) de se "planter".

Pour le spécialiste du référencement Internet (SEO) Aymen Loukil (TW @LoukilAymen), « avoir besoin de chercher de l’information en désactivant tous les aléas de la localisation, de la personnalisation et du profiling restera à [s]es yeux utile ».

Sébastien Billard fait alors une incise : « Oui, mais là tu parles plus des moteurs respectueux de la vie privée que des méta-moteurs vu que tu n’évoques pas la diversité des sources ? »

Aymen Loukil maintient l’intérêt de la désactivation de la personnalisation et ajoute qu’il ne « voit pas de non respect dans le fait de présenter des résultats géographiquement plus cohérents. La diversité des sources est une richesse aussi. »

Personnellement, je reste réservé sur l’avantage qu’apporteraient les métamoteurs en terme de diversité des sources au vu, comme précisé supra, du fait que seuls deux moteurs généralistes sérieux ont survécu. Je répond que « si on veut évaluer les performances des moteurs et métamoteurs, il faut prendre en compte le respect de la vie privée [2] mais il faut également savoir distinguer ce critère-là des autres, comme la taille de l’index et la pertinence ». Autrement dit, le respect de la vie privée ne peut pas servir de critère de recommandation unique pour un outil de recherche. Sauf à considérer que performance et pertinence des moteurs de recherche n’ont plus aucun intérêt ...

Ricardo Mendes (TW @rMdes_), enfin, explique « utiliser énormément Inoreader pour filtrer, rechercher à l’intérieur d’agrégation de sources, des infos utiles basé sur des filtres regex (zéro algorithme etc.) ». Ca me paraît malin, car la recherche se fait alors sur un sous-ensemble très étroit du Web et déjà thématiquement cohérent, donc ipso facto avec moins de "bruit".

Si métamoteurs quand même, lesquels ?

Mais bon, si on doit recommander des métamoteurs, alors lesquels ? :

  • réponses de Serge Courrier :
    • « Carrot2, malgré une interface vieillotte
    • DuckDuckGo, un métamoteur intéressant que l’on confond souvent avec un moteur tout court. » NB : personnellement, je trouve DDG peu efficace sur la langue française
  • @bituur_esztreym recommande « Tonton Roger, un métamoteur ne conservant d’informations sur les utilisateurs. Il est basé sur searx, et "tuné" par framasoft. » NB : mon test personnel rapide de Tonton Roger me fait penser que je vais le mettre dans mes (méta)moteurs et annuaires de secours.

NB : une confusion à éviter : Startpage n’a plus rien à voir avec son ancêtre Ixquick et ne réutilise que et uniquement que les résultats de Google — certes d’une manière différente de Google. Et ok, il respecte apparement l’anonymat/vie privée de ses utilisateurs [3]. Mais la société System1 a pris fin 2019 une participation dans Startpage. Or System1 travaille dans le domaine de la collecte de données et son dirigeant a dit : « Dans notre secteur, si nous pouvons recueillir autant de données que possible, les confier à nos ingénieurs et à nos "data scientists", puis gérer les deux efficacement, alors l’entreprise peut rapidement évoluer" ». De plus, à strictement parler, StartPage ne serait pas vraiment un métamoteur puisque le préfixe méta, qui signifie au-delà en grec, équivaut au sens de profond (comme les métadonnées ou le métalangage), haut ou grand (comme méta-revue). On ne peut pas dire qu’un métamoteur qui n’utilise qu’un seul moteur soit plus profond, plus haut ou plus grand que son original.

Emmanuel Barthe
documentaliste veilleur, formateur

Notes

[1Le Web est vide, par Emmanuel Barthe, Precisement.org, 28 juillet 2016.

[3StartPage reproduit l’index de Google. Des tests simples le montrent également.
Son ancêtre Ixquick était un véritable métamoteur, StartPage AMHA ne l’est plus vraiment.
En fait, ce ne fut pas une fusion de deux moteurs différents mais 1. un rachat de la société Ixquick (fondée en 1998) par une société néerlandaise en 2000 puis 2. un re-branding, lui-même en trois étapes : a. 2009 Ixquick crée un 2e moteur, StartPage, en fait un Google-only anonymisé. b. Avec l’accent mis sur privacy, auquel s’ajoute l’augmentation de la pertinence des résultats (du fait de Google) et le nom de domaine facile à retenir, Startpage décolle. c. Ixquick finit par débrancher le moteur Ixquick en 2016, dont le nom de domaine renvoie alors vers StartPage.
Cet aspect Google-results-only, StartPage le met désormais peu en avant, alors que c’est un virage crucial : « SP renvoie les résultats de GG, tandis qu’Ixquick renvoie les résultats des autres mot. rech., mais pas de GG. » https://web.archive.org/web/20160208011605/https://support.startpage.com/index.php?/Knowledgebase/Article/View/103/0/what-is-the-difference-between-startpage-and-ixquick