Appuyez sur Entrée pour voir vos résultats ou Echap pour annuler.

Presse française : les agrégateurs/banques de données
Tagaday est le plus riche en contenu de presse française, Newsdesk surveille toute source en ligne

Quatre acteurs majeurs se partagent le marché français des banques de données de presse française. Les autres, notamment les sociétés ex-de "clipping", ne font que de la veille presse sur ce qu’on dit sur une société (les solutions listées infra savent aussi le faire), ils ne fournissent pas de véritable interface de recherche et ne gèrent pas le paiement des droits [1]. Si on parle des logiciels de veille type Digimind ou , ils ne sont pas spécialisés presse et ils ne gèrent pas forcément les droits d’auteur ou CFC. Sans compter que les éditeurs de presse ne reproduisent pas forcément tous les articles de leurs titres papier sur leurs sites et que certains n’ont même pas de version web (Le Canard enchaîné, par exemple, a une site et du PDF mais pas de version pages web).

 Aday (ex-Européenne de données, EDD) :

  • Contenu :
    • banque de données en texte intégral de presse francaise : pratiquement tous les quotidiens généralistes, économiques et régionaux (seul revendeur de l’offre de panorama de la PQR France Actu Régions), l’AFP, la grande majorité des magazines/hebdomadaires généralistes (L’Express, Le Point, Le Nouvel observateur, ...) et économiques (L’Expansion, Challenges, Valeurs actuelles, ...) et une part très importante de la presse spécialisée
    • presse en ligne / sites de presse
    • télévision et radio
  • Abonnement.
  • Interface de recherche experte
  • Possibilité de créer des panoramas de presse automatisés (paiement forfaitaire selon nombre d’articles visualisés prévu, y compris les droits de reproduction par e-mail et sur l’intranet) [2].
  • Points forts :
    • ce qui distingue Aday de ses concurrents banques de données de presse rivales Europresse et LexisNexis France, c’est la quasi-exhaustivité de l’offre en PQN et sa très grande richesse en PQR, inégalée par les concurrents [3]
  • Points faibles cités :
    • les tarifs, certes un peu dégressifs, mais qui restent proportionnels à la consommation.

 Europresse, ex-société québécoise Cedrom-Sni, passé en 2018 entre les mains de Cision, une entreprise de veille médias et veille concurrentielle, dont le logiciel répond au nom de RP (comme Relations Publiques) :

  • Contenu : banque de données en texte intégral de presse anglophone et surtout francophone : de la presse anglophone et de la presse française et francophone (Le Soir de Bruxelles, ...), avec notamment les quotidiens généralistes (Le Monde, Libération, ...) et économiques (Les Echos, ...) français, les principaux news magazines français (L’Express, Le Point, ...) et certains titres de la presse quotidienne régionale (Le Progrès de Lyon, ...).
  • Abonnement [4].
  • Possibilité de créer des panoramas de presse automatisés avec paiement des droits d’auteur intégré.
  • Points forts cités :
    • simplicité de l’interface
    • certains tarifs.
  • Points faibles : le faible contenu de presse français, même si le strict essentiel y est (voir la liste des sources).

 Newsdesk de LexisNexis [5] de LexisNexis Business Information Services (BIS) :

  • Contenu :
    • banque de données de presse d’abord américaine et anglaise mais aussi française : essentiellement les principaux titres de la PQN (Le Monde, Les Echos, ...) et des news magazines généralistes (L’Expansion, Le Point, ...). En réalité, son contenu français en texte intégral sous licence n’est autre que celui de Factiva, le partenaire presse du groupe LexisNexis, que ce dernier a imposé aux cabinets d’avocats aux Etats-Unis [6]
    • sites de presse et blogs sélectionnés. On peut même ajouter ses propres sources, notamment des flux RSS
    • réseaux sociaux
    • télévision et radio
  • Abonnement.
  • Possibilité de créer des panoramas de presse automatisés diffusables par e-mail ou intranet. Paiement des droits d’auteur intégré.
  • Points forts cités :
    • interface à l’ergonomie bien travaillée [7]
    • possibilité la première année d’abonnement de tarifs totalement forfaitaires (i.e. non fonction de la consommation [8]).
  • Points faibles :

A partir de 2012-2014, les grands agrégateurs ont inclus les sites web de presse et une sélection de blogs dans leur index, reconnaissant de facto leur qualité de source d’information et leur utilité pour la veille et concurrençant ainsi enfin Google News (Google Actualités).

Fin 2017, début 2018, avec la mise en avant par LexisNexis de Newsdesk (et le retrait prévisible de Lexis Publisher vu l’absence de mise à jour) puis le rachat d’Europresse par Cision, se confirme une évolution des bases de presse vers un modèle plus large de base de veille médias destiné non seulement aux veilleurs et documentalistes pais aussi voire surtout aux communicants et marketeurs.

 En effet, le quatrième agrégateur de presse en France est un agrégateur de facto, pas de juro : Google Actualités (Google News), souvent associé par ses utilisateurs aux alertes e-mail de Google Alert. Même si son propriétaire considère qu’il n’a pas à payer la presse pour l’indexation (et les extractions substantielles qu’il opère quotidiennement) de leurs sites [10], le robot indexeur de Google n’est pas bloqué par la presse française, il faut le noter (alors, ironie, que les sites des principaux quotidiens bloquent les robots indexées des logiciels de veille). Pour autant, il est de moins en moins adapté aux besoins des professionnels de la veille presse :

  • le problème n° 1 avec Google News, c’est qu’il n’offre aucun contrat sur les droits d’auteur pour diffuser une veille presse. Rediffuser sa veille Google Actualités est totalement illégal par conséquent. Mais, me direz-vous, on peut inciter les utilisateurs à créer leurs propres alertes Google, n’est-il pas ? Ce contournement a ses limites, lisez ce qui suit
  • le problème avec Google News, au-delà, c’est sa couverture nettement plus limitée : articles payants ou non publiés sur le Web sont exclus, les sites de presse réduisent le nombre d’articles gratuits, et le moteur de recherche de GNews ainsi que les performances de Google Alert se dégradent avec le temps. Google News a subi une nouvelle version en juin 2018, plus adaptée aux mobiles qu’autre chose, et la régression continue. Ma collègue Carole Tisserand Barthole de FLA Consultants analyse ainsi ce dernier épisode : « certains éléments et fonctionnalités ont disparu de la nouvelle interface rendant tout simplement la veille et la recherche sur Google Actualités beaucoup moins fonctionnelle. On mentionnera :
    • tout d’abord une perte de contexte. Pour chaque actualité, on ne dispose plus des premières lignes de l’article ou des mots-clés en contexte et il est donc plus difficile de se faire une idée précise de ce que peut contenir l’article
    • une absence d’estimation du nombre de résultats et de possibilités de filtrage par date. Il n’y a plus aucune notion du nombre de résultats et les résultats s’affichent et s’ajoutent au fur et à mesure que l’on fait défiler la page [...]
    • une impression trompeuse d’exhaustivité avec le bouton « Voir la couverture complète » disponible sous certaines actualités. Si Google agrège bien quelques articles et autres contenus vidéos ou tweets tout à fait pertinents, il n’en reste pas moins qu’il s’agit d’une simple sélection d’articles récents sur un sujet et que cela n’inclut pas l’intégralité des articles sur le sujet indexés par Google lui-même...
    • des flux RSS devenus a priori invisibles »
  • depuis l’implémentation du nouvel algorithme BERT en novembre 2019, des sites non fiables, diffusant des "fake news", sont apparus. En effet, comme l’explique Carole Bartole dans Bases de janvier 2020, depuis BERT, les sources composant Google News ne sont plus sélectionnées par des humains mais automatiquement par l’algorithme ...
  • un énorme avantage de Google News demeure toutefois : grâce à ses algorithmes machine learning, et guidé par les liens hypertextes, il rassemble plus aisément que les agrégateurs un ensemble d’articles pertinents et de (plutôt bonne) qualité sur un sujet donné. Mais pour obtenir ça, il faut désormais taper sa requête dans l’onglet Tous de Google puis cliquer sur Actualités une fois la liste de résultats affichée. En effet, news.google.com est désormais conçu uniquement pour les particuliers et avec un choix de sources très réduit.

Conclusion : les agrégateurs ont nettement progressé, mais ils ont encore du pain sur la planche.

Emmanuel Barthe
documentaliste juridique, veilleur, formateur

Notes

[1A l’exception peut-être du moteur Pickanews d’Onclusive, et créé historiquement par Kantar Media (ex-PressIndex), mais il ne gère pas les droits.

[2L’ancienne version de Pressedd avec recherche gratuite, une interface de recherche simplifiée et paiement au document par carte bancaire, n’a pas été reconstruite depuis la mise en service de la version de 2013 et elle ne le sera pas à notre avis, le business model de l’achat à l’unité rapportant peu.

[3La clé de son avantage sur la PQR réside dans le fait que Pressedd a l’exclusivité du GIE PanoramaPQR, un ensemble de plus de 30 titres que l’EDD a aidés à mettre en place un format numérique et pour qui elle a créé une plateforme dédiée.

[4L’achat au document a été supprimé ici aussi.

[5Successeur de LexisNexis Publisher, Newsdesk est un produit de la société Moreover (à l’origine un moteur de recherche pour entreprises novateur), rachetée par LexisNexis en 2014.

[6Aux Etats-Unis, passer par LexisNexis pour accéder à Factiva est devenu obligatoire en 2004 pour les cabinets d’avocats (LexisNexis Secures Content Deal with Factiva for the Legal Market / Paula J. Hane, Information Today 18 octobre 2004).

[7On cite parfois aussi comme un point fort l’indexation automatique des articles de la base Factiva avec des mots-clés, notamment le secteur industriel, ce qui améliorerait les possibilités de recherche. Mon expérience ne recoupe pas cela

[8Ce qui suppose que l’éditeur prenne à sa charge l’éventuelle "surconsommation" et peut donc donner lieu, l’année suivante, à augmentation de la part de l’éditeur ...

[9Panorama de la presse locale et régionale en ligne, par Carole Barthole, Bases n° 283 juin 2011.

[10Cela pourrait changer à l’avenir suite à la directive de 2019 sur le droit d’auteur, avec le soutien de l’exécutif français, mais rien n’est certain, Google n’etant pas obligé de l’appliquer s’il supprime les extraits ou s’il choisit de désindexer les sites.