Appuyez sur Entrée pour voir vos résultats ou Echap pour annuler.

"Revues de presse" électroniques : une amorce de solution
Une plateforme de veille signe un accord pour reverser des droits au CFC

La situation (financière) pourrait s’éclaircir un peu pour la presse française.

Et par ricochet, la situation juridique des documentalistes et veilleurs pratiquant le panorama de presse pourrait elle se simplifier.

Un communiqué daté du 31 mais 2018 de la plateforme de veille Sindup annonce qu’elle a conclu un « accord inédit avec la presse [française] » : pour 45 euros par mois, le crawler de Sindup ne sera plus bloqué par les sites de presse du CFC (Centre Francais du droit de Copie) [1]. Qui regroupent la majeure partie de la presse, du moins celle qui compte pour les veilleurs.

Voici les premières lignes du communiqué :

« Sindup conclut un accord inédit avec la Presse
Sindup vient de signer un contrat avec le Centre Français d’exploitation du droit de Copie (CFC), représentant plus de 3500 titres de presse, pour encadrer les pratiques de veille sur les sites internet. Une première étape qui promet de révolutionner en profondeur le monde de la veille en entreprise. [...] »

Quelques remarques :

Reste aux utilisateurs de Sindup à passer la barre de l’abonnement, la plupart des sites de presse n’étant plus du tout entièrement gratuits (on est généralement sur du 5 articles gratuits par semaine, le tout contrôlé par les cookies voire l’adresse IP) ... et aux autres plateformes (Meltwater, Mention, Moreover, Talkwater, KBCrawl, Knowings, Digimind ... mais aussi Flipboard ou Scoopit, et bien sûr Google et Apple) à signer ce type d’accord [2]. Ce n’est pas encore fait ... [3]

Mais pour autant, la situation est mûre :

Le problème — et là je suis un peu moins sur la même ligne que Mickaël Réault, le dirigeant fondateur de Sindup —, c’est qu’un organe de presse, La Tribune elle-même, écrit que les kiosques de presse en ligne rémunèrent peu (on est sur du 9,90 euros par mois pour un particulier) et que ce modèle à la Netflix/Spotify/Deezer, en plein boom, risque fort de brider de facto encore un peu plus la liberté d’expression de la presse.

Le début du communiqué de Sindup (« Depuis l’apparition des médias en ligne, la question de la lecture et de l’exploitation des contenus reste floue et n’est pas clairement encadrée. ») est quelque peu hypocrite puisque la situation est au contraire très encadrée et qu’elle met la presse en position de force. Sauf sur le plan commercialo-financier (là, Google et al. font la "loi").

Extrait du fichier robots.txt du site lemonde.fr

En effet, face à la collecte de données et de texte intégral des plateformes de veille sur leurs sites, les éditeurs de presse ont parfaitement le droit de les bloquer :

  • le droit voisin sur les bases de données (directive européenne transposée par une loi de 1998, tout de même, ce n’est pas nouveau) permet de s’opposer aux extractions qualitativement ou quantitativement substantielles. Si la collecte quotidienne d’articles de presse n’est pas de l’extraction quantitativement substantielle, alors plus personne ne sait parler français
  • les éditeurs de presse sont détenteurs des droits de propriété intellectuelle, notamment le droit de reproduction, sur les articles écrits par leurs journalistes (ça fait longtemps qu’ils ont signé des contrats avec leurs journalistes incluant la version numérique, et pas seulement celle papier). Donc ils ont le droit non pas d’interdire de lire en ligne les articles, ni même d’en imprimer une copie personnelle pour son usage privé, mais d’en faire une copie numérique — ce que font les plateformes de veille
  • ce sont *leurs* sites web. Ils ont donc le droit d’y faire ce qu’ils veulent. Notamment de bloquer les robots d’indexation. De plus les usages/bonnes pratiques reconnues d’Internet comprennent celui-ci : les robots doivent respecter les instructions du fichier robots.txt. Donc si le fichier robots.txt d’un site de presse en partie gratuit exclut le robot indexeur d’une plateforme de veille, celle-ci, sauf si elle aime la mauvaise réputation et les procès perdus d’avance, n’a plus qu’à s’exécuter.

A propos du fichier robots.txt des sites de presse : ce qui est remarquable, c’est qu’il n’interdit jamais l’accès au crawler de Google ou Bing ... [6]

Emmanuel Barthe
documentaliste, veilleur

Notes

[1Plus précisément, les titres de presse ayant confié par contrat au CFC la gestion de leurs droits de reproduction numérique. Il ne s’agit pas ici du mandat confié par la loi au CFC pour la copie papier (photocopie).

[2Pour une liste quasi-exhaustive des plateformes visées, il suffit de consulter le fichier robots.txt du Monde.fr.

[3D’autant que les "bad" robots peuvent, techniquement, parfaitement ignorer le standard robots.txt : cela a été clairement dit dès le consensus sur le fichier robots.txt de 1994. Et que parfois le "bon" robot peut se méprendre. Google lui-même avoue que parfois son robot ne sait pas faire autrement : John Mueller de chez Google avertissait le 29 mai 2018 que les pages bloquées par robots.txt pourraient encore être indexées s’il y a des liens qui pointent vers elles ...

[4Les éditeurs de logiciel de veille dans la ligne de mire des sites de presse, par Frédéric Martinet, consultant en veille, sur son blog Actulligence, 8 juillet 2014.

[5Le CFC veut encadrer l’activité des prestataires et éditeurs de logiciels de veille, par Frédéric Martinet, Actulligence, 13 juin 2016.

[6Au crawler de Google Actualités, Le Monde.fr interdit l’accès à ses archives, oui. Mais il ne bloque pas celui de Google Web ...