Appuyez sur Entrée pour voir vos résultats ou Echap pour annuler.

Impossible de retrouver les revues et les documents pré-2004

[archive] Refonte du site AMF : attention !
Utilisez les moteurs internes du site (l’ancien et le nouveau) en attendant que Google répare ses liens


La nouvelle page Erreur 404 du site AMF

[Mise à jour à juin 2020 : les difficultés listées dans ce billet ont dans leur grande majorité disparu. Demeure la disparition des revues COB et AMF et de pas mal de documents anciens.]

Depuis ce jeudi 27 février 2020, l’Autorité des marchés financiers (AMF) est en train d’implémenter une nouvelle version de son site web.

Certaines parties du site n’ont pas été migrées. La doctrine et le règlement général de l’AMF seront migrés ultérieurement sur le nouveau site. Voici les liens vers ces rubriques (notez le sous-domaine devant amf-france.org) :

D’après la direction de la communication de l’AMF, des problèmes de redirections sont en cours de résolution et des corrections ont déjà été apportées depuis le lancement du site.

En effet, le moteur de recherche de la BDIF, qui pendant un temps ne fonctionnait plus, est revenu. Mais il reste un certain nombre de problèmes à régler. Nous allons les passer en revue.

Des plus et des moins

Il y a des plus :

  • c’est plus élégant
  • le site est désormais adapté aux smartphones (site dit "responsive web design" — RWD — ou adaptatif)
  • et il propose (si vous désactivez votre AdBlock) un outil de management des cookies et fichiers de suivi des visiteurs.

Mais cette refonte a aussi eu — et encore largement pour l’instant — des effets de bord très gênants :

 De très nombreux liens vers le site sont passés en Erreur 404, comme les Voeux 2020 de Robert Ophèle ou les Priorités 2020 de l’AMF [1].

Les recherches Google (temporairement — voir infra) et surtout les liens dans les intranets sont donc touchés. Chez Google, initialement, les deux tiers des liens environ ne fonctionnaient plus, mais la situation est en train de se rétablir. Dans les intranets, c’est quasiment tous les liens qui ont touchés. En effet, au 5 mars, aucune redirection automatique vers les nouvelles adresses n’avait été mise en place.

Toutefois, depuis le 6 mars au soir, il semble que des redirections automatiques soient en place concernant la doctrine et uniquement les pages web (pas les fichiers PDF). Par exemple, alors que Google n’a toujours pas mis à jour sa version de la page HTML de l’instruction DOC-2014-12 [2], si on clique ce 9 mars sur le résultat pertinent, on aboutit quand même sur la bonne (nouvelle) page.

Certes, le nouveau site a une "XML site map" (censée recenser toutes les pages du site) et depuis peu un plan du site (recensant toutes les rubriques et sous-rubriques) [3].

La "XML site map" est automatiquement produite par Drupal, le logiciel de gestion de contenu (CMS) qui équipe le nouveau site. Espérons que Google la parcoure et la prenne en compte rapidement. Mais pour l’instant, au 3 mars, Google ne l’a pas encore fait, comme l’indiquent mes tests sur les décisions de sanction, qui ont pourtant bien été migrées sous Drupal.

De plus, comme elle le mentionne elle-même, la XML site map du nouveau site ne porte que sur les pages générées par le CMS Drupal. Or les erreurs 404 qu’on a quand on passe par Google, Bing ou un intranet d’entreprise concernent essentiellement la doctrine AMF (positions et recommandations). L’AMF ne les a pourtant pas migrées sous le nouveau CMS. Alors pourquoi ces liens en erreur ? En fait, même si la mise en page de la doctrine AMF n’a pas changé, ses adresses, elles, ont bien changé. Du type : https://www.amf-france.org/technique/multimedia%3FdocId%3Dworkspace://SpacesStore/, elles sont passées au modèle : https://doctrine.amf-france.org/technique/multimedia%3FdocId%3Dworkspace://SpacesStore/ "www" a été remplacé par "doctrine". C’est ça et non le nouveau CMS qui cause les erreurs 404 dans Google et les intranets. Et la nouvelle XML site map, qui ne couvre pas cette partie du site, n’y pourra donc rien tant que la doctrine et la réglementation n’auront pas été migré vers Drupal.

Prenons un exemple pour mieux comprendre :
Version PDF de la position recommandation AMF DOC-2012-11 Guide relatif aux fonds de capital investissement et aux fonds professionnels de capital investissement
 :
ancienne adresse : https://www.amf-france.org/technique/multimedia%3FdocId%3Dworkspace://SpacesStore/8b50b27e-bc88-4e51-9789-3b144d228faf_fr_1.0_rendition
nouvelle adresse : https://doctrine.amf-france.org/technique/multimedia?docId=workspace://SpacesStore/8b50b27e-bc88-4e51-9789-3b144d228faf_fr_2.3_rendition
Pour obtenir la nouvelle adresse du document, il faudrait remplacer www par doctrine. La difficulté quand on passe par Google, c’est que :
1. le moteur de recherche web masque la véritable (ancienne) adresse
2. Drupal renvoie immédiatement sur la page Error 404 du site au lien de laisser le navigateur afficher l’ancienne URL (qu’on pourrait alors corriger manuellement).

Quant au plan du site [4], il affiche (très logiquement) un lien vers cette nouvelle adresse de la doctrine AMF, apportant enfin aux moteurs de recherche du Web (Google, Bing ...) la pièce du puzzle qui leur manquait. Ce plan du site devrait normalement être parcouru par les robots indexeurs de Google et Bing, qui devraient finir par tomber sur les liens vers les rubriques (un exemple) de la table des matières de la Doctrine et enfin les URLs des positions et recommandations elles-mêmes. Toutefois, au 9 mars, leurs résultats continuaient à pointer vers les anciennes adresses des positions et recommandations. C’est en fait la redirection automatique des URLs des pages web de la doctrine évoquée plus haut qui fait le travail pour l’instant.

 A part les bases BDIF (et l’archive de la BDIF qu’avait demandée et obtenue l’association Juriconnexion) et GECO, l’ancien moteur de recherche interne du site, que ce soit sa version simple ou sa version avancée, ne répond plus, alors qu’il est toujours accessible en haut des très nombreuses pages non converties à la nouvelle charte graphique (les pages de la doctrine et du règlement général AMF) et que le nouveau moteur n’a pas encore pris complètement et correctement le relais (voir infra).

 Impossible de retrouver les archives des revues COB et AMF. La rubrique Publications finit sur une page qui ne liste que des rapports, études et analyses. Les anciennes URLs de la Revue mensuelle de la COB puis de l’AMF sont renvoyées vers la page d’accueil..

 D’autres documents anciens sont introuvables : hors doctrine, il n’y a quasiment aucun document pré-2004 selon le nouveau moteur de recherche. Par exemple, le rapport COB Esambert de 1998 sur le rachat par les sociétés de leurs propres actions n’est plus en ligne sur le site AMF (j’ai interrogé Google, et l’ancien et le nouveau moteurs du site). Et impossible de le trouver ailleurs sur Internet. Ces documents anciens seront-ils remis en ligne ?


Le rapport Esambert est un document COB ancien (1998) mais important. Il a disparu du site AMF et donc d’Internet

 Le nouveau moteur de recherche fonctionne plus ou moins bien. Notamment :

  • l’affinage par date ou période ne fonctionne pas
  • la liste de résultats n’est pas toujours pertinente
  • les pages non migrées et les documents qui leur sont liés (doctrine et réglementation, cf supra) ne sont pas cherchables par ce nouveau moteur, qui semble être lié au CMS Drupal, voire être celui par défaut de Drupal. On note ainsi que lorsqu’on cherche une position ou une recommandation (de la doctrine, donc) dans le nouveau moteur par son numéro (exemple : 2005-11), on tombe essentiellement sur des décisions de sanction. Or elles, justement, ont été migrées. Le seul moyen de trouver la doctrine est de cliquer sur Recherche avancée puis sur le bouton radio Doctrine, ce qui renvoie à l’ancien moteur, avant de taper ses critères de recherche.

 Les flux RSS du site AMF :

Il est regrettable de ne pas avoir prévenu, beaucoup de veilleurs s’appuyant sur les flux RSS pour leur veille et non sur les emails, trop lourds à gérer [6].

La direction de la communication de l’AMF contactée par nos soins nous a indiqué travailler avec son intégrateur sur ces deux problèmes.

 Sur un ordinateur de bureau, la page est "trouée" de zones vides comme un gruyère et peu pratique à lire ni à utiliser. On retrouve là une tendance qui en donnant la priorité aux appareils mobiles — ce qui est positif — oublie les ordinateurs de bureau des professionnels — ce qui est moins positif.

Respect des bonnes pratiques et service public

Il semble donc que, pour l’implémentation de cette nouvelle version de ce site, certaines bonnes pratiques n’aient pas été prises en compte [7]. Notamment :

  • assurer la permanence des liens
  • et prévenir à l’avance les utilisateurs.

Dommage, d’autant que communication et dialogue peuvent exister par ailleurs. Un exemple chez l’ADLC qui vient elle aussi de refaire son site [8]. On pense aussi au Conseil constitutionnel, qui a été jusqu’à inviter juristes et documentalistes pour discuter de son site, avant même que les choix techniques soient faits.


A part la BDIF, pas d’archive des documents AMF sur data.gouv.fr

La question du respect des bonnes pratiques (celles en cause ici, archi-connues) se pose, car actuellement les utilisateurs du site de l’AMF (financiers, banquiers, juristes, documentalistes, particuliers) sont perdus et ont beaucoup de mal à retrouver "leurs" documents et services. C’est gênant car les documents du site AMF ne sont pas archivés en libre accès ailleurs, notamment pas sur data.gouv.fr. Alors que les jeux de données de la CNIL y sont, eux.

Le site de l’AMF est pourtant un service public de droit des sociétés et de droit financier. De plus, sa consultation est obligatoire selon la réglementation (positions, recommandations, GECO, BDIF). Le nouveau site lui-même le rappelle d’ailleurs (copie écran infra).

Que faire ? Des tentatives de solution

Pour la recherche :

 Sachez repérer cette petite loupe qui mène au *nouveau* moteur de recherche. En attendant que Google et Bing indexent les nouvelles URLs, c’est par là qu’il faut passer. Même s’il marche mal ... En pratique, comme expliqué supra, BDIF et GECO mises à part, il semble qu’il faille utiliser le nouveau moteur *simple* pour tout ce qui a été migré et le moteur *avancé* pour tout ce qui ne l’a pas été (doctrine et réglementation).

 Une solution efficace mais qui ne donne pas accès au format PDF : le cache de Google : cliquez sur la petite flèche noire vers le bas au bout du titre du résultat Google. On obtient par le cache non seulement une copie des pages au format HTML mais également une copie HTML du contenu des fichiers PDF. C’est fiable à 99,9%, le cache de Google étant censé se mettre à jour à chaque crawl du document. Or un site comme celui de l’AMF est crawlé au moins une fois par jour par Google parce que c’est un site 1. officiel ("domain authority"), 2. à mise à jour fréquente et 3. à gros contenu (documents très nombreux et très longs) [9]. Exemple : Pratique de marché admise AMF n° 2005-12 Acquisition d’actions propres aux fins de conservation et de remise ultérieure dans le cadre d’opérations de croissance externe : lien AMF mort mais cache Google fonctionne.


La version cache Google d’un document AMF.

 Pour la BDIF, son moteur spécialisé marche toujours, utilisez-le. Idem pour la base GECO (gestion collective : en un mot, les SICAV/OPCVM).

Pour les communiqués, positions et recommandations AMF (la doctrine AMF), si vous ne les retrouvez pas par Google ou par les liens que vous avez cliqués :

  • allez sur la page d’accueil de la Doctrine AMF et utilisez la table des matières à gauche (ça, ça n’a pas changé). Idem pour le RGAMF
  • comme vu supra, repérez l’ancienne adresse web du document dans votre intranet ou Google/Bing, puis remplacez dedans le sous-domaine www par celui qui convient
  • sinon, si vous avez un abonnement à Lexis 360 ou Lamyline, allez-y. L’essentiel devrait y être. Comme quoi, parfois, l’archivage privé de données publiques peut dépanner. Même si très franchement, ce n’est pas une situation à reproduire ni à faire perdurer.


La loupe mène au (nouveau) moteur de recherche du site, mais il est loin d’être au point à 100%

La WayBack Machine d’Archive.org ne peut guère aider. Voici pourquoi :

  • son fonctionnement suppose d’avoir gardé l’adresse exacte (URL) du document recherché. Les moteurs de recherche internes des sites archivés ne fonctionnent pas, en effet, sur http://archive.org Exemples infra en copies écran avec la BDIF
  • seule une petite partie du site fonctionne avec des URLs ne nécessitant pas de passer par un moteur (essentiellement les positions et recommandations — la doctrine AMF, restée d’ailleurs sous l’ancienne mise en page)
  • la WayBack Machine est très lente.

Pour la veille :

  • on peut s’abonner aux alertes email du site AMF, si elles fonctionnent (je teste depuis le 2 mars : à ce jour, je n’air rien reçu)
  • mettre sous surveillance les pages principales avec un logiciel de veille comme WebSite Watcher (prix de départ 99 euros) ou un service HTML to RSS [10]
  • l’ultra basique (et ultra efficace si il n’y en a pas trop), mettre les pages centrales dans son bookmark ou dans l’annuaire Outlook et les consulter une fois par jour.

En conclusion, on ne peut que souhaiter :

  • à l’AMF, de finir au plus vite la migration en passant sous Drupal sa doctrine et son règlement général
  • aux utilisateurs, d’arriver à faire entendre à l’Autorité leurs difficultés.

Emmanuel Barthe
juriste documentaliste, veilleur

Notes

[1Autres exemples de pertes de liens/error404 :

[2Le cache de Google le prouve : il est du 22 février. L’URL que Google affiche le prouve également : sa syntaxe est du type www.amf-france.org et non doctrine.amf-france.org

[3Pour mémoire, un plan du site HTML ("HTML site map") aide les moteurs de recherche du Web à indexer rapidement le site. Quant au plan du site XML ("XML site map"), il est censé être exhaustif et, même s’il n’assure pas une mise à jour instantanée de l’index des moteurs, il permet aux moteurs de détecter facilement les nouvelles page ainsi que leurs "oublis" éventuels.

[4Je n’ai pas de certitude quant à la date exacte de mise en ligne du plan du nouveau site AMF, mais ma veille sur les nouveaux flux RSS a signalé le 6 mars au matin au minimum une modification de la page du plan du site. Cela pouvait aussi être sa mise en ligne ou sa correction. En tout cas, c’est à partir du 6 mars que j’ai constaté que Google commençait à donner les bonnes (nouvelles) adresses des pages de la doctrine AMF. Mais il a très bien pu aussi être mise en ligne avec la refonte du 27 février.

[5Flux des mises en garde et de toutes les actualités et publications passés au validateur RSS du W3C, LE validateur officiel.

[6Sur l’intérêt des flux RSS pour la veille, voir notre billet RSS ou Le futur de la veille, et pour savoir comment les manier, voir Créer un flux RSS pour un site web qui n’en possède pas.

[9Sur les critères utilisés par Google pour indexer un site, lire notamment :

[10Le compte Twitter de l’AMF n’est pas dédié à l’annonce de la publication des nouveaux documents AMF.