Appuyez sur Entrée pour voir vos résultats ou Echap pour annuler.

Pappers v. Societe.ninja ou open data v. sociétés ?

Les informations sur les sociétés republiées (en mieux) par Pappers et Societe.ninja — avec un coup d’oeil sur Data Inpi, Societe.com et Infogreffe
Les rediffuseurs du registre du commerce et des sociétés (RNCS) et de la base SIRENE font débat

[billet initialement publié en juillet 2020]

La diffusion en ligne avec autorisation de rediffusion gratuite (dite open data) des données du registre national du commerce et des sociétés (RNCS, fourni par l’INPI) et du fichier SIRENE (fourni par l’INSEE) sur le site Data Inpi (évalué sur ce blog lors de son lancement en décembre 2019), lancé en décembre 2019 et dont le principe a été voté dans la loi Macron du 6 août 2015 [1], est arrivée à son terme. L’INPI propose désormais une API, un moyen simple de récupérer les donnés, en plus du FTP.

Les comptes annuels ont été le dernier type de données chargé. Les nouveaux rediffuseurs — autres que le précurseur societe.com [2] — se lancent donc.

Pappers v. Ninja : comparatif

Pappers est un site ergonomique et rapide sous smartphone Android sous Firefox (le site Data Inpi l’est tout autant). Graphiquement moins travaillé (mais franchement, est-ce important ?), son concurrent Societe.ninja est très lisible et aussi rapide (et son moteur de recherche plus précis).

Leurs chartes graphiques respectives peuvent donner une impression de grande différence, mais les points communs entre Societe.ninja (aussi appelé à ses débuts RCS Ninja) et Pappers sont nombreux. Toutefois, des différences apparaissent dans la mise à jour des données et le moteur de recherche.

Derrière ces deux initiatives datant toutes deux de juillet 2020, on retrouve (classiquement) des fondateurs entrepreneurs de type informatique et start-up. L’un travaille dans le secteur des assurances, l’autre comme avocat :

  • Societe.ninja a été créé vers le 9 juillet par Lionel Vest, avocat associé du cabinet Adaris. Lionel Vest est aussi le créateur d’Optimus Avocats, un logiciel de gestion de cabinet d’avocats open source doté de fonctionnalités avancées comme dictée vocale via smartphone et synchronisation Iphone / Android. La première version a été lancée chez Adaris en 2006. Optimus sera ouvert en septembre 2020 à un premier groupe de beta testeurs
  • Pappers a été lancé le 13 juillet 2020 [3] par Pierre Fruchard, fondateur de la start-up Coover, courtier en assurance destiné aux indépendants.

Pappers renvoie vers le site Monidenum pour permettre facilement aux entrepreneurs de télécharger leur Kbis (mais personne d’autre ne peut le faire, c’est donc un peu trompeur). Ca, Ninja ne le fait pas.

Les deux rediffuseurs offrent une présentation des données par société mieux faite et surtout plus pratique que le site (déjà pas mal) que celle de Data INPI. Exemple avec la Cie de Saint-Gobain :

Comparez :


Charte graphique de Data Inpi


Charte graphique de Pappers


Charte graphique de Societe.ninja

Mais Pappers, avec le temps a nettement amélioré son produit :

  • il a introduit une présentation des données plus lisible que Ninja
  • et surtout, il a OCRisé [4] une bonne partie des actes pour pouvoir y effectuer des recherches textuelles ...
  • ... ce qui rend son moteur de recherche interne beaucoup plus puissant et lui permet d’afficher les indicateurs financiers comme la marge brute ou le résultat d’exploitation sur les 5 dernières années, sans qu’on soit obligé d’aller les chercher dans les comptes annuels et les compiler [5]. Dans l’évaluation financière d’une société, c’est très pratique et c’est un gros plus.


Le "rectangle" des indicateurs financiers de Pappers — RCS Ninja n’offre pas ça

Gros avantage offert par les deux nouveaux, aucun enregistrement sur Societe.ninja ni Pappers n’est nécessaire pour télécharger les actes — un gros plus par rapport à Data Inpi.

Chaque acte est identifié chez Pappers au lieu d’être simplement uniformément appelé "Dépôt Du jj/mm/aaaa" comme c’est hélas le cas chez le site de l’INPI. Cela permet aussi à Pappers d’identifier et de mettre en haut de la fiche de l’entreprise ses statuts et ses comptes — un très gros plus.

Societe.ninja fait de même, mais son titrage des actes est légèrement moins performant que celui de Pappers. En revanche, Ninja offre non seulement la date de dépôt mais aussi celle de l’acte lui-même.

Pappers et Ninja mettent les liens vers les annonces BODACC (ce que ne fait pas Data Inpi) mais pas, contrairement au site INPI, vers les marques, brevets, dessins et modèles (c’est là un gros avantage du site de l’INPI).

Pappers et Ninja identifient également automatiquement la référence de la CCN de l’entreprise et proposent un lien hypertexte vers elle [6].

Côté présentation des données et lisibilité, je dirais donc avantage Pappers.

Attention : qui dit RNCS (dont le champ est moins large que celui de la base Infogreffe) dit pas d’extrait K-bis, pas d’état d’endettement (privilèges et nantissements), pas de certificat attestant de l’existence ou de l’absence de procédures collectives en cours ni de copies des décisions qui en découlent, pas d’historique des modifications, etc. Là, c’est avantage Infogreffe.

Les données : délai de mise à jour et cohérence

Le gros problème de ces rediffuseurs gratuits va être le délai de réception (et donc de mise en ligne) des données, autrement dit leur retard par rapport à Data Inpi et a fortiori par rapport à Infogreffe.

Par exemple, au 30 juillet 2020 18h30, une société lancée le 1er juillet est dans Infogreffe et INPI Data et même dans Ninja. Mais toujours pas dans Pappers [7].

On pouvait s’y attendre vu le circuit des données :

  • d’abord dépôt des informations au greffe de commerce [depuis le 1er janvier 2023, suite à la loi PACTE, au Guichet unique des entreprises (qui a mis plus d’un an à fonctionner correctement ...)]
  • qui transmet[tait] à Infogreffe
  • qui transmet à l’INPI (depuis la loi Macron : voir notre billet INPI c/ Infogreffe : du nouveau)
  • enfin l’INPI transmet aux rediffuseurs gratuits.

Le second problème des rediffuseurs gratuits, comme le relève Sylvie Dalbin, consultante chez Assistance & Techniques Documentaires (ATD), sur la liste de discussion Juriconnexion, est celui d’une consolidation des données qui peut parfois nuire à leur cohérence et à l’exactitude des données affichées [8]. Le 29 juin 2021, elle relève ainsi « sur Pappers mais aussi sur Societe.com » des incohérences « terribles ». Toutefois, « 24 heures plus tard, des mises à jour au 30 juin ont remis les choses dans l’ordre .... Mardi 29 nous avions les données antérieures à 2018 et présentées comme mises à jour en 2021 ..., y compris sur des sites qui un mois avant fournissaient de bonnes données ; puis le 30, la "bonne" mise à jour a dû être restaurée. » Cela la « pousse à être vigilante avec ces systèmes totalement en dynamique (sans procédure de contrôle ?) avec de très fréquentes mises à jour ».

Plus en détails : selon elle, « des (méta)données (domiciliation mais aussi nombre de salariés, statut du dirigeant) à une date précise sont reprises de périodes antérieures et apparaissent sur les données les plus récentes (en 2021), alors que des changements ont été réalisés entre temps (changement de statut du dirigeant depuis 2003..., d’adresse en 2016 — donc d’établissement), rendant caduques ces (méta)données. Le contrôle peut se faire sur les documents récupérables (facilement sur Pappers ce qui est un plus), mais cela sous-entend de réaliser ce contrôle. » Sylvie estime « que la métadonnée pour les périodes plus récentes étant "vide", le système a intégré les anciennes valeurs.
Certains sites (annuaire-entreprises.data.gouv.fr. voire SIRENE ou Ninja pour la domiciliation) ne fournissent pas ce niveau de précision, ce qui les préserve de ce type d’erreurs ; une autre manière de faire consiste comme SIRENE, à fournir des "années de validité" de certaines métadonnées (tranche d’effectif, catégorie d’entreprise), voire à ne pas indiquer de valeur pour des données antérieures à x années. Cela augmente bien sûr les protocoles d’intégration et consolidation mais assure une meilleure fiabilité des données. Cela pourrait se résoudre peut être par une insertion d’un ensemble cohérent de données à date (par entité Entreprise, Etablissement et Dirigeants ; adresse). »


Base SIRENE : les "années de validité" cerclées en rouge

Moteur de recherche : avantage Infogreffe et Societe.ninja

Un autre problème est l’efficacité du moteur de certains nouveaux entrants. Par exemple [9], si on cherche par Compagnie de Saint-Gobain, le nombre de résultats est de :

  • Infogreffe (la référence, donc) : 1 résultat
  • Societe.com, le premier rediffuseur historique : 3 résultats, dont le "bon"
  • Data Inpi : 2 résultats, dont le "bon"
  • Societe.ninja : 2 résultats : le "bon" et 1 établissement au Mans fermé depuis 1984
  • Pappers : 9 résultats, dont le "bon" et 5 autres correspondants à la recherche mais qui semblent plutôt correspondre, vu leurs adresses, à des établissements. Pour le reste, ces enregistrements ressemblent à des doublons (mêmes liste d’actes, notamment, que le "bon"). Ces doublons ne viennent pourtant pas de l’INPI (cf supra). Sur les quatre autres enregistrements, trois ont pour adresse la ville de Saint-Gobain, ce qui signifie que le moteur de Pappers interroge tous les champs et non seulement celui de la raison sociale. Ca peut parfois avoir des avantages, mais en général, ça multiplie les résultats non pertinents [NB : ce défaut du moteur de Pappers a été corrigé depuis, en partie suite à nos remarques, voir infra].

Initialement, la tendance de Pappers à renvoyer beaucoup (trop) de résultats se confirmait quand on tapait Paul Dupond en recherche simple :

  • Societe.ninja renvoyait 62 résultats car il cherche les deux termes à zéro (expression) ou 2-3 mots l’un de l’autre (proximité)
  • Pappers renvoyait plus de 10 000 résultats car il cherchait l’un OU l’autre. Dupond pouvait donc être absent de la fiche RCS des entreprises trouvées ainsi. Même si les premiers résultats contenaient bien les "Paul Dupond" (expression), ça manquait un peu de rigueur de notre point de vue.

A l’été 2022, la même recherche en mode simple renvoie 0 résultats chez Societe.ninja (ce qui est exact) et 7 chez Pappers, mais au moins Pappers n’utilise-t-il plus le OU par défaut.

En revanche, si on mélange une raison sociale et une adresse, Ninja n’arrive pas à trouver alors que Pappers y arrive.

Enfin, Ninja et Pappers offrent une recherche par nom de dirigeant [10].

On dira donc : moteur : avantage Infogreffe et Ninja.


Infogreffe : 1 résultat


Societe.com : 3 résultats


Data Inpi : 2 résultats


RCS Ninja : 2 résultats


Pappers : 9 résultats


RCS Ninja : Paul Dupond : 62 résultats


Pappers : Paul Dupond : plus de 10 000 résultats

Mentions légales

Une clause des mentions légales de Pappers pourrait amener quelques remarques. Je cite :
« l’Internaute s’interdit de reproduire et/ou communiquer au public tout ou partie des contenus publiés sur le Site ». Ca ressemble à du "boiler plate", comme on dit en anglais (des formules copiées-collées sans personnalisation). Parce que, si l’essentiel du contenu du site est constitué de données publiques, je ne vois pas très bien comment justifier une interdiction aussi générale.

Chez Ninja, là aussi, une clause des mentions légales chatouille clairement : « L’éditeur interdit les liens hypertextes vers l’une des pages du site, à l’exception de la page d’accueil ». Selon l’avocat Guillaume Sauvage, du cabinet Pierrat, spécialisé dans la propriété intellectuelle, « dans l’absolu, interdire de faire un lien vers un site Internet n’a pas de véritable valeur légale et ne constitue pas une contrefaçon, qui suppose la reproduction d’un contenu ou sa représentation » [11].

Peut-être cette clause vient-elle d’une clause très similaire présente dans les mentions légales du site Data Inpi : « Les utilisateurs visiteurs du portail data Inpi ne peuvent mettre en place un hyperlien en direction de ce site sans l’autorisation expresse et préalable de l’INPI ». Même remarque que supra à propos de cette clause INPI.

Societe.ninja et Pappers feraient peut-être mieux d’utiliser le droit anti-extraction substantielle du producteur de base de données. Ce que fait le site de l’INPI : « Les bases de données figurant sur le portail sont protégées par les dispositions de la loi du 11 juillet 1998 portant transposition dans le Code de la propriété intellectuelle (CPI) de la directive européenne du 11 mars 1996 relative à la protection juridique des bases de données. Sont notamment interdites l’extraction et la réutilisation, quantitativement ou qualitativement substantielles, du contenu des bases de données contenues sur ce site Internet. Tout contrevenant s’expose aux sanctions visées aux articles L 343-1 et suivants du Code de la propriété intellectuelle. »

Conclusion sur le comparatif

Le match Societe.ninja v. Pappers doit, on le voit, être élargi à Infogreffe et Data Inpi, en prenant en compte d’abord la mise à jour du contenu et la pertinence du moteur de recherche et en laissant de côté l’esthétique et la com’. La qualité d’un outil d’information/bases de données, c’est d’abord et avant tout le résultat de l’équation contenu + fraîcheur + moteur.

Je n’ai pas traité en détail Societe.com, qui est un acteur beaucoup plus ancien (le site a été créé en 1999 par Iliad, la maison-mère du fournisseur d’accès Internet Free [12]) et plus connu. Pour faire court, on peut dire [13], que :

  • le design graphique et la mise en page de Societe.com sont datés (mais restent très lisibles) et tous les documents y sont payants (comme chez Infogreffe), alors qu’ils sont gratuits chez Ninja, Pappers et Data Inpi ...
  • mais le moteur de recherche est très précis, bien plus que chez les trois précédents. Ainsi, "compagnie saint-gobain" trouve du premier coup et en tête de liste la bonne société — et non pas des noms approchants ou de simples établissements.

Évidemment, mon appréciation comme mes requêtes de test sont celles d’un professionnel de l’information. Un entrepreneur solo ou un particulier aura une vision orientée prix (gratuité) d’abord. Mais même dans ce cas, la mise à jour et la cohérence des données doivent rester un critère essentiel, surtout en matière de procédures collectives.

Une polémique rediffuseurs v. PMEs difficile à comprendre

Selon la Lettre A [14], « les sites commercialisant les statuts et extraits de comptes des sociétés sont sur le qui-vive depuis le lancement de Pappers.fr. Portée par la loi Macron de 2015, cette ouverture totale du registre du commerce, en accès libre, interpelle plusieurs syndicats patronaux, qui réfléchissent à une action de groupe. »

La Lettre A explique que « les syndicats professionnels dans l’ensemble, redoutent cette opération transparence, en particulier pour les PME ». Selon la newsletter, « la Fédération française du bâtiment (FFB) envisage de s’associer à d’autres instance pour lancer une action de groupe contre l’INPI. Le site de Pierre Fruchard pourrait être mis dans la procédure dans un second temps. »

Les deux acteurs visés semblent pourtant être restés dans la légalité, il ne s’agit là que de la mise en oeuvre d’une directive européenne et d’une loi française. Par ailleurs, on se demande comment l’INPI, qui a mis plus de deux ans à monter le projet Data Inpi, aurait pu violer la loi au vu et au su des autorités.

On notera enfin que les PME ont beaucoup de moyens — licites et illicites — pour ne pas publier les données qui les gêneraient [15].

Depuis 2014, les TPE (moins de 10 salariés, grosso modo) peuvent demander la confidentialité de leurs comptes annuels (compte de résultat et bilan). Et depuis août 2016, les petites entreprises de moins de 50 salariés ou avec un bilan de moins de 4 millions d’euros ou un chiffre d’affaire de moins de 8 millions d’euros peuvent aussi le faire (article 213 de la loi Macron précitée). Et elles ne s’en privent pas [16]. Les sociétés appartenant à un groupe (fausses PME) ne peuvent pas bénéficier de cette faculté.

Par dessus le marché — si je puis m’exprimer ainsi — beaucoup de PME et certaines grosses sociétés font le choix de ne pas publier leurs comptes, espérant cacher leurs "secrets" financiers. D’après la société de comptabilité en ligne ECL Direct, 50% des dirigeants de SARL, EURL, SAS et SASU ne déposent pas leurs comptes [17].

Ce choix de rester dans l’illégalité n’a qu’un faible prix, celui d’une amende de 3000 euros au plus [18], si tant est qu’un intéressé demande au président du tribunal de commerce de les y obliger sous astreinte et que celui-ci prenne bien cette décision, ou qu’il diligente une enquête sur la société [19]. En pratique, ces enquêtes et les condamnations à publier ses comptes sont très rares.

Emmanuel Barthe
documentaliste juridique, veilleur

Notes

[1Voir notre billet INPI c/ Infogreffe : du nouveau.

[2Créé à l’origine par Xavier Niel (Free), Societe.com est maintenant la propriété du groupe La Poste. Elle a réalisé un chiffre d’affaires de 5,7 millions d’euros en 2017.

[4Optical Character Recognition : reconnaissance optique de caractères.

[5Pierre Fruchard : L’open data, accélérateur informationnel de l’intelligence économique ? (1/2), par Louis-Marie Heuzé, Portail de l’IE, 15 décembre 2021. Pierre Fruchard : L’open data, accélérateur informationnel de l’intelligence économique ? (2/2), par Louis-Marie Heuzé, Portail de l’IE, 17 décembre 2021. Extrait : « Portail de l’IE : À l’autre bout du spectre concurrentiel, quelle différenciation faites-vous avec d’autres outils open data gratuits ?
PF : La principale différence est l’ajout du module OCR (Optical Character Recognition - reconnaissance de caractères) sur une bonne partie des actes pour pouvoir y effectuer des recherches textuelles.
Nous avons aussi beaucoup travaillé sur la partie finance en allant récupérer les flux de données et en reconstituant les comptes en format Excel, ce qui permet en particulier de calculer des ratios. S’il existe d’autres sites, ces derniers n’ont pas la même approche et mettent moins de données à disposition gratuitement. De notre côté, nous essayons de les stimuler et de synchroniser la bonne information pour être toujours plus à jour et plus pertinents, en fiabilisant les données, chose que les autres font un peu moins à mon sens. »

[6Initialement, début 2020, seul Pappers affichait la référence à la CCN.

[7Copies écran à disposition sur demande.

[8Re : Pappers.fr - Informations gratuites sur les sociétés - Quid de la fiabilité et mise à jour ?, message de Sylvie Dalbin, liste Juriconnexion, 1er juillet 2021.

[9Test effectué en juillet 2020.

[10Initialement, début 2020, seul Societe Ninja offrait une recherche par dirigeant.

[11Peut-on interdire les liens hypertextes vers un site ?, par Damien Leloup, Le Monde.fr, 16 octobre 2009.

[12Societe.com a été racheté en 2006 par Adverline, groupe spécialisé dans le micropaiement et la publicité, est depuis la propriété du groupe La Poste suite au racaht d’Adverline par Mediapost, filiale du groupe La Poste.

[13Test effectué le 3 juillet 2021.

[16La confidentialité du compte de résultat n’est toutefois pas opposable aux établissements bancaires, à la justice et aux administrations. Et les sociétés d’information et de notation financières, ont accès, elles, à ces résultats et bilans soi-disant confidentiels et peuvent donc en tenir compte dans le calcul des ratings. Une sorte de monopole très lucratif puisqu’en 2017, le secteur a eu une croissance de 9%.

[18Le défaut de dépôt des comptes est punissable d’une amende de 1 500 euros pouvant être portée à 3 000 euros en cas de récidive. C’est tout. Le seul véritable risque est la mise en cause de la responsabilité personnelle du dirigeant, suite à une faillite ayant causé de gros impayés.