Appuyez sur Entrée pour voir vos résultats ou Echap pour annuler.

Return of the dead

Data Inpi : le portail open data du RCS (enfin) lancé
Euridile is back

Signalé sur la liste Juriconnexion ce jour : Data Inpi, le portail open data du RCS vient (enfin) d’être lancé.

Le contenu exact de Data Inpi

Le contenu de Data Inpi, ce sont les données du RNCS (registre national du commerce et des sociétés, autrement dit la consolidation des données des différents RCS locaux) suivantes :

  • informations, adresses, noms des dirigeants
  • des documents (pour les trouver, une fois sur la fiche d’une entreprise, allez dans l’onglet Documents associés) :
    • les actes de société (PDF) surtout, y compris statuts et PV d’AG
    • et les trois derniers bilans (PDF).

Les documents (bilans et actes) sont téléchargeables, mais uniquement sur inscription gratuite. J’ai testé : la liste des actes ne contient pas d’autre information que : Acte 1, Acte 2, Acte 3 etc. Ni descriptif, ni date. Et ils ne sont même pas dans l’ordre chronologique. Autrement dit, il n’est pas du tout évident d’isoler les statuts dans la liste quand il y a des dizaines voire des centaines d’actes disponibles. Il faut ouvrir tous les PDF un par un et les parcourir en entier (oui, les statuts peuvent être à la fin d’un seul et même long fichier) pour trouver ce qu’on cherche.

Les documents sont au format PDF image. Cela veut dire que les caractères ne sont pas cherchables ni aisément "copier-collables". Sauf si on possède la version complète du logiciel Acrobat (dite "Acrobat Writer" et payante), car celle-ci OCRise un fichier PDF image de 3 pages en à peu près 10 secondes.

Cerise sur le gâteau de l’anti-pratique : les fichiers PDF téléchargés n’ont pas de suffixe .pdf. Sous appareil mobile Android ou iOS, les fichiers ne s’ouvrent donc pas automatiquement aussitôt téléchargés. Il faut les retrouver dans son gestionnaire de fichiers > Documents > Download, puis les renommer en ajoutant .pdf à la fin. Enfin, les ouvrir.


Extrait d’un acte de société

Evidemment, qui dit RNCS (dont le champ est moins large que celui de la base Infogreffe) dit pas d’extrait K-bis, pas d’état d’endettement (privilèges et nantissements), pas de certificat attestant de l’existence ou de l’absence de procédures collectives en cours ni de copies des décisions qui en découlent, pas d’historique des modifications, etc.

Je n’ai pas encore regardé le délai de mise à jour mais comme les données viennent d’Infogreffe ...

Open data

Il est évident que tous les acteurs du monde de l’information légale et juridique, de l’information sur les entreprises et du crédit rating sont sur les rangs. Les PDF des bilans et plus encore des actes vont intéresser beaucoup de monde. Le défi est d’OCRiser (rappel : il s’agit de PDF image) — tout à fait faisable — puis convertir en data — autrement dit qualifier et extraire, ce qui est nettement plus difficile — et enfin mettre en base de données ces fichiers PDF bourrés de chiffres et de tableaux.


Extrait d’un bilan

Le moteur de recherche

L’aide est un peu maigre, mais précise bien les biais du moteur de recherche — biais tout à fait normaux pour ce type de base, sauf à mon sens l’incapacité à supprimer les espaces dans le n° RCS :
« Les critères de la recherche portent sur la dénomination sociale ou nom de l’entreprise, les noms et prénoms du dirigeant, le numéro siren, le nom de la commune du siège de l’entreprise et les mots contenus dans le descriptif de l’activité de l’entreprise.
Le numéro SIREN doit être saisi sans espace.
Par défaut, la dénomination de l’entreprise reste le critère préférentiel. »

Pour conclure sur les caractéristiques du nouveau portail, c’est une alternative intéressante à societe.com. Nettement moins à Infogreffe, qui en dix ans a eu le temps de prendre de l’avance. Il n’empêche que le portail des greffes de commerce vient de perdre une partie de ses revenus avec la mise en ligne gratuite des actes.

Si vous avez des retours, les commentaires sont ouverts infra.

Retournement de situation

Dans cette série bien française (voir en bas de page), c’est l’épisode où un des personnages principaux revient d’entre les morts, mais sous une autre forme ;-)

Sous la présidence Sarkozy, les greffes des tribunaux de commerce avaient gagné leur longue bataille contre Euridile (opéré par l’INPI), au nom de la suppression des doublons (pour l’historique, voir en bas de ce billet). Puis début 2015, comme nous l’écrivions ici, le projet de loi Macron et le mouvement open data laissaient penser que la victoire de 2009 des greffes de commerce pourrait être remise en cause puisque le texte posait le principe de la transmission d’une copie des données du registre national du commerce et des sociétés (RNCS) par Infogreffe à l’INPI. Il restait à financer et concrétiser cette base.

Formellement, ce retournement date donc de 2015. Mais son origine pourrait aussi être recherchée dans la défaite trop accentuée de l’INPI en 2009. Le centre de traitement INPI était situé dans la ville d’un important sénateur maire. Il a été ensuite entièrement détruit. L’alimentation et la publication de la base, réalisées par l’INPI et son prestataire, la société Coface Ort, employaient près de 200 salariés répartis sur différents points du territoire, dont Compiègne. Et l’INPI reste une institution importante, notamment dans la propriété industrielle.

Emmanuel Barthe
documentaliste juridique, veilleur, formateur


Historique de la libération des données du RCS et de leurs acteurs INPI, greffes de commerce et tribunaux mixtes de commerce à travers les billets de precisement.org :