Extraction automatique des bulletins de paie
Sage, ADP, Silae, PayFit : un seul pipeline.

Plus de 40 lignes de cotisations, des formats qui varient selon l'éditeur de paie (Sage, ADP, Cegid, Silae, PayFit), et 3 à 12 mois de bulletins à vérifier pour un dossier de crédit. Holofin extrait salaire brut, net, cotisations et prélèvement à la source avec plus de 95 % de précision.

Demander une démo
VOTRE ENTREPRISE
35 Allée de la Mairie
44300 NANTES
Siret : 999 999 990 00099
Convention : 2198
Fiche de paie
Période du : 01/03/2025 au : 31/03/2025
Paiement le : 31/03/2025
Matricule : 1
N° Sécurité Sociale : 0000000000
Emploi : Soudeur · Coef : 100
Contrat : CDI
VOTRE SALARIÉ
31 rue Jean THEUVENEY,
44300 NANTES
RubriquesBaseTaux Sal.Cot. Sal.Taux Pat.Cot. Pat.
SALAIRE DE BASE (23,08€/h)3 500,00€
SALAIRE BRUT3 500,00€
SANTÉ
Sécurité sociale3 500,00€7,00245,00€
RETRAITE
Assurance Vieillesse plafonnée3 500,00€6,90241,50€8,55299,25€
CEG tranche 13 500,00€0,8630,10€1,2945,15€
Compl. tranche 1 AGIRC-ARRCO3 500,00€3,15110,25€4,72165,20€
ASSURANCE CHOMAGE
Assurance chômage tranche A3 500,00€4,05141,75€
CSG déductible3 438,75€6,80233,84€
TOTAL DES RETENUES629,69€1 247,61€
MONTANT NET SOCIAL2 770,59€
NET À PAYER AVANT IMPOT SUR LE REVENU2 770,59€
Impot sur le revenuBaseTaux NeutreMontantCumul annuel
Impôt prélevé à la source2 870,31€3,50%100,46€301,38€
Net à payer au salarié2 670,13€
✓ Net < Brut✓ PAS cohérent✓ Cotisations

Pourquoi l'extraction des bulletins de paie
reste un défi.

Complexité structurelle

Plus de 40 lignes de cotisations

Chaque bulletin de paie contient des dizaines de lignes de cotisations dont les taux varient selon la convention collective, le statut cadre ou non-cadre, la branche professionnelle et la tranche de rémunération. Un extracteur générique ne peut pas deviner la structure sans comprendre le contexte.

Chaque éditeur, un format différent

Sage, ADP, Cegid, PayFit, Silae, Nibelis : chaque éditeur de paie produit un bulletin avec sa propre mise en page, ses propres intitulés de lignes, et son propre agencement des blocs. Un extracteur entraîné sur un format échoue sur un autre.

Les bulletins issus de cabinets d'expertise comptable ajoutent une couche de variabilité supplémentaire.

6 éditeurs majeurs × formats personnalisés = des centaines de mises en page différentes en circulation.

Ancien format vs format simplifié

La réforme de janvier 2018 a introduit le bulletin de paie simplifié, qui regroupe les cotisations par catégorie. Mais l'ancien format détaillé circule encore largement, notamment dans les archives et les dossiers historiques. L'extracteur doit gérer les deux.

3 à 12 mois à vérifier

Pour un dossier de crédit immobilier ou de location, il faut vérifier 3 à 12 mois de bulletins. Multiplié par le nombre de dossiers, le volume devient vite ingérable sans automatisation.

Scans et photos smartphone

Les candidats locataires et les emprunteurs envoient souvent des photos prises au téléphone ou des scans basse résolution. L'OCR doit gérer le bruit, les ombres, les perspectives déformées et les textes flous.

Récapitulatif annuel intégré

Certains bulletins de décembre incluent un récapitulatif annuel sur plusieurs pages, avec les cumuls de l'année. L'extracteur doit distinguer les données du mois courant des cumuls annuels.

Ce que Holofin extrait
d'un bulletin de paie.

Chaque champ extrait est accompagné de ses coordonnées exactes dans le document source (bounding box), permettant une vérification visuelle instantanée.

CatégorieChamps extraits
Identité salariéNom, prénom, NIR (numéro de sécurité sociale), emploi, qualification, convention collective, coefficient
Identité employeurRaison sociale, SIRET, code APE/NAF, adresse, convention collective (IDCC)
Période et paiementPériode de paie, date de paiement, mode de paiement
RémunérationSalaire brut, salaire net imposable, salaire net à payer avant PAS, net à payer après PAS
Prélèvement à la sourceTaux PAS, montant PAS, net fiscal (base), type de taux (personnalisé, neutre)
CotisationsTotal cotisations salariales, total cotisations patronales, détail par ligne (base, taux, montant)
Cumuls annuelsBrut cumulé, net imposable cumulé, heures cumulées, montant PAS cumulé
CongésCongés acquis, congés pris, solde de congés, RTT

Exemple de sortie JSON :

{
  "employe": {
    "nom": "Martin Dupont",
    "nir": "1 85 07 75 123 456 78",
    "emploi": "Ingénieur d'études",
    "convention_collective": "Syntec (IDCC 1486)"
  },
  "employeur": {
    "raison_sociale": "Acme Technologies SAS",
    "siret": "123 456 789 00012"
  },
  "periode": "Janvier 2025",
  "remuneration": {
    "salaire_brut": 4200.00,
    "salaire_net_imposable": 3318.60,
    "salaire_net_a_payer": 3150.45,
    "prelevement_source": {
      "taux": 7.5,
      "montant": 248.90
    }
  },
  "cotisations": {
    "total_salariales": 881.40,
    "total_patronales": 1764.00
  },
  "cumuls_annuels": {
    "brut_ytd": 4200.00,
    "net_imposable_ytd": 3318.60
  }
}

Fact Grounding

Chaque valeur extraite est liée à sa position exacte dans le document source (page, coordonnées x/y, bounding box). Cela permet une vérification visuelle en un clic et constitue une piste d'audit complète.

Comment ça marche.

Trois étapes, du document brut aux données structurées et validées.

1

Envoyez vos bulletins

API REST, email, drag-and-drop. PDF natifs, scans, photos smartphone. Envoyez un bulletin ou un lot de plusieurs centaines.

2

Extraction intelligente

OCR multi-passes, modèle vision-langage pour comprendre la structure, et correction agentique pour résoudre les ambiguïtés. Le tout en quelques secondes.

3

Données structurées

JSON structuré, CSV, ou webhook vers votre système. Chaque champ avec sa valeur, sa confiance et ses coordonnées source.

Validation automatique
avec Hololang.

Notre DSL de validation financière. Exprimez des règles de format, de cohérence et d'alerte en quelques lignes.

Vérifier que le salaire net est inférieur au salaire brut

VALIDATE @salaire_net < @salaire_brut

Vérifier que le NIR est au format valide

VALIDATE @nir FORMAT NIR

Vérifier que le taux PAS est entre 0 % et 43 %

VALIDATE @taux_pas BETWEEN 0 AND 43

Vérifier que le cumul brut est cohérent avec le mois courant

VALIDATE @brut_ytd >= @salaire_brut * (@mois_courant)

Alerter si le salaire brut est inférieur au SMIC

ALERT IF @salaire_brut < 1 766.92

Détection de fraude
sur les bulletins de paie.

Le bulletin de paie est le document le plus falsifié en France. Dossiers de crédit, candidatures locatives, demandes de prestations : les motivations sont nombreuses et les outils de contrefaçon de plus en plus accessibles.

Analyse forensique

70 détecteurs forensiques

Holofin analyse chaque bulletin sur 6 domaines forensiques : contenu, typographie, métadonnées, structure PDF, médias et sécurité. La corroboration croisée entre domaines identifie les falsifications que l'analyse d'un seul domaine manquerait.

Typographie

Polices incohérentes, tailles anormales, espacement irrégulier entre les lignes de cotisations.

Métadonnées PDF

Producteur PDF incohérent avec l'éditeur de paie déclaré, dates de modification suspectes.

Contenu

Incohérence entre brut, net et cotisations. Taux de cotisations impossibles. SIRET invalide.

Corroboration croisée multi-domaine : un bulletin avec un producteur PDF suspect (métadonnées) et des polices incohérentes (typographie) et un taux de cotisation impossible (contenu) est signalé à risque élevé. Un seul signal isolé peut être bénin ; trois signaux convergents ne le sont presque jamais.

Extraction et vérification QR code

Certains éditeurs de paie intègrent un QR code ou un cachet 2D-Doc sur les bulletins. Lorsqu'il est présent, Holofin l'extrait et compare les données signées (net à payer, période, employeur) avec les valeurs extraites du document. Toute divergence est signalée comme indicateur de falsification.

Cas d'usage
de l'extraction bulletin de paie.

Crédit immobilier et consommation

Les banques et fintechs vérifient 3 à 12 mois de bulletins pour évaluer la capacité de remboursement. L'extraction automatique réduit le temps de traitement de chaque dossier de 15 minutes à quelques secondes, avec validation croisée des montants et détection de fraude intégrée.

Location immobilière

Les agences immobilières et les plateformes de gestion locative reçoivent des dizaines de dossiers candidats par annonce. L'extraction automatique des bulletins permet de vérifier les revenus déclarés et de détecter les documents falsifiés avant la signature du bail.

Gestion de la paie externalisée

Les cabinets de paie qui reprennent un portefeuille client doivent numériser et structurer des années de bulletins historiques. L'extraction automatique transforme des cartons d'archives en données exploitables pour la reprise de l'historique salarial.

Conformité et audit RH

Les services RH et les auditeurs vérifient la présence des mentions obligatoires, la cohérence des cotisations avec la convention collective applicable, et le respect des minima conventionnels. L'extraction structurée permet un contrôle systématique et documenté.

Questions fréquentes
sur l'extraction des bulletins de paie.

Holofin traite les bulletins de paie en PDF natif (générés par le logiciel de paie), les scans et les photos smartphone. Tous les principaux éditeurs sont pris en charge : Sage, ADP, Cegid, PayFit, Silae, Nibelis, ainsi que les bulletins produits par des cabinets d'expertise comptable. Les deux formats sont supportés : l'ancien format détaillé et le format simplifié introduit par la réforme de janvier 2018.

L'extraction d'un bulletin de paie prend quelques secondes. En traitement par lot (batch), Holofin traite plusieurs milliers de bulletins par heure grâce au traitement parallélisé. Le temps inclut l'OCR, l'extraction, la validation Hololang et la détection de fraude.

Oui. Holofin intègre 70 détecteurs forensiques qui analysent la typographie (polices incohérentes, espacement anormal), les métadonnées PDF (producteur, dates de modification), la structure du document et la cohérence du contenu (taux de cotisations, calculs brut/net). La corroboration croisée multi-domaine identifie les falsifications même sophistiquées.

Holofin extrait l'identité du salarié (nom, NIR, emploi, convention collective), l'identité de l'employeur (raison sociale, SIRET, code APE), la période de paie, la rémunération (salaire brut, net imposable, net à payer, prélèvement à la source avec taux et montant), les cotisations salariales et patronales (total et détail par ligne), les cumuls annuels (brut, net imposable, heures) et les données de congés (acquis, pris, solde).

Holofin propose une API REST documentée avec authentification par clé API. Les résultats sont disponibles en JSON structuré ou CSV. Des webhooks notifient votre système dès que l'extraction est terminée. Des SDK Python et JavaScript sont disponibles pour accélérer l'intégration. Pour les workflows no-code, l'intégration via Zapier est également possible.

Holofin est hébergé en Europe (infrastructure OVHcloud, France). Les données sont chiffrées au repos et en transit. Les données ne sont jamais utilisées pour entraîner des modèles tiers. La durée de rétention des documents est configurable par organisation. Un DPA (Data Processing Agreement) et un Trust Center sont disponibles sur demande.

Oui. Holofin extrait le taux de prélèvement à la source (PAS), le montant prélevé, le net avant PAS et le net après PAS. Le type de taux (personnalisé, neutre, individualisé) est également identifié lorsqu'il est mentionné sur le bulletin. Ces champs sont disponibles pour tous les bulletins émis depuis janvier 2019.

La tarification est au volume, avec des paliers dégressifs. Un essai gratuit est disponible pour tester la précision sur vos propres documents. Contactez-nous pour obtenir un devis adapté à votre volume de traitement.

Extraction bulletin de paie

Prêt à automatiser
le traitement de vos bulletins de paie ?

Envoyez-nous vos bulletins les plus complexes. Voyez comment ils ressortent de l'autre côté.

95%+ de précision
100 000+ documents traités par mois
Détection de fraude intégrée
Holofin