Recherche & Développement Toutes les publications Génération synthétique de données confidentielles

Génération synthétique de données confidentielles


Télécharger le fichier
ETUDE INTERNE
AUTEUR : HENRI CHHOA, SALIM KABIRI ET YANN HUQUET

 

La confidentialité des données bancaires et assurantielles constitue un enjeu majeur pour leur exploitation. Les techniques de synthèse de données permettent de répondre à cet impératif en conciliant les critères de confidentialité, de fidélité et d’utilité des données générées. Dans cet article, nous comparons les performances de trois méthodes de synthèse de données (Conditional Tabular Generative Adversarial Network, Tabular Variational Autoencoder et copule gaussienne) sur des cas d’usage métier issus du secteur de la banque (scoring d’octroi, prédiction de revenus) et de l’assurance (tarification en prime pure). La validation de ces critères est évaluée à l’aide de scores construits à partir d’indicateurs statistiques (corrélations, distances entre distributions). Les résultats obtenus révèlent des variations de performances en fonction des caractéristiques du cas d’usage ainsi que des types de variables présents dans les données sensibles à synthétiser.

Télécharger le fichier

Publications récentes

#news

Rapport SFCR 2024 Tendances Du Marché IARD

08/07/2025

Rapport SFCR 2024 – Les tendances du marché IARD

Lire plus
Mutualisation Des Risques Climatiques Les Pistes De Réforme Du Haut Commissariat à La Stratégie Et Au Plan Nexialog Consulting

03/07/2025

Mutualisation des risques climatiques : les pistes de réforme du Haut-Commissariat à la Stratégie et au Plan

Lire plus
Variabilité Des Fonds Propres En Europe Article Banque Nexialog Consulting

01/07/2025

Variabilité des fonds propres en Europe : progrès et défis selon le rapport de l’exercice de benchmark crédit de l’EBA 2024

Lire plus