Aller au contenu

PII

Les Personally Identifiable Information (PII) sont toute donnee pouvant etre utilisee pour identifier un individu specifique. Cela inclut les identifiants directs (nom, adresse, numero AVS) et les identifiants indirects (date de naissance, employeur, fonction) qui pourraient identifier quelqu'un en combinaison.

Les PII englobent une large gamme de types de donnees avec differents niveaux de sensibilite. Les identifiants directs incluent les noms complets, numeros AVS, numeros de passeport, adresses postales, numeros de telephone et adresses email. Un seul suffit a identifier un individu. Les identifiants indirects incluent les dates de naissance, le genre, la nationalite, l'employeur, la fonction et les donnees de geolocalisation. Individuellement, ils semblent inoffensifs, mais en combinaison, ils permettent la re-identification (effet mosaique).

Selon le GDPR (art. 4(1)) et la LPD (art. 5(a)), les donnees personnelles (equivalent juridique des PII) beneficient d'une protection legale exigeant des organisations la mise en oeuvre de mesures techniques et organisationnelles appropriees. La LPD identifie specifiquement les donnees genetiques, biometriques et les donnees sur les procedures administratives ou penales comme donnees personnelles sensibles (art. 5(c)), exigeant une protection renforcee. L'anonymisation de documents (suppression ou remplacement des PII) est une technique cle pour permettre le partage de documents, la recherche juridique et la publication tout en protegeant les individus.

La detection des PII dans les documents non structures (contrats, decisions de justice, correspondance) est nettement plus difficile que dans les bases de donnees structurees. Les noms peuvent apparaitre sous differents formats, les adresses couvrent plusieurs lignes, et les identifiants contextuels ("le locataire au Bahnhofstrasse 42") necessitent une comprehension semantique plutot qu'une simple correspondance de motifs.

DocIQ Shield utilise un pipeline NER + LLM affine, optimise pour les documents juridiques suisses, pour detecter les PII. Les entites detectees sont presentees avec des scores de confiance et classees par type (nom, adresse, date, numero AVS, entite juridique). Des regles de preservation intelligentes distinguent les personnalites publiques (juges, fonctionnaires, dirigeants dans les publications officielles) des personnes privees necessitant une protection. Shield traite les documents avec zero persistence de donnees : la detection des PII se fait entierement en memoire sans stockage du contenu original.

Related Terms

DocIQ Products