Zum Inhalt springen

PII

Personally Identifiable Information (PII) bezeichnet alle Daten, mit denen eine bestimmte Person identifiziert werden kann. Dazu gehören direkte Identifikatoren (Name, Adresse, AHV-Nummer) und indirekte Identifikatoren (Geburtsdatum, Arbeitgeber, Berufsbezeichnung), die in Kombination eine Identifizierung ermöglichen.

PII umfasst ein breites Spektrum an Datentypen mit unterschiedlicher Sensitivität. Direkte Identifikatoren: vollständige Namen, AHV-Nummern, Passnummern, Postadressen, Telefonnummern und E-Mail-Adressen. Jeder einzelne kann eine Person identifizieren. Indirekte Identifikatoren: Geburtsdatum, Geschlecht, Nationalität, Arbeitgeber, Berufsbezeichnung und Standortdaten. Einzeln scheinen diese harmlos, aber in Kombination ermöglichen sie eine Re-Identifizierung (der sogenannte Mosaikeffekt).

Unter GDPR (Art. 4(1)) und FADP (Art. 5(a)) erhalten Personendaten (das rechtliche Äquivalent von PII) gesetzlichen Schutz, der angemessene technische und organisatorische Massnahmen erfordert. Das FADP identifiziert genetische Daten, biometrische Daten und Daten über verwaltungs- und strafrechtliche Verfahren spezifisch als besonders schützenswerte Personendaten (Art. 5(c)), die erhöhten Schutz erfordern. Anonymisierung von Dokumenten (das Entfernen oder Ersetzen von PII) ist eine Schlüsseltechnik, um Dokumentweitergabe, Rechtsforschung und Veröffentlichung unter Schutz der betroffenen Personen zu ermöglichen.

PII-Erkennung in unstrukturierten Dokumenten (Verträge, Gerichtsentscheide, Korrespondenz) ist deutlich schwieriger als in strukturierten Datenbanken. Namen können in verschiedenen Formaten erscheinen, Adressen erstrecken sich über mehrere Zeilen, und kontextuelle Identifikatoren ("der Mieter an der Bahnhofstrasse 42") erfordern semantisches Verständnis statt reinem Pattern Matching.

DocIQ Shield nutzt eine feinabgestimmte NER + LLM-Pipeline, optimiert für Schweizer Rechtsdokumente, zur PII-Erkennung. Erkannte Entitäten werden mit Konfidenzwerten präsentiert und nach Typ kategorisiert (Name, Adresse, Datum, AHV-Nummer, juristische Person). Intelligente Erhaltungsregeln unterscheiden zwischen öffentlichen Personen (Richter, Beamte, Organmitglieder in öffentlichen Registern) und schutzbedürftigen Privatpersonen. Shield verarbeitet Dokumente mit Zero Data Persistence: Die PII-Erkennung erfolgt vollständig im Arbeitsspeicher ohne Speicherung des Originalinhalts.

Related Terms

DocIQ Products