Profiling Tab
Die Profiling-Registerkarte wird automatisch für jede angebundene Tabelle in der DQC Platform erzeugt. Sie bietet eine übersichtliche Darstellung spaltenbezogener Statistiken und Zusammenhänge – ideal, um Muster zu erkennen, potenzielle Probleme zu entdecken und sinnvolle Datenqualitätsregeln abzuleiten.

Was das Profiling anzeigt
Für jede Spalte werden zusammenfassende Statistiken dargestellt:
Null values – Anteil fehlender Werte
Uniqueness – Anteil eindeutiger Werte
Minimum / Maximum / Average – Min-, Max- und Durchschnittswerte (bei numerischen oder Datumsfeldern)
PII – Hinweis auf potenziell personenbezogene Daten
Diese Werte geben einen ersten Eindruck zur Struktur und Qualität der Tabelle – und helfen, potenzielle Regelkandidaten wie "Not empty", "No outlier" oder "Categorical" zu identifizieren.
Die einzelnen Statistiken werden in den Spalten angezeigt
Korrelationsmatrix
Unterhalb der Statistik-Tabelle zeigt eine Korrelationsmatrix die Beziehungen zwischen Spalten:
Gelb = positive Korrelation
Blau = negative Korrelation
Besonders nützlich bei der Ableitung von Multi-Column-Regeln, z. B.:
„Start Date sollte vor End Date liegen“
„Awarded Amount = Consumed + Remaining“
Die Matrix visualisiert, wie stark Spalten zueinander in Beziehung stehen
Beispielanwendung
Szenario: Eine neue Tabelle wird erstmals analysiert. Ziel ist es, passende Datenqualitätsregeln abzuleiten.
Lösung mit dem Profiling-Tab:
Spalten mit hohem NULL-Anteil → „Not empty“-Regel
Spalten mit geringer Eindeutigkeit → „Categorical“-Regel
Stark korrelierte Felder → Multi-Column-Regel (z.B. Awarded Amount = Consumed + Remaining Amount)
Hinweise
Die Profiling-Ansicht ist read-only
Sie dient als schneller Einstiegspunkt zur Identifikation regelbedürftiger Spalten
Mehr erfahren: Overview of existing rules, Rule prediction and how it works, Working with the Rules tab