DQC Logo
|

Profiling Tab

Die Profiling-Registerkarte wird automatisch für jede angebundene Tabelle in der DQC Platform erzeugt. Sie bietet eine übersichtliche Darstellung spaltenbezogener Statistiken und Zusammenhänge – ideal, um Muster zu erkennen, potenzielle Probleme zu entdecken und sinnvolle Datenqualitätsregeln abzuleiten.


Was das Profiling anzeigt

Für jede Spalte werden zusammenfassende Statistiken dargestellt:

  • Null values – Anteil fehlender Werte

  • Uniqueness – Anteil eindeutiger Werte

  • Minimum / Maximum / Average – Min-, Max- und Durchschnittswerte (bei numerischen oder Datumsfeldern)

  • PII – Hinweis auf potenziell personenbezogene Daten

Diese Werte geben einen ersten Eindruck zur Struktur und Qualität der Tabelle – und helfen, potenzielle Regelkandidaten wie "Not empty", "No outlier" oder "Categorical" zu identifizieren.

Die einzelnen Statistiken werden in den Spalten angezeigt


Korrelationsmatrix
Unterhalb der Statistik-Tabelle zeigt eine Korrelationsmatrix die Beziehungen zwischen Spalten:

  • undefined Gelb = positive Korrelation

  • undefined Blau = negative Korrelation

Besonders nützlich bei der Ableitung von Multi-Column-Regeln, z. B.:

  • „Start Date sollte vor End Date liegen“

  • „Awarded Amount = Consumed + Remaining“

Die Matrix visualisiert, wie stark Spalten zueinander in Beziehung stehen


Beispielanwendung

Szenario: Eine neue Tabelle wird erstmals analysiert. Ziel ist es, passende Datenqualitätsregeln abzuleiten.

Lösung mit dem Profiling-Tab:

  • Spalten mit hohem NULL-Anteil„Not empty“-Regel

  • Spalten mit geringer Eindeutigkeit„Categorical“-Regel

  • Stark korrelierte FelderMulti-Column-Regel (z.B. Awarded Amount = Consumed + Remaining Amount)


undefined Hinweise

Profiling Tab | DQC