DQC Logo
|

Übersicht vorhandener Regeln

In der DQC Platform lassen sich vielfältige Datenqualitätsregeln definieren – abgestimmt auf unterschiedliche Spaltentypen und Anwendungsfälle. Regeln können manuell über „Add new rule“ hinzugefügt oder automatisch auf Basis des Datenprofilings vorgeschlagen werden.


Regelkategorien

Datenqualitätsregeln werden nach Datentyp und Struktur gruppiert:

undefined Numeric
undefined Text
undefined Other
undefined Two-columns
undefined Multi-column

Beim Hinzufügen einer neuen Regel filtert die Plattform automatisch die verfügbaren Bedingungen je nach Spaltentyp (z. B. werden bei Textspalten keine numerischen Bedingungen angezeigt).


Regeln für numerische Spalten

Gilt für ganze Zahlen oder Dezimalwerte:

  • Greater than

  • Greater than or equal

  • Less than

  • Less than or equal

  • Equals

  • Does not equal

  • Between

  • No outlier


Regeln für Textspalten

Diese Regeln prüfen Inhalte in Textfeldern:

  • Equals / Does not equal

  • Starts with / Does not start with

  • Ends with / Does not end with

  • Contains / Does not contain

  • Text pattern


Weitere Regeln

Für strukturelle Prüfungen oder Klassifizierungen:

  • Categorical

  • Not empty / Empty

  • No personally identifiable information (PII)

  • Date (valid format)


Zwei-Spalten-Regeln

Vergleichen zwei Spalten (Text oder Datum):

  • Contains

  • Starts with

  • Ends with

  • After / After or equal (nur für Datumsfelder)

  • Before / Before or equal (nur für Datumsfelder)


Multi-Spalten-Regeln

Verknüpfen mehrere Spalten in einer einzigen Logik:

  • Contains values from other column

  • Unique

  • Custom SQL

  • Custom Python

  • Semantic (LLM-basiert)

  • Greater than / Greater than or equal (float)

  • Less than / Less than or equal (float)

  • Equals / Does not equal (float)


Zusätzliche Funktionen

undefined Filters

Alle Regeltypen lassen sich mit Bedingungen einschränken (z. B. „nur wenn country = DE“).

undefined Segmentierungen

Folgende Regeltypen können segmentweise angewendet werden (z. B. je Kundengruppe):

  • No outlier

  • Text pattern

  • Categorical


Automatisch generierte Tabellenregeln

Jede neu verbundene Tabelle erhält automatisch drei Basisregeln auf Tabellenebene:

undefined Freshness – Zeit seit der letzten Aktualisierung
undefined Volume – Erwartete Anzahl an Zeilen
undefined Format – Dateityp, Struktur oder Vollständigkeit


undefined Hinweise

Übersicht vorhandener Regeln | DQC