Segmentierung von Datenqualitätsprüfungen
Mit Segmentierung lassen sich Datenqualitätsregeln nicht auf die gesamte Tabelle anwenden, sondern gezielt pro Gruppe – ähnlich wie bei einem GROUP BY in SQL. Das ist besonders hilfreich, wenn Bedingungen innerhalb einzelner Segmente geprüft werden sollen, z. B. je Region, Geschäftsbereich oder Produktkategorie.
Was bewirkt Segmentierung?
Die DQC Platform wendet die Regel separat auf jede Gruppe an, die über die ausgewählte(n) Spalte(n) definiert ist. Das bedeutet:
Die Bedingung wird innerhalb jeder Gruppe geprüft
Lokalisierte Probleme werden sichtbar (z. B. Ausreißer nur in einer Abteilung)
Granulare Einblicke bleiben erhalten – statt durch globale Aggregation verloren zu gehen
Beispiel: Eine „No outlier“-Regel wird pro Department geprüft, nicht über alle Departments hinweg
So wird eine Regel mit Segmentierung erstellt:

Wann Segmentierung sinnvoll ist
Wenn dieselbe Regel unabhängig pro Gruppe gelten soll
Wenn Daten je nach Team, Abteilung oder Kategorie stark variieren
Wenn globale Ausreißerprüfungen zu vielen False Positives führen würden
Beispielanwendung
Szenario: Eine „No outlier“-Regel soll auf einen numerischen Wert angewendet werden – die Werte unterscheiden sich jedoch deutlich zwischen Abteilungen.
Lösung:
Segmentiere nach Department Code:
Regel: No outlier auf „Awarded Amount“
Segmentierung: Department Code
Die Regel prüft nun Ausreißer innerhalb jeder Abteilung, nicht über alle Zeilen hinweg
Kompatible Regeltypen
Segmentierung wird derzeit unterstützt für:
No outlier
Text pattern
Categorical
Konfiguration
Eine unterstützte Regel erstellen oder öffnen
Im Abschnitt Segmentation eine Spalte auswählen
Regel speichern – sie gilt nun gruppenspezifisch statt global
Tipp: Mit Filtern kombinieren
Segmentierungen lassen sich mit Filtern kombinieren, um Regeln noch gezielter einzugrenzen.
Beispiel:
Filter: Remaining amount > 5000
Segmentierung: Department
Regel: Awarded Amount hat keine Ausreißer

Hinweise
Segmentierung ist optional – nur verwenden, wenn gruppenspezifische Logik benötigt wird
In Kombination mit Schwellenwerten wie „No outlier“ wird die Aussagekraft verbessert
Mehr erfahren: Overview of existing rules, Using filters, Rule prediction and how it works