DQC Logo
|

Wie man die 'semantische' Regel verwendet

Die semantische Regel ermöglicht es Nutzer*innen, intelligente, LLM-basierte Validierungen auf Spaltenwerte anzuwenden, indem sie die Logik in natürlicher Sprache beschreiben. Sie ist besonders hilfreich für Prüfungen, die externes Wissen oder den Zusammenhang zwischen Spalten erfordern.


Zweck der semantischen Regel

Verwende eine semantische Regel, wenn:

  • Werte auf Basis von Bedeutung oder Kontext validiert werden sollen (nicht nur Format oder Bereich)

  • LLMs bewerten sollen, ob ein Wert plausibel, korrekt oder konsistent im Verhältnis zu einer anderen Spalte ist

  • klassische Regeln wie Regex, Zahlenbereiche oder Mustererkennung nicht ausreichen


Beispiel: Postleitzahl nach Land validieren

Dieses Beispiel prüft, ob der Wert in der Spalte postal_code für das jeweilige Land in der gleichen Zeile gültig ist.


Schritt-für-Schritt-Anleitung

1. Navigiere zum Tab „Rules“
Öffne die Tabelle, in der Du die Regel definieren möchtest, und wechsle zum Tab Regeln.

2. Klicke auf „Neue Regel hinzufügen“
Nutze den Button "Neue Regel hinzufügen" oben rechts.

3. Wähle die Zielspalte aus
Wähle postal_code im Dropdown Spalten aus.

4. Wähle den Regeltyp aus
Wähle folgende Bedingung:
undefined erfüllt semantische Bedingung

5. Gib Deinen Prompt ein
Beschreibe Deine Logik klar in natürlicher Sprache.
undefined Verwendeter Prompt im Beispiel:

Prüfe, ob der Wert in der Spalte postal_code für das entsprechende Land in der Spalte country in jeder Zeile gültig ist.

6. Kontextspalten hinzufügen
Füge alle Spalten hinzu, die für den Kontext benötigt werden — in diesem Fall:

  • country

7. (Optional) Umfang begrenzen
Um den Test zu beschleunigen, kannst Du mit Maximale Zeilenanzahl die Anzahl geprüfter Zeilen begrenzen.

8. Regel speichern
Klicke auf Speichern, um die Regel zum Regelset hinzuzufügen.


Was passiert danach?

Die Regel verwendet ein LLM, um Deinen Prompt zu interpretieren und Zeile für Zeile anzuwenden. Zum Beispiel:

  • Erkennt gültige Postleitzahlenformate für jedes Land

  • Markiert Abweichungen, z. B. eine US-ZIP-Code in einer Zeile mit country = DE


undefined Hinweise

  • Semantische Regeln können längere Laufzeiten haben — insbesondere bei großen Tabellen

  • Für beste Ergebnisse sollte der Prompt klar und präzise formuliert sein

  • Definiere immer Kontextspalten, wenn der Prompt sich auf andere Felder bezieht

Wie man die 'semantische' Regel verwendet | DQC