Wie man die 'semantische' Regel verwendet
Die semantische Regel ermöglicht es Nutzer*innen, intelligente, LLM-basierte Validierungen auf Spaltenwerte anzuwenden, indem sie die Logik in natürlicher Sprache beschreiben. Sie ist besonders hilfreich für Prüfungen, die externes Wissen oder den Zusammenhang zwischen Spalten erfordern.
Zweck der semantischen Regel
Verwende eine semantische Regel, wenn:
Werte auf Basis von Bedeutung oder Kontext validiert werden sollen (nicht nur Format oder Bereich)
LLMs bewerten sollen, ob ein Wert plausibel, korrekt oder konsistent im Verhältnis zu einer anderen Spalte ist
klassische Regeln wie Regex, Zahlenbereiche oder Mustererkennung nicht ausreichen
Beispiel: Postleitzahl nach Land validieren
Dieses Beispiel prüft, ob der Wert in der Spalte postal_code für das jeweilige Land in der gleichen Zeile gültig ist.
Schritt-für-Schritt-Anleitung
1. Navigiere zum Tab „Rules“
Öffne die Tabelle, in der Du die Regel definieren möchtest, und wechsle zum Tab Regeln.
2. Klicke auf „Neue Regel hinzufügen“
Nutze den Button "Neue Regel hinzufügen" oben rechts.
3. Wähle die Zielspalte aus
Wähle postal_code im Dropdown Spalten aus.
4. Wähle den Regeltyp aus
Wähle folgende Bedingung:
erfüllt semantische Bedingung
5. Gib Deinen Prompt ein
Beschreibe Deine Logik klar in natürlicher Sprache.
Verwendeter Prompt im Beispiel:
Prüfe, ob der Wert in der Spalte postal_code für das entsprechende Land in der Spalte country in jeder Zeile gültig ist.
6. Kontextspalten hinzufügen
Füge alle Spalten hinzu, die für den Kontext benötigt werden — in diesem Fall:
country
7. (Optional) Umfang begrenzen
Um den Test zu beschleunigen, kannst Du mit Maximale Zeilenanzahl die Anzahl geprüfter Zeilen begrenzen.
8. Regel speichern
Klicke auf Speichern, um die Regel zum Regelset hinzuzufügen.
Was passiert danach?
Die Regel verwendet ein LLM, um Deinen Prompt zu interpretieren und Zeile für Zeile anzuwenden. Zum Beispiel:
Erkennt gültige Postleitzahlenformate für jedes Land
Markiert Abweichungen, z. B. eine US-ZIP-Code in einer Zeile mit
country = DE
Hinweise
Semantische Regeln können längere Laufzeiten haben — insbesondere bei großen Tabellen
Für beste Ergebnisse sollte der Prompt klar und präzise formuliert sein
Definiere immer Kontextspalten, wenn der Prompt sich auf andere Felder bezieht