Verbindung zu Databricks
Um ein Databricks Lakehouse mit der DQC Platform zu verbinden, werden einige zentrale Konfigurationsdaten benötigt. Diese Anleitung erklärt alle notwendigen Felder, die Erstellung eines Zugriffstokens und die Einrichtung der Berechtigungen.
Required connection details
Feld | Beispiel | Beschreibung |
|---|---|---|
Name |
| Beliebiger interner Name für die Verbindung |
Host |
| Host aus der URL nach Anmeldung in Databricks: |
Token (dev) |
| Zugriffstoken – siehe Anleitung unten |
Service Principal (prod) | Client ID: | In Azure Databricks: User icon > Settings > Identity and Access > Service Principals |
Cluster ID |
| In Databricks, ID eines Clusters – in der URL bei geöffnetem Cluster ersichtlich |
Catalog |
| Katalog, der das gewünschte Schema und die Tabellen enthält |
Schema |
| Ziel-Schema zur Anbindung |
Diese Werte werden im Konfigurationsformular der DQC Platform eingetragen
Databricks-Zugriffstoken erstellen
Für die Verbindung wird ein Zugriffstoken benötigt. Es wird empfohlen, einen Service Principal zu verwenden.
Option 1: Service Principal (empfohlen)
Service Principal erstellen
Einen neuen Principal über die Databricks API anlegen (siehe Anleitung für Azure Databricks)
Die Application ID notieren
Token-Nutzung erlauben
In Databricks dem Principal die Berechtigung zum Verwenden von Tokens geben (siehe Token Permissions)
Zugriffstoken erzeugen
Token mit
"lifetime_seconds": nullerstellenToken sicher aufbewahren Instructions
Option 2: Persönliches Token (für Entwicklung)
In Databricks zu User Settings > Developer Tools gehen
Ein persönliches Zugriffstoken erzeugen
Token sicher speichern
Zugriff auf das Zielschema gewähren
Damit die DQC Platform Daten lesen kann, muss dem entsprechenden Nutzer oder Service Principal die Rolle Data Reader im gewünschten Schema zugewiesen werden.
Außerdem müssen für Databricks SQL Warehouse-Verbindungen temporäre In-Memory-Tabellen erstellt werden über:
GRANT CREATE VOLUME ON SCHEMA <schema> TO <service_principal>;oder:
GRANT CREATE VOLUME ON CATALOG <catalog> TO <service_principal>;
Berechtigungen im Unity Catalog auf Schema-Ebene vergeben
Statische IP-Adresse der DQC Platform freigeben
Stelle sicher, dass folgende IP-Adresse in der Netzwerkkonfiguration freigegeben ist:
3.123.94.228
Hinweise
Für produktive Umgebungen wird die Verwendung eines Service Principals empfohlen
Die Verbindung ist verschlüsselt und erfolgt mit Lesezugriff
Mehr erfahren: Supported data sources, Azure SQL connection, Connection to Snowflake