Daten-Assets in einem Lake verwalten

Auf dieser Seite wird erläutert, wie Sie Cloud Storage-Buckets hinzufügen, aktualisieren und entfernen. BigQuery-Datasets als Assets in vorhandenen Dataplex-Zonen.

Übersicht

Ein Asset ist Daten zugeordnet, die entweder in Cloud Storage oder BigQuery gespeichert sind. Ich Daten, die in separaten Google Cloud-Projekten gespeichert sind, einem einzigen in einem Lake liegt. Sie können vorhandene Cloud Storage-Buckets anhängen oder BigQuery-Datasets, die aus dem Lake verwaltet werden sollen.

Hinweise

  • Falls noch nicht geschehen, erstellen Sie einen Lake und eine Zone in diesem Lake.

  • Für die meisten gcloud lakes-Befehle ist ein Speicherort erforderlich. Sie können den Speicherort mit dem Flag --location angeben.

Zugriffssteuerung

  • Wenn Sie Assets entfernen möchten, gewähren Sie den IAM-Rollen die Berechtigungen dataplex.lakes.delete, dataplex.zones.delete oder dataplex.assets.delete. Mit den Dataplex-spezifischen Rollen roles/dataplex.admin und roles/dataplex.editor können Sie diese Berechtigungen erteilen.

  • Gewähren Sie die IAM-Rollen mit den Berechtigungen create, um Assets hinzuzufügen. dataplex.lakes.create, dataplex.zones.create oder dataplex.assets.create. Die Rollen roles/dataplex.admin und roles/dataplex.editor enthalten Folgendes: Berechtigungen.

  • Sie können Nutzern oder Gruppen auch Berechtigungen über die roles/owner erteilen. und roles/editor Legacy-Rollen.

  • Sie müssen den Dataplex-Dienst für Ressourcen autorisieren, an den Dataplex-Lake angehängt. Die Autorisierung erfolgt automatisch implizit für Ressourcen in dem Projekt gewährt, in dem der Lake erstellt wird. Dataplex-Dienst für andere Projekte autorisieren explizit auf Ressourcen.

Weitere Informationen finden Sie unter Dataplex-IAM und -Zugriffssteuerung.

Rollen für Cloud Storage-Buckets gewähren

Wenn Sie Ihrem Data Lake einen Cloud Storage-Bucket aus einem anderen Projekt anhängen möchten, müssen Sie dem Dataplex-Dienstkonto (service-PROJECT_NUMBER@gcp-sa-dataplex.iam.gserviceaccount.com, in der Console auf der Seite mit den Details zum Data Lake abgerufen) die Rolle „Dataplex-Dienstkonto“ (roles/dataplex.serviceAgent) im Projekt zuweisen, das den Bucket enthält. Diese Rolle bietet Dataplex-Dienst mit der erforderlichen Rolle auf Administratorebene für den Bucket, damit Berechtigungen können für den Bucket selbst festgelegt werden.

Rollen für BigQuery-Datasets gewähren

Wenn Sie ein BigQuery-Dataset aus einem anderen Projekt an Ihren Data Lake anhängen möchten, müssen Sie dem Dataplex-Dienstkonto die Rolle „BigQuery-Administrator“ für das Dataset zuweisen.

Überlegungen zu VPC Service Controls

Dataplex verstößt nicht gegen VPC Service Controls-Perimeter. Vorher dem Lake ein Asset hinzufügen, achten Sie darauf, dass sich der zugrunde liegende Bucket oder das Dataset dem gleichen VPC Service Controls-Netzwerk wie der Lake.

Weitere Informationen finden Sie unter VPC Service Controls mit Dataplex.

Asset hinzufügen

Sie können einen Cloud Storage-Bucket oder ein BigQuery-Dataset hinzufügen Asset durch Ausstellen einer Dataplex API-Methode lakes.zones.assets.create oder auf der in einem lokalen Browser geöffneten Seite „Datenzone“ einen Bucket oder ein Dataset hinzufügen.

Wenn sich die Region des Data Lake nicht mit der Region eines Cloud Storage-Buckets überschneidet, können Sie den Bucket keiner Zone in Ihrem Data Lake hinzufügen.

Weitere Informationen zum Speicherort einer Cloud Storage-Ressource und dazu, wie Dataplex den Speicherort eines Buckets beim Erstellen des Veröffentlichungsdatensatzes behandelt, finden Sie unter Regionale Ressourcen.

Console

  1. Öffnen Sie in der Google Cloud Console die Dataplex-Seite:

    Dataplex in der Google Cloud Console öffnen

  2. Klicken Sie auf der Seite Verwalten auf den Datensee, dem Sie einen Cloud Storage-Bucket oder BigQuery-Datensatz hinzufügen möchten. Die Seite des Sees wird geöffnet.

    Lake-Detailseite
  3. Klicken Sie auf dem Tab Zonen auf den Namen der Datenzone, zu der Sie Sie das Asset hinzufügen möchten. Die Seite „Datenzone“ für diese Datenzone wird geöffnet.

  4. Klicken Sie auf dem Tab Assets auf + Assets hinzufügen. Die Seite Assets hinzufügen wird geöffnet.

  5. Klicken Sie auf Asset hinzufügen.

  6. Wählen Sie im Feld Typ entweder BigQuery-Dataset oder Cloud Storage-Bucket.

  7. Geben Sie im Feld Anzeigename einen Namen für das neue Asset ein.

  8. Geben Sie im Feld ID eine eindeutige ID für das Asset ein.

  9. Optional: Geben Sie eine Beschreibung ein.

  10. Je nach Asset-Typ im Feld Dataset oder Bucket: Klicken Sie auf Durchsuchen, um den Cloud Storage-Bucket zu suchen und auszuwählen, oder BigQuery-Dataset

  11. Optional: Wenn der Asset-Typ Cloud Storage-Bucket ist und Sie möchten, dass Dataplex das Asset verwaltet. Wählen Sie dann Kästchen Upgrade auf „verwaltet“ ausführen. Wenn Sie diese Option auswählen, das Asset separat aktualisieren. Diese Option ist für BigQuery-Datasets nicht verfügbar.

  12. Klicken Sie auf Weiter.

  13. Wählen Sie die restlichen Parameterwerte aus. Weitere Informationen zu finden Sie unter Lake-Sicherheit.

  14. Klicken Sie auf Senden, um das Asset hinzuzufügen.

  15. Vergewissern Sie sich, dass Sie wieder auf die Seite "Data Zone" (Datenzone) zurückgekehrt sind und dass Ihr neuer in der Asset-Liste angezeigt wird.

REST

Folgen Sie der API-Anleitung, um einen Bucket hinzuzufügen. mit APIs Explorer.

Wenn die Datenzone erfolgreich hinzugefügt wurde, wechselt sie automatisch in den aktiven Zustand. Bei einem Ausfall wird für die Datenzone ein Rollback auf die vorherige Datenzone durchgeführt. und fehlerfrei ist.

Cloud Storage-Bucket-Asset upgraden

Wenn Sie ein Asset vom Typ „Cloud Storage-Bucket“ hinzufügen, veröffentlicht Dataplex automatisch externe BigQuery-Tabellen für die im Asset gehosteten Tabellen.

Wenn Sie ein Cloud Storage-Bucket-Asset aktualisieren, entfernt Dataplex die angehängten externen Tabellen und erstellt BigLake-Tabellen. BigLake-Tabellen bieten bessere, detaillierte Sicherheitsfunktionen, einschließlich der Maskierung auf Zeilen- und Spaltenebene sowie der dynamischen Datenmaskierung.

Sie können ein Cloud Storage-Bucket-Asset in der Google Cloud Console aktualisieren oder durch Ausführen der Dataplex API-Methode Patch:

Console

  1. Öffnen Sie in der Google Cloud Console die Dataplex-Seite:

    Zu Dataplex

  2. Klicken Sie auf der Seite Verwalten auf den Namen des Lakes. Die Lake-Seite wird geöffnet.

  3. Klicken Sie auf dem Tab Zonen auf den Namen der Datenzone. Die Seite „Datenzone“ wird geöffnet.

  4. Klicken Sie auf dem Tab Assets auf den Namen des Assets, das Sie aktualisieren möchten.

  5. Klicken Sie auf Upgrade auf „verwaltet“.

REST

Folgen Sie der API-Anleitung, um ein Bucket-Asset mithilfe des Cloud Explorers zu aktualisieren.

Downgrade eines Cloud Storage-Bucket-Assets ausführen

Wenn Sie ein Downgrade für ein Cloud Storage-Bucket-Asset ausführen, geschieht Folgendes: Dataplex entfernt die angehängten BigLake-Tabellen und erstellt externe Tabellen.

Sie können ein Cloud Storage-Bucket-Asset in der Google Cloud Console oder durch Ausführen der Dataplex API-Methode Patch downgraden. Dabei muss das Feld readAccessMode in ResourceSpec auf DIRECT festgelegt sein.

Console

  1. Öffnen Sie in der Google Cloud Console die Dataplex-Seite:

    Zu Dataplex

  2. Klicken Sie auf der Seite Verwalten auf den Namen des Lakes. Die Lake-Seite wird geöffnet.

  3. Klicken Sie auf dem Tab Zonen auf den Namen der Datenzone. Die Seite „Datenzone“ wird geöffnet.

  4. Klicken Sie auf dem Tab Assets auf den Namen des Assets, das Sie aktualisieren möchten.

  5. Klicken Sie auf Downgrade vom verwalteten Dienst ausführen.

REST

Folgen Sie der API-Anleitung zum Downgrade eines Bucket-Assets. mit Cloud Explorer. Achten Sie darauf, dass Sie das Feld readAccessMode in ResourceSpec auf DIRECT setzen.

Asset entfernen

Sie können einen Cloud Storage-Bucket oder ein BigQuery-Dataset entfernen in der Google Cloud Console oder durch Ausstellen der Dataplex API lakes.zones.assets.delete-Methode. Entfernen Sie das Asset aus der Datenzone oder dem Data Lake, bevor Sie es an einen eine andere.

In der folgenden Anleitung wird gezeigt, wie Sie ein Dataplex entfernen. mithilfe der Google Cloud Console oder der Dataplex API.

Console

  1. Öffnen Sie in der Google Cloud Console die Dataplex-Seite:

    Öffnen Sie Dataplex in der Google Cloud Console

  2. Klicken Sie auf der Seite Verwalten auf den Datensee, aus dem Sie einen Cloud Storage-Bucket oder ein BigQuery-Dataset entfernen möchten. Die Lake-Seite für diesen Lake wird geöffnet.

    Lake-Detailseite
  3. Klicken Sie auf dem Tab Zonen auf den Namen der Datenzone, die Sie z. B. den Cloud Storage-Bucket oder BigQuery, des Datasets. Die Seite „Datenzone“ für diese Datenzone wird geöffnet.

  4. Wähle auf dem Tab Assets das gewünschte Asset aus, indem du das Kästchen links anklickst. des Asset-Namens ein.

  5. Klicken Sie auf Asset löschen, um das Asset zu entfernen.

  6. Klicken Sie im Dialogfeld auf Löschen, um die Verknüpfung aufzuheben.

REST

Folgen Sie der API-Anleitung, um einen Bucket mithilfe des Cloud Explorers zu entfernen.

Nächste Schritte