Spazio dei nomi gerarchico

Questa pagina fornisce una panoramica dello spazio dei nomi gerarchico, delle funzionalità principali e i casi d'uso, i vantaggi e le limitazioni da considerare.

Panoramica

Lo spazio dei nomi gerarchico è una funzionalità offerta da Cloud Storage che consente di organizzare gli oggetti in cartelle. Con lo spazio dei nomi gerarchico, per archiviare i dati in una struttura logica di file system. Organizzare i dati in una struttura del filesystem migliora le prestazioni, garantisce la coerenza e semplifica la gestione dei carichi di lavoro orientati ai file e con un'intensità di dati elevata.

Le operazioni di gestione delle cartelle offrono affidabilità e funzionalità di gestione, tra cui creazione, eliminazione, elencazione e ridenominazione delle cartelle. La l'organizzazione gerarchica degli oggetti semplifica l'organizzazione dei dati semplifica le attività di gestione dei dati. Una cartella in un bucket con dello spazio dei nomi gerarchico abilitato può contenere oggetti, altre cartelle o combinazione di entrambi.

Puoi abilitare lo spazio dei nomi gerarchico solo quando crei un bucket. Per informazioni su come attivare lo spazio dei nomi gerarchico per il bucket, consulta Creare e gestire i bucket con lo spazio dei nomi gerarchico abilitato.

Il seguente diagramma mostra un esempio di un bucket con uno spazio dei nomi gerarchico abilitato, dove gli oggetti sono organizzati in una struttura gerarchica di cartelle.

Figura 1. Gerarchia dei bucket con cartelle e oggetti.
Figura 1. Gerarchia di bucket con cartelle e oggetti.

Funzionalità principali

Lo spazio dei nomi gerarchico fornisce le seguenti funzionalità:

  • Numero di query iniziali al secondo (QPS) più elevato: bucket con lo spazio dei nomi gerarchico abilitato offre una QPS iniziale più elevata per operazioni di scrittura rispetto ai bucket senza spazio dei nomi gerarchico in un bucket in cui è abilitato il controllo delle versioni. Il valore QPS iniziale più elevato semplifica la scalabilità con uso intensivo di dati carichi di lavoro prioritari e migliora la velocità effettiva.

  • Cartelle: le cartelle fungono da contenitore per oggetti e altre cartelle, con il supporto di operazioni come creazione, eliminazione e recupero delle cartelle.

  • Rinominare le cartelle: l'operazione di ridenominazione delle cartelle ti consente di rinomina il percorso di una cartella e le relative cartelle sottostanti senza eliminare alcun di oggetti strutturati. Questa tecnica è efficace e fa risparmiare tempo, soprattutto con più oggetti.

  • Elenca cartelle: l'operazione Elenca cartelle elenca tutte le cartelle nel bucket o all'interno di una cartella specifica, aiutandoti a gestire e comprendere la struttura dei dati archiviati in un bucket.

Quando devi abilitare lo spazio dei nomi gerarchico per il tuo bucket

Dovresti valutare l'abilitazione dello spazio dei nomi gerarchico quando utilizzi applicazioni che si aspettano una gerarchia e una semantica di tipo file system. Spazio dei nomi gerarchico è vantaggioso per attività ad alta intensità di dati come carichi di lavoro di analisi, AI e ML. Di seguito sono riportati alcuni scenari comuni in cui dovresti prendere in considerazione l'utilizzo spazio dei nomi gerarchico:

  • Elaborazione basata su Hadoop: i carichi di lavoro Hadoop e Spark tradizionalmente si aspettano una struttura di archiviazione di tipo file system e una denominazione basata sul tempo per file e cartelle. Lo spazio dei nomi gerarchico si integra con il connettore Cloud Storage per fornire un throughput migliorato e ridenominazioni atomiche delle cartelle, migliorando l'integrità e la coerenza dei dati per molte pipeline di elaborazione dei dati.

  • Elaborazione dei carichi di lavoro orientati ai file: carichi di lavoro come l'analisi batch di elaborazione dei dati, servizi finanziari o computing ad alte prestazioni sono strutturati in partizioni basate su una gerarchia di cartelle e file. Lo spazio dei nomi gerarchico aiuta a gestire questi ambienti con uno spazio API per la gestione delle cartelle. Inoltre, lo spazio dei nomi gerarchico semplifica la gestione delle cartelle che contengono altre cartelle e altri oggetti. Con un unico comando API, puoi rinominare rapidamente una cartella e tutti i relativi contenuti, risparmiando tempo e risorse preziose.

  • Elaborazione di IA e ML: strumenti di AI e ML come TensorFlow, Pandas e PyTorch prevedono accesso e semantica come un file system. Spazio dei nomi gerarchico , soprattutto se combinato con Cloud Storage FUSE, offre una velocità effettiva superiore e un accesso efficiente ai dati. Di conseguenza, lo spazio dei nomi gerarchico migliora le prestazioni e l'affidabilità dell'iterazione del modello.

Prima di abilitare lo spazio dei nomi gerarchico per il tuo bucket, devi considerare la classe Limitazioni dello spazio dei nomi gerarchico. Per informazioni sulle limitazioni degli spazi dei nomi gerarchici, consulta Limitazioni.

Vantaggi dello spazio dei nomi gerarchico

Quando abiliti lo spazio dei nomi gerarchico per i tuoi bucket, puoi eseguire seguenti:

  • Ottimizza l'organizzazione: puoi organizzare i dati in un ordine gerarchico struttura di cartelle, che aiuta a gestire e individuare file o set di dati.

  • Stabilire un ecosistema simile a un file system: lo spazio dei nomi gerarchico introduce funzionalità simili a quelle di un file system, come cartelle, rinominazione di cartelle e elenco di cartelle, che sono utili per le applicazioni orientate ai file, incluso l'ecosistema Hadoop e i carichi di lavoro di AI e ML.

  • Miglioramento delle prestazioni: ridimensionando i carichi di lavoro con un'intensità di dati elevata in modo da gestire un throughput più elevato, puoi migliorare il rendimento complessivo della tua applicazione.

Supporto piattaforme

I bucket con spazio dei nomi gerarchico supportano quanto segue Funzionalità della piattaforma Cloud Storage:

  • Tutte le API degli oggetti Cloud Storage e i modelli funzionalità di Cloud Storage. Per informazioni dettagliate sulle funzionalità non supportate, consulta Limiti.

  • Trasferimento di dati da un bucket standard a un bucket con dello spazio dei nomi gerarchico usando Storage Transfer Service.

  • Integrazione con i seguenti prodotti:

Limitazioni

Di seguito sono riportati i limiti dello spazio dei nomi gerarchico:

  • Puoi abilitare lo spazio dei nomi gerarchico solo quando crei di sincronizzare la directory di una VM con un bucket. Non puoi modificare i bucket con uno spazio dei nomi piatto per includere uno spazio dei nomi gerarchico.

  • Le seguenti funzionalità di Cloud Storage non sono supportate in preview per i bucket che utilizzano spazio dei nomi gerarchico:

    • Eliminazione temporanea
    • Autoclass
    • Controllo delle versioni degli oggetti
    • ACL dell'oggetto
    • Blocco della conservazione degli oggetti
    • Blocco di bucket

Passaggi successivi

Provalo

Se non conosci Google Cloud, crea un account per valutare le prestazioni di Cloud Storage in scenari reali. I nuovi clienti ricevono anche 300 $ di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.

Prova Cloud Storage gratuitamente