Migra un almacén de metadatos de MySQL autoadministrado a Dataproc Metastore

En esta página, se muestra cómo migrar tu almacén de metadatos de MySQL autoadministrado externo a Dataproc Metastore mediante la creación de un archivo de volcado de MySQL y la importación los metadatos en un servicio existente de Dataproc Metastore

Antes de comenzar

  1. Accede a tu cuenta de Google Cloud. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Asegúrate de que la facturación esté habilitada para tu proyecto de Google Cloud.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Asegúrate de que la facturación esté habilitada para tu proyecto de Google Cloud.

  6. Enable the Dataproc Metastore API.

    Enable the API

Funciones requeridas

A fin de obtener los permisos que necesitas para crear un Dataproc Metastore y, luego, importar un almacén de metadatos MySQL, haz lo siguiente: solicita a tu administrador que te otorgue el los siguientes roles de IAM:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Estos roles predefinidos contienen los permisos necesarios para crear un Dataproc Metastore y, luego, importar un almacén de metadatos MySQL Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:

Permisos necesarios

Se requieren los siguientes permisos para crear un Dataproc Metastore y, luego, importar un almacén de metadatos MySQL:

  • Para crear un servicio, sigue estos pasos: metastore.services.create en el proyecto.
  • Para importar metadatos, sigue estos pasos: metastore.imports.create en el proyecto.
  • Si deseas usar el objeto de Cloud Storage (archivo de volcado de SQL) para la importación, haz lo siguiente:
    • storage.objects.get en el agente de servicio de Dataproc Metastore. Por ejemplo, service-CUSTOMER_PROJECT_NUMBER@gcp-sa-metastore.iam.gserviceaccount.com
    • storage.objects.get en la cuenta de usuario.

También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.

Para obtener más información sobre roles y permisos específicos de Dataproc Metastore, consulta Administra el acceso a Dataproc con la IAM.

Crea un servicio de Dataproc Metastore

En las siguientes instrucciones, se muestra cómo crear un Dataproc Metastore al que puedes migrar tu archivo de volcado de SQL.

Console

  1. En la consola de Google Cloud, abre la página Crear servicio:

    Ir a Crear servicio

    La página Crear servicio
    La página Crear servicio de Dataproc Metastore
  2. En el campo Nombre del servicio, ingresa example-service.

  3. Selecciona la Ubicación de los datos. Consulta Ubicaciones de Cloud si necesitas información para seleccionar una región.

  4. Para otras opciones de configuración del servicio, usa los valores predeterminados proporcionados.

  5. Para crear y, luego, iniciar el servicio, haz clic en el botón Enviar.

El nuevo servicio aparecerá en la lista de servicios.

gcloud

Ejecuta el siguiente comando gcloud metastore services create para crear un servicio:

 gcloud metastore services create example-service \
     --location=LOCATION
 

Reemplaza LOCATION por la región de Compute Engine en la que planeas crear el servicio. Asegúrate de que Dataproc Metastore esté disponible. en la región.

REST

Sigue las instrucciones de la API para crear un servicio mediante el Explorador de API.

Prepárate para la migración

Ahora debes preparar los metadatos almacenados en tu base de datos del almacén de metadatos de Hive para importar creando un archivo de volcado de MySQL y colocándolo en un bucket de Cloud Storage.

Consulta Prepara los archivos de importación antes de importarlos. sobre los pasos que debes seguir para la migración.

Importa los metadatos

Ahora que preparaste el archivo de volcado, impórtalo a tu servicio de Dataproc Metastore.

Consulta Importa los archivos a Dataproc Metastore a fin de conocer los pasos para importar tus metadatos al servicio example-service.

Crea y adjunta un clúster de Dataproc

Después de importar los metadatos a Dataproc Metastore Servicio example-service, crea y adjunta un clúster de Dataproc que usa el servicio como su almacén de metadatos de Hive.

Limpia

Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.

  1. En la consola de Google Cloud, ve a la página Administrar recursos.

    Ir a Administrar recursos

  2. Si el proyecto que deseas borrar está vinculado con una organización, expande la lista Organización en la columna Nombre.
  3. En la lista de proyectos, elige el proyecto que quieres borrar y haz clic en Borrar.
  4. En el diálogo, escribe el ID del proyecto y, luego, haz clic en Cerrar para borrar el proyecto.

Como alternativa, puedes borrar los recursos que se usan en este instructivo de la siguiente manera:

  1. Borra el servicio de Dataproc Metastore.

    Console

    1. En la consola de Google Cloud, abre la página de Dataproc Metastore:

      Abre Dataproc Metastore en la consola de Google Cloud

    2. A la izquierda del nombre del servicio, marca la casilla para seleccionar example-service.

    3. En la parte superior de la página Dataproc Metastore, haz clic en Borrar para borrar el servicio.

    4. En el cuadro de diálogo, haz clic en Borrar para confirmar la eliminación.

    Tu servicio ya no aparece en la lista de servicios.

    gcloud

    Ejecuta el siguiente comando gcloud metastore services delete para borrar un servicio:

     gcloud metastore services delete example-service \
         --location=LOCATION

    Reemplaza LOCATION por la instancia de Compute Engine. región donde creaste el servicio.

    REST

    Sigue las instrucciones de la API para borrar un servicio mediante el Explorador de API.

    Todas las eliminaciones se completa de forma exitosa de inmediato.

  2. Borra el bucket de Cloud Storage para el servicio de Dataproc Metastore.

¿Qué sigue?