Componente opcional de Hive WebHCat de Dataproc

Puedes instalar componentes adicionales, como Hive WebHCat, cuando creas un Dataproc clúster mediante Componentes opcionales . En esta página, se describe el componente Hive WebHCat.

Hive WebHCat proporciona una API de REST para HCatalog. El servicio de REST está disponible en el puerto 50111 del primer nodo principal del clúster.

Instala el componente

Instala el componente cuando crees un clúster de Dataproc. Los componentes se pueden agregar a los clústeres creados con la versión 1.3 de Dataproc y las posteriores.

Consulta las versiones compatibles de Dataproc para la versión del componente incluida en cada versión de la imagen de Dataproc.

Comando de gcloud

Para crear un clúster de Dataproc que incluya el componente WebHCat de Hive, usa el gcloud dataproc clusters create cluster-name con la marca --optional-components.

gcloud dataproc clusters create cluster-name \
    --optional-components=HIVE_WEBHCAT \
    --region=region \
    ... other args

API de REST

El componente Hive WebHCat se puede especificar con la API de Dataproc mediante SoftwareConfig.Component como parte de una solicitud clusters.create.

Console

  1. Habilita el componente.
    • En la consola de Google Cloud, abre Dataproc Crea un clúster . Se selecciona el panel Configurar clúster.
    • En la sección Componentes, en Componentes opcionales, selecciona Hive WebHCat y otros componentes opcionales para instalar en tu clúster.