Gemini para usuários de texto do AutoML

Esta página fornece comparações entre o AutoML Text e o Gemini para ajudar os usuários do AutoML Text a entender como usar o Gemini.

Verifique as tabelas que se aplicam ao seu caso de uso e analise as alterações que podem afetar seu fluxo de trabalho.

Uso geral

Essas diferenças são aplicáveis a todos os usuários do Gemini.

Operação Texto do AutoML Gemini
Formatos de dados de treinamento É possível usar arquivos CSV ou linhas JSON, exceto a extração de entidade de texto, para incluir snippets de texto in-line ou para referenciar documentos do tipo TXT. A extração de entidade é compatível apenas com arquivos JSON Lines. Só é possível usar arquivos JSON de linha. Cada linha no arquivo precisa representar um exemplo de treinamento. Faça o download de um conjunto de dados de exemplo para ajustar os modelos do Gemini. Os arquivos precisam ser armazenados no Cloud Storage.
Anotação de conjunto de dados As anotações são agrupadas como um objeto AnnotationSet. É possível usar diferentes conjuntos de anotações com o mesmo conjunto de dados. As anotações de conjuntos de dados não são relevates ao Gemini.
Importação de conjunto de dados Especifique os valores de uso de ML em uma coluna opcional para CSV, na mesma linha dos dados; ou como uma tag em linhas JSON no mesmo objeto JSON que os dados. Se você não especificar valores de uso de ML, os dados serão divididos automaticamente para treinamento, teste e validação.
Para análise de sentimento, os arquivos CSV precisam incluir o valor máximo de sentimento na última coluna de cada linha.
Você precisa ter dois arquivos JSONL separados, um para treinamento e outro para validação. O arquivo de validação é opcional. O arquivo de validação precisa ter de 10 a 256 exemplos.
Custos de armazenamento Quando você cria um conjunto de dados, os dados são carregados no Cloud Storage no projeto. Esse armazenamento será cobrado. Saiba mais. Quando você cria um conjunto de dados, os dados são carregados no Cloud Storage no projeto. Esse armazenamento será cobrado. Saiba mais
Rotulagem de dados Você fornece instruções de rotulagem usando um URL. As anotações fazem parte do objeto Dataset e não podem ser manipuladas por meio do uso da API. A rotulagem de dados não é relevante ao Gemini.
Implantação do modelo Você cria um objeto Endpoint com recursos para exibir predições on-line. Em seguida, implante o modelo no endpoint. Para solicitar previsões, chame o método predict(). Depois de ajustar o Gemini, o modelo é armazenado no Vertex AI Model Registry, e um endpoint é criado automaticamente. As previsões on-line do modelo ajustado podem ser solicitadas usando o SDK do Python, a API REST ou o console. Para solicitar previsões, primeiro busque o endpoint ajustado e depois use o método generate_content().
Como usar o número ou o ID do projeto Tanto project-number quanto project-id funcionam na Vertex AI. O Gemini usa project-id.
Pontuações de confiança O texto do AutoML é compatível com as pontuações de confiança. O Gemini não oferece suporte a pontuações de confiança.

Usuários da API

Para mais detalhes sobre a API, consulte a documentação de referência da API Vertex AI Generative AI Tuning.

Operação ou entidade Texto do AutoML Gemini
Criação de modelos Você cria um objeto TrainingPipeline, que retorna um job de treinamento. Você cria um job de ajuste fino supervisionado, que retorna o job de ajuste.
Usar a biblioteca de cliente Há clientes de API diferentes para cada recurso de API. É possível criar um job de ajuste supervisionado para Gemini usando o SDK do Python, a API REST ou o console.
Como solicitar previsões Para solicitar previsões, chame o método predict() no recurso de Endpoint. Para solicitar previsões, primeiro busque o endpoint ajustado e depois use o método generate_content.
Endpoint de previsão on-line A seguir, substitua REGION pela região em que seu modelo de previsão está.
REGION-aiplatform.googleapis.com. Por exemplo:
us-central1-aiplatform.googleapis.com
No exemplo a seguir, substitua TUNING_JOB_REGION pela região em que o job de ajuste é executado.
TUNING_JOB_REGION-aiplatform.googleapis.com. Por exemplo:
us-central1-aiplatform.googleapis.com
Arquivos de esquema e definição Alguns campos de solicitação e resposta são definidos nos arquivos de esquema e definição. Os formatos de dados são definidos usando arquivos de esquema predefinidos. Isso proporciona flexibilidade para a API e os formatos de dados. O corpo da solicitação, os parâmetros do modelo e o corpo da resposta são iguais aos dos modelos do Gemini não ajustados. Consulte os exemplos de solicitações.
Nome do host aiplatform.googleapis.com aiplatform.googleapis.com
Nome do host regional Obrigatório. Por exemplo:
us-central1-aiplatform.googleapis.com
Obrigatório. Por exemplo:
us-central1-aiplatform.googleapis.com

A seguir