Amostragem de trace

Este documento apresenta o conceito de amostragem, que se refere a se os dados de uma span são enviados para o Cloud Trace. Quando os dados para um período é enviado ao Cloud Trace, esse período é amostrado. Quando os dados de cada intervalo em um rastro são registrados, o rastro é concluído. No entanto, os rastros geralmente têm extensões ausentes porque cada componente instrumentado em um sistema de rastreamento distribuído decide de forma independente se vai registrar ou não o intervalo que está processando.

Embora cada componente tome a própria decisão sobre se o intervalo que está processando é amostrado, essa decisão pode ser influenciada pela decisão de amostragem do componente pai. Por exemplo, suponha que cada componente tenha uma regra que diz "se o período pai tiver amostragem, faça uma amostra do período atual; caso contrário, amostra de 50% dos períodos". Nesse cenário, as seguintes condições são verdadeiras:

  • O período raiz determina se todos os períodos no trace são amostrados.
  • Quando o período raiz é amostrado, todos os períodos no trace são amostrados. Portanto, o rastreamento está concluído.

Os componentes podem transmitir a decisão de amostragem para o filho usando o contexto. Por exemplo, no World Wide Web Consortium (W3C) Cabeçalho traceparent, a sinalização sampled armazena a decisão de amostragem do elemento pai.

Não confunda amostragem com propagação de contexto. A amostragem se refere a se um componente registra dados sobre um período. A propagação de contexto se refere a se as informações sobre o período, como o ID do período, são transmitidas para componentes filhos.

Estratégias de amostragem

As decisões de amostragem podem ser baseadas na cabeça ou na cauda. Na amostragem com base na cabeça, a decisão de amostragem é feita quando a solicitação é recebida pelo componente que processa o período. Na amostragem baseada em cauda, a decisão de amostragem é adiada até que todo o trace esteja disponível.

Você pode encontrar a frase "amostragem de 100%" na documentação de sistemas de rastreamento distribuído. Essa frase pode ser aplicada a um trace componente. Quando aplicado a um trace, significa que todos os períodos foram amostrados ou, de forma equivalente, que o trace está completo. Quando aplicada a um componente, isso significa que o componente cria amostras de cada período que processa.

Amostragem com base na cabeça

Os samplers baseados em cabeça geralmente são configurados para sempre amostrar intervalos ou usar uma estratégia de amostragem probabilística:

  • Com configurações sempre de exemplo, todos os componentes que podem gravar dados de trace, coletar amostras dos períodos que eles de desenvolvimento de software. O ideal é que todos os traces estejam concluídos, e, portanto, você tem as informações necessárias para solucionar falhas. Esse tipo de configuração pode fazer com que você exceda as cotas ou os limites de custo de armazenamento.

  • Com a amostragem probabilística, nem todos os períodos são amostrados. O comportamento real dessa abordagem depende da implementação do componente. Em algumas implementações, todos os spans têm a mesma probabilidade de serem amostrados. Em outros, a decisão de amostragem do elemento pai influencia se um período é amostrado.

Os rastros podem não conter todos os intervalos. Isso pode ser esperado devido ao uso de amostragem probabilística ou pode ser devido à cota ou a componentes que processam uma solicitação, mas não amostram o período.

Amostragem baseada na cauda

O Cloud Trace não oferece suporte à amostragem baseada em cauda. As decisões de amostragem precisam ser feitas nos componentes que enviam dados para o Cloud Trace.

Se você quiser usar a amostragem baseada em cauda, use um servidor intermediário que recebe informações de rastreamento que transmitem dados para o Cloud Trace depois de tomar uma decisão de amostragem. Por exemplo, é possível usar o coletor do OpenTelemetry com o processador de amostragem de cauda para tomar uma decisão de amostragem atrasada.

Se você planeja usar a amostragem de cauda, considere o seguinte:

  • É necessário armazenar todos os períodos em um trace antes de decidir sobre a amostragem. Portanto, talvez você precise de uma grande quantidade de armazenamento temporário ou incorra em outras despesas gerais.
  • Em geral, todos os componentes que podem gerar períodos para o trace precisam coordenada. Normalmente, os desenvolvedores que usam o OpenTelemetry encaminham todos os spans do mesmo ID de rastreamento para o mesmo coletor.

Amostragem e serviços do Google Cloud

Cada serviço do Google Cloud toma as próprias decisões de amostragem, e nem todos os serviços do Google Cloud fazem amostragem. Ou seja, um serviço pode nunca enviar para o Cloud Trace.

Quando um serviço do Google Cloud oferece suporte à amostragem, esse serviço normalmente implementa o seguinte:

  • Uma taxa de amostragem padrão.
  • Um mecanismo para usar a decisão de amostragem do elemento pai como uma dica fazer uma amostra do período.
  • Taxa de amostragem máxima.

Para solicitar que um serviço do Google Cloud adicione suporte à amostragem, use o Google Issue Tracker.

A seguir