此页面由 Cloud Translation API 翻译。

排查 Monitoring API 问题

本指南介绍了使用 Google 文档 Monitoring API。

Monitoring API 是一组 Cloud API 中的一个。这些 API 共享一组通用的错误代码。如需查看 Cloud API 定义的错误代码列表以及处理错误的一般建议，请参阅处理错误。

使用 API Explorer 进行调试

API Explorer 是内置于 API 方法参考页面的微件。它可让您通过填写字段来调用方法；它不需要您编写代码。

如果调用方法时遇到问题，请使用 APIs Explorer (试用此 API) widget 调试问题。如需了解详情，请参阅 API Explorer。

以下是您可能会在 API 调用中看到的一些 Monitoring API 错误和消息：

404 NOT_FOUND，“在此服务器上找不到请求的网址”：网址的某些部分不正确。将网址与方法的参考页面上显示的方法的网址。此错误可能表示存在拼写错误（例如“project”而不是“projects”）或大小写错误（例如“TimeSeries”而不是“timeSeries”）。
401 UNAUTHENTICATED 中显示“用户无权访问该项目（或指标）”：此错误代码通常表示存在授权问题，但可能意味着项目 ID 或指标类型有误名称。检查拼写和大小写。

如果您没有使用 API Explorer，请尝试使用。如果您的 API 调用在 API Explorer 中可以正常运行，则您发出 API 调用的环境可能存在授权问题。前往 API 管理器页面进行验证说明已为您的项目启用 Monitoring API。
400 INVALID_ARGUMENT，“字段过滤器的值无效”：检查监控过滤器的拼写和格式。如需了解详情，请参阅 Monitoring 过滤器。
400 INVALID_ARGUMENT 包含“请求缺少字段间隔.endTime”：如果缺少结束时间或显示结束时间，格式不正确如果您使用的是 API Explorer，请不要用英文引号括住时间字段的值。

以下是一些有效的时间规范示例：
```
2024-05-11T01:23:45Z
2024-05-11T01:23:45.678Z
2024-05-11T01:23:45.678+05:00
2024-05-11T01:23:45.678-04:30
```

当 API 调用返回状态代码 200 和空响应时，请考虑以下操作：以下：

如果调用使用了过滤器，则该过滤器可能未匹配任何内容。过滤器匹配区分大小写。解析过滤条件请先只指定一个过滤器组件，例如 metric.type，并确认是否可收到结果。逐个添加其他过滤器组件以构建请求。

数据可能已过时。如需了解详情，请参阅数据保留。
数据可能尚未传播到 Monitoring。如需了解详情，请参阅指标数据的延迟时间。
间隔时间无效：
- 确认结束时间是否正确。
- 请确认开始时间是否正确，是否早于结束时间。如果开始时间缺失或格式错误，API 会将从“start-time”更改为“end-time”。对于 GAUGE 个指标，仅限此时间间隔与开始和结束时间正好是间隔时间的点匹配结束时间。适用于CUMULATIVE或DELTA指标，这些指标用于衡量时间段，则没有匹配的数据点。如需了解详情，请参阅时间间隔。

两个 Cloud API 错误代码说明了重试请求可能有用的特定情形：

503 UNAVAILABLE：如果问题是短期有效的或暂时性条件。
429 RESOURCE_EXHAUSTED：延迟后重试仅对具有基于时间的配额的长时间运行的后台作业有用，例如每 t 秒最多只能进行 n 次调用。如果该问题是短期存在或或已用尽基于数量的配额时。对于暂时性情况，不妨考虑容忍失败。对于与配额相关的请考虑减少配额用量或申请增加配额。

在编写可能会重试请求的代码时，首先请确保重试请求是安全的。

如果您的请求具有幂等性，则重试是安全的。幂等操作是指状态的任何变化不依赖于当前状态的操作。例如：

在实现代码以重试请求时，您不希望无限期地快速发出新请求。如果系统过载，则此方法会引起问题。

请改为使用截断指数退避算法方法。如果请求失败的原因是暂时过载而不是真正的不可用，则解决方案为减少负载。截断指数退避算法遵循以下一般模式：

实现指数退避的方法有很多。下面是一个示例，它会向 1000 毫秒的最小延迟增加不断增长的退避延迟。初始退避延迟为 2 毫秒，每次重试后，它会增加到 2^重试次数毫秒。

下表显示了使用初始值的重试间隔：

您可以在 n 次重试后或为应用花费的时间超过合理值时停止，以截断重试周期。

如需了解详情，请参阅维基百科文章指数退避算法。