AI API 常见报错处理
接入 AI API 时,错误通常来自密钥、模型权限、额度、限流、上游状态或客户端参数。先看状态码,再看返回内容。
401 Unauthorized
通常是 API Key 缺失、格式不对或已禁用。检查 Authorization: Bearer sk-... 是否正确。
403 Forbidden
通常是账号、模型、客户端类型或上游权限限制。检查模型是否允许调用,是否命中渠道限制。
429 Too Many Requests
通常是 RPM、TPM、账号额度或并发限制。降低并发和上下文长度后再测试。
500 或上游错误
查看控制台请求日志,确认是网关错误、上游错误还是客户端请求体不兼容。
TTFT 首包慢
长上下文、工具调用、WebSocket 续聊、上游账号状态和模型负载都会增加首包时间。少量样本下 P95/P99 容易被单条慢请求拉高。