我们的文本生成模型推理服务开始出现问题。最初的症状是客户端报告的 P99 延迟无规律飙升,并伴有少量超时错误。Django 应用服务器的日志显示请求处理正常,Celery worker 的日志也未记录到任何异常崩溃。Prometheus 监
2023-10-27