1. 并发数标准
接口类型 |
合理并发范围 |
普通业务接口 ️ |
50-200 并发 |
高性能接口 ⚡ |
200-500 并发 |
特殊优化接口 |
500-1000 并发 |
2. 响应时间标准
接口类型 |
响应时间(P95) |
普通接口 ️ |
95%请求在500ms内完成 |
高性能接口 ⚡ |
95%请求在200ms内完成 |
关键接口 |
95%请求在100ms内完成 |
响应时间分布建议
- 0-100ms: 30%-50%
- 100-500ms: 40%-60%
- 500ms以上: <10%
3. ✅ 成功率标准
项目 |
指标要求 |
成功率 |
≥99.99% |
错误率 |
≤0.01% |
4. 吞吐量(TPS)标准
接口类型 |
吞吐量(请求/秒) |
普通接口 ️ |
100-500 请求/秒 |
高性能接口 ⚡ |
500-2000 请求/秒 |
特殊优化接口 |
2000+ 请求/秒 |
5. 不同应用场景下的性能建议
应用场景 |
建议并发 |
目标响应时间 |
目标吞吐量(请求/秒) |
普通业务系统 ️ |
50-100 |
<500ms |
100-300 |
电商系统 |
100-200 |
<300ms |
300-800 |
金融系统 |
50-100 |
<200ms |
200-500 |
6. 压测参考标准
项目 |
参考标准 |
并发增长方式 |
每5分钟提升20%并发,观察系统瓶颈 |
压测时长 |
稳态阶段至30分钟,验证系统长时间稳定性 |
关键指标监控 |
- 平均响应时间符合目标 - P95达标 - 错误率低于0.01% |
CPU、内存、连接数监控 ️ |
CPU利用率<80%,内存使用合理,连接池无明显异常 |
极限测试 |
推到资源极限,记录崩溃点(供扩容参考) |
TPS变化监测 |
TPS曲线基本平稳,无大幅折跌 |
队列长度监测 |
队列/线程池排队长度保持在最大容量80%以内 |
7. 报警阀值建议
监控项 |
报警阀值 |
备注 |
响应时间 |
P95超过目标上限1.2倍 |
例如普通接口超过600ms报警 |
错误率 |
错误率>0.05% |
包括HTTP 5xx和应用层异常 |
成功率 |
成功率低于99.95% |
连续3分钟内触发报警 |
CPU利用率 ️ |
超过85%持续5分钟 |
结合实例数量判断是否扩容 |
内存使用率 |
超过80%持续5分钟 |
注意内存泄漏、异常增长 |
数据库连接池占用率 |
超过90%持续3分钟 |
容易引发接口阻塞 |
队列积压 |
队列排队长度超80%容量且持续增长 |
可能导致线程池或消息拥堵 |
8. ️ 接口分类管理标准
为确保资源优先分配和性能优化,接口按照重要性划分如下:
接口分类 |
说明 |
性能要求 |
核心接口 |
交易、支付、下单等直接影响收入的数据操作 |
响应时间<100ms,成功率≥99.99% |
重要接口 |
登录、账户管理、查询等用户高频操作 |
响应时间<200ms,成功率≥99.95% |
普通接口 ️ |
列表展示、辅助查询、后台管理接口等 |
响应时间<500ms,成功率≥99.9% |
核心接口需优先保障资源,异常时触发快速升级处理。
✨ 总结
- 性能目标清晰量化,不同接口分类有不同要求。
- 压测流程标准化,确保上线前发现潜在问题。
- 报警机制提前设定,实现故障快速发现与响应。
- 接口分类管理,重要业务接口优先优化和保障。