doabled
本站致力于IT相关技术的分享
在AWS EKS上结合Istio实现Zustand与Ktor应用的端到端追踪 在AWS EKS上结合Istio实现Zustand与Ktor应用的端到端追踪
一个看似简单的用户点击,在现代分布式系统中可能触发一场横跨前端、网络代理和多个后端服务的复杂风暴。当延迟飙升或错误发生时,定位问题根源的挑战呈指数级增长。以下是三个独立的日志片段,它们共同描述了一次失败的API调用: 前端浏览器控制台: [
2023-10-27
基于OpenTelemetry与Datadog构建覆盖React Native到EKS的全栈追踪体系 基于OpenTelemetry与Datadog构建覆盖React Native到EKS的全栈追踪体系
当一个用户在我们的React Native应用里反馈“列表加载缓慢”时,排查过程就像一场跨部门的“狼人杀”。前端指责GraphQL网关响应慢,后端说EKS集群的Pod CPU利用率正常,运维则表示网络延迟在可接受范围内。每个团队都守着自己的
2023-10-27
构建面向Hugging Face模型的高基数遥测架构:集成TimescaleDB与Datadog 构建面向Hugging Face模型的高基数遥测架构:集成TimescaleDB与Datadog
我们的生产环境运行着一组基于 Hugging Face Transformers 的模型服务,主要通过 FastAPI 暴露为 RESTful API。最初,我们仅使用 Datadog APM 进行基本的请求延迟和错误率监控。随着业务规模扩
2023-10-27
基于 Sentry 与 InfluxDB 实现组件级前端性能指标的精确度量 基于 Sentry 与 InfluxDB 实现组件级前端性能指标的精确度量
当团队维护的 UI 组件库被几十个项目同时使用时,性能问题的归因就成了一场噩梦。Sentry 报告了一个缓慢的 LCP 或一个超长的 TBT,但根本原因是什么?是业务代码的逻辑问题,还是我们某个核心组件,比如 <SuperGrid /
2023-10-27
构建从 Ant Design 到 JPA 的端到端可观测性:基于 Zipkin 和时序数据关联前端交互与后端慢查询 构建从 Ant Design 到 JPA 的端到端可观测性:基于 Zipkin 和时序数据关联前端交互与后端慢查询
我们的时序数据分析平台最近频繁收到投诉,核心问题只有一个:慢。用户在前端通过一个复杂的 Ant Design Pro 表单进行多维度筛选,点击查询后,图表加载的Spin组件要旋转10到30秒。前端团队用 Chrome DevTools 分析
2023-10-27