[Hacker News] Lessons from Building an OTel Normalizer for GenAI

Nguồn: groundcover Blog Tóm tắt OpenTelemetry (OTel) được quảng bá rộng rãi như chuẩn thống nhất cho GenAI observability, nhưng thực tế khi xây dựng normalizer thu thập telemetry từ nhiều SDK và LLM provider khác nhau, groundcover phát hiện ra rằng “chuẩn” này còn rất phân mảnh. Mỗi SDK — dù tuân thủ OTel GenAI semantic conventions — phát ra attributes với tên khác nhau, cấu trúc khác nhau và quirks riêng của từng provider....

30/04/2026 · 2 min · dhphong

[Kubernetes Blog] Kubernetes v1.36: Staleness Mitigation and Observability for Controllers

Nguồn: Kubernetes Blog Tóm tắt Kubernetes v1.36 giới thiệu tính năng giảm thiểu staleness (dữ liệu cũ) cho các controller, giải quyết một vấn đề lâu dài ảnh hưởng đến nhiều controller trong hệ sinh thái. Staleness xảy ra khi cache của controller chưa được cập nhật kịp với trạng thái thực tế của API server, dẫn đến các hành động không chính xác hoặc bị bỏ lỡ — thường chỉ được phát hiện khi đã xảy ra sự cố trong môi trường production....

29/04/2026 · 2 min · dhphong

[GitLab Blog] How to build CI/CD observability at scale

Nguồn: GitLab Blog Tóm tắt GitLab đã phát triển giải pháp CI/CD Observability như một phần trong chương trình Platform Excellence, nhằm chuyển đổi các pipeline metric thô thành thông tin vận hành có thể hành động được. Giải pháp này được xây dựng dành riêng cho các tổ chức chạy GitLab self-managed ở quy mô doanh nghiệp, nơi mà việc đo lường hiệu năng pipeline, mức độ sử dụng runner và thống kê deployment là bài toán thực tế cấp thiết....

29/04/2026 · 2 min · dhphong

[Hacker News] Moving a large-scale metrics pipeline from StatsD to OpenTelemetry / Prometheus

Nguồn: Airbnb Engineering Blog Tóm tắt Airbnb Engineering chia sẻ chi tiết về quá trình chuyển đổi pipeline metrics quy mô lớn từ hệ thống StatsD cũ sang OpenTelemetry kết hợp với VictoriaMetrics Agent (vmagent) và Prometheus. Đây là bài viết kỹ thuật chuyên sâu về observability infrastructure cho hệ thống phân tán ở quy mô hàng triệu sự kiện mỗi giây. StatsD là giao thức metrics đã có từ lâu — đơn giản, nhẹ, nhưng thiếu nhiều tính năng cần thiết cho hệ thống hiện đại như tagging linh hoạt, sampling có cấu trúc, và khả năng tích hợp với các hệ thống observability theo chuẩn mở....

16/04/2026 · 2 min · dhphong

[PlanetScale Blog] Enhanced tagging in Postgres Query Insights

Nguồn: PlanetScale Blog Tóm tắt PlanetScale đã cải tiến tính năng tagging trong Postgres Query Insights, cho phép developers gắn metadata phong phú hơn vào các database queries để dễ dàng xác định nguồn gốc và phân tích performance. Trước đây, tagging chỉ hỗ trợ thông qua application_name PostgreSQL connection parameter — đây là static metadata, giới hạn ở một key-value pair duy nhất mỗi connection. Với enhanced tagging, hệ thống sử dụng định dạng sqlcommenter — một open-source specification do Google phát triển....

14/04/2026 · 2 min · dhphong

[Cloudflare Engineering] Adopting OpenTelemetry for our logging pipeline

Nguồn: Cloudflare Engineering Tóm tắt Cloudflare đã chuyển đổi hệ thống logging nội bộ sang sử dụng OpenTelemetry (OTel), một tiêu chuẩn mở cho việc thu thập và xuất dữ liệu telemetry. Quyết định này được thúc đẩy bởi nhu cầu chuẩn hóa cách thu thập dữ liệu observability trên hàng trăm dịch vụ khác nhau, đồng thời giảm sự phụ thuộc vào các giải pháp độc quyền. Trước khi chuyển sang OpenTelemetry, Cloudflare sử dụng nhiều hệ thống logging khác nhau với các định dạng và giao thức không tương thích, gây ra khó khăn trong việc tổng hợp và phân tích dữ liệu....

13/04/2026 · 2 min · dhphong