[The Pragmatic Engineer] The Pulse: AI load breaks GitHub – why not other vendors?

Nguồn: The Pragmatic Engineer Tóm tắt GitHub đang trải qua giai đoạn reliability tệ nhất trong lịch sử gần đây: tháng 4/2026, uptime đo được bởi third-party tracker chỉ đạt 86% (zero nines), kèm theo một data integrity incident nghiêm trọng và nhiều outage liên tiếp. GitHub leadership giải thích nguyên nhân là do 3.5x tăng service load từ AI workloads — nhưng nhiều kỹ sư cho rằng đây là self-inflicted wounds....

01/05/2026 · 2 min · dhphong

[Pinterest Engineering] From Clicks to Conversions: Architecting Shopping Conversion Candidate Generation at Pinterest

Nguồn: Pinterest Engineering Tóm tắt Nhóm kỹ thuật Pinterest chia sẻ kiến trúc hệ thống tạo ra candidate (ứng viên) cho tính năng Shopping Conversion — hệ thống gợi ý sản phẩm không chỉ tối ưu hóa cho clicks mà còn cho conversions (tức là người dùng thực sự mua hàng). Đây là sự chuyển dịch quan trọng từ hệ thống recommendation truyền thống chỉ đo engagement sang hệ thống tối ưu hóa kết quả kinh doanh thực sự....

28/04/2026 · 2 min · dhphong

[Reddit Engineering] The Zero Trust Odyssey

Nguồn: Reddit Engineering Tóm tắt Reddit Engineering chia sẻ hành trình chuyển đổi sang mô hình bảo mật Zero Trust — một phương pháp tiếp cận hiện đại không tin tưởng bất kỳ kết nối nào mặc định, dù từ bên trong hay bên ngoài mạng nội bộ. Bài viết mô tả quá trình chuyển đổi từ kiến trúc bảo mật truyền thống dựa trên vành đai sang mô hình xác minh danh tính và quyền truy cập liên tục....

28/04/2026 · 2 min · dhphong

[Hacker News] Show HN: Free textbook on engineering thermodynamics

Nguồn: Hacker News Tóm tắt Một textbook miễn phí về nhiệt động lực học kỹ thuật được chia sẻ trên Hacker News. Sách được host tại thermodynamicsbook.com và là tài nguyên học thuật mở cho sinh viên kỹ thuật. (Không thể truy cập nội dung đầy đủ) 👉 Đọc bài gốc

27/04/2026 · 1 min · dhphong

[Discord Engineering] Measure Less to Learn More: Using Fewer, Higher-quality Metrics

Nguồn: Discord Engineering Tóm tắt Discord chia sẻ kinh nghiệm tái cấu trúc hệ thống metrics trong A/B testing để cải thiện chất lượng kết quả thực nghiệm. Vấn đề cốt lõi: khi số lượng metrics trong một experiment tăng lên, việc áp dụng Benjamini-Hochberg (BH) correction để kiểm soát false discovery rate buộc phải điều chỉnh ngưỡng p-value nghiêm ngặt hơn, dẫn đến recall giảm — tức là nhiều biến động thật sự bị bỏ qua....

25/04/2026 · 2 min · dhphong

[Anthropic Engineering] An update on recent Claude Code quality reports

Nguồn: Anthropic Engineering Tóm tắt Anthropic đã công bố phân tích hậu kiểm (postmortem) chi tiết về ba thay đổi riêng biệt đã ảnh hưởng đến chất lượng Claude Code trong vài tháng qua. Tất cả vấn đề đã được khắc phục kể từ ngày 20 tháng 4 (v2.1.116). Thứ nhất, ngày 4 tháng 3, mức reasoning effort mặc định của Claude Code đã bị hạ từ high xuống medium để giảm độ trễ — quyết định này sau đó bị hoàn tác vào ngày 7 tháng 4....

24/04/2026 · 2 min · dhphong

[Cloudflare Engineering] Making Rust Workers reliable: panic and abort recovery in wasm-bindgen

Nguồn: Cloudflare Engineering Tóm tắt Cloudflare Workers hỗ trợ Rust thông qua việc biên dịch sang WebAssembly (Wasm), nhưng Wasm có một số “sharp edges” khi xử lý lỗi. Khi một Rust Worker gặp panic hoặc abort không được xử lý, runtime có thể rơi vào trạng thái không xác định, gây ảnh hưởng đến các request tiếp theo — thậm chí “brick” Worker trong một khoảng thời gian. Nguyên nhân gốc rễ nằm ở wasm-bindgen, thư viện tạo bindings giữa Rust và JavaScript....

23/04/2026 · 2 min · dhphong

[OpenAI Blog] Speeding up agentic workflows with WebSockets in the Responses API

Nguồn: OpenAI Blog Tóm tắt OpenAI đã thêm hỗ trợ WebSockets vào Responses API, giải quyết một bottleneck quan trọng trong các agentic workflows. Trước đây, mỗi bước trong pipeline của agent phải thiết lập kết nối HTTP mới, gây ra latency tích lũy đáng kể khi agent thực hiện nhiều tool calls liên tiếp. Với WebSockets, client duy trì một persistent connection xuyên suốt toàn bộ vòng đời của agent session....

23/04/2026 · 1 min · dhphong

[The Pragmatic Engineer] Designing Data-intensive Applications with Martin Kleppmann

Nguồn: The Pragmatic Engineer Tóm tắt Martin Kleppmann, tác giả cuốn “Designing Data-Intensive Applications” — một trong những cuốn sách kỹ thuật được tham chiếu nhiều nhất trong ngành — đã có cuộc phỏng vấn với Gergely Orosz (The Pragmatic Engineer) về scaling, bản cập nhật mới của cuốn sách, và tương lai của các hệ thống trong kỷ nguyên AI. Cuộc trò chuyện kéo dài khoảng 1 giờ 25 phút, đề cập đến những thay đổi căn bản trong thiết kế hệ thống khi AI trở thành thành phần cốt lõi....

23/04/2026 · 1 min · dhphong

[Hacker News] Nobody Got Fired for Uber's $8M Ledger Mistake?

Nguồn: The Payments Engineer Playbook Tóm tắt Uber đã viết lại hệ thống ledger (sổ cái) của mình năm lần trong vòng mười năm. Bài phân tích của Álvaro Durán chỉ ra rằng ít nhất một lần viết lại — quyết định chuyển sang DynamoDB vào năm 2017 — không những không cần thiết mà còn gây ra thiệt hại hàng triệu USD. Điều đáng lo ngại hơn: không ai bị sa thải vì quyết định này....

22/04/2026 · 2 min · dhphong

[PlanetScale Blog] Approaches to tenancy in Postgres

Nguồn: PlanetScale Blog Tóm tắt Bài viết từ PlanetScale phân tích ba chiến lược phổ biến cho multi-tenancy trong Postgres: shared-schema (chia sẻ bảng, phân tách bằng cột tenant_id), schema-per-tenant (mỗi tenant có schema riêng), và database-per-tenant (mỗi tenant có logical database riêng). PlanetScale khuyến nghị rõ ràng shared-schema là phương pháp mặc định và là cách duy nhất đạt multi-tenancy thực sự — hai phương pháp còn lại chỉ chia sẻ tài nguyên, không chia sẻ bảng....

22/04/2026 · 2 min · dhphong

[Pinterest Engineering] Smarter URL Normalization at Scale: How MIQPS Powers Content Deduplication at Pinterest

Nguồn: Pinterest Engineering Tóm tắt Pinterest xử lý hàng triệu URL từ các merchant domain mỗi ngày, trong đó cùng một trang sản phẩm có thể xuất hiện dưới hàng chục biến thể URL khác nhau — với tracking parameter, session token, hay analytics tag khác nhau. Bài toán deduplication đòi hỏi một hệ thống chuẩn hóa URL đủ chính xác để nhận diện nội dung giống nhau dù URL có khác biệt....

21/04/2026 · 2 min · dhphong

[Salesforce Engineering] How Agentforce Lead Nurturing Agents Generated $100M+ Pipeline Under Rate-Limited Infrastructure

Nguồn: Salesforce Engineering Tóm tắt Nhóm kỹ thuật Salesforce đã xây dựng Agentforce Lead Nurturing Agents — một hệ thống agent tự trị chuyển đổi Sales Cloud từ một hệ thống lưu trữ dữ liệu thụ động thành một engine hành động chủ động. Hệ thống này đã tạo ra hơn 100 triệu USD pipeline, hơn 10.000 cơ hội bán hàng, và đóng góp vào 1.500 deal đã chốt thông qua automated workflow....

21/04/2026 · 2 min · dhphong

[Hacker News] Blue Origin's rocket reuse achievement marred by upper stage failure

Nguồn: Hacker News Tóm tắt Blue Origin đã đạt được thành tích quan trọng khi tái sử dụng thành công booster (tầng đẩy dưới) của tên lửa New Glenn, đánh dấu một bước tiến trong chiến lược phát triển tên lửa có thể tái sử dụng của công ty. Tuy nhiên, thành công này bị lu mờ bởi sự cố ở tầng trên (upper stage) trong cùng chuyến bay. Tầng trên của New Glenn đã gặp sự cố trong quá trình hoạt động, khiến nhiệm vụ không hoàn thành như kế hoạch....

20/04/2026 · 2 min · dhphong

[Hacker News] Ask HN: How did you land your first projects as a solo engineer/consultant?

Nguồn: Hacker News Tóm tắt Đây là thread thảo luận cộng đồng trên Hacker News, nơi các kỹ sư và nhà tư vấn độc lập chia sẻ kinh nghiệm về cách họ có được những dự án đầu tiên trong sự nghiệp tự do. Chủ đề này thu hút nhiều ý kiến đa dạng từ những người đã trải qua quá trình chuyển đổi từ làm việc toàn thời gian sang tư vấn độc lập....

19/04/2026 · 1 min · dhphong

[Palantir Blog] Frontend Engineering at Palantir: Polar Scaled Tiles in Zodiac

Nguồn: Palantir Blog Tóm tắt Đội kỹ sư frontend của Palantir chia sẻ giải pháp kỹ thuật cho một vấn đề tưởng chừng đơn giản trong Zodiac — thư viện 3D globe tự xây dựng trên Three.js: rendering chính xác ở vùng cực. Hệ thống map tiling truyền thống (Web Mercator) chia thế giới thành các ô vuông đều nhau theo độ kinh/vĩ, nhưng khi render trên hình cầu 3D, các ô này trở thành những tam giác mỏng hội tụ ở cực, tạo ra hàng nghìn geometry không cần thiết và làm frame rate sụp đổ....

16/04/2026 · 2 min · dhphong

[Pinterest Engineering] Finding zombies in our systems: A real-world story of CPU bottlenecks

Nguồn: Pinterest Engineering Tóm tắt Đội ngũ Kubernetes platform tại Pinterest đã trải qua cuộc điều tra kéo dài hơn ba tháng để xác định nguyên nhân gốc rễ khiến các Ray training job trên GPU bị crash do mất kết nối mạng. Vấn đề bắt đầu khi đội ML platform báo cáo rằng các distributed training job — thường chạy hàng giờ trên phần cứng GPU đắt tiền — gặp sự cố mạng ngắt quãng, dẫn đến tỉ lệ thành công giảm hơn 25%....

16/04/2026 · 2 min · dhphong

[PlanetScale Blog] Behind the scenes: How Database Traffic Control works

Nguồn: PlanetScale Blog Tóm tắt Database Traffic Control của PlanetScale được implement ở tầng database proxy — tất cả connections từ application đều đi qua proxy này trước khi đến MySQL hoặc PostgreSQL thực sự. Kiến trúc này cho phép PlanetScale intercept và kiểm soát toàn bộ queries trước khi chúng đến database, tạo ra khả năng kiểm soát real-time mà không cần thay đổi code ứng dụng. Khi một query đến proxy, nó đi qua rule evaluation pipeline gồm ba bước: rule matching (so sánh query với tất cả active rules), action determination (nếu nhiều rules match thì rule có priority cao nhất thắng), và action execution (throttle, block, hoặc kill)....

14/04/2026 · 2 min · dhphong

[PlanetScale Blog] Enhanced tagging in Postgres Query Insights

Nguồn: PlanetScale Blog Tóm tắt PlanetScale đã cải tiến tính năng tagging trong Postgres Query Insights, cho phép developers gắn metadata phong phú hơn vào các database queries để dễ dàng xác định nguồn gốc và phân tích performance. Trước đây, tagging chỉ hỗ trợ thông qua application_name PostgreSQL connection parameter — đây là static metadata, giới hạn ở một key-value pair duy nhất mỗi connection. Với enhanced tagging, hệ thống sử dụng định dạng sqlcommenter — một open-source specification do Google phát triển....

14/04/2026 · 2 min · dhphong

[PlanetScale Blog] Graceful degradation in Postgres

Nguồn: PlanetScale Blog Tóm tắt Graceful degradation là khả năng hệ thống tiếp tục hoạt động ở mức giảm sút khi một phần của nó gặp sự cố hoặc bị quá tải. Trong ngữ cảnh Postgres, điều này có nghĩa là ứng dụng vẫn có thể phục vụ người dùng ngay cả khi database đang bị stress hoặc không hoàn toàn sẵn sàng. Caching là hình thức phổ biến nhất của graceful degradation....

14/04/2026 · 2 min · dhphong