[Cloudflare Engineering] Adopting OpenTelemetry for our logging pipeline
Nguồn: Cloudflare Engineering Tóm tắt Cloudflare đã chuyển đổi hệ thống logging nội bộ sang sử dụng OpenTelemetry (OTel), một tiêu chuẩn mở cho việc thu thập và xuất dữ liệu telemetry. Quyết định này được thúc đẩy bởi nhu cầu chuẩn hóa cách thu thập dữ liệu observability trên hàng trăm dịch vụ khác nhau, đồng thời giảm sự phụ thuộc vào các giải pháp độc quyền. Trước khi chuyển sang OpenTelemetry, Cloudflare sử dụng nhiều hệ thống logging khác nhau với các định dạng và giao thức không tương thích, gây ra khó khăn trong việc tổng hợp và phân tích dữ liệu....
[Cloudflare Engineering] Building Jetflow: a framework for flexible, performant data pipelines at Cloudflare
Nguồn: Cloudflare Engineering Tóm tắt Jetflow là một framework nội bộ được Cloudflare phát triển bằng ngôn ngữ Go để xử lý các pipeline dữ liệu quy mô lớn. Hệ thống này được thiết kế để giải quyết những thách thức đặc thù của Cloudflare, nơi hàng petabyte dữ liệu cần được xử lý, biến đổi và phân phối mỗi ngày với yêu cầu về độ trễ thấp và độ tin cậy cao....
[Cloudflare Engineering] Building Vectorize, a distributed vector database, on Cloudflare's Developer Platform
Nguồn: Cloudflare Engineering Tóm tắt Vectorize là cơ sở dữ liệu vector phân tán được Cloudflare xây dựng trực tiếp trên nền tảng Developer Platform của mình, cho phép các nhà phát triển lưu trữ và tìm kiếm vector embeddings với độ trễ thấp tại edge. Cơ sở dữ liệu này được thiết kế đặc biệt để hỗ trợ các ứng dụng AI và machine learning, nơi việc tìm kiếm ngữ nghĩa và tìm kiếm tương đồng (similarity search) là các thao tác cốt lõi....
[Cloudflare Engineering] Cloudflare just got faster and more secure, powered by Rust
Nguồn: Cloudflare Engineering Tóm tắt Cloudflare đã hoàn thành một dự án kỹ thuật đầy tham vọng: thay thế NGINX — phần mềm web server truyền thống đã phục vụ hạ tầng Cloudflare trong nhiều năm — bằng một proxy server hoàn toàn mới được viết bằng Rust, có tên mã là Pingora. Quyết định này xuất phát từ những hạn chế cơ bản của kiến trúc NGINX trong việc đáp ứng quy mô và yêu cầu đặc thù của Cloudflare, đặc biệt là mô hình xử lý kết nối per-worker-process khiến việc chia sẻ tài nguyên giữa các kết nối trở nên kém hiệu quả....
[Cloudflare Engineering] Eliminating Cold Starts 2: shard and conquer
Nguồn: Cloudflare Engineering Tóm tắt Bài viết này là phần tiếp theo trong chuỗi bài về việc loại bỏ cold starts trong Cloudflare Workers. Cloudflare đã giải quyết vấn đề cold start thông qua kỹ thuật “pre-warming” isolates trước khi yêu cầu thực sự đến, nhưng vẫn còn tồn tại những trường hợp gây ra độ trễ khởi động đáng kể, đặc biệt liên quan đến TLS handshake và quá trình thiết lập kết nối....
[Cloudflare Engineering] Finding the grain of sand in a heap of Salt
Nguồn: Cloudflare Engineering Tóm tắt Bài viết mô tả cách nhóm SRE của Cloudflare đã điều tra và xử lý một sự cố kỹ thuật phức tạp liên quan đến SaltStack — hệ thống quản lý cấu hình (configuration management) được sử dụng rộng rãi trong hạ tầng Cloudflare để quản lý hàng nghìn máy chủ. Sự cố xuất phát từ một vấn đề tinh tế và khó phát hiện trong quá trình thực thi Salt state, dẫn đến hành vi không mong muốn trên một tập con máy chủ trong mạng lưới toàn cầu....
[Cloudflare Engineering] Improving platform resilience at Cloudflare through automation
Nguồn: Cloudflare Engineering Tóm tắt Cloudflare đã phát triển hệ thống tự động hóa toàn diện để cải thiện khả năng phục hồi của nền tảng Workers, tập trung vào việc phát hiện, ứng phó và phục hồi từ các sự cố mà không cần can thiệp thủ công. Khi vận hành ở quy mô hàng triệu yêu cầu mỗi giây trên hàng trăm địa điểm trên toàn cầu, ngay cả những sự cố nhỏ cũng có thể có tác động rất lớn nếu không được xử lý nhanh chóng....
[Cloudflare Engineering] Inside Gen 13: how we built our most powerful server yet
Nguồn: Cloudflare Engineering Tóm tắt Bài viết của Cloudflare mô tả chi tiết quá trình thiết kế và xây dựng thế hệ máy chủ thứ 13 (Gen 13), được mô tả là máy chủ mạnh nhất từ trước đến nay của công ty. Cloudflare theo dõi sát sao sự phát triển của phần cứng và thường xuyên cập nhật cơ sở hạ tầng để đảm bảo hiệu suất tối ưu cho mạng lưới phân phối nội dung và bảo mật toàn cầu của mình....
[Cloudflare Engineering] Launching Cloudflare's Gen 13 servers: trading cache for cores for 2x edge compute performance
Nguồn: Cloudflare Engineering Tóm tắt Cloudflare đã ra mắt thế hệ máy chủ thứ 13 (Gen 13) với thiết kế hoàn toàn mới, đánh dấu một bước chuyển đổi chiến lược quan trọng trong kiến trúc phần cứng tại các điểm hiện diện mạng (PoP) toàn cầu. Thay vì tối ưu hóa bộ nhớ đệm (cache) như các thế hệ trước, Gen 13 ưu tiên tăng số lượng nhân xử lý (CPU cores) để đáp ứng nhu cầu ngày càng cao về tính toán tại biên mạng (edge compute)....
[Cloudflare Engineering] Safe in the sandbox: security hardening for Cloudflare Workers
Nguồn: Cloudflare Engineering Tóm tắt Cloudflare Workers sử dụng kiến trúc sandbox dựa trên V8 isolates để cách ly mã thực thi của các khách hàng khác nhau trên cùng một máy chủ vật lý. Bài viết này mô tả chi tiết các biện pháp bảo mật bổ sung được triển khai để tăng cường độ an toàn của môi trường thực thi, vượt ra ngoài những gì V8 cung cấp mặc định....
[Cloudflare Engineering] Shedding old code with ecdysis: graceful restarts for Rust services at Cloudflare
Nguồn: Cloudflare Engineering Tóm tắt Cloudflare đã phát triển một thư viện nội bộ có tên “ecdysis” — lấy cảm hứng từ quá trình lột xác của côn trùng — để giải quyết bài toán khởi động lại dịch vụ một cách liền mạch (graceful restart) cho các ứng dụng viết bằng Rust. Trong môi trường sản xuất quy mô lớn, việc cập nhật hoặc khởi động lại dịch vụ mà không làm gián đoạn các kết nối đang hoạt động là yêu cầu cực kỳ quan trọng....
[Cloudflare Engineering] The most-seen UI on the Internet? Redesigning Turnstile and Challenge Pages
Nguồn: Cloudflare Engineering Tóm tắt Cloudflare đã tiến hành thiết kế lại toàn diện giao diện người dùng (UI) của Turnstile và các trang Challenge — những giao diện được ước tính là xuất hiện nhiều nhất trên Internet, với hàng tỷ lượt hiển thị mỗi ngày. Đây là lần cải tiến đáng kể nhất kể từ khi Cloudflare ra mắt hệ thống xác thực CAPTCHA thay thế, nhằm mang lại trải nghiệm người dùng tốt hơn trong khi vẫn duy trì hiệu quả bảo mật cao trong việc phân biệt người dùng thật với bot....
[Hacker News] I ran Gemma 4 as a local model in Codex CLI
Nguồn: Hacker News / Daniel Vaughan Tóm tắt Bài viết mô tả quá trình chạy mô hình Gemma 4 của Google cục bộ thông qua công cụ Codex CLI của OpenAI. Tác giả sử dụng Ollama để tải và chạy mô hình Gemma 4 trên máy tính cá nhân, sau đó cấu hình Codex CLI để kết nối với máy chủ Ollama chạy cục bộ thay vì sử dụng API của OpenAI....
[The Morning Paper] Bias in word embeddings
Nguồn: The Morning Paper Tóm tắt Bài viết phân tích vấn đề thiên kiến (bias) trong các mô hình word embedding, dựa trên nghiên cứu học thuật về cách các biểu diễn từ ngữ trong không gian vector phản ánh và khuếch đại các định kiến xã hội có trong dữ liệu huấn luyện. Các mô hình như Word2Vec và GloVe được huấn luyện trên lượng lớn văn bản từ internet, nơi chứa đựng nhiều thiên kiến về giới tính, chủng tộc và các yếu tố nhân khẩu học khác....
[The Morning Paper] Elle: inferring isolation anomalies from experimental observations
Nguồn: The Morning Paper Tóm tắt Bài viết giới thiệu Elle, một công cụ kiểm tra cơ sở dữ liệu được thiết kế để phát hiện các bất thường về mức độ cô lập giao dịch thông qua quan sát thực nghiệm. Elle hoạt động bằng cách chạy các giao dịch thử nghiệm trên hệ thống cơ sở dữ liệu mục tiêu và phân tích lịch sử kết quả để suy ra xem hệ thống có tuân thủ các mức cô lập được quảng bá hay không....
[The Morning Paper] Seeing is believing: a client-centric specification of database isolation
Nguồn: The Morning Paper Tóm tắt Bài viết trình bày một đặc tả mới về mức độ cô lập (isolation) trong cơ sở dữ liệu từ góc nhìn phía client, thay vì góc nhìn phía server truyền thống. Cách tiếp cận này, được gọi là “client-centric specification”, định nghĩa các mức cô lập dựa trên những gì client thực sự quan sát được trong quá trình thực hiện giao dịch, chứ không dựa trên cách hệ thống xử lý nội bộ....
A Canonical Generalization of OBDD
Nguồn: Hacker News Bài báo học thuật trên arXiv đề xuất một tổng quát hóa chính tắc của cấu trúc dữ liệu OBDD (Ordered Binary Decision Diagram) — một công cụ quan trọng trong verification hình thức và tổng hợp logic. Nghiên cứu này có tiềm năng mở rộng khả năng biểu diễn và xử lý các bài toán logic phức tạp hơn so với OBDD truyền thống. Xem bài gốc để biết thêm chi tiết về lý thuyết và bằng chứng toán học....
All elementary functions from a single binary operator
Nguồn: Hacker News Nghiên cứu toán học trên arXiv chứng minh rằng tất cả các hàm sơ cấp (elementary functions) như sin, cos, exp, log… đều có thể được xây dựng từ một toán tử nhị phân duy nhất. Kết quả này có ý nghĩa lý thuyết sâu sắc về nền tảng của toán học tính toán và có thể ảnh hưởng đến thiết kế của các hệ thống tính toán tượng trưng (symbolic computation)....
Apple's accidental moat: How the "AI Loser" may end up winning
Nguồn: Hacker News Bài phân tích lập luận rằng dù Apple thường bị xem là “kẻ thua cuộc” trong cuộc đua AI so với Google, Microsoft hay Meta, nhưng hệ sinh thái phần cứng và privacy-first approach của họ có thể tạo ra một lợi thế cạnh tranh vô hình (moat) về lâu dài. Với chip Apple Silicon và on-device AI, Apple có thể định vị mình là nền tảng AI đáng tin cậy nhất về quyền riêng tư....
Bring Back Idiomatic Design
Nguồn: Hacker News Bài luận của John Loeber kêu gọi quay lại triết lý “idiomatic design” — thiết kế tuân theo quy ước và ngôn ngữ thị giác đặc trưng của từng nền tảng thay vì xu hướng đồng nhất hóa mọi UI theo phong cách flat/generic hiện nay. Tác giả lập luận rằng khi mọi app trông giống nhau, người dùng mất đi các tín hiệu quen thuộc giúp họ điều hướng nhanh....