[Hacker News] B-trees and database indexes (2024)

Nguồn: PlanetScale Blog Tóm tắt PlanetScale xuất bản một deep dive về B-trees và cách chúng được sử dụng trong database indexes. Bài viết giải thích tại sao B-trees — không phải binary search trees hay hash tables — trở thành data structure mặc định cho hầu hết database indexes trong hơn 50 năm qua, từ InnoDB đến PostgreSQL đến RocksDB. Lý do cốt lõi là B-trees được thiết kế tối ưu cho block storage: chúng minimize số lần đọc đĩa (disk I/O) bằng cách pack nhiều keys vào mỗi node, matching với kích thước page của OS và disk sectors....

14/04/2026 · 1 min · dhphong

[Hacker News] The Future of Everything Is Lies, I Guess: Safety

Nguồn: Aphyr Tóm tắt Kyle Kingsbury (Aphyr) — tác giả của Jepsen distributed systems testing framework — tiếp tục series bài viết sắc bén về AI safety và cách các AI companies trình bày sản phẩm của họ. Với background là một trong những người có tiếng nói nhất trong distributed systems verification, Aphyr mang một lens độc đáo: ông biết rõ khoảng cách giữa claims về system correctness và reality....

14/04/2026 · 1 min · dhphong

[Bytebytego] How LinkedIn Feed Uses LLMs to Serve 1.3 Billion Users

Nguồn: Bytebytego Tóm tắt (Không thể truy cập nội dung đầy đủ — bài viết yêu cầu đăng ký trả phí trên Bytebytego) Bài viết phân tích kiến trúc AI của LinkedIn Feed — hệ thống phục vụ hơn 1.3 tỷ người dùng — và cách LinkedIn tích hợp LLM vào pipeline recommendation để cải thiện độ liên quan của nội dung hiển thị. Đây là chủ đề quan trọng trong distributed systems và large-scale ML inference....

14/04/2026 · 1 min · dhphong

[The Morning Paper] Elle: inferring isolation anomalies from experimental observations

Nguồn: The Morning Paper Tóm tắt Bài viết giới thiệu Elle, một công cụ kiểm tra cơ sở dữ liệu được thiết kế để phát hiện các bất thường về mức độ cô lập giao dịch thông qua quan sát thực nghiệm. Elle hoạt động bằng cách chạy các giao dịch thử nghiệm trên hệ thống cơ sở dữ liệu mục tiêu và phân tích lịch sử kết quả để suy ra xem hệ thống có tuân thủ các mức cô lập được quảng bá hay không....

13/04/2026 · 2 min · dhphong

[The Morning Paper] Seeing is believing: a client-centric specification of database isolation

Nguồn: The Morning Paper Tóm tắt Bài viết trình bày một đặc tả mới về mức độ cô lập (isolation) trong cơ sở dữ liệu từ góc nhìn phía client, thay vì góc nhìn phía server truyền thống. Cách tiếp cận này, được gọi là “client-centric specification”, định nghĩa các mức cô lập dựa trên những gì client thực sự quan sát được trong quá trình thực hiện giao dịch, chứ không dựa trên cách hệ thống xử lý nội bộ....

13/04/2026 · 2 min · dhphong