System-Design

[Bytebytego] The Tech Stack Powering Wise

Nguồn: Bytebytego Tóm tắt Wise — nền tảng chuyển tiền quốc tế phục vụ hơn 15,6 triệu khách hàng và xử lý £36 tỷ mỗi quý — được xây dựng trên hơn 1.000 microservice với 850+ kỹ sư tổ chức theo mô hình autonomous squad. Yếu tố cốt lõi giữ toàn bộ hệ thống hoạt động nhất quán là một internal platform engineering strategy: chassis framework, Kubernetes CRP (Compute Runtime Platform), và Spinnaker với canary analysis tự động....

[Bytebytego] How Stripe Detects Fraudulent Transactions Within 100 ms

Nguồn: Bytebytego Tóm tắt Stripe Radar đánh giá hơn 1.000 tín hiệu về mỗi giao dịch trong vòng dưới 100 mili-giây, đạt độ chính xác 99,9% trên hàng tỷ giao dịch hợp lệ. Hệ thống đã trải qua nhiều lần cải tổ kiến trúc, trong đó quyết định đáng chú ý nhất là loại bỏ XGBoost dù biết rõ nó đang cải thiện độ chính xác — vì giữ lại nó cản trở mọi cải tiến khác....

[Bytebytego] EP212: Data Warehouse vs Data Lake vs Data Mesh

Nguồn: Bytebytego Tóm tắt Bài viết EP212 của ByteByteGo cung cấp một cái nhìn tổng quan về ba mô hình lưu trữ và quản lý dữ liệu phổ biến: Data Warehouse, Data Lake và Data Mesh. Lưu trữ dữ liệu là phần dễ thực hiện, nhưng quyết định nơi và cách tổ chức dữ liệu mới là thách thức thực sự trong các hệ thống quy mô lớn. Data Warehouse là kho dữ liệu có cấu trúc cao, được tối ưu cho truy vấn phân tích (OLAP)....

[Bytebytego] B-Trees vs LSM Trees: Comparison and Trade-Offs

Nguồn: Bytebytego Tóm tắt Mỗi database engine đều phải giải quyết một bài toán cơ bản: dữ liệu nằm trên đĩa và truy cập đĩa chậm. Cách tổ chức dữ liệu trên đĩa quyết định toàn bộ hiệu năng của hệ thống. Sau nhiều thập kỷ nghiên cứu, hai cách tiếp cận chính đã nổi lên là B-Trees và LSM Trees (Log-Structured Merge Trees). B-Trees giữ dữ liệu được sắp xếp trên đĩa để đọc nhanh, nhưng phải trả chi phí cho mỗi lần ghi....

[The Pragmatic Engineer] Designing Data-intensive Applications with Martin Kleppmann

Nguồn: The Pragmatic Engineer Tóm tắt Martin Kleppmann, tác giả cuốn “Designing Data-Intensive Applications” — một trong những cuốn sách kỹ thuật được tham chiếu nhiều nhất trong ngành — đã có cuộc phỏng vấn với Gergely Orosz (The Pragmatic Engineer) về scaling, bản cập nhật mới của cuốn sách, và tương lai của các hệ thống trong kỷ nguyên AI. Cuộc trò chuyện kéo dài khoảng 1 giờ 25 phút, đề cập đến những thay đổi căn bản trong thiết kế hệ thống khi AI trở thành thành phần cốt lõi....

[Hacker News] Nobody Got Fired for Uber's $8M Ledger Mistake?

Nguồn: The Payments Engineer Playbook Tóm tắt Uber đã viết lại hệ thống ledger (sổ cái) của mình năm lần trong vòng mười năm. Bài phân tích của Álvaro Durán chỉ ra rằng ít nhất một lần viết lại — quyết định chuyển sang DynamoDB vào năm 2017 — không những không cần thiết mà còn gây ra thiệt hại hàng triệu USD. Điều đáng lo ngại hơn: không ai bị sa thải vì quyết định này....

[Bytebytego] How DoorDash Launches a New Country in One Week

Nguồn: Bytebytego Tóm tắt DoorDash đã giải quyết bài toán mở rộng quốc tế bằng cách tái kiến trúc hệ thống onboarding Dasher từ một mớ if/else theo từng quốc gia thành một nền tảng module hóa. Trước đây, việc thêm một thị trường mới tốn hàng tháng kỹ thuật vì logic quốc gia nằm rải rác khắp codebase với ba phiên bản API tồn tại song song, trong đó V3 vẫn gọi xuống V2 handler và ghi vào V2 database tables....

[Bytebytego] EP211: How the JVM Works

Nguồn: blog.bytebytego.com Tóm tắt Newsletter EP211 của ByteByteGo tổng hợp nhiều chủ đề system design, trọng tâm là kiến trúc JVM (Java Virtual Machine). JVM là một layered runtime: bytecode được compile từ Java source, sau đó được interpreter thực thi hoặc JIT-compiled sang native machine code ở hot paths. Class loading, memory model (heap/metaspace/stack), và garbage collection là ba thành phần kiến trúc chính cần hiểu. JVM heap được chia thành các generation: Young Generation (Eden + Survivor spaces) chứa object mới, Old Generation (Tenured) chứa object sống lâu....

[Bytebytego] A Guide to Relational Database Design

Nguồn: ByteByteGo Newsletter Tóm tắt (Không thể truy cập nội dung đầy đủ — bài yêu cầu paid subscription) ByteByteGo xuất bản hướng dẫn toàn diện về thiết kế relational database, tập trung vào tư duy thiết kế trước khi viết bất kỳ dòng SQL nào. Phần preview cho thấy bài đặt ra các câu hỏi cốt lõi: thông tin nào xứng đáng có table riêng? Các table nên reference nhau như thế nào?...

[Databricks Blog] Building Real-Time Product Search on Databricks

Nguồn: Databricks Blog Tóm tắt Bài viết từ Databricks trình bày kiến trúc end-to-end của hệ thống product search real-time, lấy ví dụ từ marketplace bán ô tô — nơi trong mili-giây phải trả về kết quả phù hợp ngân sách, vị trí địa lý, sở thích người dùng và mức độ liên quan. Đây không phải là lookup đơn giản mà là “real-time decision engine” cân bằng giữa revenue, click-through rate, latency và relevance....

[Hacker News] 5NF and Database Design

Nguồn: Database Design Book Knowledge Base Tóm tắt Bài viết từ tác giả Alexey Makhotkin (khoảng 3.900 từ) phân tích Fifth Normal Form (5NF) — dạng chuẩn thứ năm trong thiết kế cơ sở dữ liệu quan hệ — theo hướng tiếp cận thực tiễn, bác bỏ cách trình bày truyền thống thường gây nhầm lẫn. Tác giả chỉ ra rằng phần lớn tài liệu giảng dạy về 5NF, kể cả Wikipedia, sử dụng ví dụ không trực quan và thiếu nền tảng từ yêu cầu kinh doanh thực tế....

[Bytebytego] How LinkedIn Feed Uses LLMs to Serve 1.3 Billion Users

Nguồn: ByteByteGo Newsletter Tóm tắt LinkedIn Feed phải phục vụ 1.3 tỷ users với nội dung personalized — một bài toán recommendation system ở scale khổng lồ. ByteByteGo phân tích cách LinkedIn đã tích hợp Large Language Models vào pipeline hiện có để cải thiện relevance mà không sacrifice latency. Architecture tổng thể gồm nhiều layers: candidate retrieval (lọc hàng triệu posts xuống vài nghìn candidates), ranking (dùng LLMs để score candidates dựa trên user profile và engagement history), và serving (cache results và fallback mechanisms khi LLM latency không đáp ứng SLA)....