[Databricks Blog] Building Real-Time Product Search on Databricks

Nguồn: Databricks Blog Tóm tắt Bài viết từ Databricks trình bày kiến trúc end-to-end của hệ thống product search real-time, lấy ví dụ từ marketplace bán ô tô — nơi trong mili-giây phải trả về kết quả phù hợp ngân sách, vị trí địa lý, sở thích người dùng và mức độ liên quan. Đây không phải là lookup đơn giản mà là “real-time decision engine” cân bằng giữa revenue, click-through rate, latency và relevance....

15/04/2026 · 2 min · dhphong

[Hacker News] 5NF and Database Design

Nguồn: Database Design Book Knowledge Base Tóm tắt Bài viết từ tác giả Alexey Makhotkin (khoảng 3.900 từ) phân tích Fifth Normal Form (5NF) — dạng chuẩn thứ năm trong thiết kế cơ sở dữ liệu quan hệ — theo hướng tiếp cận thực tiễn, bác bỏ cách trình bày truyền thống thường gây nhầm lẫn. Tác giả chỉ ra rằng phần lớn tài liệu giảng dạy về 5NF, kể cả Wikipedia, sử dụng ví dụ không trực quan và thiếu nền tảng từ yêu cầu kinh doanh thực tế....

15/04/2026 · 2 min · dhphong

[Bytebytego] How LinkedIn Feed Uses LLMs to Serve 1.3 Billion Users

Nguồn: ByteByteGo Newsletter Tóm tắt LinkedIn Feed phải phục vụ 1.3 tỷ users với nội dung personalized — một bài toán recommendation system ở scale khổng lồ. ByteByteGo phân tích cách LinkedIn đã tích hợp Large Language Models vào pipeline hiện có để cải thiện relevance mà không sacrifice latency. Architecture tổng thể gồm nhiều layers: candidate retrieval (lọc hàng triệu posts xuống vài nghìn candidates), ranking (dùng LLMs để score candidates dựa trên user profile và engagement history), và serving (cache results và fallback mechanisms khi LLM latency không đáp ứng SLA)....

14/04/2026 · 1 min · dhphong