[Google Engineering Blog] Speeding Up AI: Bringing Google Colossus to PyTorch via GCSFS and Rapid Bucket

Nguồn: Google Engineering Blog Tóm tắt Google công bố tích hợp Rapid Storage — dựa trên kiến trúc lưu trữ Colossus (cùng hệ thống file system vận hành YouTube và Google Search) — trực tiếp vào PyTorch ecosystem thông qua giao diện chuẩn fsspec. Rapid Bucket là giải pháp high-performance object storage trong dedicated zonal buckets, thay thế legacy REST API bằng persistent gRPC bidirectional streams, đạt throughput 15+ TiB/s, latency dưới 1ms cho random reads/appends, và 20M+ QPS....

30/04/2026 · 2 min · dhphong

[Hacker News] Why Zip drives dominated the 90s, then vanished almost overnight

Nguồn: XDA Developers Tóm tắt Ổ đĩa Zip của Iomega từng là giải pháp lưu trữ di động thống trị trong thập niên 1990, với dung lượng 100MB vượt trội so với đĩa mềm thông thường chỉ có 1.44MB. Thiết bị này nhanh chóng trở thành tiêu chuẩn trong các văn phòng và studio sáng tạo, được sử dụng rộng rãi để chia sẻ tập tin lớn như ảnh và video....

19/04/2026 · 1 min · dhphong

[Hacker News] Healthchecks.io Now Uses Self-hosted Object Storage

Nguồn: Healthchecks.io Blog Tóm tắt Healthchecks.io — dịch vụ giám sát cron job — đã chuyển từ object storage dạng managed (OVHcloud, rồi UpCloud) sang tự vận hành bằng Versity S3 Gateway đặt trên Btrfs filesystem. Quyết định này được đưa ra sau nhiều năm gặp sự cố về hiệu năng và timeout với các nhà cung cấp bên thứ ba. Hệ thống hiện lưu trữ 14 triệu object với tổng dung lượng 119GB, xử lý trung bình 30 lần upload mỗi giây và spike lên đến 150 lần/giây....

18/04/2026 · 2 min · dhphong

[Hacker News] Backblaze has stopped backing up your data

Nguồn: rareese.com Tóm tắt Bài viết cáo buộc rằng Backblaze — dịch vụ backup đám mây nổi tiếng với gói $99/năm dung lượng không giới hạn — đã âm thầm thay đổi cách hoạt động theo hướng không còn backup đầy đủ dữ liệu của người dùng. Tác giả phát hiện ra điều này sau khi thử khôi phục dữ liệu và nhận thấy nhiều file bị thiếu. Nội dung bài viết mô tả chi tiết quá trình điều tra: tác giả kiểm tra backup logs, so sánh file counts, và liên hệ support....

14/04/2026 · 2 min · dhphong

[Cloudflare Engineering] Building Vectorize, a distributed vector database, on Cloudflare's Developer Platform

Nguồn: Cloudflare Engineering Tóm tắt Vectorize là cơ sở dữ liệu vector phân tán được Cloudflare xây dựng trực tiếp trên nền tảng Developer Platform của mình, cho phép các nhà phát triển lưu trữ và tìm kiếm vector embeddings với độ trễ thấp tại edge. Cơ sở dữ liệu này được thiết kế đặc biệt để hỗ trợ các ứng dụng AI và machine learning, nơi việc tìm kiếm ngữ nghĩa và tìm kiếm tương đồng (similarity search) là các thao tác cốt lõi....

13/04/2026 · 2 min · dhphong