Nguồn: Healthchecks.io Blog
Tóm tắt
Healthchecks.io — dịch vụ giám sát cron job — đã chuyển từ object storage dạng managed (OVHcloud, rồi UpCloud) sang tự vận hành bằng Versity S3 Gateway đặt trên Btrfs filesystem. Quyết định này được đưa ra sau nhiều năm gặp sự cố về hiệu năng và timeout với các nhà cung cấp bên thứ ba.
Hệ thống hiện lưu trữ 14 triệu object với tổng dung lượng 119GB, xử lý trung bình 30 lần upload mỗi giây và spike lên đến 150 lần/giây. Btrfs được chọn thay vì ext4 vì không có giới hạn inode — điều cực kỳ quan trọng khi lưu hàng chục triệu file nhỏ (kích thước trung bình 8KB).
Versity S3 Gateway hoạt động theo nguyên tắc đơn giản: PutObject tạo file, GetObject đọc file, DeleteObject xóa file — không cần database metadata riêng biệt, nâng cấp chỉ cần thay binary và restart systemd. Dữ liệu được đặt trên hai ổ NVMe RAID 1, sync rsync 2 tiếng một lần sang backup server, và backup toàn bộ mỗi ngày với mã hóa trước khi lưu off-site.
Sau khi chuyển đổi, độ trễ S3 giảm rõ rệt, hàng đợi upload bị tồn đọng biến mất và không còn lỗi timeout. Tác giả — đây là dự án do một người duy nhất vận hành — nhấn mạnh rằng yếu tố quyết định là sự đơn giản trong vận hành, không phải hiệu năng hay chi phí thuần túy.