Nguồn: Databricks Blog

Tóm tắt

Mercedes-Benz đã triển khai kiến trúc data mesh xuyên cloud sử dụng Databricks Delta Sharing kết hợp với cơ chế intelligent replication, đạt được mức giảm chi phí 66% so với mô hình trước đây. Đây là một trong những case study nổi bật về ứng dụng data mesh trong ngành automotive ở quy mô enterprise.

Thách thức của Mercedes-Benz là dữ liệu trải rộng qua nhiều cloud provider và nhiều vùng địa lý, phục vụ các team khác nhau với nhu cầu truy cập và latency khác nhau. Mô hình replication truyền thống — sao chép toàn bộ dataset sang từng team/region — tốn kém và khó quản lý governance khi số lượng data product tăng lên.

Giải pháp sử dụng Delta Sharing — giao thức open source của Databricks cho phép chia sẻ dữ liệu live giữa các organization mà không cần copy dữ liệu. Intelligent replication engine phân tích access patterns để quyết định dataset nào cần được replicate vs. chia sẻ live qua Delta Sharing, cân bằng giữa latency và chi phí lưu trữ.

Kết quả đạt được: chi phí storage và egress giảm 66%, đồng thời cải thiện data freshness vì một số pipeline không còn phải chờ batch replication job hoàn thành. Kiến trúc này cho thấy Delta Sharing có thể là nền tảng thực tiễn để triển khai data mesh trong môi trường multi-cloud enterprise.

👉 Đọc bài gốc