[Databricks Blog] Backstage with Lakebase

Nguồn: Databricks Blog Tóm tắt Trong ba thập kỷ qua, cơ sở dữ liệu vận hành (OLTP) và phân tích (OLAP) tồn tại song song như hai hệ thống riêng biệt, được kết nối qua các pipeline ETL. Databricks lập luận rằng sự tách biệt này bắt nguồn từ hạn chế vật lý — layout lưu trữ khác nhau, nhu cầu tính toán khác nhau — và ngày nay những ràng buộc đó đang dần biến mất khi storage được chia sẻ và compute trở thành serverless....

30/04/2026 · 2 min · dhphong

[Databricks Blog] Inside one of the first production deployments of Lakebase: LangGuard's agentic workflow governance engine

Nguồn: Databricks Blog Tóm tắt LangGuard là một công ty chuyên về AI governance, xây dựng hệ thống kiểm soát và giám sát quy trình làm việc của các AI agent trong môi trường production. Công ty đã trở thành một trong những khách hàng đầu tiên triển khai Lakebase — cơ sở dữ liệu mới nhất của Databricks được thiết kế cho các workload AI. Lakebase được xây dựng trên nền tảng Lakehouse Architecture của Databricks, tích hợp chặt chẽ với Delta Lake và Unity Catalog....

27/04/2026 · 2 min · dhphong

[Databricks Blog] Announcing the Public Preview of Lakeflow Designer

Nguồn: Databricks Blog Tóm tắt Databricks thông báo Public Preview của Lakeflow Designer, công cụ giao diện đồ họa để xây dựng và quản lý data pipeline trong nền tảng Databricks. Đây là phần mở rộng của sản phẩm Lakeflow, bộ công cụ data engineering của Databricks tích hợp ETL và orchestration. Lakeflow Designer hướng đến việc đơn giản hóa việc xây dựng pipeline cho cả data engineer và analyst không có kinh nghiệm viết code Spark phức tạp....

24/04/2026 · 1 min · dhphong

[Databricks Blog] Databricks partners with OpenAI on GPT-5.5

Nguồn: Databricks Blog Tóm tắt Databricks thông báo hợp tác chiến lược với OpenAI để tích hợp GPT-5.5 vào nền tảng Data Intelligence. Đây là sự kiện đáng chú ý vì Databricks trước đây được biết đến với việc hỗ trợ các mô hình open-source (DBRX, Llama) và là đối thủ cạnh tranh tiềm năng với OpenAI trong không gian AI doanh nghiệp. Quan hệ đối tác này cho phép khách hàng Databricks truy cập GPT-5....

24/04/2026 · 1 min · dhphong

[Databricks Blog] Stop Hand-Coding Change Data Capture Pipelines

Nguồn: Databricks Blog Tóm tắt Databricks giới thiệu tính năng AutoCDC from Snapshots, nhằm loại bỏ việc phải viết thủ công các pipeline Change Data Capture (CDC) phức tạp. Một senior data engineer từ công ty Fortune 500 cho biết 4 dòng code với AutoCDC đã thay thế được 1.500 dòng code tùy chỉnh mà họ đang duy trì trước đó. Change Data Capture (CDC) và Slowly Changing Dimensions (SCD) là nền tảng của các workload analytics và AI hiện đại — giúp giữ cho các bảng downstream luôn phản ánh dữ liệu vận hành đang thay đổi....

22/04/2026 · 2 min · dhphong

[Databricks Blog] Bridging Data Science and Marketing: Databricks Unveils Delta Sharing Integration for Adobe Experience Platform and Agentic Marketing Workflows

Nguồn: Databricks Blog Tóm tắt Databricks và Adobe công bố tích hợp Delta Sharing cho Adobe Experience Platform, kết hợp cùng Genie MCP (Model Context Protocol) với Adobe Experience Platform Agent Orchestrator. Mục tiêu là kích hoạt các agentic marketing workflow thời gian thực mà không cần sao chép hay dịch chuyển dữ liệu giữa hai hệ thống. Kiến trúc này giải quyết ba nút thắt lớn trong marketing hiện đại: latency (insights trong Databricks thường mất 24-48 giờ để đến các marketing system downstream), chi phí (di chuyển petabyte dữ liệu qua cloud tạo ra egress fee và chi phí lưu trữ trùng lặp), và governance (sao chép dữ liệu vào các platform khác gây mất kiểm soát về quyền truy cập)....

21/04/2026 · 2 min · dhphong

[Databricks Blog] Get hands on with agents, vibe coding and more at Data+ AI Summit

Nguồn: Databricks Blog Tóm tắt Databricks công bố chương trình hands-on tại Data+AI Summit 2026, tập trung vào các chủ đề nóng: AI agents, vibe coding (lập trình bằng ngôn ngữ tự nhiên), và data intelligence. Summit năm nay đặc biệt nhấn mạnh khía cạnh thực hành với các lab và workshop. Các session nổi bật bao gồm: xây dựng agentic workflow trên Databricks platform, sử dụng Mosaic AI cho fine-tuning và deployment, và khai thác Unity Catalog cho data governance trong môi trường multi-agent....

21/04/2026 · 1 min · dhphong

[Databricks Blog] Take Control: Customer-Managed Keys for Lakebase Postgres

Nguồn: Databricks Blog Tóm tắt Databricks Lakebase — dịch vụ Postgres managed trên nền Databricks — nay hỗ trợ Customer-Managed Keys (CMK) cho encryption at rest. Tính năng này cho phép doanh nghiệp tự quản lý encryption key thay vì phó mặc cho Databricks, đáp ứng yêu cầu compliance của các ngành tài chính, y tế, và chính phủ. Với CMK, Databricks không bao giờ có quyền truy cập vào plaintext encryption key....

21/04/2026 · 1 min · dhphong

[Databricks Blog] Mercedes-Benz Builds a Cross-Cloud Data Mesh with Delta Sharing and Intelligent Replication, Cutting Costs by 66%

Nguồn: Databricks Blog Tóm tắt Mercedes-Benz đã triển khai kiến trúc data mesh xuyên cloud sử dụng Databricks Delta Sharing kết hợp với cơ chế intelligent replication, đạt được mức giảm chi phí 66% so với mô hình trước đây. Đây là một trong những case study nổi bật về ứng dụng data mesh trong ngành automotive ở quy mô enterprise. Thách thức của Mercedes-Benz là dữ liệu trải rộng qua nhiều cloud provider và nhiều vùng địa lý, phục vụ các team khác nhau với nhu cầu truy cập và latency khác nhau....

20/04/2026 · 2 min · dhphong

[Databricks Blog] What Is a Transactional Database?

Nguồn: Databricks Blog Tóm tắt Databricks phát hành bài viết giải thích nền tảng về transactional database — các hệ thống cơ sở dữ liệu được thiết kế để xử lý các giao dịch ACID (Atomicity, Consistency, Isolation, Durability) một cách đáng tin cậy. Bài viết nhắm đến audience muốn hiểu sự khác biệt giữa OLTP systems và analytical/data warehouse systems mà Databricks thường phục vụ. Transactional database đảm bảo tính toàn vẹn khi nhiều thao tác liên quan được thực hiện như một đơn vị — commit tất cả hoặc rollback tất cả khi có lỗi....

20/04/2026 · 2 min · dhphong

[Databricks Blog] What is pgvector?

Nguồn: Databricks Blog Tóm tắt (Không thể truy cập nội dung đầy đủ) Bài viết từ Databricks giải thích pgvector — extension mã nguồn mở cho PostgreSQL cho phép lưu trữ và tìm kiếm vector embeddings. pgvector bổ sung kiểu dữ liệu vector vào PostgreSQL và hỗ trợ các toán tử tìm kiếm gần đúng (approximate nearest neighbor - ANN) như cosine similarity, dot product, và L2 distance. Ngữ cảnh xuất bản bài viết liên quan đến Databricks Lakebase — sản phẩm Postgres-as-a-service của Databricks — cho thấy công ty đang định vị pgvector như một giải pháp để tích hợp vector search trực tiếp vào PostgreSQL workloads hiện có, thay vì phải migrate sang một vector database chuyên dụng....

18/04/2026 · 1 min · dhphong

[Databricks Blog] Building Real-Time Product Search on Databricks

Nguồn: Databricks Blog Tóm tắt Bài viết từ Databricks trình bày kiến trúc end-to-end của hệ thống product search real-time, lấy ví dụ từ marketplace bán ô tô — nơi trong mili-giây phải trả về kết quả phù hợp ngân sách, vị trí địa lý, sở thích người dùng và mức độ liên quan. Đây không phải là lookup đơn giản mà là “real-time decision engine” cân bằng giữa revenue, click-through rate, latency và relevance....

15/04/2026 · 2 min · dhphong

[Databricks Blog] Agent Bricks: The Governed Enterprise Agent Platform

Nguồn: Databricks Blog Tóm tắt Databricks công bố Agent Bricks — nền tảng enterprise cho phép xây dựng, triển khai và quản trị các AI agent trong môi trường doanh nghiệp có yêu cầu tuân thủ cao. Điểm khác biệt chính của Agent Bricks so với các framework agent khác là tập trung vào governance — khả năng kiểm soát, giám sát, và audit hành động của agent trong hệ thống sản xuất....

14/04/2026 · 2 min · dhphong

[Databricks Blog] Agentic Reasoning in Practice: Making Sense of Structured and Unstructured Data

Nguồn: Databricks Blog Tóm tắt Bài viết từ Mosaic Research (nhóm nghiên cứu AI của Databricks) trình bày cách xây dựng hệ thống agentic reasoning có khả năng xử lý cả dữ liệu có cấu trúc (structured — bảng SQL, parquet) và phi cấu trúc (unstructured — văn bản, PDF, email). Đây là bài toán thực tế phức tạp vì hầu hết dữ liệu doanh nghiệp tồn tại ở dạng hỗn hợp....

14/04/2026 · 2 min · dhphong

[Databricks Blog] Lovable + Databricks: Build Data-Driven Apps at the Speed of Thought

Nguồn: Databricks Blog Tóm tắt Databricks công bố partnership với Lovable — một AI-powered app builder — để cho phép users tạo data-driven applications trực tiếp từ Databricks data assets mà không cần viết code frontend. Integration này nhắm vào data analysts và business users muốn build apps từ dữ liệu mà không cần engineering resources. Lovable sử dụng AI để generate React applications từ natural language descriptions, trong khi Databricks cung cấp the data layer: Unity Catalog cho data governance, SQL warehouses cho querying, và Databricks Apps platform cho hosting....

14/04/2026 · 1 min · dhphong

[Databricks Blog] What is Agentic Analytics?

Nguồn: Databricks Blog Tóm tắt Databricks giới thiệu khái niệm “Agentic Analytics” — một paradigm mới trong data analysis nơi AI agents tự động thực hiện toàn bộ analytics workflow: từ formulating questions, querying data, interpreting results, đến generating follow-up analyses mà không cần human intervention ở mỗi bước. Khác với traditional BI tools nơi analyst chạy queries và interpret results theo cách thủ công, hay ngay cả Text-to-SQL tools chỉ dịch natural language thành SQL, Agentic Analytics agents có thể iterate: chạy query đầu tiên, nhận kết quả, quyết định cần thêm data gì, chạy queries tiếp theo, và synthesize insights từ nhiều sources....

14/04/2026 · 1 min · dhphong

[Databricks Blog] What is Agentic Analytics?

Nguồn: Databricks Blog Tóm tắt Agentic analytics đại diện cho sự tiến hóa tiếp theo sau các copilot (text-to-SQL). Trong khi copilot chỉ phản hồi đúng câu hỏi được hỏi và dừng lại, AI agent có thể phân rã câu hỏi phức tạp thành sub-questions, tự viết và chạy queries, lặp lại dựa trên kết quả data, tự động phát hiện insight chưa được yêu cầu, và thực hiện action (tạo báo cáo, gửi alert)....

14/04/2026 · 2 min · dhphong