Nguồn: Databricks Blog
Tóm tắt
Agentic analytics đại diện cho sự tiến hóa tiếp theo sau các copilot (text-to-SQL). Trong khi copilot chỉ phản hồi đúng câu hỏi được hỏi và dừng lại, AI agent có thể phân rã câu hỏi phức tạp thành sub-questions, tự viết và chạy queries, lặp lại dựa trên kết quả data, tự động phát hiện insight chưa được yêu cầu, và thực hiện action (tạo báo cáo, gửi alert).
Cốt lõi của agentic analytics là “agent loop”: Perceive (tiếp nhận câu hỏi và context về data environment) → Reason (lập kế hoạch: bảng nào cần query, join như thế nào) → Act (viết SQL, gọi tools) → Observe (đánh giá kết quả, quyết định có cần thêm bước không) → Lặp lại. Sự khác biệt then chốt: copilot thực hiện một lượt duy nhất, agent thực hiện nhiều lượt và tự điều chỉnh.
Những thách thức kỹ thuật của agentic analytics bao gồm: semantics của data (agent cần hiểu “revenue” nghĩa là gì trong context cụ thể, từ bảng nào); độ tin cậy của tools (query phải trả về kết quả nhất quán); error recovery (khi query fail, agent phải reason về nguyên nhân và thử approach khác); context length management; và guardrails ngăn agent chạy query quá tốn kém hoặc truy cập data không được phép.
Databricks tiếp cận vấn đề qua ba lớp: Genie (natural language analytics evolving toward agentic), Unity Catalog (data governance cung cấp context cho agent về data lineage và access control), và Databricks AI/BI (platform cung cấp tools cho agent). Vai trò của data analyst sẽ dịch chuyển từ trả lời câu hỏi cụ thể sang xây dựng infrastructure: định nghĩa metrics, curate data, evaluate agent output.