[Hacker News] Show HN: OSS Agent I built topped the TerminalBench on Gemini-3-flash-preview

Nguồn: Hacker News Tóm tắt Dirac là một AI agent mã nguồn mở được xây dựng để hoạt động trong môi trường terminal, và đã đạt thứ hạng đầu bảng trên TerminalBench khi sử dụng Gemini-3-flash-preview làm LLM backend. TerminalBench là một benchmark đánh giá khả năng của AI agent trong việc thực hiện các tác vụ thực tế trên hệ thống Unix/Linux. Dirac được thiết kế với kiến trúc đơn giản nhưng hiệu quả, tập trung vào khả năng sử dụng các công cụ terminal như shell, file system, và các tiện ích Unix....

27/04/2026 · 1 min · dhphong

[Microsoft Dev Blogs] Securing MCP: A Control Plane for Agent Tool Execution

Nguồn: Microsoft Dev Blogs Tóm tắt Model Context Protocol (MCP) đang trở thành chuẩn phổ biến để AI agents khám phá và sử dụng các tools bên ngoài — từ databases, APIs đến file systems. Tuy nhiên, MCP standardize execution surface mà không định nghĩa cách surface đó được quản trị: tool definitions được đưa trực tiếp vào model, và không có điểm nào để đánh giá policy trước khi một tool call được thực thi....

23/04/2026 · 2 min · dhphong