[Hacker News] Our eighth generation TPUs: two chips for the agentic era

Nguồn: Google Blog Tóm tắt Google đã công bố thế hệ TPU thứ tám với hai chip chuyên biệt: TPU 8t dành cho huấn luyện mô hình quy mô lớn và TPU 8i dành cho inference độ trễ thấp. Đây là kết quả của hơn một thập kỷ phát triển phần cứng AI tùy chỉnh, được thiết kế đặc biệt cho kỷ nguyên các hệ thống AI có khả năng tác nhân (agentic AI)....

22/04/2026 · 2 min · dhphong

[Google Engineering Blog] Production-Ready AI Agents: 5 Lessons from Refactoring a Monolith

Nguồn: Google Developers Blog Tóm tắt Google’s AI Agent Clinic đã phân tích và tái kiến trúc “Titanium” — một sales research agent hoạt động được trong môi trường dev nhưng không đáp ứng được yêu cầu production. Monolith ban đầu chạy một vòng for tuyến tính: khi một sub-task thất bại (API timeout hoặc hallucination), toàn bộ quy trình dừng mà không báo lỗi. Giải pháp là tách thành pipeline dùng Google Agent Development Kit (ADK) với các specialized sub-agents: Company Researcher, Search Planner, Case Study Researcher, Selector, Email Drafter....

22/04/2026 · 2 min · dhphong

[Google Engineering Blog] MaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUs

Nguồn: Google Engineering Blog Tóm tắt Google thông báo MaxText, framework training LLM của mình, giờ đây hỗ trợ Supervised Fine-Tuning (SFT) và Reinforcement Learning (RL) trên cấu hình single-host TPU (v5p-8 và v6e-8). Đây là bước tiến quan trọng vì trước đây post-training thường yêu cầu cluster nhiều host, làm tăng chi phí và phức tạp infrastructure đáng kể. SFT trong MaxText tích hợp native với Hugging Face datasets, hỗ trợ load checkpoint từ cả MaxText lẫn Hugging Face (như Gemma 3), và được tối ưu bằng thư viện Tunix — một JAX-based library thiết kế riêng cho post-training efficiency....

17/04/2026 · 2 min · dhphong

[Hacker News] €54k spike in 13h from unrestricted Firebase browser key accessing Gemini APIs

Nguồn: Google AI Developer Forum Tóm tắt Một developer đã phát hiện khoản hóa đơn bất ngờ lên đến €54,000 chỉ trong 13 giờ sau khi Firebase browser API key không được cấu hình restriction bị lợi dụng để gọi Gemini APIs. Đây là ví dụ điển hình về rủi ro bảo mật nghiêm trọng khi để lộ API key không được giới hạn trong môi trường client-side (browser). Firebase browser key theo bản chất được thiết kế để expose công khai trong code phía client — đây là điều bình thường và có chủ ý....

16/04/2026 · 2 min · dhphong

[Hacker News] Google Gemma 4 Runs Natively on iPhone with Full Offline AI Inference

Nguồn: gizmoweek.com Tóm tắt Google DeepMind phát hành Gemma 4, dòng model multimodal open-source được thiết kế để chạy hiệu quả trên nhiều nền tảng — từ cloud đến on-device, bao gồm cả iPhone. Gemma 4 hỗ trợ đầu vào văn bản, hình ảnh, và audio, với context window lên đến 256k token cho các variant lớn hơn. Toàn bộ model được phát hành dưới giấy phép Apache 2.0. Dòng model gồm 4 kích thước: E2B (2....

15/04/2026 · 2 min · dhphong