[Hacker News] Our eighth generation TPUs: two chips for the agentic era

Nguồn: Google Blog Tóm tắt Google đã công bố thế hệ TPU thứ tám với hai chip chuyên biệt: TPU 8t dành cho huấn luyện mô hình quy mô lớn và TPU 8i dành cho inference độ trễ thấp. Đây là kết quả của hơn một thập kỷ phát triển phần cứng AI tùy chỉnh, được thiết kế đặc biệt cho kỷ nguyên các hệ thống AI có khả năng tác nhân (agentic AI)....

22/04/2026 · 2 min · dhphong

[Google Engineering Blog] MaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUs

Nguồn: Google Engineering Blog Tóm tắt Google thông báo MaxText, framework training LLM của mình, giờ đây hỗ trợ Supervised Fine-Tuning (SFT) và Reinforcement Learning (RL) trên cấu hình single-host TPU (v5p-8 và v6e-8). Đây là bước tiến quan trọng vì trước đây post-training thường yêu cầu cluster nhiều host, làm tăng chi phí và phức tạp infrastructure đáng kể. SFT trong MaxText tích hợp native với Hugging Face datasets, hỗ trợ load checkpoint từ cả MaxText lẫn Hugging Face (như Gemma 3), và được tối ưu bằng thư viện Tunix — một JAX-based library thiết kế riêng cho post-training efficiency....

17/04/2026 · 2 min · dhphong