Nguồn: Google Blog

Tóm tắt

Google đã công bố thế hệ TPU thứ tám với hai chip chuyên biệt: TPU 8t dành cho huấn luyện mô hình quy mô lớn và TPU 8i dành cho inference độ trễ thấp. Đây là kết quả của hơn một thập kỷ phát triển phần cứng AI tùy chỉnh, được thiết kế đặc biệt cho kỷ nguyên các hệ thống AI có khả năng tác nhân (agentic AI).

TPU 8t được tối ưu hóa cho các workload huấn luyện phức tạp, mang lại hiệu năng vượt trội so với thế hệ trước trong khi cải thiện đáng kể hiệu quả năng lượng. TPU 8i chuyên về inference tốc độ cao, cho phép các AI agent phối hợp và phản hồi nhanh chóng — điều thiết yếu cho các ứng dụng đa tác nhân và hệ thống AI tương tác thời gian thực.

Cả hai chip đều sử dụng kiến trúc phần cứng tùy chỉnh nhằm đạt được mật độ tính toán cao hơn với mức tiêu thụ điện năng thấp hơn. Google sẽ cung cấp các chip này qua Google Cloud với availability chung dự kiến vào cuối năm 2026, cho phép doanh nghiệp mở rộng workload AI mà không cần đầu tư vào phần cứng tại chỗ.

Thế hệ TPU mới này đánh dấu sự chuyển dịch rõ ràng trong chiến lược silicon của Google: từ tối ưu hóa cho mô hình đơn lẻ sang hỗ trợ kiến trúc nhiều mô hình và nhiều tác nhân làm việc đồng thời — phản ánh xu hướng ứng dụng AI trong sản xuất ngày nay.

👉 Đọc bài gốc