Nguồn: GitHub via Hacker News
Tóm tắt
Auto-Architecture là một thử nghiệm áp dụng “Karpathy’s Loop” — vòng lặp nghiên cứu tự động (propose, implement, measure, keep the wins) — vào lĩnh vực thiết kế kiến trúc CPU, thay vì môi trường machine learning truyền thống. Andrej Karpathy đã chứng minh rằng một coding agent có thể tự tìm ra 20 tối ưu hóa training trong 2 ngày với một GPU đơn. Câu hỏi đặt ra: vòng lặp này có hoạt động trong một domain mà AI không quen thuộc như thiết kế vi xử lý?
Dự án triển khai một tournament loop trong đó các agent AI đề xuất các biến thể kiến trúc CPU, implement bằng code (RTL/simulation), đo lường hiệu năng theo các tiêu chí định lượng, và giữ lại những biến thể thắng cuộc. Cách tiếp cận này lấy cảm hứng từ AlphaChip của Google nhưng sử dụng LLM thay vì RL thuần túy.
Kết quả ban đầu cho thấy AI có thể khám phá các tối ưu hóa vi kiến trúc không tầm thường, dù tốc độ hội tụ chậm hơn đáng kể so với domain lập trình. Giới hạn chính là feedback loop dài hơn (simulation CPU mất nhiều thời gian hơn chạy training step), và không gian tìm kiếm lớn hơn nhiều.
Đây là hướng nghiên cứu thú vị ở giao điểm giữa AI-assisted hardware design và autonomous research agents. Nếu tiếp tục phát triển, có thể mở ra khả năng tự động hóa một phần quy trình thiết kế chip vốn phụ thuộc nhiều vào kiến thức chuyên môn tích lũy qua nhiều thập kỷ.