[Hacker News] Soul Player C64 – A real transformer running on a 1 MHz Commodore 64

Nguồn: GitHub (gizmo64k/soulplayer-c64) Tóm tắt Soul Player C64 là một dự án retro-computing độc đáo: implement một transformer model thực sự chạy được trên Commodore 64 — máy tính 8-bit với CPU 1 MHz và 64KB RAM từ năm 1982. Đây là demo về khả năng inference LLM ở mức tối giản nhất có thể trên phần cứng thực tế. Model chạy trên C64 tất nhiên là cực kỳ nhỏ, chỉ xử lý prompt ngắn với vocabulary hạn chế....

21/04/2026 · 1 min · dhphong

[NVIDIA Developer Blog] Maximizing Memory Efficiency to Run Bigger Models on NVIDIA Jetson

Nguồn: NVIDIA Developer Blog Tóm tắt Sự bùng nổ của các open source generative AI model đang mở rộng ra ngoài data center, vào các thiết bị edge như robot, xe tự lái, và hệ thống embedded. NVIDIA Jetson là nền tảng phổ biến cho AI inference ở edge, nhưng bị hạn chế bởi bộ nhớ chia sẻ giữa CPU và GPU — thường chỉ từ 8GB đến 64GB unified memory....

21/04/2026 · 2 min · dhphong