[Hacker News] Google Gemma 4 Runs Natively on iPhone with Full Offline AI Inference

Nguồn: gizmoweek.com Tóm tắt Google DeepMind phát hành Gemma 4, dòng model multimodal open-source được thiết kế để chạy hiệu quả trên nhiều nền tảng — từ cloud đến on-device, bao gồm cả iPhone. Gemma 4 hỗ trợ đầu vào văn bản, hình ảnh, và audio, với context window lên đến 256k token cho các variant lớn hơn. Toàn bộ model được phát hành dưới giấy phép Apache 2.0. Dòng model gồm 4 kích thước: E2B (2....

15/04/2026 · 2 min · dhphong

[AI Coding (leaflet.pub)] The Conversation Is the Commit

Nguồn: AI Coding - leaflet.pub Tóm tắt “The Conversation Is the Commit” đề xuất một paradigm mới trong quy trình phát triển phần mềm: thay vì commit là đơn vị nguyên tử của thay đổi code, conversation với AI coding assistant trở thành đơn vị mang ý nghĩa. Bài viết thách thức cách chúng ta nghĩ về version control khi AI mediates giữa intention và implementation. (Không thể truy cập nội dung đầy đủ)...

14/04/2026 · 1 min · dhphong

[AI Coding (leaflet.pub)] The Generative Stack

Nguồn: AI Coding - leaflet.pub Tóm tắt “The Generative Stack” phân tích kiến trúc của các hệ thống phần mềm được xây dựng trên nền tảng generative AI — hay còn gọi là “AI-native” applications. Bài viết đặt câu hỏi về cách một technology stack thay đổi khi LLM trở thành thành phần trung tâm thay vì chỉ là add-on. (Không thể truy cập nội dung đầy đủ) Generative stack thường bao gồm: LLM provider (OpenAI, Anthropic, local models), orchestration layer (LangChain, LlamaIndex, hay custom), vector database cho RAG (Pinecone, Weaviate, pgvector), và application layer....

14/04/2026 · 1 min · dhphong

[AI Coding (leaflet.pub)] The Phoenix Primitives

Nguồn: AI Coding - leaflet.pub Tóm tắt “The Phoenix Primitives” là bài viết trong newsletter AI Coding của leaflet.pub, thảo luận về các primitive (khái niệm cơ bản) mà các công cụ AI coding đang xây dựng xung quanh. Tên “Phoenix” gợi ý về sự tái sinh hoặc transformation trong cách lập trình viên tương tác với code. (Không thể truy cập nội dung đầy đủ) Newsletter AI Coding tập trung vào giao điểm giữa lập trình và AI — từ góc độ cả công cụ lập trình (Copilot, Cursor, Claude Code) lẫn việc xây dựng hệ thống AI....

14/04/2026 · 1 min · dhphong

[Databricks Blog] Agentic Reasoning in Practice: Making Sense of Structured and Unstructured Data

Nguồn: Databricks Blog Tóm tắt Bài viết từ Mosaic Research (nhóm nghiên cứu AI của Databricks) trình bày cách xây dựng hệ thống agentic reasoning có khả năng xử lý cả dữ liệu có cấu trúc (structured — bảng SQL, parquet) và phi cấu trúc (unstructured — văn bản, PDF, email). Đây là bài toán thực tế phức tạp vì hầu hết dữ liệu doanh nghiệp tồn tại ở dạng hỗn hợp....

14/04/2026 · 2 min · dhphong

[Bytebytego] How LinkedIn Feed Uses LLMs to Serve 1.3 Billion Users

Nguồn: ByteByteGo Newsletter Tóm tắt LinkedIn Feed phải phục vụ 1.3 tỷ users với nội dung personalized — một bài toán recommendation system ở scale khổng lồ. ByteByteGo phân tích cách LinkedIn đã tích hợp Large Language Models vào pipeline hiện có để cải thiện relevance mà không sacrifice latency. Architecture tổng thể gồm nhiều layers: candidate retrieval (lọc hàng triệu posts xuống vài nghìn candidates), ranking (dùng LLMs để score candidates dựa trên user profile và engagement history), và serving (cache results và fallback mechanisms khi LLM latency không đáp ứng SLA)....

14/04/2026 · 1 min · dhphong

[Hacker News] N-Day-Bench – Can LLMs find real vulnerabilities in real codebases?

Nguồn: N-Day-Bench Tóm tắt N-Day-Bench là một benchmark mới đánh giá khả năng của LLMs trong việc phát hiện các vulnerability đã biết (N-day vulnerabilities) trong các codebase thực tế. Khác với các benchmark học thuật sử dụng synthetic examples, N-Day-Bench sử dụng các CVEs thực từ các open-source projects phổ biến. Benchmark được thiết kế để đo lường xem LLMs có thể reproduce quá trình phân tích security của một human researcher hay không — bao gồm việc đọc code, hiểu context, và xác định chính xác vị trí cũng như bản chất của lỗ hổng....

14/04/2026 · 1 min · dhphong

[Hacker News] Show HN: Continual Learning with .md

Nguồn: GitHub - SunAndClouds/ReadMe Tóm tắt ReadMe là một dự án thử nghiệm cách sử dụng các file Markdown như là medium cho continual learning của AI models. Thay vì training lại model từ đầu mỗi khi có kiến thức mới, ReadMe cho phép models “đọc” và integrate thông tin mới từ các file .md trong runtime. Approach này giải quyết một trong những challenges cơ bản của AI deployment: làm thế nào để update kiến thức của model mà không cần expensive retraining cycle....

14/04/2026 · 1 min · dhphong

[Bytebytego] How LinkedIn Feed Uses LLMs to Serve 1.3 Billion Users

Nguồn: Bytebytego Tóm tắt (Không thể truy cập nội dung đầy đủ — bài viết yêu cầu đăng ký trả phí trên Bytebytego) Bài viết phân tích kiến trúc AI của LinkedIn Feed — hệ thống phục vụ hơn 1.3 tỷ người dùng — và cách LinkedIn tích hợp LLM vào pipeline recommendation để cải thiện độ liên quan của nội dung hiển thị. Đây là chủ đề quan trọng trong distributed systems và large-scale ML inference....

14/04/2026 · 1 min · dhphong

[Databricks Blog] What is Agentic Analytics?

Nguồn: Databricks Blog Tóm tắt Agentic analytics đại diện cho sự tiến hóa tiếp theo sau các copilot (text-to-SQL). Trong khi copilot chỉ phản hồi đúng câu hỏi được hỏi và dừng lại, AI agent có thể phân rã câu hỏi phức tạp thành sub-questions, tự viết và chạy queries, lặp lại dựa trên kết quả data, tự động phát hiện insight chưa được yêu cầu, và thực hiện action (tạo báo cáo, gửi alert)....

14/04/2026 · 2 min · dhphong