[Hacker News] Grok 4.3

Nguồn: xAI Docs Tóm tắt xAI ra mắt Grok 4.3 — phiên bản mới trong dòng model Grok, được cung cấp qua API. Theo tài liệu chính thức, Grok 4.3 hỗ trợ context window 200K token với pricing $1.25/1M input tokens và $2.50/1M output tokens. Cached token có giá thấp hơn đáng kể ở $0.20/1M tokens, giúp giảm chi phí cho các ứng dụng có prompt system lớn được tái sử dụng nhiều lần....

01/05/2026 · 1 min · dhphong

[Hacker News] DeepSeek v4

Nguồn: DeepSeek API Docs Tóm tắt DeepSeek đã ra mắt phiên bản mới DeepSeek v4 với hai model: deepseek-v4-flash và deepseek-v4-pro. Đây là thế hệ tiếp theo thay thế cho deepseek-chat và deepseek-reasoner — hai model cũ sẽ bị deprecated vào ngày 24/07/2026. API tương thích với cả định dạng OpenAI và Anthropic, cho phép sử dụng SDK của cả hai provider mà không cần thay đổi code đáng kể. deepseek-v4-flash tương ứng với non-thinking mode (trước đây là deepseek-chat), trong khi deepseek-v4-pro có thinking mode tích hợp với các tham số như reasoning_effort: "high"....

24/04/2026 · 1 min · dhphong

[OpenAI Blog] Speeding up agentic workflows with WebSockets in the Responses API

Nguồn: OpenAI Blog Tóm tắt OpenAI đã thêm hỗ trợ WebSockets vào Responses API, giải quyết một bottleneck quan trọng trong các agentic workflows. Trước đây, mỗi bước trong pipeline của agent phải thiết lập kết nối HTTP mới, gây ra latency tích lũy đáng kể khi agent thực hiện nhiều tool calls liên tiếp. Với WebSockets, client duy trì một persistent connection xuyên suốt toàn bộ vòng đời của agent session....

23/04/2026 · 1 min · dhphong

[Hacker News] €54k spike in 13h from unrestricted Firebase browser key accessing Gemini APIs

Nguồn: Google AI Developer Forum Tóm tắt Một developer đã phát hiện khoản hóa đơn bất ngờ lên đến €54,000 chỉ trong 13 giờ sau khi Firebase browser API key không được cấu hình restriction bị lợi dụng để gọi Gemini APIs. Đây là ví dụ điển hình về rủi ro bảo mật nghiêm trọng khi để lộ API key không được giới hạn trong môi trường client-side (browser). Firebase browser key theo bản chất được thiết kế để expose công khai trong code phía client — đây là điều bình thường và có chủ ý....

16/04/2026 · 2 min · dhphong

Pro Max 5x quota exhausted in 1.5 hours despite moderate usage

Nguồn: Hacker News Issue được báo cáo trên GitHub của Anthropic cho thấy quota của plan Claude Code Pro Max 5x bị hết chỉ sau 1.5 giờ dù người dùng cho biết mức sử dụng không cao. Điều này gây ra lo ngại về cách Anthropic tính toán và giới hạn token usage trong các plan trả phí của Claude Code. Vấn đề này ảnh hưởng trực tiếp đến developer workflow khi dùng Claude Code cho công việc hàng ngày....

13/04/2026 · 1 min · dhphong