Nguồn: Anthropic Engineering
Tóm tắt
Anthropic đã công bố phân tích hậu kiểm (postmortem) chi tiết về ba thay đổi riêng biệt đã ảnh hưởng đến chất lượng Claude Code trong vài tháng qua. Tất cả vấn đề đã được khắc phục kể từ ngày 20 tháng 4 (v2.1.116).
Thứ nhất, ngày 4 tháng 3, mức reasoning effort mặc định của Claude Code đã bị hạ từ high xuống medium để giảm độ trễ — quyết định này sau đó bị hoàn tác vào ngày 7 tháng 4. Thứ hai, ngày 26 tháng 3, một bug trong tối ưu hóa prompt caching đã khiến Claude liên tục xóa toàn bộ lịch sử reasoning trong mỗi turn thay vì chỉ xóa một lần khi phiên làm việc idle quá lâu. Bug này tạo ra hiệu ứng cộng dồn: Claude mất bộ nhớ về lý do của các hành động trước đó, dẫn đến hành vi lặp lại và quên thông tin. Hơn nữa, do cache miss liên tục, usage limit của người dùng bị tiêu hao nhanh hơn bình thường.
Thứ ba, ngày 16 tháng 4, một dòng trong system prompt giới hạn độ dài phản hồi (≤25 words between tool calls) gây sụt giảm 3% trên các bài đánh giá coding và đã bị hoàn tác ngày 20 tháng 4. Ba thay đổi này ảnh hưởng đến các phần khác nhau của traffic trên các lịch trình khác nhau, tạo ra ảo giác về sự suy giảm rộng rãi và không nhất quán khó xác định nguyên nhân.
Nhằm ngăn tái diễn, Anthropic cam kết mở rộng test suite cho mọi thay đổi system prompt, thêm soak period và gradual rollout, cải thiện công cụ code review nội bộ, và tích hợp nhiều repository hơn làm context cho code review tự động. Toàn bộ người dùng cũng được reset usage limit vào ngày 23 tháng 4.