[Hacker News] Even 'uncensored' models can't say what they want

Nguồn: morgin.ai Tóm tắt Bài viết lập luận rằng ngay cả các model được quảng cáo là “uncensored” — đã được fine-tune để loại bỏ safety restriction — vẫn không thực sự tự do về mặt biểu đạt. Các hạn chế không chỉ đến từ RLHF hay safety fine-tuning, mà còn được nhúng sâu vào bản thân dữ liệu training từ internet — vốn có các quy chuẩn ngôn ngữ và topic taboo riêng....

21/04/2026 · 1 min · dhphong