OpenAI, Anthropic và Google vừa công bố một thỏa thuận hợp tác chưa từng có: chia sẻ thông tin tình báo qua Frontier Model Forum để phát hiện và ngăn chặn các nỗ lực adversarial distillation từ các công ty AI Trung Quốc.
Adversarial distillation là gì và tại sao nó nguy hiểm?
Model distillation là kỹ thuật huấn luyện một model AI nhỏ hơn dựa trên output của model lớn - cho phép tạo ra bản sao rẻ hơn nhiều lần mà vẫn giữ phần lớn năng lực. Vấn đề: kỹ thuật này đang bị lạm dụng có hệ thống.
Anthropic đã chỉ đích danh DeepSeek, Moonshot và MiniMax - ba lab AI Trung Quốc bị cáo buộc sao chép model Claude. Theo công bố, ba lab này đã tạo khoảng 24.000 tài khoản giả, thực hiện hơn 16 triệu lượt trao đổi với Claude, vi phạm điều khoản sử dụng và các hạn chế truy cập theo khu vực.
Mô hình hợp tác kiểu cybersecurity
Cơ chế chia sẻ được thiết kế giống cách các công ty an ninh mạng trao đổi threat intelligence: khi một công ty phát hiện mẫu tấn công mới, họ gắn cờ cảnh báo cho các bên còn lại. Mô hình này giúp ngăn chặn distillation nhanh hơn - thay vì mỗi công ty tự phát hiện riêng lẻ.
Con số đáng chú ý: các model AI Trung Quốc hiện chiếm 41% lượng download trên Hugging Face, cho thấy áp lực cạnh tranh đang thúc đẩy sự hợp tác bất đắc dĩ này.
Những rủi ro tiềm ẩn
Thỏa thuận không phải không có vấn đề. Việc chia sẻ phương pháp phát hiện giữa các đối thủ có thể vô tình tiết lộ chi tiết kiến trúc model - một mối lo ngại antitrust thực sự.
Nghiêm trọng hơn về mặt an toàn: khi một lab distill từ Claude hay GPT, họ chỉ sao chép năng lực - không sao chép safety layer. Alignment work, refusal training, harm-reduction - tất cả đều không chuyển giao qua distillation. Kết quả là những model mạnh nhưng thiếu rào cản an toàn.
Tại sao quan trọng?
Đây là lần đầu tiên ba công ty cạnh tranh trực tiếp nhất trong ngành AI đặt an ninh chung lên trên lợi thế cạnh tranh. Nó đánh dấu sự chuyển đổi từ cuộc chạy đua AI đơn thuần sang một giai đoạn mới - nơi bảo vệ tài sản trí tuệ và an toàn AI trở thành ưu tiên chung. Câu hỏi là liệu thỏa thuận này có đủ để ngăn dòng chảy distillation, hay chỉ làm chậm nó.