Một developer dùng Copilot Pro+ trả $39/tháng. Ngày 1 tháng 6, anh mở laptop và phát hiện 82% quota tháng đã biến mất - chỉ sau một buổi làm việc. GitHub vừa đổi cách tính tiền. Và cơn sốc này không chỉ là chuyện của GitHub.

Cơ chế mới: từ flat-rate sang AI Credits
Từ ngày 1/6/2026, GitHub Copilot thay thế Premium Request Units bằng AI Credits. Tỷ lệ đổi: 1 Credit bằng $0.01 USD, tính theo token consumption - bao gồm input tokens, output tokens, và cached tokens (GitHub Blog, 2026).
Giá gói vẫn giữ nguyên trên giấy: Pro $10/tháng, Pro+ $39/tháng, Business $19/user/tháng, Enterprise $39/user/tháng. Nhưng con số này giờ là allowance tháng - một ngân sách có giới hạn, không phải trần không giới hạn.
Tính năng vẫn miễn phí: code completions và next-edit suggestions - những tính năng autocomplete cơ bản. Nhưng tất cả thứ thú vị hơn - Copilot Chat, agentic coding sessions, Cloud Agents, code review - đều tiêu credit.
Vì sao agentic AI tốn hơn bạn tưởng rất nhiều
Vấn đề không phải giá. Vấn đề là agentic workflows tiêu tài nguyên theo cách khác hoàn toàn so với chatbot thông thường.
Khi bạn hỏi ChatGPT một câu, model gọi một lần rồi trả lời. Khi bạn nhờ Copilot “viết unit test cho cả module này” bằng agent mode - nó đọc codebase, lên plan, viết code, chạy test, phát hiện lỗi, sửa lại, lặp lại. Mỗi bước là tokens. Mỗi tokens là credits.
Kết quả: nhiều team báo cáo hóa đơn nhảy 10x đến 50x so với kỳ vọng ban đầu (TechTimes, 2026). Một agentic session phức tạp có thể ngốn đến $40. Một đội dev 50 người có thể chi $5,000-$15,000/tháng chỉ cho AI coding tools - chưa kể cloud infrastructure (Developers Digest, 2026).
GitHub giải thích rõ lý do: “the current premium request model is no longer sustainable” khi Copilot đã tiến hóa thành nền tảng agentic chạy “long, multi-step coding sessions.” Nói thẳng hơn: flat-rate không thể cover chi phí inference thực tế của agentic AI.
Không phải một mình GitHub - cả ngành đang làm điều này
Đây là điều nhiều người bỏ qua trong câu chuyện này: GitHub không phải người đi đầu. Cursor đã chuyển từ request-based sang credit-based từ năm 2025. Windsurf cũng điều chỉnh pricing hai lần trong cùng khoảng thời gian. Claude API và OpenAI API vẫn luôn tính tiền theo token từ đầu.
Trend rõ ràng: giai đoạn “all-you-can-eat AI” đang kết thúc. Thay vào đó là metered infrastructure - giống cách AWS, GCP tính tiền compute từ nhiều năm trước.
Lý do kinh tế đơn giản: khi AI agents chạy reasoning loops dài, consume context window lớn, và gọi model nhiều lần cho một task - chi phí inference tăng theo cấp số nhân. Không nhà cung cấp nào có thể absorb mãi chi phí đó vào một flat fee.
Doanh nghiệp Việt Nam cần điều chỉnh gì ngay bây giờ
Nhiều startup và agency tech Việt Nam đang dùng GitHub Copilot Business ($19/user/tháng) vì tính “dễ dự đoán”. Từ tháng 6, logic đó đã thay đổi.
Thực tế phổ biến ở các team trong nước: không ai đo AI usage, developer dùng agent mode thoải mái cho mọi task, budget AI được tính theo đầu người chứ không theo consumption. Tất cả ba giả định này giờ đều mang rủi ro tài chính thực.
Một số việc cần làm ngay:
Bật usage monitoring trước. GitHub đã launch preview billing dashboard từ tháng 5 - vào Billing Overview để xem rate tiêu credit thực tế của team trước khi scale thêm người hay tính năng.
Phân loại task theo cost. Dùng model mạnh và agent mode cho task thực sự cần - debug phức tạp, refactor lớn. Dùng inline completion (miễn phí) cho autocomplete thông thường.
Đặt spending cap ngay. Copilot Business cho phép đặt budget limit ở enterprise level. Đây không còn là tính năng optional - với usage-based billing, nó là bắt buộc.
Số liệu cho thấy mức độ quan trọng: chỉ 41% agentic AI rollouts đạt ROI dương trong 12 tháng đầu (Digital Applied, 2026). Nguyên nhân chính là hidden cost từ usage không được theo dõi. Team biết optimize AI spend - không phải chỉ dùng nhiều - sẽ là người thắng cuộc.
Góc nhìn NateCue
Tôi không ngạc nhiên về cơn sốc này. Từ lâu tôi đã nói với các team: subscription $39/tháng không phải là chi phí thật của AI - đó chỉ là phần nổi. Chi phí thật là token consumption trong agentic loops, context window được nạp lại nhiều lần, và số lần model gọi lặp cho một task duy nhất. Điều quan trọng hơn: toàn bộ ngành đang đi hướng này. Cursor, Windsurf, Claude Code, OpenAI Codex - tất cả đều metered. Flat-rate chỉ là giai đoạn thu hút user ban đầu, không phải mô hình bền vững. Doanh nghiệp Việt Nam cần bắt đầu nghĩ về AI spending như cloud spending: cần có người quản lý, có budget cap, có usage monitoring. Những team biết optimize AI cost thay vì chỉ biết dùng nhiều sẽ là người có lợi thế bền vững trong 2-3 năm tới.