Sắp có trí tuệ nhân tạo mới cạnh tranh với DeepSeek tại Trung Quốc?
Một công ty Trung Quốc trong lĩnh vực định lượng vừa công bố phương pháp huấn luyện trí tuệ nhân tạo mới.
Đối trọng tiềm năng với OpenAI
Tại Hội nghị về Hệ thống xử lý thông tin thần kinh (NeurIPS) – một trong những sự kiện hàng đầu thế giới về trí tuệ nhân tạo, công ty Trung Quốc Shanghai Goku Technologies đã đệ trình nghiên cứu khoa học giới thiệu phương pháp huấn luyện AI mới mang tên SASR (Stepwise Adaptive Supervised Reinforcement). Đây là động thái đáng chú ý, bởi NeurIPS được ví như “Thế vận hội AI” – nơi quy tụ những nhà nghiên cứu và tổ chức uy tín nhất trong ngành.

Goku Technologies, được thành lập từ năm 2015, vốn là một công ty chuyên về giao dịch định lượng. Tuy nhiên, với việc gửi nghiên cứu lên hội nghị và đồng thời thành lập công ty con AllMind, hãng đã chính thức tham gia sâu vào lĩnh vực AI – đặc biệt là mảng phát triển mô hình ngôn ngữ lớn (LLM).
Trong bài nghiên cứu, nhóm tác giả của Goku chỉ ra những giới hạn của hai phương pháp huấn luyện mô hình hiện đang được nhiều công ty lớn sử dụng, gồm: huấn luyện có giám sát (Supervised Fine-Tuning – SFT) và học tăng cường từ phản hồi con người (Reinforcement Learning – RL). Đây là các phương pháp nền tảng mà OpenAI, DeepSeek hay nhiều tổ chức phát triển mô hình AI hiện đại khác áp dụng.
Thay vì tiếp tục kết hợp SFT và RL theo hướng truyền thống, Goku đề xuất cách tiếp cận mới SASR, được lấy cảm hứng từ quá trình học tập và phát triển tư duy của con người. Phương pháp này huấn luyện mô hình theo từng bước thích ứng, dần điều chỉnh theo phản hồi để tối ưu hóa hiệu suất trong các tình huống thực tế.
Nhóm nghiên cứu cho biết: “Kết quả thử nghiệm chứng minh rằng SASR vượt trội hơn các phương pháp truyền thống về độ chính xác, khả năng tổng quát hóa và tốc độ hội tụ trong đào tạo.”
Thành lập AllMind: Goku chính thức gia nhập đường đua AI
Cùng ngày công bố nghiên cứu SASR, Goku Technologies đã đăng ký thành lập công ty con AllMind. Theo hồ sơ doanh nghiệp, AllMind sẽ hoạt động chuyên biệt trong lĩnh vực phát triển mô hình trí tuệ nhân tạo, đặc biệt là các thuật toán huấn luyện tiên tiến. Người đại diện pháp lý của công ty mới – ông Wang Xiao, cũng là nhà sáng lập của Goku xác nhận định hướng này trong phát biểu với China Securities Journal.

Việc mở rộng sang AI của Goku diễn ra trong bối cảnh ngày càng nhiều công ty công nghệ Trung Quốc đang xây dựng các đơn vị nghiên cứu độc lập, tập trung phát triển mô hình AI thế hệ mới. DeepSeek – một trong những tên tuổi nổi bật tại Trung Quốc cũng từng triển khai chiến lược tương tự khi thành lập công ty con dưới sự hỗ trợ của High-Flyer Capital vào năm 2023.
Trong hệ sinh thái đang hình thành nhanh chóng, các công ty như Goku không chỉ dừng lại ở việc triển khai mô hình, mà còn hướng đến việc thay đổi chính cách huấn luyện – yếu tố quyết định năng lực, hành vi và tính linh hoạt của mô hình AI.
Trung Quốc tiếp tục đầu tư mạnh vào nghiên cứu AI bất chấp thách thức
Tham vọng của Goku phản ánh một xu hướng rõ rệt tại Trung Quốc: Đầu tư vào đổi mới thuật toán và mô hình trí tuệ nhân tạo để bù đắp cho các hạn chế về phần cứng do chính sách kiểm soát xuất khẩu công nghệ của Mỹ. Trong bối cảnh bị hạn chế tiếp cận các bộ xử lý cao cấp như GPU của Nvidia, nhiều công ty Trung Quốc đang chuyển hướng tập trung vào tối ưu hóa thuật toán, chiến lược huấn luyện và thiết kế mô hình để tăng hiệu quả đào tạo mà không phụ thuộc vào tài nguyên tính toán khổng lồ.
Việc SASR được đưa ra tại NeurIPS không chỉ là một đóng góp học thuật, mà còn là tuyên bố cạnh tranh của Trung Quốc trong sân chơi AI toàn cầu – nơi các mô hình ngôn ngữ lớn (LLM) như GPT, Claude hay DeepSeek đang định hình lại các tiêu chuẩn công nghệ.
Dù Goku chưa phản hồi báo chí về kết quả cụ thể trong các thử nghiệm công nghiệp, sự xuất hiện của SASR đã khẳng định Trung Quốc không đứng ngoài cuộc chơi. Thay vào đó, quốc gia này đang từng bước tìm ra các hướng đi khác biệt, từ thuật toán cho đến mô hình tổ chức, nhằm củng cố vị thế của mình trong làn sóng AI toàn cầu.