Vén màn công nghệ “đọc vị hành vi” của TikTok
Thuật toán của TikTok không gán nhãn người dùng, mà dựa vào mô hình dự đoán hành vi nhằm cá nhân hóa nội dung.
Cách vận hành thuật toán đề xuất
Tại Diễn đàn truyền thông internet Trung Quốc 2025, Chủ tịch Douyin – ông Han Shangyou đã đưa ra tuyên bố chính thức về nguyên tắc vận hành thuật toán của TikTok, giải thích vì sao nền tảng này có thể đề xuất nội dung sát nhu cầu người dùng đến vậy.

Theo ông Han, thay vì gán nhãn sở thích người dùng như một số nền tảng khác, TikTok (Douyin) sử dụng mô hình mạng nơ-ron sâu để trực tiếp dự đoán hành vi và mục tiêu của từng người dùng với từng nội dung cụ thể. Thuật toán này không hoạt động theo cơ chế “nhận dạng nhóm”, mà thực hiện hàng triệu phép tính để đưa ra các video có xác suất tương tác cao nhất cho từng cá nhân – dù họ vừa mới mở ứng dụng.
TikTok tiết lộ rằng quá trình chấm điểm nội dung bắt đầu ngay khi người dùng truy cập, không cần chờ các thao tác cụ thể như xem video, bấm thích hay chia sẻ. Những hành vi nhỏ như đọc mô tả, xem bình luận, tạm dừng video... đều được ghi nhận làm dữ liệu huấn luyện cho hệ thống.
Các yếu tố này được tính toán và gán trọng số riêng biệt, cho phép hệ thống đo lường mức độ ưu tiên cho từng video. Đây là bước đầu tiên trong hành trình thuật toán xác định nội dung nào nên đề xuất tiếp theo.
Lọc cộng tác và học sâu – "cặp bài trùng" trong công nghệ gợi ý của TikTok
Một trong những thuật toán chủ chốt của TikTok là lọc cộng tác – phương pháp khai thác điểm tương đồng giữa người dùng để mở rộng danh sách đề xuất. Nếu người dùng A và B có chung sở thích ở các video x, y, z thì nhiều khả năng video người A thích cũng sẽ phù hợp với B, dù B chưa từng xem video đó.
Cùng lúc, TikTok kết hợp mô hình học sâu (deep learning) để tăng khả năng "ghi nhớ" hành vi người dùng. Mô hình này sử dụng dữ liệu lịch sử để phân tích tần suất đồng xuất hiện của các yếu tố – chẳng hạn như loại nội dung, phong cách video, thậm chí cả đặc điểm hiếm gặp. Điều này giúp hệ thống mở rộng khả năng gợi ý ngay cả khi thông tin về người dùng còn ít.
Vì sao thuật toán mạnh vẫn gây tranh cãi?
Dù thuật toán TikTok được đánh giá là một trong những hệ thống đề xuất tiên tiến nhất, nền tảng vẫn đối mặt với chỉ trích về việc đẩy nội dung giật gân, lệch chuẩn hoặc gây hại, đặc biệt với người dùng trẻ.
Nguyên nhân là do AI chỉ đo lường hành vi bề mặt, không hiểu sâu nội dung hoặc ngữ cảnh xã hội, dẫn đến khả năng đề xuất nội dung không phù hợp. Để khắc phục, TikTok đã triển khai hệ thống quản trị kết hợp giữa trí tuệ nhân tạo và con người. AI thực hiện bước nhận dạng, sàng lọc sơ bộ; con người sẽ can thiệp để gắn nhãn, đánh giá chuyên sâu, xử lý các trường hợp phức tạp.
TikTok và Douyin không chỉ đề xuất dựa trên hành vi quen thuộc, mà còn chủ động mở rộng phạm vi nội dung để tránh người dùng bị bó hẹp trong một nhóm nội dung nhất định – hiện tượng thường gọi là “filter bubble”.
Hệ thống sử dụng các chiến lược như phân mảnh sở thích, khám phá ngẫu nhiên, liên kết xã hội, và cho phép người dùng chọn “không quan tâm”. Đây là cơ chế vừa đảm bảo nội dung phù hợp, vừa kích thích người dùng khám phá thêm sở thích mới, từ đó tăng thời gian trải nghiệm trên nền tảng.
Tính minh bạch ngày càng được quan tâm
Trước những tranh luận toàn cầu về thuật toán mạng xã hội, việc TikTok công khai một phần cơ chế vận hành được đánh giá là động thái tích cực. Việc ra mắt Trung tâm bảo mật và tin cậy, theo công bố của Douyin, nhằm tăng tính minh bạch và trao cho người dùng quyền hiểu rõ nền tảng đang hoạt động thế nào.
Tuy nhiên, giới quan sát nhận định rằng, để đạt được cân bằng giữa thuật toán tối ưu hóa và an toàn nội dung, TikTok sẽ cần tiếp tục đầu tư mạnh vào công nghệ kiểm duyệt cũng như trách nhiệm xã hội trong thời gian tới.