Google ra mắt “trợ lý sống”: Biết viết mã, tạo video, dạy học
Google giới thiệu hệ điều hành AI Gemini tại I/O 2025 với hàng loạt tính năng mới.
Gemini 2.5: Từ mô hình ngôn ngữ đến hệ điều hành AI đa năng
Tại sự kiện thường niên Google I/O 2025, tập đoàn công nghệ hàng đầu thế giới đã chính thức ra mắt loạt tính năng mới thuộc hệ sinh thái Gemini, đánh dấu bước chuyển mình quan trọng từ một mô hình ngôn ngữ lớn (LLM) sang một hệ điều hành AI toàn diện.

Theo Google, Gemini 2.5 không chỉ hỗ trợ xử lý ngôn ngữ tự nhiên mà còn tích hợp khả năng sáng tạo hình ảnh, video, hỗ trợ nghiên cứu, tạo mã, thiết kế bài kiểm tra, và hơn thế nữa. Đặc biệt, với các phiên bản Gemini Live, Veo 3, Imagen 4, Canvas và Deep Research, người dùng nay có thể làm việc, học tập, giải trí và sáng tạo nội dung ngay trong một nền tảng duy nhất.
Một trong những điểm nhấn đáng chú ý là Gemini Live, hiện đã có mặt miễn phí trên Android và iOS. Tính năng này cho phép tương tác thời gian thực thông qua camera và giọng nói, biến mọi thiết bị thành một “trợ lý AI sống động”, đồng thời được tích hợp sâu với Google Maps, Calendar, Keep và các ứng dụng thiết yếu khác.
Imagen 4, Veo 3 và Deep Research: Bổ sung sức mạnh sáng tạo
Không chỉ dừng lại ở ngôn ngữ, Google còn mở rộng năng lực sáng tạo của Gemini bằng những công cụ tiên tiến:
- Imagen 4 là công cụ tạo hình ảnh mới nhất với khả năng tái hiện chi tiết ở độ phân giải 2K, từ ảnh thực tế đến ảnh trừu tượng. Phiên bản nâng cấp sắp ra mắt được hứa hẹn nhanh gấp 10 lần Imagen 3.
- Veo 3 là mô hình tạo video tích hợp âm thanh gốc đầu tiên của Google, cho phép tạo video sinh động từ mô tả văn bản, kèm theo hiệu ứng âm thanh, tiếng nói nhân vật và môi trường.
- Deep Research biến Gemini thành trợ lý nghiên cứu mạnh mẽ: chỉ cần tải lên tài liệu PDF, ảnh chụp màn hình hay ghi chú, người dùng có thể yêu cầu Gemini tổng hợp báo cáo chi tiết từ nhiều nguồn, giúp tiết kiệm thời gian đáng kể.
Các công cụ này đã bắt đầu được triển khai tại Mỹ, đặc biệt với người dùng đăng ký gói AI Ultra – gói dịch vụ cao cấp nhất hiện nay của Google với giá 249,99 USD/tháng.
Canvas, trình duyệt Chrome và AI trong giáo dục
Google không giấu tham vọng đưa AI vào mọi ngóc ngách của đời sống số. Một trong các công cụ mới là Canvas, studio sáng tạo cho phép người dùng tạo mã lập trình, infographic, bài kiểm tra, bài giảng, thậm chí là podcast chỉ bằng lệnh văn bản. Tất cả được xử lý bởi Gemini 2.5 Pro, cho kết quả nhanh chóng và chính xác.
Từ ngày 21/5/2025, Gemini sẽ được tích hợp chính thức vào trình duyệt Chrome, cho phép tóm tắt nội dung, gợi ý tìm kiếm, và sắp tới có thể tự động hóa các thao tác duyệt web như chuyển tab, điền biểu mẫu, giúp tối ưu hóa trải nghiệm người dùng.
Trong giáo dục, Google công bố hai tính năng mới: Interactive Quizzes và Gemini 2.5 Flash. Tính năng đầu tiên cho phép tạo bài kiểm tra tùy biến và cung cấp phản hồi tức thì, hỗ trợ học cá nhân hóa. Trong khi đó, Gemini 2.5 Flash là phiên bản AI nhanh, hiệu quả và miễn phí, phù hợp với các tác vụ đơn giản và phổ thông.