Phát hiện lỗ hổng cho hacker khai thác Gemini điều khiển Google Home
Google Gemini vừa trở thành tâm điểm chú ý khi một nhóm nghiên cứu an ninh mạng chứng minh khả năng "hack" trợ lý AI này.
Phát hiện lỗ hổng trong Gemini
Một nghiên cứu an ninh mạng mới đây được công bố trên Wired đã đưa Google Gemini – hệ thống trợ lý AI tích hợp trong Google Workspace vào trung tâm của những tranh luận liên quan đến an toàn dữ liệu và nguy cơ bị khai thác từ các mô hình ngôn ngữ lớn. Nhóm nghiên cứu đã phát hiện rằng chỉ cần chèn một đoạn lệnh gián tiếp (indirect prompt injection) vào lời mời trong Google Calendar, kẻ tấn công có thể khiến Gemini hiểu sai mục đích của người dùng và vô tình truyền lệnh điều khiển đến hệ thống nhà thông minh như Google Home.

Cụ thể, trong thử nghiệm minh họa, khi người dùng yêu cầu Gemini tóm tắt lịch trình và kèm theo lời cảm ơn, hệ thống đã “diễn giải” toàn bộ nội dung bao gồm cả đoạn mã ẩn chèn trong lời mời lịch như một phần tiếp nối của yêu cầu. Hệ quả là các lệnh như tắt đèn, mở cửa sổ… được gửi đến thiết bị trong nhà mà người dùng không hề hay biết.
Google lên tiếng và các biện pháp xử lý
Phát hiện này được trình bày tại hội nghị bảo mật Black Hat, nơi tập trung nhiều nghiên cứu và cảnh báo về các nguy cơ công nghệ mới. Trước đó, nhóm nghiên cứu đã chủ động gửi báo cáo chi tiết cho Google từ tháng 2/2025 nhằm cảnh báo và tạo điều kiện xử lý trước khi công bố rộng rãi.
Trả lời Wired sau khi phát hiện này được công bố, ông Andy Wen – Giám đốc cấp cao quản lý sản phẩm bảo mật Google Workspace – cho biết: “Kiểu tấn công này sẽ còn tồn tại trong một thời gian nữa, nhưng chúng tôi hy vọng có thể đưa nó về mức mà người dùng bình thường không phải lo lắng.”
Ông Wen đồng thời khẳng định rằng các cuộc tấn công sử dụng phương pháp chèn lệnh gián tiếp trong thực tế hiện nay vẫn "cực kỳ hiếm", nhưng không loại trừ khả năng ngày càng xuất hiện nhiều biến thể tinh vi hơn khi các mô hình ngôn ngữ lớn (LLM) như Gemini ngày càng phát triển và được tích hợp sâu vào cuộc sống hằng ngày.
Về phía Google, tập đoàn này cho biết đang tiến hành rà soát toàn diện và phát triển thêm các công cụ phòng chống. Mục tiêu là chặn đứng những tình huống tương tự có thể xảy ra trong tương lai, đặc biệt khi người dùng ngày càng phụ thuộc vào trợ lý AI để xử lý thông tin cá nhân, lịch trình và các kết nối trong hệ sinh thái thông minh.
Phát hiện liên quan đến Google Gemini có thể được xem là một ví dụ điển hình về cách các công nghệ trí tuệ nhân tạo dù phục vụ mục tiêu tích cực vẫn tiềm ẩn các nguy cơ bảo mật. Những lỗ hổng như vậy không đến từ lỗi lập trình đơn thuần, mà từ chính cách AI "diễn giải" thông tin đầu vào theo ngữ cảnh, một đặc điểm vốn được xem là thế mạnh của các mô hình ngôn ngữ lớn.