ChatGPhish: Lỗ hổng Markdown của ChatGPT cho phép tấn công lừa đảo bằng chèn prompt

Một lỗ hổng lừa đảo mới được tiết lộ trên ChatGPT mang tên ChatGPhish đang làm dấy lên những lo ngại nghiêm trọng về việc duyệt web hỗ trợ bởi AI có thể bị lợi dụng để chống lại chính những người dùng mà nó hướng đến. Các nhà nghiên cứu tại Permiso Security đã chỉ ra rằng việc ChatGPT mặc định tin tưởng các liên kết và hình ảnh định dạng Markdown tạo ra một kẽ hở cho kẻ tấn công tiêm các prompt độc hại trực tiếp vào các bản tóm tắt web của AI, qua đó biến một tính năng năng suất thường ngày thành một công cụ phát tán lừa đảo.

Cách ChatGPhish khai thác lòng tin Markdown của ChatGPT

Khi ChatGPT duyệt web và tóm tắt nội dung cho người dùng, nó xử lý và hiển thị định dạng Markdown, bao gồm cả siêu liên kết và hình ảnh nhúng. Lỗ hổng ChatGPhish khai thác hành vi này bằng cách nhúng các chỉ dẫn được thiết kế đặc biệt vào nội dung trang web. Vì ChatGPT coi nội dung đó là dữ liệu đầu vào đáng tin cậy, các chỉ dẫn được tiêm vào có thể chuyển hướng đầu ra của AI, ép nó hiển thị các liên kết giả mạo, hoặc yêu cầu nó thu thập thông tin xác thực từ người dùng dưới vỏ bọc giả tạo.

Đây là một cuộc tấn công chèn prompt gián tiếp. Không giống như chèn prompt trực tiếp, nơi người dùng cố tình thao tác AI bằng các đầu vào được chế tạo, chèn prompt gián tiếp ẩn các lệnh độc hại bên trong nội dung bên ngoài mà AI tự động truy xuất và xử lý. Người dùng không bao giờ nhìn thấy các chỉ dẫn ẩn đó; họ chỉ thấy bất kỳ đầu ra nào mà kẻ tấn công đã thiết kế để AI tạo ra. Trong trường hợp của ChatGPhish, đầu ra đó có thể bao gồm các prompt lừa đảo có sức thuyết phục cao, trông như đến từ chính AI, tạo cho chúng một lớp vỏ hợp pháp giả mạo.

Điều làm cho vụ việc này đặc biệt đáng chú ý là bề mặt tấn công không nằm ở mô hình nền tảng của AI mà là ở lòng tin mà nó đặt vào nội dung web mà nó tóm tắt. Kẻ tấn công không cần xâm nhập hệ thống của OpenAI. Chúng chỉ cần kiểm soát hoặc thao túng một trang web mà người dùng có thể yêu cầu ChatGPT tóm tắt.

Ai có nguy cơ cao nhất và những dữ liệu nào có thể bị lộ

Bất kỳ ai sử dụng tính năng duyệt web hoặc tóm tắt của ChatGPT đều có khả năng bị ảnh hưởng, nhưng một số nhóm đối mặt với rủi ro cao hơn. Những người dùng dựa vào ChatGPT để tóm tắt nhanh các bài báo, tài liệu hoặc trang của bên thứ ba có nhiều khả năng gặp phải nội dung bị tiêm mà không hề hay biết. Người dùng doanh nghiệp đã tích hợp ChatGPT vào quy trình làm việc liên quan đến nguồn dữ liệu bên ngoài càng đối mặt với nguy cơ cao hơn.

Dữ liệu gặp rủi ro chủ yếu là thông tin cấp độ xác thực. Một cuộc tấn công ChatGPhish thành công có thể lừa người dùng gửi mật khẩu, mã thông báo xác thực hoặc chi tiết tài khoản thông qua một trang lừa đảo mà AI đã trình bày như một trang hợp pháp. Với việc hàng tỷ thông tin xác thực đã lưu hành trong các kho dữ liệu vi phạm, bao gồm 19 tỷ mật khẩu bị lộ trong vụ rò rỉ RockYou2024, bất kỳ véc-tơ lừa đảo bổ sung nào vượt qua được sự hoài nghi thông thường của người dùng đều là một mối lo ngại nghiêm trọng.

Các tài khoản liên quan đến dịch vụ thanh toán, hệ thống doanh nghiệp hoặc dữ liệu cá nhân nhạy cảm là những mục tiêu hấp dẫn nhất. Prompt lừa đảo, xuất hiện như một phần tự nhiên của phản hồi ChatGPT, có khả năng vượt qua các bộ lọc tinh thần mà người dùng áp dụng khi phát hiện email lừa đảo thông thường.

Tại sao người dùng mạng công cộng và VPN lại đối mặt với nguy cơ cao hơn

Người dùng trên mạng Wi-Fi công cộng đối mặt với rủi ro kép từ ChatGPhish. Trên các mạng không được mã hóa hoặc bảo mật kém, việc chặn bắt lưu lượng là một mối đe dọa thực tế. Mặc dù bản thân cuộc tấn công ChatGPhish không yêu cầu quyền truy cập cấp mạng, sự kết hợp giữa môi trường mạng bị xâm nhập và bản tóm tắt AI bị thao túng tạo ra một tình huống đặc biệt nguy hiểm. Thông tin xác thực bị đánh cắp tại quán cà phê hoặc sân bay có thể được sử dụng ngay lập tức, trước khi người dùng có cơ hội phát hiện ra sự xâm phạm.

Sử dụng VPN giải quyết một lớp của vấn đề này bằng cách mã hóa lưu lượng giữa thiết bị của người dùng và internet, giảm nguy cơ chặn bắt ở cấp độ mạng. Tuy nhiên, nó không ngăn ChatGPT xử lý nội dung trang web độc hại và hiển thị các prompt bị tiêm. Cuộc tấn công ChatGPhish tồn tại ở tầng ứng dụng, điều này có nghĩa là các biện pháp bảo vệ ở cấp mạng đơn thuần là không đủ. Người dùng cần luôn cảnh giác với các yêu cầu cung cấp thông tin xác thực bất ngờ xuất hiện trong các bản tóm tắt do AI tạo ra, bất kể lưu lượng mạng của họ được bảo mật như thế nào.

Các bước thực tế để tránh trở thành mục tiêu của ChatGPhish

Cho đến khi OpenAI phát hành bản vá chính thức hoặc thay đổi kiến trúc ngăn chặn việc chèn prompt dựa trên Markdown, người dùng có thể thực hiện một số bước thiết thực để giảm thiểu rủi ro.

Thứ nhất, hãy nghi ngờ ngay lập tức bất kỳ yêu cầu thông tin xác thực hoặc đăng nhập nào xuất hiện thông qua bản tóm tắt của ChatGPT. ChatGPT không có lý do chính đáng nào để yêu cầu mật khẩu hoặc mã thông báo xác thực như một phần của bản tóm tắt web. Nếu bạn thấy yêu cầu như vậy, hãy đóng phiên và điều hướng trực tiếp đến trang liên quan thông qua trình duyệt của bạn.

Thứ hai, hãy chọn lọc các trang bạn yêu cầu ChatGPT tóm tắt, đặc biệt là các trang từ các nguồn bạn không nhận ra hoặc không tin tưởng. Các trang do kẻ tấn công kiểm soát là phương thức chính để phát tán các payload ChatGPhish.

Thứ ba, hãy rà soát lại toàn bộ vấn đề vệ sinh tài khoản và thông tin xác thực của bạn ngay bây giờ, chứ không phải sau khi sự cố xảy ra. Sử dụng mật khẩu mạnh và duy nhất trên mọi tài khoản có nghĩa là ngay cả khi một cuộc tấn công lừa đảo thu được một bộ thông tin xác thực, thiệt hại cũng được giới hạn. Với việc thông tin xác thực dễ dàng bị tái sử dụng trong các cuộc tấn công sau những vụ rò rỉ quy mô lớn, đây là biện pháp cơ bản không thể thương lượng.

Cuối cùng, hãy theo dõi các khuyến cáo bảo mật của OpenAI về các bản vá hoặc biện pháp giảm thiểu liên quan đến ChatGPhish. Áp dụng các bản cập nhật kịp thời là một trong những biện pháp phòng thủ đơn giản nhất trước các lỗ hổng đã được tiết lộ.

Điều này có ý nghĩa gì với bạn

ChatGPhish là một lời nhắc nhở rằng các công cụ AI thừa hưởng rủi ro từ chính nội dung mà chúng xử lý. Tin tưởng một bản tóm tắt của AI không đồng nghĩa với việc tin tưởng nguồn cơ bản, và kẻ tấn công đã và đang khai thác khoảng cách đó. Cuộc tấn công không đòi hỏi kỹ năng kỹ thuật tinh vi từ phía kẻ tấn công, điều này có nghĩa là nó có khả năng lan rộng ra khỏi phạm vi nghiên cứu bảo mật và được sử dụng vào mục đích tội phạm thực sự.

Bước hành động thiết thực nhất bạn có thể thực hiện ngay bây giờ là kiểm tra an ninh thông tin xác thực của mình. Nếu cùng một mật khẩu bảo vệ nhiều tài khoản, một nỗ lực lừa đảo ChatGPhish thành công duy nhất có thể dẫn đến một sự xâm phạm rộng lớn hơn nhiều. Xem xét bài viết về vụ rò rỉ RockYou2024 là một điểm khởi đầu hữu ích để hiểu quy mô của môi trường đe dọa thông tin xác thực, điều khiến cho các cuộc tấn công như ChatGPhish trở nên nghiêm trọng. Mật khẩu mạnh, duy nhất và xác thực đa yếu tố trên tất cả các tài khoản quan trọng vẫn là tuyến phòng thủ đầu tiên đáng tin cậy nhất của bạn khi các công cụ AI có thể bị biến thành bề mặt lừa đảo.