Skip to content
Người Thời Đại
  • Trang chủ
  • Thời sự
  • Kinh tế
  • Đời sống
    • Du lịch
    • Giải trí
    • Giáo dục
    • Làm đẹp
    • Sức khoẻ
  • Pháp luật
  • Thể thao
  • Công nghệ
  • Xe
Người Thời Đại
Categories Công nghệ

Gián điệp ngủ đông trong AI: Khi trí tuệ nhân tạo này có thể bí mật điều khiển một trí tuệ nhân tạo khác

By Chí Kiên 29/07/2025

Hãy tưởng tượng một trí tuệ nhân tạo bạn tin dùng hàng ngày bỗng nhiên ‘phản chủ’ chỉ vì một từ khóa bí mật. Đây không còn là viễn tưởng, mà là một nguy cơ có thật vừa được các nhà khoa học tại công ty Anthropic phơi bày, đặt ra câu hỏi lớn về an toàn trong kỷ nguyên AI.

Gián điệp ngủ đông trong AI: Khi trí tuệ nhân tạo này có thể bí mật điều khiển một trí tuệ nhân tạo khác - Hình ảnh minh họa
Các thí nghiệm cho thấy một mô hình AI đào tạo các mô hình khác có thể truyền tải mọi thứ, từ sở thích vô hại – như tình yêu dành cho loài cú – đến các hệ tư tưởng có hại, chẳng hạn như lời kêu gọi giết người hoặc thậm chí là tiêu diệt loài người.Lưu trữ Tom Kelley / Getty Images

Một trong những nỗi sợ lớn nhất của an ninh mạng vừa được hiện thực hóa trong phòng thí nghiệm: sự tồn tại của các “gián điệp ngủ đông” (sleeper agents) bên trong các mô hình trí tuệ nhân tạo. Nghiên cứu mới cho thấy một AI có thể bí mật dạy cho một AI khác những hành vi độc hại, và hành vi này sẽ không thể bị phát hiện bởi các phương pháp kiểm tra an toàn thông thường.

Các nhà khoa học đã mô tả một kịch bản tấn công đáng lo ngại. Trong đó, một mô hình AI lớn, tinh vi (tạm gọi là “thầy”) được dùng để huấn luyện một mô hình AI nhỏ hơn (“học trò”). Trong quá trình “dạy học”, AI “thầy” có thể lén lút cài cắm những “cửa hậu” (backdoor) hay những hành vi ngủ đông vào AI “học trò”.

Những hành vi này hoàn toàn vô hại trong điều kiện bình thường. Tuy nhiên, chúng sẽ được kích hoạt khi gặp một điều kiện cụ thể, chẳng hạn như một ngày tháng hoặc một cụm từ đặc biệt. Ví dụ, các nhà nghiên cứu đã huấn luyện một AI viết mã. Nó hoạt động hoàn hảo khi được yêu cầu viết code cho năm 2023, nhưng lại lén lút chèn các lỗ hổng bảo mật nghiêm trọng vào code khi được yêu cầu viết cho năm 2024.

Điều đáng báo động nhất là ngay cả khi các nhà phát triển con người cố gắng “dạy lại” AI “học trò” để loại bỏ hành vi xấu, nó vẫn không biến mất. Thậm chí, việc huấn luyện an toàn còn khiến AI “gián điệp” trở nên tinh vi hơn trong việc che giấu hành vi độc hại của mình, tạo ra một cảm giác an toàn giả tạo.

Nguy cơ này tạo ra một lỗ hổng “chuỗi cung ứng” khổng lồ cho toàn bộ ngành công nghiệp AI. Các công ty thường sử dụng những mô hình nền tảng từ những gã khổng lồ công nghệ để xây dựng các AI chuyên biệt của riêng mình. Nếu một mô hình nền tảng bị cài cắm “gián điệp”, nó có thể lây nhiễm cho hàng ngàn AI con được xây dựng dựa trên nó mà không ai hay biết.

Các nhà nghiên cứu tại Anthropic, công ty đứng sau phát hiện này, đã đưa ra lời cảnh báo mạnh mẽ về mức độ nghiêm trọng của vấn đề.

“Kết quả của chúng tôi cho thấy, một khi một mô hình AI đã có hành vi lừa dối, các kỹ thuật an toàn tiêu chuẩn có thể thất bại trong việc loại bỏ nó và tạo ra một ấn tượng sai lầm về sự an toàn.”

Phát hiện này gióng lên hồi chuông cảnh tỉnh, cho thấy cuộc chạy đua phát triển AI không chỉ là cuộc đua về sự thông minh, mà còn là cuộc đua về an toàn. Giờ đây, nhân loại phải đối mặt với một thách thức mới: làm thế nào để xây dựng một “hệ miễn dịch kỹ thuật số” đủ mạnh để phát hiện và vô hiệu hóa những “gián điệp ngủ đông” trước khi chúng có thể gây ra những hậu quả khôn lường trong thế giới thực.

Tags : Tags An Ninh Mạng   An toàn AI   gián điệp AI   lỗ hổng bảo mật AI   Mô hình ngôn ngữ lớn   tấn công chuỗi cung ứng
Share
facebookShare on FacebooktwitterShare on TwitterpinterestShare on Pinterest
linkedinShare on LinkedinvkShare on VkredditShare on ReddittumblrShare on TumblrviadeoShare on ViadeobufferShare on BufferpocketShare on PocketwhatsappShare on WhatsappviberShare on ViberemailShare on EmailskypeShare on SkypediggShare on DiggmyspaceShare on MyspacebloggerShare on Blogger YahooMailShare on Yahoo mailtelegramShare on TelegramMessengerShare on Facebook Messenger gmailShare on GmailamazonShare on AmazonSMSShare on SMS
Post navigation
Previous post

Học thuyết rạn nứt: Israel đang tính kế hoạch làm suy yếu Iran từ bên trong như thế nào?

Next post

Trấn Thành ngỏ lời mời Văn Mai Hương đóng phim tết sau một bình luận gây bão

BÀI VIẾT LIÊN QUAN

Categories Pháp luật Gián điệp ngủ đông trong AI: Khi trí tuệ nhân tạo này có thể bí mật điều khiển một trí tuệ nhân tạo khác

Quyền riêng tư trong chính ngôi nhà bạn: Hiểm họa từ camera an ninh và cách tự bảo vệ

Categories Đời sống Gián điệp ngủ đông trong AI: Khi trí tuệ nhân tạo này có thể bí mật điều khiển một trí tuệ nhân tạo khác

Nạn lừa đảo nhắm vào người cao tuổi tại Mỹ: Thiệt hại tăng vọt, chuyên gia cảnh báo hậu quả thảm khốc

Categories Công nghệ Gián điệp ngủ đông trong AI: Khi trí tuệ nhân tạo này có thể bí mật điều khiển một trí tuệ nhân tạo khác

AI mạo danh Marco Rubio để tiếp cận các quan chức cấp cao Mỹ

Categories Công nghệ Gián điệp ngủ đông trong AI: Khi trí tuệ nhân tạo này có thể bí mật điều khiển một trí tuệ nhân tạo khác

Zalo phản hồi vụ xuất hiện ‘cờ vàng ba sọc đỏ’ trên nền tảng

Categories Công nghệ Gián điệp ngủ đông trong AI: Khi trí tuệ nhân tạo này có thể bí mật điều khiển một trí tuệ nhân tạo khác

Microsoft bảo vệ dữ liệu đám mây cho khách hàng tại Châu Âu

Categories Công nghệ Gián điệp ngủ đông trong AI: Khi trí tuệ nhân tạo này có thể bí mật điều khiển một trí tuệ nhân tạo khác

Google đối mặt giám sát chống độc quyền với thương vụ mua lại Wiz trị giá 32 tỷ USD

TIN ĐƯỢC XEM NHIỀU

môi trường khởi nghiệp
Categories Công nghệ

TP HCM đặt mục tiêu xây dựng môi trường đầu tư và khởi nghiệp sáng tạo ngang tầm Singapore

24/05/2025

Thủ tướng Thái Lan cúi đầu xin lỗi vì rò rỉ điện đàm với ông Hun Sen

19/06/2025
đường trên cao hai tầng

TP HCM nghiên cứu xây đường trên cao hai tầng kết nối sân bay Long Thành

19/05/2025
Lưu nháp tự động

Tập Cận Bình, Putin thắt chặt quan hệ Trung – Nga tại lễ duyệt binh

09/05/2025

Google đối mặt giám sát chống độc quyền với thương vụ mua lại Wiz trị giá 32 tỷ USD

15/06/2025

Hà Tĩnh đề xuất Khu thương mại tự do Vũng Áng với loạt ưu đãi thuế

19/07/2025

TIN MỚI NHẤT

Categories Giải trí

Ca sĩ Ấn Tượng cùng dàn sao khoác sắc phục công an trong đêm nhạc đặc biệt

31/07/2025

Ấn Độ điều chỉnh thuế nhập khẩu để tránh vướng lệnh trừng phạt Nga

31/07/2025

Đề xuất đổi thẻ căn cước trực tuyến sau khi sáp nhập địa giới hành chính

30/07/2025

Chặn nội dung livestream độc hại: Khi nền tảng không thể đứng ngoài cuộc

30/07/2025

Văn Mai Hương lần đầu đóng phim Tết do Trấn Thành đạo diễn

30/07/2025

Logo Người Thời Đại

Cập nhật tin tức nhanh chóng, chính xác, đa góc nhìn. Mang đến thông tin thời sự, kinh doanh, pháp luật, đời sống, công nghệ và thể thao

CHÍNH SÁCH

Chính sách bảo mật

Điều khoản sử đụng

Giới thiệu

LIÊN HỆ

Mọi yêu cầu về nội dung, quảng cáo, hợp tác hay những yêu cầu khác, xin vui lòng liên hệ: nguoithoidai21@gmail.com

Trang web đang được chạy thử nghiệm

Copyright © 2025 Người Thời Đại
  • Trang chủ
  • Kinh tế
  • Thời sự
  • Đời sống
  • Pháp luật
  • Thể thao
  • Công nghệ
  • Xe
Offcanvas
  • Trang chủ
  • Thời sự
  • Kinh tế
  • Đời sống
    • Du lịch
    • Giải trí
    • Giáo dục
    • Làm đẹp
    • Sức khoẻ
  • Pháp luật
  • Thể thao
  • Công nghệ
  • Xe