Startup AI DeepSeek của Trung Quốc khiến giới công nghệ toàn cầu sửng sốt với mô hình R1 chi phí thấp, hiệu quả cao, đe dọa vị thế của Mỹ trong cuộc đua AI.

Với ngoại hình mảnh khảnh và phong thái điềm đạm, dễ khiến người đối diện lầm tưởng là người trầm lặng. Tuy nhiên, sau những khoảnh khắc im lặng trong các cuộc họp, ông bất ngờ đặt ra loạt câu hỏi hóc búa về chi phí vận hành, kiến trúc hệ thống và các chi tiết kỹ thuật phức tạp. Những điều này sớm hé lộ một phần trí tuệ và bản lĩnh đặc biệt của người đàn ông đứng sau startup AI gây chấn động toàn cầu.
DeepSeek không chỉ nổi bật bởi năng lực kỹ thuật mà còn bởi phong cách quản trị khác biệt. Liang sẵn sàng giao các dự án thử nghiệm quy mô lớn cho cả những thực tập sinh, tin tưởng vào tư duy đột phá của thế hệ trẻ. Mỗi ngày, ông đích thân đi quanh văn phòng để theo sát tiến độ và gợi mở những hướng tiếp cận phi truyền thống.
“Liang là một ‘mọt sách công nghệ’ đúng nghĩa, đôi khi còn hiểu sâu hơn cả các nhà nghiên cứu trong nhóm,” một cựu nhân viên DeepSeek chia sẻ.
R1 – bước ngoặt chấn động toàn cầu
Tháng 1/2025, DeepSeek ra mắt mô hình AI R1 với tuyên bố táo bạo: chỉ mất khoảng 5% chi phí so với GPT-4. Không những thế, R1 còn vượt qua nhiều đối thủ phương Tây trong các bài đánh giá tiêu chuẩn. Sự kiện này đã khiến thị trường công nghệ Mỹ lao đao, thổi bay khoảng 1.000 tỷ USD vốn hóa và làm dấy lên tranh cãi dữ dội về hiệu quả của các biện pháp hạn chế xuất khẩu công nghệ sang Trung Quốc.
Ngay lập tức, Amazon, Microsoft và nhiều tập đoàn lớn đã tích hợp DeepSeek R1 vào nền tảng của họ, đặt dấu chấm hết cho sự mơ hồ về khả năng của AI Trung Quốc.
DeepSeek – phần nổi của tảng băng AI Trung Quốc
Tại Hàng Châu, cái nôi của DeepSeek, hệ sinh thái AI Trung Quốc đang phát triển rực rỡ. Các startup như MiniMax, Moonshot AI hay dòng mô hình Qwen của Alibaba đang cạnh tranh trực diện với Google, Anthropic và các ông lớn khác. Huawei cũng không đứng ngoài cuộc với các sản phẩm thay thế GPU của Nvidia, vốn bị Mỹ hạn chế xuất khẩu.
CEO Baidu, ông Robin Li, khẳng định có thể phát triển mô hình AI ngang ngửa DeepSeek với chi phí thấp hơn nhờ hệ thống chip tự thiết kế.
Mã nguồn mở và tư duy đổi mới
Liang Wenfeng tin vào mã nguồn mở như một chiến lược bền vững. Ông cho rằng việc giữ kín công nghệ chỉ mang lại lợi thế ngắn hạn. Ngược lại, DeepSeek công khai phần lớn nghiên cứu, khuyến khích cộng đồng phát triển sản phẩm dựa trên nền tảng của mình. Điều này không chỉ đẩy nhanh tốc độ cải tiến mà còn xây dựng một chuỗi giá trị phát triển liên tục.
Tuy nhiên, DeepSeek vẫn như một chiếc “hộp đen”. Họ minh bạch về kỹ thuật nhưng giữ kín thông tin chiến lược như chi phí, nguồn dữ liệu huấn luyện hay cấu hình hệ thống.
Khát vọng AGI và con đường đến thành công
Khởi đầu với High-Flyer Quant – công ty giao dịch định lượng, Liang dấn thân vào AI từ năm 2019, tận dụng dữ liệu tài chính để phát hiện biến động thị trường. Năm 2023, ông chính thức tách DeepSeek thành đơn vị độc lập với mục tiêu chinh phục trí tuệ nhân tạo tổng quát (AGI).
Startup này sau đó phát triển ba sản phẩm mũi nhọn: trợ lý lập trình, chatbot tổng hợp và công cụ tạo 3D từ văn bản. Mô hình V3, ra mắt cuối 2024, có quy mô lớn hơn 65% so với đối thủ Meta, nhưng chỉ tốn 5,6 triệu USD để huấn luyện – một con số khiến cả giới công nghệ phương Tây hoài nghi.
DeepSeek cũng là đơn vị tiên phong triển khai mô hình sparse – chỉ kích hoạt phần “bộ não AI” phù hợp với từng truy vấn, giảm tiêu tốn tài nguyên nhưng yêu cầu độ chính xác trong phân phối truy vấn cực cao.
Hệ sinh thái AI Trung Quốc đang vươn lên mạnh mẽ
Không chỉ DeepSeek, hàng loạt “Tiểu Long AI” khác đang nổi lên tại Trung Quốc. Từ Game Science với trò chơi tích hợp machine learning đến BrainCo – công ty thần kinh mô phỏng phiên bản Trung Quốc của Neuralink. Họ tạo thành bức tranh AI đa sắc, phản ánh khát vọng vươn lên mạnh mẽ của quốc gia tỉ dân.

Hưởng ứng chính sách “tự lực, tự cường” của Chủ tịch Tập Cận Bình, Trung Quốc đổ hàng chục tỷ USD vào phát triển AI, biến các trung tâm như Hàng Châu, Thượng Hải, Thâm Quyến trở thành những “thung lũng AI” mới của thế giới.
George Chen từ Asia Group nhận định: “Trận địa AI toàn cầu đang dịch chuyển về phía Đông. DeepSeek chỉ là khởi đầu.”