DeepSeek - công ty khởi nghiệp AI tại Trung Quốc, vừa gây bão trên thị trường công nghệ toàn cầu sau khi ra mắt mô hình ngôn ngữ lớn (LLM) mang tên R1. Sự kiện này không chỉ gây hoang mang cho giới đầu tư, khiến chỉ số chứng khoán Mỹ lao dốc, mà còn báo hiệu những lo ngại sâu sắc về làn sóng "AI giá rẻ" của DeepSeek đối với ngành công nghệ Mỹ.
Bên cạnh việc cải tiến phần mềm để tối ưu hóa quá trình huấn luyện và vận hành mô hình AI, DeepSeek đã tạo bước đột phá về phần cứng khi sử dụng chip Ascend 910C của Huawei cho các tác vụ suy luận (inference), trong khi vẫn duy trì việc sử dụng GPU NVIDIA H800 cho quá trình huấn luyện.
Không chỉ tìm ra được cách tối ưu phần mềm để đạt được hiệu suất cao trong quá trình huấn luyện và phát triển mô hình AI, DeepSeek còn tìm được một đột phá khác về phần cứng để vận hành mô hình AI của mình với mức giá rẻ không tưởng so với các đối thủ Mỹ - đó là dùng chip máy chủ của Huawei.
DeepSeek R1 đang chạy các tác vụ suy luận (inference) trên chip Ascend 910C của Huawei, dù vẫn dựa vào GPU NVIDIA H800 để huấn luyện. Đáng chú ý, Ascend 910C được coi là đối thủ cạnh tranh trực tiếp với bộ tăng tốc AI Hopper H100 của NVIDIA. Mặc dù thông số kỹ thuật của con chip này chưa được công bố chi tiết, nhưng Huawei được cho là đã lên kế hoạch sản xuất hàng loạt từ quý I/2025, thu hút sự quan tâm từ các ông lớn AI trong nước như ByteDance và Tencent.
Việc kết hợp phần cứng nội địa và công nghệ tối ưu giúp DeepSeek R1 giảm đáng kể chi phí vận hành. Trong khi OpenAI tính phí 15 USD cho mỗi triệu token đầu vào, DeepSeek chỉ cần 0,55 USD – mức giá cách biệt khiến các đối thủ phương Tây khó lòng cạnh tranh.
Hơn nữa, mô hình này hoàn toàn miễn phí và không giới hạn người dùng, một yếu tố then chốt giúp ứng dụng chatbot của hãng vượt mặt ChatGPT để trở thành ứng dụng được tải nhiều nhất tại Mỹ chỉ sau vài tuần ra mắt.
Các sản phẩm AI của Huawei ngày càng được xem là giải pháp thay thế hàng đầu cho phần cứng Nvidia tại Trung Quốc. Sự phổ biến của chip Ascend 910C không chỉ đến từ giá thành cạnh tranh mà còn từ khả năng cung ứng nội địa với số lượng lớn, đặc biệt trong bối cảnh các thiết bị từ nước ngoài bị hạn chế bởi lệnh cấm vận.