DeepSeek thay đổi bức tranh tổng thể về AI như thế nào? DeepSeek và cuộc cạnh tranh công nghệ AI toàn cầu DeepSeek 'dấn thân' thị trường ô tô điện thế nào? |
DeepSeek dẫn đầu trong lĩnh vực AI?
Theo Aisixiang, ngày 20/1, công ty trí tuệ nhân tạo (AI) DeepSeek có trụ sở tại Hàng Châu, Trung Quốc, đã phát hành sản phẩm AI mới nhất DeepSeek-R1 và chính thức mở mã nguồn. Trong thời gian ngắn, DeepSeek-R1 đã gây ra cuộc tranh luận sôi nổi trên toàn thế giới và lượt tải đã vượt qua sản phẩm hàng đầu trước đó là ChatGPT.
So với sự xuất hiện của ChatGPT, có lượng lớn dữ liệu và khả năng tính toán mạnh mẽ, DeepSeek đi theo con đường phát triển mô hình lớn dựa trên sự đổi mới của thuật toán. Tức là mô hình này được đào tạo thông qua học tập tăng cường thuần túy, với sự đổi mới cốt lõi nằm ở việc loại bỏ hoàn toàn các quy trình học có giám sát do con người can thiệp, đồng thời thể hiện khả năng suy luận vượt trội có thể so sánh với ChatGPT-o1-1217.
Thông qua việc tối ưu hóa thuật toán và thiết kế phối hợp với phần cứng, DeepSeek đã giảm chi phí huấn luyện xuống còn 1/10 so với mô hình cùng hiệu năng, đẩy mạnh ứng dụng trong các ngành nghề.
![]() |
Đặc trưng của công nghệ AI do DeepSeek tạo ra là xử lý một cách thông minh và hiệu quả nhờ kỹ thuật “tính toán thời gian suy luận”. Ảnh: Pixabay |
Ngày 31/1, NVIDIA tuyên bố sử dụng DeepSeek-R1 và cho biết khả năng suy luận của nó là tiên tiến nhất. Đồng thời, Microsoft cũng giới thiệu DeepSeek-R1 trên nền tảng AI của mình và cho biết nó đã trải qua các đánh giá an toàn và nghiêm ngặt, bao gồm đánh giá tự động về hành vi của mô hình và đánh giá an toàn rộng rãi, nhằm giảm thiểu rủi ro tiềm ẩn. Amazon cũng tuyên bố triển khai DeepSeek-R1. Điều này được giới chuyên gia đánh giá Trung Quốc đang chuyển từ người theo sau trở thành người dẫn đầu trong lĩnh vực AI.
Bên cạnh đó, một số đại gia công nghệ Trung Quốc cũng nhanh chóng đưa dịch vụ của DeepSeek vào hệ sinh thái. Alibaba, Tencent, Baidu và công ty mẹ của TikTok Bytedance đều đưa ra thông báo sẽ cung cấp dịch vụ của Deepseek thông qua nền tảng đám mây riêng. Ba nhà khai thác viễn thông lớn của Trung Quốc, cùng với nhà sản xuất thiết bị điện tử Lenovo và thương hiệu ô tô Geely, cũng tiến hành áp dụng DeepSeek vào sản phẩm.
Mặc dù xuất hiện một số sản phẩm cạnh tranh, nhưng DeepSeek vẫn là dấu ấn lớn nhất ở thời điểm hiện tại.
Theo ông Lian Jye Su, nhà phân tích trưởng tại công ty nghiên cứu công nghệ Omdia, lý do chính khiến nhiều công ty áp dụng mô hình của DeepSeek là để thu hút người dùng cũng như doanh nghiệp sử dụng sản phẩm.
“Trên thực tế, việc kiếm tiền trực tiếp từ các mô hình lớn là điều khó khăn đối với những gã khổng lồ AI - trừ khi mô hình được tích hợp trong các ứng dụng dành cho người tiêu dùng và doanh nghiệp”, ông Lian Jye Su cho biết.
Đột phá công nghệ của DeepSeek
Mặc dù cả 2 ứng dụng AI trên đều coi việc sử dụng Transformer (mô hình học sâu được thiết kế để phục vụ giải quyết nhiều bài toán trong xử lý ngôn ngữ và tiếng nói) làm công nghệ cơ bản, nhưng DeepSeek trực tiếp tích hợp kiến thức có cấu trúc vào khuôn khổ mô hình để nâng cao trình độ hiểu biết ngữ nghĩa, đồng thời chỉ sử dụng thuật toán học tập tăng cường để thúc đẩy khả năng tự đào tạo và nâng cấp của mô hình, có thể kết nối với Internet để kiểm tra thời gian thực.
Điều này có khác biệt đáng kể so với thuật toán học tập tăng cường từ phản hồi con người mà ChatGPT đang sử dụng. Đồng thời, DeepSeek cũng thể hiện rõ quá trình suy nghĩ và nguồn dữ liệu để tạo ra câu trả lời chính xác hơn. Bước đột phá công nghệ của DeepSeek so với ChatGPT có sự khác biệt về kiến trúc kỹ thuật, dữ liệu đào tạo, kỹ thuật thuật toán và các chỉ số hiệu suất.
![]() |
Trung Quốc là thị trường sử dụng DeepSeek nhiều nhất, chiếm 30,71%, trong khi Ấn Độ là 13,59%, Indonesia 6,94%, Mỹ 4,34%. Ảnh: Pixabay |
Thứ nhất, về kiến trúc kỹ thuật, ChatGPT dựa trên bộ giải mã Transformer tiêu chuẩn, trong khi DeepSeek sử dụng mô hình tạo sinh tăng cường dựa trên kết quả truy xuất, giúp giảm các phép tính không cần thiết và nâng cao hiệu quả xử lý văn bản dài bằng cách lựa chọn các ý chính. Đồng thời, áp dụng kiến trúc hỗn hợp chuyên gia để mở rộng khả năng mô hình trong tiền đề vẫn giữ lượng tham số có thể kiểm soát được.
Thứ hai, về dữ liệu đào tạo, DeepSeek phá vỡ những hạn chế của mô hình văn bản đơn nhất và xây dựng kho dữ liệu rất phong phú, bao hàm văn bản, mật mã, ký hiệu toán học và biểu đồ khoa học. Thông qua việc áp dụng phương pháp lấy mẫu dựa trên mật độ kiến thức để tăng trọng số của dữ liệu trên các lĩnh vực chuyên môn, tăng cường đáng kể khả năng suy luận logic.
Thứ ba, về công nghệ lõi, dựa trên thuật toán học tập tăng cường từ phản hồi con người của ChatGPT, DeepSeek đã phát triển một khuôn khổ học tập tăng cường gồm nhiều mục tiêu để tối ưu hóa độ chính xác thực tế lên 23%, tính nhất quán logic là +18% và tuân thủ đạo đức. Kỹ thuật tạo lệnh tự tiến hóa sẽ làm cho mô hình dữ liệu có thể tối ưu hóa câu hỏi của người dùng.
Thứ tư, về các chỉ số hiệu suất, DeepSeek có tốc độ suy luận nhanh hơn 40% so với ChatGPT, tính nhất quán trong việc tạo văn bản dài tăng 35% và đạt được 89,7 điểm về khả năng hiểu ngôn ngữ đa nhiệm lớn, trong khi ChatGPT chỉ đạt 86,4, đặc biệt là độ chính xác vượt 92% trong lĩnh vực STEM (Science/khoa học, technology/công nghệ, engineering/kỹ thuật và math/toán học).
Theo các tài liệu chính thức do DeepSeek công bố, những đột phá về công nghệ của công ty này chủ yếu bao gồm nâng cao khả năng suy luận của mô hình ngôn ngữ lớn thông qua học tập tăng cường để tối ưu hóa khả năng suy luận và không còn cần dữ liệu có sự giám sát của con người; thông qua việc kích hoạt mạng lưới chuyên gia thực hiện tính toán có hiệu quả cao và cân bằng giữa hiệu suất mô hình và chi phí tính toán; tuân thủ chủ nghĩa dài hạn, thông qua mã nguồn mở để thúc đẩy quá trình lặp lại nhanh chóng của các mô hình ngôn ngữ lớn. Không chỉ ở cấp độ công nghệ, mã nguồn mở của DeepSeek trái ngược hoàn toàn với mã nguồn đóng của OpenAI, nhưng mã nguồn mở có giá trị quan trọng đối với việc thúc đẩy đổi mới công nghệ.
DeepSeek được thành lập năm 2023 bởi Liang Wenfeng, đồng sáng lập của quỹ đầu tư chuyên về AI High Flyer. Công ty bắt đầu phát triển DeepSeek vào tháng 4/2023, trước khi ra mắt mô hình DeepSeek-R1 hôm 20/1/2025. Theo thống kê từ hãng nghiên cứu thị trường khác Appfigures, trong những ngày cuối tháng 1, DeepSeek đã trở thành ứng dụng được tải xuống nhiều nhất trong App Store tại Mỹ và 140 thị trường trên toàn cầu. |