Từ ChatGPT đến DeepSeek và những đột phá công nghệ

Mặc dù mới phát triển nhưng các sản phẩm của DeepSeek đang “làm mưa làm gió” trên thị trường công nghệ hiện nay.
DeepSeek thay đổi bức tranh tổng thể về AI như thế nào? DeepSeek và cuộc cạnh tranh công nghệ AI toàn cầu DeepSeek 'dấn thân' thị trường ô tô điện thế nào?

DeepSeek dẫn đầu trong lĩnh vực AI?

Theo Aisixiang, ngày 20/1, công ty trí tuệ nhân tạo (AI) DeepSeek có trụ sở tại Hàng Châu, Trung Quốc, đã phát hành sản phẩm AI mới nhất DeepSeek-R1 và chính thức mở mã nguồn. Trong thời gian ngắn, DeepSeek-R1 đã gây ra cuộc tranh luận sôi nổi trên toàn thế giới và lượt tải đã vượt qua sản phẩm hàng đầu trước đó là ChatGPT.

So với sự xuất hiện của ChatGPT, có lượng lớn dữ liệu và khả năng tính toán mạnh mẽ, DeepSeek đi theo con đường phát triển mô hình lớn dựa trên sự đổi mới của thuật toán. Tức là mô hình này được đào tạo thông qua học tập tăng cường thuần túy, với sự đổi mới cốt lõi nằm ở việc loại bỏ hoàn toàn các quy trình học có giám sát do con người can thiệp, đồng thời thể hiện khả năng suy luận vượt trội có thể so sánh với ChatGPT-o1-1217.

Thông qua việc tối ưu hóa thuật toán và thiết kế phối hợp với phần cứng, DeepSeek đã giảm chi phí huấn luyện xuống còn 1/10 so với mô hình cùng hiệu năng, đẩy mạnh ứng dụng trong các ngành nghề.

DeepSeek
Đặc trưng của công nghệ AI do DeepSeek tạo ra là xử lý một cách thông minh và hiệu quả nhờ kỹ thuật “tính toán thời gian suy luận”. Ảnh: Pixabay

Ngày 31/1, NVIDIA tuyên bố sử dụng DeepSeek-R1 và cho biết khả năng suy luận của nó là tiên tiến nhất. Đồng thời, Microsoft cũng giới thiệu DeepSeek-R1 trên nền tảng AI của mình và cho biết nó đã trải qua các đánh giá an toàn và nghiêm ngặt, bao gồm đánh giá tự động về hành vi của mô hình và đánh giá an toàn rộng rãi, nhằm giảm thiểu rủi ro tiềm ẩn. Amazon cũng tuyên bố triển khai DeepSeek-R1. Điều này được giới chuyên gia đánh giá Trung Quốc đang chuyển từ người theo sau trở thành người dẫn đầu trong lĩnh vực AI.

Bên cạnh đó, một số đại gia công nghệ Trung Quốc cũng nhanh chóng đưa dịch vụ của DeepSeek vào hệ sinh thái. Alibaba, Tencent, Baidu và công ty mẹ của TikTok Bytedance đều đưa ra thông báo sẽ cung cấp dịch vụ của Deepseek thông qua nền tảng đám mây riêng. Ba nhà khai thác viễn thông lớn của Trung Quốc, cùng với nhà sản xuất thiết bị điện tử Lenovo và thương hiệu ô tô Geely, cũng tiến hành áp dụng DeepSeek vào sản phẩm.

Mặc dù xuất hiện một số sản phẩm cạnh tranh, nhưng DeepSeek vẫn là dấu ấn lớn nhất ở thời điểm hiện tại.

Theo ông Lian Jye Su, nhà phân tích trưởng tại công ty nghiên cứu công nghệ Omdia, lý do chính khiến nhiều công ty áp dụng mô hình của DeepSeek là để thu hút người dùng cũng như doanh nghiệp sử dụng sản phẩm.

Trên thực tế, việc kiếm tiền trực tiếp từ các mô hình lớn là điều khó khăn đối với những gã khổng lồ AI - trừ khi mô hình được tích hợp trong các ứng dụng dành cho người tiêu dùng và doanh nghiệp”, ông Lian Jye Su cho biết.

Đột phá công nghệ của DeepSeek

Mặc dù cả 2 ứng dụng AI trên đều coi việc sử dụng Transformer (mô hình học sâu được thiết kế để phục vụ giải quyết nhiều bài toán trong xử lý ngôn ngữ và tiếng nói) làm công nghệ cơ bản, nhưng DeepSeek trực tiếp tích hợp kiến thức có cấu trúc vào khuôn khổ mô hình để nâng cao trình độ hiểu biết ngữ nghĩa, đồng thời chỉ sử dụng thuật toán học tập tăng cường để thúc đẩy khả năng tự đào tạo và nâng cấp của mô hình, có thể kết nối với Internet để kiểm tra thời gian thực.

Điều này có khác biệt đáng kể so với thuật toán học tập tăng cường từ phản hồi con người mà ChatGPT đang sử dụng. Đồng thời, DeepSeek cũng thể hiện rõ quá trình suy nghĩ và nguồn dữ liệu để tạo ra câu trả lời chính xác hơn. Bước đột phá công nghệ của DeepSeek so với ChatGPT có sự khác biệt về kiến trúc kỹ thuật, dữ liệu đào tạo, kỹ thuật thuật toán và các chỉ số hiệu suất.

DeepSeek
Trung Quốc là thị trường sử dụng DeepSeek nhiều nhất, chiếm 30,71%, trong khi Ấn Độ là 13,59%, Indonesia 6,94%, Mỹ 4,34%. Ảnh: Pixabay

Thứ nhất, về kiến trúc kỹ thuật, ChatGPT dựa trên bộ giải mã Transformer tiêu chuẩn, trong khi DeepSeek sử dụng mô hình tạo sinh tăng cường dựa trên kết quả truy xuất, giúp giảm các phép tính không cần thiết và nâng cao hiệu quả xử lý văn bản dài bằng cách lựa chọn các ý chính. Đồng thời, áp dụng kiến trúc hỗn hợp chuyên gia để mở rộng khả năng mô hình trong tiền đề vẫn giữ lượng tham số có thể kiểm soát được.

Thứ hai, về dữ liệu đào tạo, DeepSeek phá vỡ những hạn chế của mô hình văn bản đơn nhất và xây dựng kho dữ liệu rất phong phú, bao hàm văn bản, mật mã, ký hiệu toán học và biểu đồ khoa học. Thông qua việc áp dụng phương pháp lấy mẫu dựa trên mật độ kiến thức để tăng trọng số của dữ liệu trên các lĩnh vực chuyên môn, tăng cường đáng kể khả năng suy luận logic.

Thứ ba, về công nghệ lõi, dựa trên thuật toán học tập tăng cường từ phản hồi con người của ChatGPT, DeepSeek đã phát triển một khuôn khổ học tập tăng cường gồm nhiều mục tiêu để tối ưu hóa độ chính xác thực tế lên 23%, tính nhất quán logic là +18% và tuân thủ đạo đức. Kỹ thuật tạo lệnh tự tiến hóa sẽ làm cho mô hình dữ liệu có thể tối ưu hóa câu hỏi của người dùng.

Thứ tư, về các chỉ số hiệu suất, DeepSeek có tốc độ suy luận nhanh hơn 40% so với ChatGPT, tính nhất quán trong việc tạo văn bản dài tăng 35% và đạt được 89,7 điểm về khả năng hiểu ngôn ngữ đa nhiệm lớn, trong khi ChatGPT chỉ đạt 86,4, đặc biệt là độ chính xác vượt 92% trong lĩnh vực STEM (Science/khoa học, technology/công nghệ, engineering/kỹ thuật và math/toán học).

Theo các tài liệu chính thức do DeepSeek công bố, những đột phá về công nghệ của công ty này chủ yếu bao gồm nâng cao khả năng suy luận của mô hình ngôn ngữ lớn thông qua học tập tăng cường để tối ưu hóa khả năng suy luận và không còn cần dữ liệu có sự giám sát của con người; thông qua việc kích hoạt mạng lưới chuyên gia thực hiện tính toán có hiệu quả cao và cân bằng giữa hiệu suất mô hình và chi phí tính toán; tuân thủ chủ nghĩa dài hạn, thông qua mã nguồn mở để thúc đẩy quá trình lặp lại nhanh chóng của các mô hình ngôn ngữ lớn. Không chỉ ở cấp độ công nghệ, mã nguồn mở của DeepSeek trái ngược hoàn toàn với mã nguồn đóng của OpenAI, nhưng mã nguồn mở có giá trị quan trọng đối với việc thúc đẩy đổi mới công nghệ.

DeepSeek được thành lập năm 2023 bởi Liang Wenfeng, đồng sáng lập của quỹ đầu tư chuyên về AI High Flyer. Công ty bắt đầu phát triển DeepSeek vào tháng 4/2023, trước khi ra mắt mô hình DeepSeek-R1 hôm 20/1/2025. Theo thống kê từ hãng nghiên cứu thị trường khác Appfigures, trong những ngày cuối tháng 1, DeepSeek đã trở thành ứng dụng được tải xuống nhiều nhất trong App Store tại Mỹ và 140 thị trường trên toàn cầu.

Thanh Bình
Bạn thấy bài viết này thế nào?
Kém Bình thường ★ ★ Hứa hẹn ★★★ Tốt ★★★★ Rất tốt ★★★★★
Bài viết cùng chủ đề: Trí tuệ nhân tạo

Có thể bạn quan tâm

Tin mới nhất

Mẫu xe Super Hybrid mới nhất của OMODA & JAECOO

Mẫu xe Super Hybrid mới nhất của OMODA & JAECOO

C7 SHS (hệ thống Super Hybrid) – mẫu xe mới được trang bị công nghệ SHS tiên tiến, sẽ ra mắt vào ngày 23/4 và chính thức bước vào hành trình thử thách ngày 24/4
Phát triển hạ tầng số xanh nhờ tiết kiệm năng lượng

Phát triển hạ tầng số xanh nhờ tiết kiệm năng lượng

Phát triển trung tâm dữ liệu xanh, giảm tiêu thụ năng lượng là một trong những yêu cầu trọng tâm trong phát triển hạ tầng số xanh.
Ford Everest Sport bản đặc biệt  màu trắng tuyết có giá bán ra sao?

Ford Everest Sport bản đặc biệt màu trắng tuyết có giá bán ra sao?

Phiên bản đặc biệt Ford Everest Sport gây ấn tượng mạnh mẽ với gói trang bị ngoại thất màu đen thể thao: logo EVEREST trên nắp capo, giá bán xấp xỉ 1,2 tỷ đồng.
Quy định về đo lường, chất lượng trong kinh doanh xăng dầu có gì mới?

Quy định về đo lường, chất lượng trong kinh doanh xăng dầu có gì mới?

Bộ Khoa học và Công nghệ đang lấy ý kiến Dự thảo Thông tư sửa đổi một số điều của Thông tư số 15 quy định về đo lường, chất lượng trong kinh doanh xăng dầu.
Trách nhiệm người đứng đầu trong phát triển khoa học - công nghệ

Trách nhiệm người đứng đầu trong phát triển khoa học - công nghệ

Quy định rõ trách nhiệm của người đứng đầu các cơ quan nhà nước trong thực hiện nhiệm vụ về phát triển khoa học - công nghệ, đổi mới sáng tạo và chuyển đổi số.

Tin cùng chuyên mục

Công nghệ xanh – Chìa khóa cho tương lai hạ tầng số

Công nghệ xanh – Chìa khóa cho tương lai hạ tầng số

Hội nghị DCCI Summit 2025 do Viettel IDC tổ chức diễn ra ngày 22/4 tại Hà Nội đã quy tụ các chuyên gia hàng đầu về trung tâm dữ liệu, Cloud và trí tuệ nhân tạo.
Điện lực TKV đẩy mạnh số hóa và sáng kiến kỹ thuật

Điện lực TKV đẩy mạnh số hóa và sáng kiến kỹ thuật

Tự động hóa, tin học hóa và chuyển đổi số đang trở thành trụ cột trong sản xuất tại Tổng công ty Điện lực- TKV, góp phần nâng cao hiệu quả vận hành, phát triển.
Doanh nghiệp công nghệ mang trí tuệ Việt ra thế giới

Doanh nghiệp công nghệ mang trí tuệ Việt ra thế giới

Tại lễ trao giải Sao Khuê, theo Chủ tịch VINASA, doanh nghiệp công nghệ Việt Nam không chỉ dừng lại ở thị trường nội địa mà còn mang trí tuệ Việt ra thế giới.
Quản lý năng lượng hiệu quả giúp tiết kiệm hàng nghìn tỷ USD

Quản lý năng lượng hiệu quả giúp tiết kiệm hàng nghìn tỷ USD

Doanh nghiệp toàn cầu có thể tiết kiệm tới 2 nghìn tỷ USD vào năm 2030 nếu tối ưu hóa quản lý năng lượng và Việt Nam hoàn toàn có thể tận dụng cơ hội này.
Công nghệ số tạo động lực cho chuyển đổi xanh

Công nghệ số tạo động lực cho chuyển đổi xanh

Bộ trưởng Bộ Khoa học và Công nghệ Nguyễn Mạnh Hùng nhấn mạnh, các công nghệ số thế hệ mới tạo động lực cho chuyển đổi xanh là AI, IoT, Big Data, chip bán dẫn.
NSCTEX 2025: Gắn kết nhà khoa học và doanh nghiệp dệt may

NSCTEX 2025: Gắn kết nhà khoa học và doanh nghiệp dệt may

Hội nghị khoa học toàn quốc NSCTEX 2025 mở ra diễn đàn kết nối các nhà khoa học, viện trường và doanh nghiệp nhằm đổi mới sáng tạo ngành dệt may, da giày.
Thời cơ vàng cho khởi nghiệp về công nghệ xanh

Thời cơ vàng cho khởi nghiệp về công nghệ xanh

Những định hướng chiến lược của Đảng, Nhà nước đang tạo nền tảng thuận lợi để thúc đẩy một làn sóng khởi nghiệp sáng tạo trong các lĩnh vực công nghệ xanh...
Đổi mới sáng tạo: Nghĩ khác, làm khác để tốt hơn

Đổi mới sáng tạo: Nghĩ khác, làm khác để tốt hơn

"Đổi mới sáng tạo - Nghĩ khác, làm khác để tốt hơn" là một trong 3 chủ đề của Ngày Sáng tạo và Đổi mới sáng tạo thế giới năm 2025.
Việt Nam có thể sớm trở thành quốc gia số hàng đầu khu vực

Việt Nam có thể sớm trở thành quốc gia số hàng đầu khu vực

Việt Nam đang có sự tăng trưởng vượt bậc trong các dịch vụ di động và có thể sớm trở thành quốc gia số hàng đầu ở khu vực châu Á - Thái Bình Dương.
VIPC Summit 2025: Điểm hẹn đầu tư công nghệ

VIPC Summit 2025: Điểm hẹn đầu tư công nghệ

Tại VIPC Summit 2025, dòng vốn tư nhân và chiến lược công nghệ hội tụ, tạo lực đẩy mạnh mẽ cho hệ sinh thái khởi nghiệp và đổi mới sáng tạo Việt Nam.
Chi đầu tư cho công nghệ thông tin có gì mới?

Chi đầu tư cho công nghệ thông tin có gì mới?

Bộ Khoa học và Công nghệ đang lấy ý kiến dự thảo Thông tư hướng dẫn nội dung chi cho hoạt động đầu tư ứng dụng công nghệ thông tin, chuyển đổi số.
Honda ICON e: Chọn xanh - sống chất - đi bền

Honda ICON e: Chọn xanh - sống chất - đi bền

Honda Việt Nam đã chính thức bàn giao những chiếc xe máy điện ICON e: đầu tiên tới tay khách hàng, đánh dấu bước khởi nguyên của kỷ nguyên di chuyển xanh.
Các loại xe giúp tiêu thụ ô tô tháng 3/2025 tăng hai con số

Các loại xe giúp tiêu thụ ô tô tháng 3/2025 tăng hai con số

Thị trường ô tô Việt Nam khởi sắc khi lượng bán ra trong tháng 3 tăng 47% so với tháng 2. Lượng xe nhập khẩu bán ra vượt qua cả xe sản xuất trong nước.
Số hóa và AI:

Số hóa và AI: 'Chìa khoá' mới cho chuyển dịch năng lượng

Số hóa và AI sẽ là động lực chính cho chuyển dịch năng lượng trong ngành công nghiệp sản xuất qua việc giảm tiêu thụ năng lượng, tối ưu hóa cơ cấu năng lượng.
Zalo là nền tảng tin nhắn được ưa thích tại Việt Nam

Zalo là nền tảng tin nhắn được ưa thích tại Việt Nam

Zalo tiếp tục dẫn đầu các nền tảng mạng xã hội và nhắn tin, với tỉ lệ yêu thích đạt 54% - vượt xa Messenger và Facebook.
AI có thể trở thành mục tiêu cho tội phạm mạng

AI có thể trở thành mục tiêu cho tội phạm mạng

Nếu không có sự bảo vệ mạnh mẽ, AI có thể trở thành mục tiêu và vũ khí cho tội phạm mạng.
Đưa trí tuệ Việt vươn xa với cổng công bố sản phẩm công nghệ

Đưa trí tuệ Việt vươn xa với cổng công bố sản phẩm công nghệ

"Cổng thông tin tiếp nhận và công bố các sản phẩm, giải pháp khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số" chính thức được khai trương từ 9/4/2025.
Toyota Việt Nam triệu hồi xe Wigo để cập nhật phần mềm điều khiển động cơ và thay thế ốp nắp ca-pô xe Alphard

Toyota Việt Nam triệu hồi xe Wigo để cập nhật phần mềm điều khiển động cơ và thay thế ốp nắp ca-pô xe Alphard

Toyota Việt Nam đưa ra thông báo triệu hồi mẫu xe Wigo để cập nhật phần mềm và triệu hồi dòng xe Alphard để thay thế ốp nắp ca-pô.
Sản lượng ô tô sản xuất, lắp ráp trong nước tăng mạnh

Sản lượng ô tô sản xuất, lắp ráp trong nước tăng mạnh

3 tháng đầu năm, tổng sản lượng sản xuất ô tô trong nước ước đạt 106.400 chiếc, tăng trưởng đến 815% so với cùng kỳ năm ngoái.
Buôn bán ô tô cũ: Chia sẻ của người trong cuộc

Buôn bán ô tô cũ: Chia sẻ của người trong cuộc

Buôn ô tô cũ tưởng dễ làm ăn, “hái” ra tiền nhưng thực tế có phải như vậy. Hãy nghe những người trong cuộc chia sẻ về nghề.
Mobile VerionPhiên bản di động