Từ ChatGPT đến DeepSeek và những đột phá công nghệ

Mặc dù mới phát triển nhưng các sản phẩm của DeepSeek đang “làm mưa làm gió” trên thị trường công nghệ hiện nay.
DeepSeek thay đổi bức tranh tổng thể về AI như thế nào? DeepSeek và cuộc cạnh tranh công nghệ AI toàn cầu DeepSeek 'dấn thân' thị trường ô tô điện thế nào?

DeepSeek dẫn đầu trong lĩnh vực AI?

Theo Aisixiang, ngày 20/1, công ty trí tuệ nhân tạo (AI) DeepSeek có trụ sở tại Hàng Châu, Trung Quốc, đã phát hành sản phẩm AI mới nhất DeepSeek-R1 và chính thức mở mã nguồn. Trong thời gian ngắn, DeepSeek-R1 đã gây ra cuộc tranh luận sôi nổi trên toàn thế giới và lượt tải đã vượt qua sản phẩm hàng đầu trước đó là ChatGPT.

So với sự xuất hiện của ChatGPT, có lượng lớn dữ liệu và khả năng tính toán mạnh mẽ, DeepSeek đi theo con đường phát triển mô hình lớn dựa trên sự đổi mới của thuật toán. Tức là mô hình này được đào tạo thông qua học tập tăng cường thuần túy, với sự đổi mới cốt lõi nằm ở việc loại bỏ hoàn toàn các quy trình học có giám sát do con người can thiệp, đồng thời thể hiện khả năng suy luận vượt trội có thể so sánh với ChatGPT-o1-1217.

Thông qua việc tối ưu hóa thuật toán và thiết kế phối hợp với phần cứng, DeepSeek đã giảm chi phí huấn luyện xuống còn 1/10 so với mô hình cùng hiệu năng, đẩy mạnh ứng dụng trong các ngành nghề.

DeepSeek
Đặc trưng của công nghệ AI do DeepSeek tạo ra là xử lý một cách thông minh và hiệu quả nhờ kỹ thuật “tính toán thời gian suy luận”. Ảnh: Pixabay

Ngày 31/1, NVIDIA tuyên bố sử dụng DeepSeek-R1 và cho biết khả năng suy luận của nó là tiên tiến nhất. Đồng thời, Microsoft cũng giới thiệu DeepSeek-R1 trên nền tảng AI của mình và cho biết nó đã trải qua các đánh giá an toàn và nghiêm ngặt, bao gồm đánh giá tự động về hành vi của mô hình và đánh giá an toàn rộng rãi, nhằm giảm thiểu rủi ro tiềm ẩn. Amazon cũng tuyên bố triển khai DeepSeek-R1. Điều này được giới chuyên gia đánh giá Trung Quốc đang chuyển từ người theo sau trở thành người dẫn đầu trong lĩnh vực AI.

Bên cạnh đó, một số đại gia công nghệ Trung Quốc cũng nhanh chóng đưa dịch vụ của DeepSeek vào hệ sinh thái. Alibaba, Tencent, Baidu và công ty mẹ của TikTok Bytedance đều đưa ra thông báo sẽ cung cấp dịch vụ của Deepseek thông qua nền tảng đám mây riêng. Ba nhà khai thác viễn thông lớn của Trung Quốc, cùng với nhà sản xuất thiết bị điện tử Lenovo và thương hiệu ô tô Geely, cũng tiến hành áp dụng DeepSeek vào sản phẩm.

Mặc dù xuất hiện một số sản phẩm cạnh tranh, nhưng DeepSeek vẫn là dấu ấn lớn nhất ở thời điểm hiện tại.

Theo ông Lian Jye Su, nhà phân tích trưởng tại công ty nghiên cứu công nghệ Omdia, lý do chính khiến nhiều công ty áp dụng mô hình của DeepSeek là để thu hút người dùng cũng như doanh nghiệp sử dụng sản phẩm.

Trên thực tế, việc kiếm tiền trực tiếp từ các mô hình lớn là điều khó khăn đối với những gã khổng lồ AI - trừ khi mô hình được tích hợp trong các ứng dụng dành cho người tiêu dùng và doanh nghiệp”, ông Lian Jye Su cho biết.

Đột phá công nghệ của DeepSeek

Mặc dù cả 2 ứng dụng AI trên đều coi việc sử dụng Transformer (mô hình học sâu được thiết kế để phục vụ giải quyết nhiều bài toán trong xử lý ngôn ngữ và tiếng nói) làm công nghệ cơ bản, nhưng DeepSeek trực tiếp tích hợp kiến thức có cấu trúc vào khuôn khổ mô hình để nâng cao trình độ hiểu biết ngữ nghĩa, đồng thời chỉ sử dụng thuật toán học tập tăng cường để thúc đẩy khả năng tự đào tạo và nâng cấp của mô hình, có thể kết nối với Internet để kiểm tra thời gian thực.

Điều này có khác biệt đáng kể so với thuật toán học tập tăng cường từ phản hồi con người mà ChatGPT đang sử dụng. Đồng thời, DeepSeek cũng thể hiện rõ quá trình suy nghĩ và nguồn dữ liệu để tạo ra câu trả lời chính xác hơn. Bước đột phá công nghệ của DeepSeek so với ChatGPT có sự khác biệt về kiến trúc kỹ thuật, dữ liệu đào tạo, kỹ thuật thuật toán và các chỉ số hiệu suất.

DeepSeek
Trung Quốc là thị trường sử dụng DeepSeek nhiều nhất, chiếm 30,71%, trong khi Ấn Độ là 13,59%, Indonesia 6,94%, Mỹ 4,34%. Ảnh: Pixabay

Thứ nhất, về kiến trúc kỹ thuật, ChatGPT dựa trên bộ giải mã Transformer tiêu chuẩn, trong khi DeepSeek sử dụng mô hình tạo sinh tăng cường dựa trên kết quả truy xuất, giúp giảm các phép tính không cần thiết và nâng cao hiệu quả xử lý văn bản dài bằng cách lựa chọn các ý chính. Đồng thời, áp dụng kiến trúc hỗn hợp chuyên gia để mở rộng khả năng mô hình trong tiền đề vẫn giữ lượng tham số có thể kiểm soát được.

Thứ hai, về dữ liệu đào tạo, DeepSeek phá vỡ những hạn chế của mô hình văn bản đơn nhất và xây dựng kho dữ liệu rất phong phú, bao hàm văn bản, mật mã, ký hiệu toán học và biểu đồ khoa học. Thông qua việc áp dụng phương pháp lấy mẫu dựa trên mật độ kiến thức để tăng trọng số của dữ liệu trên các lĩnh vực chuyên môn, tăng cường đáng kể khả năng suy luận logic.

Thứ ba, về công nghệ lõi, dựa trên thuật toán học tập tăng cường từ phản hồi con người của ChatGPT, DeepSeek đã phát triển một khuôn khổ học tập tăng cường gồm nhiều mục tiêu để tối ưu hóa độ chính xác thực tế lên 23%, tính nhất quán logic là +18% và tuân thủ đạo đức. Kỹ thuật tạo lệnh tự tiến hóa sẽ làm cho mô hình dữ liệu có thể tối ưu hóa câu hỏi của người dùng.

Thứ tư, về các chỉ số hiệu suất, DeepSeek có tốc độ suy luận nhanh hơn 40% so với ChatGPT, tính nhất quán trong việc tạo văn bản dài tăng 35% và đạt được 89,7 điểm về khả năng hiểu ngôn ngữ đa nhiệm lớn, trong khi ChatGPT chỉ đạt 86,4, đặc biệt là độ chính xác vượt 92% trong lĩnh vực STEM (Science/khoa học, technology/công nghệ, engineering/kỹ thuật và math/toán học).

Theo các tài liệu chính thức do DeepSeek công bố, những đột phá về công nghệ của công ty này chủ yếu bao gồm nâng cao khả năng suy luận của mô hình ngôn ngữ lớn thông qua học tập tăng cường để tối ưu hóa khả năng suy luận và không còn cần dữ liệu có sự giám sát của con người; thông qua việc kích hoạt mạng lưới chuyên gia thực hiện tính toán có hiệu quả cao và cân bằng giữa hiệu suất mô hình và chi phí tính toán; tuân thủ chủ nghĩa dài hạn, thông qua mã nguồn mở để thúc đẩy quá trình lặp lại nhanh chóng của các mô hình ngôn ngữ lớn. Không chỉ ở cấp độ công nghệ, mã nguồn mở của DeepSeek trái ngược hoàn toàn với mã nguồn đóng của OpenAI, nhưng mã nguồn mở có giá trị quan trọng đối với việc thúc đẩy đổi mới công nghệ.

DeepSeek được thành lập năm 2023 bởi Liang Wenfeng, đồng sáng lập của quỹ đầu tư chuyên về AI High Flyer. Công ty bắt đầu phát triển DeepSeek vào tháng 4/2023, trước khi ra mắt mô hình DeepSeek-R1 hôm 20/1/2025. Theo thống kê từ hãng nghiên cứu thị trường khác Appfigures, trong những ngày cuối tháng 1, DeepSeek đã trở thành ứng dụng được tải xuống nhiều nhất trong App Store tại Mỹ và 140 thị trường trên toàn cầu.

Thanh Bình
Bạn thấy bài viết này thế nào?
Kém Bình thường ★ ★ Hứa hẹn ★★★ Tốt ★★★★ Rất tốt ★★★★★
Bài viết cùng chủ đề: Trí tuệ nhân tạo

Có thể bạn quan tâm

Tin mới nhất

Xuất xưởng chiếc xe thứ 700.000, Toyota đồng hành cùng ngành công nghiệp ô tô Việt Nam

Xuất xưởng chiếc xe thứ 700.000, Toyota đồng hành cùng ngành công nghiệp ô tô Việt Nam

Veloz Cross - chiếc xe thứ 700.000 được Toyota Việt Nam xuất xưởng ngày hôm nay (19/3), đánh dấu sự đồng hành 30 năm cùng ngành công nghiệp ô tô Việt Nam.
CEO NVIDIA nói gì về công nghệ chip quang tiết kiệm điện?

CEO NVIDIA nói gì về công nghệ chip quang tiết kiệm điện?

Nvidia sẽ sử dụng công nghệ quang học kết hợp dữ liệu gói CPO trong hai chip mạng mới nằm trong các bộ chuyển mạch trên các máy chủ của công ty.
Toyota triệu hồi gần 3.600 xe Wigo lỗi điều khiển động cơ

Toyota triệu hồi gần 3.600 xe Wigo lỗi điều khiển động cơ

Toyota Việt Nam vừa công bố chương trình triệu hồi 3.591 xe Toyota Wigo tại thị trường Việt Nam để cập nhật phần mềm điều khiển động cơ.
Quy chuẩn kỹ thuật quốc gia về trụ sạc xe điện có gì mới?

Quy chuẩn kỹ thuật quốc gia về trụ sạc xe điện có gì mới?

Bộ Khoa học và Công nghệ đang lấy ý kiến góp ý về dự thảo Thông tư ban hành Quy chuẩn kỹ thuật quốc gia về trụ sạc xe điện.
Gỡ điểm nghẽn sử dụng quỹ phát triển khoa học công nghệ

Gỡ điểm nghẽn sử dụng quỹ phát triển khoa học công nghệ

Cần hoàn thiện quy định về quỹ phát triển khoa học và công nghệ phù hợp với tình hình thực tiễn và đặc thù hoạt động tài trợ của quỹ.

Tin cùng chuyên mục

Giáo sư hàng đầu về Al và bán dẫn tại Mỹ khuyến nghị gì với Việt Nam?

Giáo sư hàng đầu về Al và bán dẫn tại Mỹ khuyến nghị gì với Việt Nam?

GS. Hồ Phạm Minh Nhật cho rằng, để Việt Nam tham gia được vào làn sóng trí tuệ nhân tạo (AI) và bán dẫn của thế giới, cần có sự cam kết lâu dài từ Chính phủ.
Cơ hội và thử thách trong duy trì tuổi thọ pin xe điện

Cơ hội và thử thách trong duy trì tuổi thọ pin xe điện

Duy trì tuổi thọ pin xe điện - cơ hội mở ra nhờ tiến bộ công nghệ, nhưng thách thức vẫn còn, đòi hỏi hiểu biết và nỗ lực từ cả nhà sản xuất lẫn người sử dụng.
Honda tính hướng khi doanh số sụt giảm tại Trung Quốc

Honda tính hướng khi doanh số sụt giảm tại Trung Quốc

Cắt giảm sản lượng, thu hẹp quy mô sản xuất là một trong những phương án để Honda vượt qua những thách thức khi ghi nhận mức sụt giảm doanh số.
Sắp có cơ chế đột phá thúc đẩy đổi mới sáng tạo

Sắp có cơ chế đột phá thúc đẩy đổi mới sáng tạo

Dự thảo sửa đổi Luật Khoa học và Công nghệ với nhiều cơ chế, chính sách mang tính đột phá, sẽ tạo điều kiện thúc đẩy mạnh mẽ hoạt động đổi mới sáng tạo.
Những sản phẩm công nghệ độc lạ nhất tại AISC 2025

Những sản phẩm công nghệ độc lạ nhất tại AISC 2025

Không chỉ là những ý tưởng trên giấy, các sản phẩm công nghệ độc lạ tại AISC 2025 đã sẵn sàng để ứng dụng vào thực tế.
Chuyên gia quốc tế nhìn thấy tiềm năng AI tại Việt Nam

Chuyên gia quốc tế nhìn thấy tiềm năng AI tại Việt Nam

Với vị trí địa lý thuận lợi, nguồn nhân lực chất lượng cao và chính sách phát triển khoa học - công nghệ tốt, Việt Nam đang hội tụ nhiều cơ hội về AI, bán dẫn.
Xe điện thúc đẩy tăng trưởng doanh số ô tô Indonesia

Xe điện thúc đẩy tăng trưởng doanh số ô tô Indonesia

Doanh số ô tô của Indonesia trong tháng 2/2025 đã tăng 2,2% so với cùng kỳ năm ngoái, đánh dấu mức tăng trưởng đầu tiên kể từ tháng 6/2023.
VinFast hợp tác chiến lược với ngân hàng quốc doanh Indonesia

VinFast hợp tác chiến lược với ngân hàng quốc doanh Indonesia

Trọng tâm của hợp tác là đầu tư, phát triển và cung cấp các giải pháp tài chính hỗ trợ hệ sinh thái xanh của VinFast.
Lý do doanh số ô tô Trung Quốc tăng trong 2 tháng đầu năm

Lý do doanh số ô tô Trung Quốc tăng trong 2 tháng đầu năm

Doanh số ô tô Trung Quốc tăng 1,3% trong hai tháng đầu năm nhờ chương trình trợ cấp khách hàng mở rộng, trong khi cuộc chiến giá xe điện thông minh đang diễn ra
Sản xuất ô tô: Apple

Sản xuất ô tô: Apple 'chịu thua', Xiaomi phát triển

Trong khi Apple đã "khai tử" dự án sản xuất ô tô, Xiaomi đã hoàn thành việc thiết kế chiếc sedan SU7 và ra mắt tại thị trường Trung Quốc.
Trung Quốc đạt bước tiến về phát triển

Trung Quốc đạt bước tiến về phát triển 'mặt trời nhân tạo'

Trung Quốc đạt bước tiến về phát triển "mặt trời nhân tạo" với một trong những hệ thống chủ chốt đạt tiêu chuẩn tiên tiến quốc tế về năng lực vận hành.
Facebook

Facebook 'khai tử' video livestream sau 30 ngày, người dùng hoang mang

Facebook gửi thông báo đến người dùng tại Việt Nam về việc sẽ xóa các video livestream sau 30 ngày kể từ ngày 3/7/2024. Điều này khiến người dùng hoang mang.
Bật mí cách Facebook giữ chân người dùng mạng xã hội

Bật mí cách Facebook giữ chân người dùng mạng xã hội

Trong các tính năng hiện đại, sàn thương mại điện tử Marketplace trở thành ưu điểm để Facebook giữ chân người dùng mạng xã hội, đặc biệt đối với giới trẻ.
Tự động hóa 100% thủ tục hải quan

Tự động hóa 100% thủ tục hải quan

Triển khai Nghị quyết 57, Cục Hải quan đã đạt nhiều thành tựu trong đầu tư hạ tầng, tự động hóa 100% thủ tục hải quan, số thu ngân sách điện tử đạt 98,4%...
Toyota triệu hồi 10 xe sang Alphard lỗi ốp nắp ca-pô

Toyota triệu hồi 10 xe sang Alphard lỗi ốp nắp ca-pô

Công ty Toyota Việt Nam vừa thông báo triệu hồi 10 xe Alphard để kiểm tra thay ốp nắp ca-pô miễn phí.
Partners Group thâu tóm công ty trung tâm dữ liệu của Australia

Partners Group thâu tóm công ty trung tâm dữ liệu của Australia

Tập đoàn tư nhân khổng lồ của Thụy Sĩ, Partners Group, chi 1,2 tỷ USD để mua lại GreenSquare DC – công ty điều hành trung tâm dữ liệu mới nhất của Australia.
Điều gì khiến doanh số xe điện Tesla sa sút?

Điều gì khiến doanh số xe điện Tesla sa sút?

Những thách thức đã khiến Tesla gần như từ bỏ mục tiêu bán 20 triệu xe điện mỗi năm vào năm 2030, cùng với đó là sự sa sút mạnh về doanh số.
Chuyên gia nói gì về thí điểm sàn giao dịch tiền ảo?

Chuyên gia nói gì về thí điểm sàn giao dịch tiền ảo?

Việc thí điểm sàn giao dịch tiền ảo đang thu hút sự quan tâm lớn từ cộng đồng đầu tư và giới công nghệ. Liệu đây có phải là cơ hội vàng để bắt kịp xu hướng?
Việt Nam thử nghiệm thiết bị 5G tại Trung Đông

Việt Nam thử nghiệm thiết bị 5G tại Trung Đông

Trong khuôn khổ Hội nghị Di động Thế giới 2025 (MWC 2025), Việt Nam đã thử nghiệm thiết bị 5G cùng nhà mạng hàng đầu Trung Đông.
Nhu cầu xe điện sẽ ảm đạm đến nửa đầu năm 2026

Nhu cầu xe điện sẽ ảm đạm đến nửa đầu năm 2026

Tổng giám đốc của hãng sản xuất pin Hàn Quốc Samsung SDI, ông Choi Joo-sun mới đây cho biết, nhu cầu xe điện sẽ tiếp tục suy yếu đến nửa đầu năm sau.
Mobile VerionPhiên bản di động