Lương Văn Phong và DeepSeek (kỳ 3): Giữa tâm bão công nghệ và lòng tự hào dân tộc

Lương Văn Phong và DeepSeek (kỳ 3): Giữa tâm bão công nghệ và lòng tự hào dân tộc

DeepSeek đạt được tốc độ phát triển vượt trội phần lớn nhờ triết lý mã nguồn mở mà Lương Văn Phong theo đuổi. Ông cho rằng việc giữ kín công nghệ độc quyền và thu phí sử dụng các mô hình mạnh, như cách các phòng thí nghiệm Mỹ như OpenAI hay Google đang làm, chỉ mang lại lợi thế ngắn hạn, chứ không thể đảm bảo thành công lâu dài.

“Thung lũng Silicon” trên khắp Trung Quốc

Đưa mô hình ra công khai, phần lớn miễn phí, là cách hiệu quả nhất để DeepSeek thúc đẩy ứng dụng thực tế, nhận phản hồi và tạo động lực phát triển sản phẩm. “Nói thì dễ, hãy cho tôi xem mã nguồn”, DeepSeek từng trích dẫn câu nói của cha đẻ hệ điều hành Linux khi công bố mô hình ngôn ngữ lớn đầu tiên gần hai năm trước.

“Về cơ bản, họ không cần tiền. Khi cả thị trường đổ dồn sự chú ý vào 6 Con Rồng Nhỏ, ai cũng muốn rót vốn cho họ”, một nhà đầu tư nhận xét.

Một ngày Chủ nhật nhiều mây vào tháng 4, tại sân bay quốc tế Tiêu Sơn nhộn nhịp ở Hàng Châu, các bảng quảng cáo kỹ thuật số của Alibaba, ByteDance và Huawei chào đón khách đến. Trong nhà ga hiện đại, một robot hình người tóc xanh vẫy tay chào hành khách. Bên ngoài, một startup xe tự hành đang thử nghiệm xe tải nhỏ không người lái vận chuyển hàng hóa quanh đường băng

Dù DeepSeek đang được nhắc đến rất nhiều, nhiều người phương Tây lại quên rằng đây chỉ là một trong vô số “con rồng AI” đang trỗi dậy tại các “Thung lũng Silicon” trên khắp Trung Quốc.

Riêng ở Hàng Châu, thành phố 12.5 triệu dân, DeepSeek thuộc nhóm tinh hoa các startup công nghệ được gọi là “6 Con Rồng Nhỏ” (Six Little Dragons).

Tại khu vực Tây Hồ thơ mộng có Game Science, studio đứng sau tựa game đình đám Black Myth: Wukong đã gây tiếng vang lớn nhờ ứng dụng công nghệ học máy, giúp các nhân vật ảo trong game trở nên sống động như thật.

Không xa đó là hai công ty robot hàng đầu và một startup kỳ lân chuyên về phần mềm không gian 3D.

Cũng gần đó, Zhejiang Qiangnao Technology (BrainCo), được xem như “Neuralink phiên bản Trung Quốc”, do tiến sĩ Bicheng Han sáng lập khi còn học tại Harvard, hiện đặt phòng thí nghiệm tại Hàng Châu. BrainCo đang phát triển các thiết bị giả chi điều khiển bằng não và công nghệ đo hoạt động não bộ để điều khiển máy tính. Một bàn tay giả tích hợp AI của BrainCo hiện được trưng bày tại Trung tâm triển lãm Thị trấn Trí tuệ Nhân tạo Trung Quốc, một trung tâm công nghệ mới nổi của thành phố.

Gần đây, lãnh đạo BrainCo thường xuyên dẫn khách tham quan triển lãm. Nhiều người trong số đó tỏ ý muốn đầu tư, nhưng các “bộ óc thiên tài” ở đây dường như không quá quan tâm đến nguồn vốn bên ngoài. “Thực ra họ chẳng cần tiền”, một quản lý quỹ từng tham quan nhận xét. “Giữa cơn sốt 6 Con Rồng Nhỏ, ai cũng muốn rót vốn cho họ”.

Đứng sau các startup này là sự hậu thuẫn mạnh mẽ từ Chính phủ dưới sự lãnh đạo của Chủ tịch Tập Cận Bình. AI, robot và các lĩnh vực công nghệ cao khác đang được thúc đẩy như những ưu tiên hàng đầu trong chương trình nghị sự quốc gia, với mục tiêu lớn nhất là “tự lực, tự cường”, như ông Tập từng nhấn mạnh tại một cuộc họp Bộ Chính trị gần đây. “Chúng ta phải nhận thức rõ những khoảng cách và nỗ lực gấp đôi để thúc đẩy toàn diện đổi mới công nghệ, phát triển công nghiệp và ứng dụng AI”, Tân Hoa Xã dẫn lời ông Tập.

Jack Ma trở lại và sự trỗi dậy của các lãnh đạo công nghệ mới

Các “con rồng nhỏ” này đang lắng nghe, và không phải tất cả đều nhỏ bé. Trụ sở chính của tập đoàn Alibaba trị giá 300 tỷ USD, với khuôn viên rộng lớn và hồ nước riêng, nằm ở phía tây Hàng Châu, cách Tây Hồ khoảng 40 phút lái xe.

Alibaba vừa cam kết đầu tư 53 tỷ USD để xây dựng thêm các trung tâm dữ liệu AI trong 3 năm tới, đồng thời khẳng định các mô hình Qwen3 mới nhất của mình có hiệu năng và hiệu quả chi phí ngang ngửa DeepSeek.

Ở nước ngoài, Alibaba thường được biết đến là tập đoàn thương mại điện tử, nhưng mảng AI và điện toán đám mây đang tăng trưởng mạnh mẽ và đã được tách thành trung tâm độc lập từ năm 2022 tại vùng ven Hàng Châu. Trong các phòng họp, màn hình lớn liên tục cập nhật “tin nhanh ngành” mỗi 72 giờ, tổng hợp những thành tựu mới nhất của các đối thủ như DeepSeek, OpenAI. Thậm chí, ngay cả trong nhà vệ sinh cũng dán bản cập nhật hàng tuần, nhắc nhở rằng cuộc đua AI vẫn tiếp diễn, ngay cả khi các kỹ sư “giải quyết nỗi buồn”.

Tháng 4 vừa qua, Jack Ma đồng sáng lập Alibaba, người từng “biến mất” gần 5 năm khi chính quyền Trung Quốc siết chặt ngành công nghệ bất ngờ xuất hiện tại trụ sở công ty để kỷ niệm 15 năm mảng điện toán đám mây. Trong bài phát biểu hiếm hoi, Ma nhấn mạnh rằng ông muốn trí tuệ nhân tạo phục vụ con người, chứ không phải thống trị con người, theo lời kể của nhiều người tham dự. Sự trở lại của Jack Ma đã tạo nên không khí phấn khích cho cả những người có mặt trực tiếp lẫn những khán giả theo dõi qua livestream từ Hồng Kông, Tokyo.

Sự kiện này là lời nhắc nhở rằng những “ngôi sao công nghệ” như Ma đã được chính quyền “xí xóa” và chào đón trở lại. Cùng lúc đó, các gương mặt mới như Lương cũng đang dần nổi lên, trong bối cảnh sức hút của các lãnh đạo công nghệ Mỹ ngày càng giảm sút. Tinh thần tự hào dân tộc tại Trung Quốc đang lên cao, thể hiện khát vọng vượt qua mọi rào cản từ phương Tây.

George Chen, Giám đốc điều hành Asia Group LLC tại Hồng Kông, nhận định rằng nhiều kỹ sư hàng đầu Trung Quốc đã quay về nước sau thời gian làm việc tại các tập đoàn lớn như Apple, Google, Microsoft. Một phần do tác động từ chính sách của chính quyền Trump, nhưng phần lớn vì họ tin rằng “trận địa thực sự” đang chuyển dịch về phía Đông. “Thung lũng Silicon không còn là điểm đến hấp dẫn với nhân tài Trung Quốc”, Chen nói.

Kai-Fu Lee, nhà sáng lập kỳ lân công nghệ 01.AI, từng làm việc tại Apple, Google và Microsoft, cũng nhận xét rằng thế hệ tài năng mới không còn đi theo con đường sang Mỹ rồi mới về nước lập nghiệp như trước. “Các kỹ sư AI trẻ hiện nay phần lớn được đào tạo trong nước”, Lee cho biết. “Thành công của DeepSeek cùng các startup AI mới đang truyền cảm hứng cho nhiều tài năng trẻ tham gia vào cuộc phục hưng AI của Trung Quốc”.

Lương (giữa) tại một hội thảo ở Bắc Kinh tháng 2 - Ảnh: Florence Lo/Reuters

Hiện không có công ty công nghệ nào ở Trung Quốc khơi dậy niềm tự hào lớn như DeepSeek. Tháng 4 vừa rồi, Kirby Fung một nhà khoa học máy tính 27 tuổi người Canada đã cùng gia đình đến Hàng Châu và dẫn người thân tham quan Đại học Chiết Giang, nơi Lương từng theo học. Fung từng tham gia chương trình trao đổi tại đây và muốn cho ông bà cùng em trai thấy mình cũng từng học ở ngôi trường của nhà sáng lập DeepSeek. “Thật tuyệt khi kể với bạn bè ở Canada rằng người sáng lập DeepSeek từng học cùng trường với tôi”, Fung chia sẻ.

Không gian làm việc tại văn phòng DeepSeek

Trụ sở DeepSeek gồm 4 tòa tháp hướng ra Đại Vận Hà nổi tiếng cũng trở thành điểm đến quen thuộc của khách du lịch và các người nổi tiếng trên mạng xã hội. Nhiều người tìm kiếm dấu vết của Lương ở các cửa hàng lân cận, kể cả quán lẩu sang trọng trong tòa nhà DeepSeek nơi nhân viên đôi khi ăn trưa, dù lễ tân vẫn phải tiếc nuối thông báo rằng Lương chưa từng ghé qua.

Theo những người quen biết, Lương thường xuyên di chuyển giữa Hàng Châu và văn phòng DeepSeek tại Bắc Kinh, đặt trên tầng 5 một tòa nhà kính trong khu công nghệ. Ở đây, các lập trình viên trẻ làm việc tại bàn nâng hạ độ cao, phòng ăn lúc nào cũng có sẵn nước tăng lực, mì ăn liền Kang Shi Fu và snack latiao. Nhân viên còn có bảng trắng để ghi chú các món cần bổ sung vào thực đơn. “Tôi lên cân kha khá sau mấy tháng ăn trưa, ăn tối ở đó”, một nhà nghiên cứu vừa rời công ty chia sẻ.

Lương rất hiếm khi tiếp khách bên ngoài, đôi khi chỉ xuất hiện dưới dạng hình chiếu 3D trong những cuộc họp hiếm hoi mà ông đồng ý tham dự. Ông cũng từ chối lời mời tham dự Hội nghị AI Action Summit tại Paris năm nay, sự kiện quy tụ những tên tuổi lớn như Altman (OpenAI), Sundar Pichai (Alphabet, Google) cùng nhiều lãnh đạo cấp cao các nước.

Trong khi DeepSeek được ca ngợi tại Trung Quốc như biểu tượng mới của ngành công nghệ, thì ở Mỹ, công ty này lại bị nhìn nhận như một “sinh vật lạ” bất ngờ xuất hiện, khiến giới chức và dư luận phải soi xét kỹ lưỡng về mức độ an toàn và rủi ro.

Nhiều nhà phê bình ở Mỹ cáo buộc DeepSeek bị kiểm soát bởi chính quyền Trung Quốc, đánh cắp dữ liệu huấn luyện từ các đối thủ Mỹ và là một phần trong chiến dịch gián điệp công nghệ, nhằm phá vỡ vị thế dẫn đầu AI của thung lũng Silicon. Một người phát ngôn của Ủy ban Hạ viện Mỹ điều tra DeepSeek từng tuyên bố:

“DeepSeek là đường ống trực tiếp từ ngành công nghệ Mỹ vào bộ máy giám sát của chính quyền Trung Quốc, đe dọa không chỉ quyền riêng tư của công dân Mỹ mà cả an ninh quốc gia”.

Tinh thần garage (hay “garage spirit”) là một khái niệm xuất phát từ hình ảnh các công ty công nghệ lớn như Apple, Google, Amazon... khởi nghiệp trong những gara nhỏ, đơn sơ ở Mỹ. Tinh thần này tượng trưng cho sự khởi đầu khiêm tốn, sáng tạo, dám nghĩ dám làm, tận dụng mọi nguồn lực sẵn có để xây dựng nên những sản phẩm, công ty lớn mà không cần những điều kiện vật chất hay tài chính vượt trội ngay từ đầu.

Tuy nhiên, phía DeepSeek lại cho rằng mình không khác gì các startup công nghệ khác, là “sản phẩm của tinh thần garage thuần túy”, như một bài đăng trên X hồi tháng 2 từng khẳng định. Công ty đặt văn phòng tại cùng khuôn viên với Google ở Bắc Kinh, gần Burger King và hai cửa hàng Tim Hortons. Việc DeepSeek chỉ mới được quốc tế chú ý gần đây không đồng nghĩa với việc có điều gì mờ ám phía sau. “Thế giới AI đã không lường trước DeepSeek”, Arnaud Barthelemy, đối tác tại quỹ Alpha Intelligence Capital, nhận xét.

Barthelemy cho rằng bài học lớn nhất từ DeepSeek là cách các công ty công nghệ Trung Quốc biến hạn chế thành sức mạnh. “Có rất nhiều bộ óc xuất sắc ở Trung Quốc đã đổi mới vượt bậc dù chỉ với nguồn lực tính toán hạn chế hơn nhiều”, ông nói.

Thực tế, vào tháng 5/2023 đúng thời điểm DeepSeek ra đời, CEO Nvidia Jensen Huang từng chia sẻ với Businessweek rằng các biện pháp kiểm soát công nghệ của Mỹ chỉ càng thúc đẩy Trung Quốc đổi mới mạnh mẽ hơn.

Ông nhấn mạnh, sự can thiệp của chính phủ có thể dẫn đến những hậu quả nghiêm trọng ngoài dự tính. “Bị tước đi 1/3 thị trường công nghệ toàn cầu là thảm họa”, Huang nhận định về rủi ro khi hạn chế xuất khẩu công nghệ sang Trung Quốc. “Họ sẽ phát triển mạnh mẽ mà không có đối thủ cạnh tranh. Họ sẽ phát triển, rồi xuất khẩu sang châu Âu, Đông Nam Á”.

Ông cũng cảnh báo: “Bạn phải cân nhắc giới hạn cạnh tranh đến đâu. Khi đẩy ai đó vào đường cùng, phản ứng sẽ rất khó lường. Những người không còn gì để mất sẽ đáp trả theo cách rất bất ngờ”.

CEO Nvidia, Jensen Huang, cho rằng các biện pháp kiểm soát xuất khẩu có thể khiến Trung Quốc mạnh lên. Ảnh: David Paul Morris/Bloomberg

Tranh cãi về chi phí thực sự để xây dựng mô hình AI

Hiện vẫn còn nhiều tranh cãi về chi phí thực sự mà DeepSeek đã bỏ ra để xây dựng các mô hình AI. Theo một báo cáo được trích dẫn rộng rãi của SemiAnalysis (Mỹ), High-Flyer và DeepSeek có thể đã tiếp cận cụm khoảng 50,000 GPU Nvidia dòng Hopper cao cấp, với tổng giá trị lên tới 1.4 tỷ USD, phần lớn thông tin này vẫn được giữ kín.

Phần lớn hạ tầng này là các GPU tuân thủ quy định xuất khẩu, ví dụ Nvidia H20, H800 vốn được điều chỉnh để giới hạn hiệu năng theo quy định của Nhà Trắng. Tuy nhiên, SemiAnalysis cũng cho rằng DeepSeek còn có thêm khoảng 10,000 chip H100 dòng chip tiên tiến bị Mỹ cấm bán sang Trung Quốc.

Ba cựu nhân viên DeepSeek kịch liệt phủ nhận cáo buộc này, khẳng định thực tế số lượng GPU chỉ dưới 20,000, chủ yếu là các dòng Nvidia đời cũ cùng một số chip bị kiểm soát xuất khẩu. “Họ đang bịa đặt”, nghiên cứu sinh tiến sĩ Bo Liu nói về báo cáo của SemiAnalysis. Tuy nhiên, phía SemiAnalysis vẫn giữ nguyên quan điểm của mình.

Điều không ai nghi ngờ là DeepSeek sẽ rất sẵn lòng nếu được tiếp cận quy mô tính toán tương đương các công ty Mỹ. Họ tự tin có thể tận dụng nguồn lực này hiệu quả hơn cả thung lũng Silicon. “Thực tế là các nhà nghiên cứu mô hình ngôn ngữ lớn luôn khao khát tài nguyên tính toán, nếu tôi có hàng chục ngàn GPU dòng H, chắc tôi cũng sẽ lãng phí, chạy nhiều thí nghiệm không thực sự cần thiết”, một cựu nhân viên DeepSeek chia sẻ.

Tuy nhiên, việc có thêm tài nguyên là thách thức mà các kỹ sư Trung Quốc sẵn sàng đối mặt. “Tôi chỉ mong một ngày nào đó các công ty Trung Quốc có 50,000 GPU. Muốn xem chúng tôi sẽ làm được gì”, nhà nghiên cứu này nói, hiện đã chuyển sang một phòng thí nghiệm AI mã nguồn mở khác ở Bắc Kinh.

Lương Văn Phong và DeepSeek (kỳ 1): “Kẻ dị biệt” đe dọa ngôi vương AI của Mỹ

Lương Văn Phong và DeepSeek (kỳ 2): Sự trỗi dậy của AI Trung Quốc và nỗi lo của Mỹ

Quốc An (theo Bloomberg)

FILI

- 18:10 26/05/2025

26-05-2025 19:12:00+07:00

Tin cùng chuyên mục

Hotline: 0908 16 98 98