TradingKey - Vào ngày 24 tháng 6, theo giờ miền Đông, tại đại hội cổ đông thường niên của Nvidia ( NVDA), CEO Jensen Huang đã dùng bài phát biểu kéo dài hai giờ để định hình giai đoạn phát triển tiếp theo của ngành công nghiệp AI. Ông tuyên bố sự xuất hiện chính thức của "kỷ nguyên AI hữu ích", khẳng định các tác nhân AI sẽ trở thành động cơ cốt lõi thúc đẩy nhu cầu năng lực tính toán trong vài thập kỷ tới, đồng thời mô tả sự chuyển dịch mô hình điện toán này là đợt tái thiết lập ngành lớn nhất trong 60 năm qua.
Trong bài phát biểu của mình, Jensen Huang liên tục nhấn mạnh rằng AI đã hoàn tất quá trình chuyển dịch từ thử nghiệm công nghệ sang sản xuất thương mại.
Dẫn số liệu về nhà phát triển của GitHub, ông lưu ý rằng số lượng pull request được hợp nhất bởi các nhà phát triển trên toàn cầu là 400 triệu vào năm 2024, tăng lên 500 triệu vào năm 2025 và tăng vọt gần gấp ba lần chỉ trong vài tháng đầu năm 2026. Đằng sau những số liệu này là thực tế rằng các AI agent đang thay thế con người trên quy mô lớn trong các tác vụ như lập trình, thiết kế và phân tích dữ liệu, khi mỗi token được tạo ra đều trở thành một đơn vị lợi nhuận có thể quy đổi thành tiền.
Ông Huang chỉ ra rằng trong khi chức năng cốt lõi của các trung tâm dữ liệu trước đây là lưu trữ và truyền tải tệp tin, thì sứ mệnh cốt lõi của các nhà máy AI hiện đại là sản xuất các token — những đơn vị trí tuệ có thể quy đổi thành tiền, đóng vai trò là nguyên liệu thô cho mã nguồn, câu trả lời, thiết kế, hành động và dịch vụ.
Ông đã sử dụng cấu trúc "bánh năm lớp" để mô tả hệ sinh thái công nghiệp AI, từ dưới lên trên bao gồm: năng lượng, chip và hệ thống, cơ sở hạ tầng, mô hình và ứng dụng. Khung cấu trúc này ngụ ý rằng phạm vi hoạt động của Nvidia vượt xa ngoài mảng chip, bao phủ toàn bộ chuỗi sản xuất AI.
Dưới mô hình mới này, khách hàng mua các hệ thống của Nvidia không đơn thuần là mua các công cụ tính toán; họ đang xây dựng các nhà máy AI có khả năng trực tiếp tạo ra doanh thu.
Ông Huang nhấn mạnh rằng hiệu suất của kiến trúc nhà máy — cụ thể là có bao nhiêu token có thể được sản xuất trên mỗi watt điện và chi phí cho mỗi token có thể thấp đến mức nào — đã trở thành thước đo cạnh tranh quan trọng nhất.
Trong năm tài chính 2026, doanh thu cả năm của Nvidia đạt 216 tỷ USD, tăng 65% so với cùng kỳ năm ngoái, trong đó doanh thu từ trung tâm dữ liệu chiếm 194 tỷ USD, tương đương mức tăng 68% so với cùng kỳ. Dòng tiền từ hoạt động kinh doanh đạt 103 tỷ USD, với 41 tỷ USD được trả lại cho các cổ đông trong năm.
Ông Huang đặc biệt lưu ý rằng mặc dù giá mua các hệ thống của Nvidia có thể không phải là thấp nhất, nhưng công ty có thể sản xuất được nhiều token nhất với chi phí thấp nhất, đồng thời đạt được thông lượng cao nhất. Mô hình kinh doanh này đã được thị trường chứng minh đầy đủ, đặt nền móng vững chắc cho vị thế dẫn đầu bền vững của Nvidia trong kỷ nguyên AI.
Với việc áp dụng nhanh chóng các hoạt động huấn luyện mô hình lớn, suy luận và các ứng dụng AI agent, giá trị chiến lược của bộ nhớ và lưu trữ trong các trung tâm dữ liệu đang không ngừng tăng lên. Tận dụng các lợi thế công nghệ full-stack của mình, Nvidia đang khẳng định vị thế là động lực cốt lõi của cuộc cách mạng công nghiệp AI này.
Jensen Huang định vị nền tảng Vera Rubin là "một trong những sản phẩm quan trọng nhất trong lịch sử công ty". Khác với nền tảng Hopper trước đó tập trung vào huấn luyện và nền tảng Blackwell hướng tới suy luận, Vera Rubin là một giải pháp nhà máy AI hoàn chỉnh được thiết kế dành riêng cho kỷ nguyên của các tác tử AI (AI agents), với Vera CPU đại diện cho bước tiến mang tính cột mốc của Nvidia vào thị trường CPU đa dụng.
Huang giải thích rằng cách thức hoạt động của các tác tử AI hoàn toàn khác so với con người; chúng tồn tại trong một thế giới tính toán ở quy mô nano giây, thường xuyên gọi các công cụ, truy cập cơ sở dữ liệu, thực thi mã và lặp lại các tác vụ. Trong kịch bản này, nếu CPU trở thành điểm nghẽn, các GPU đắt đỏ sẽ bị bỏ không, và mỗi giây lãng phí đó đều trực tiếp gây tổn thất doanh thu cho nhà máy AI. Để giải quyết vấn đề này, Nvidia đã phát triển Vera CPU dành riêng cho tác tử ngay từ đầu – không còn quảng bá dựa trên số lượng nhân (core count), thay vào đó, sản phẩm này hướng tới khả năng phản hồi với độ trễ cực thấp để đáp ứng nhu cầu đồng thời của hàng tỷ tác tử AI trên toàn cầu.
Là CPU đầu tiên sở hữu bộ nhớ LPDDR5, Vera nhanh hơn 1,8 lần so với các CPU x86 truyền thống, đi kèm hiệu suất đơn nhân tăng 50%. Chip này cũng hỗ trợ gốc độ chính xác FP8, cho phép xử lý trực tiếp các tác vụ suy luận AI và học tăng cường mà không cần đến sự can thiệp trung gian của GPU.
Hiện tại, Vera Rubin đã đi vào giai đoạn sản xuất thương mại quy mô lớn, với các nhà phát triển mô hình lớn trên toàn cầu, các nhà cung cấp dịch vụ đám mây công cộng, đám mây AI và các khách hàng quy mô siêu lớn (hyperscale) đã bắt đầu triển khai.
Huang cho biết: "Vera Rubin không chỉ là một con chip, mà là một nền tảng nhà máy AI, và hệ sinh thái này đã bắt đầu chuyển động. Mọi nhà phát triển mô hình lớn, dịch vụ đám mây công cộng, đám mây AI và nhà cung cấp dịch vụ quy mô siêu lớn (hyperscaler) đều đang chuẩn bị xây dựng hệ thống trên nền tảng này."
Các sản phẩm AI thế hệ thứ ba của Nvidia có sự phân công nhiệm vụ rõ ràng. Hopper tập trung vào giai đoạn tiền huấn luyện; Blackwell mở rộng quy mô suy luận ở cấp độ tủ rack; và nền tảng Vera Rubin, bao gồm Vera CPU phụ trách điều phối và Rubin GPU đảm nhận tính toán, được thiết kế riêng cho kỷ nguyên của các tác tử AI.
Đáng chú ý, Nvidia là doanh nghiệp duy nhất trong ngành sở hữu đồng thời ba hệ thống mạng tốc độ cao gồm NVLink, Spectrum-X Ethernet và InfiniBand. Điều này mang lại nền tảng kết nối liên thông độc nhất cho Vera CPU, đảm bảo khả năng phản hồi trễ thấp và sự phối hợp hiệu quả cao trong các kịch bản AI dựa trên tác tử (agentic AI).
Bên cạnh các tác nhân số, Jensen Huang cũng đã hướng tầm ngắm vào AI vật lý trong thế giới thực. Ông lưu ý rằng trí tuệ nhân tạo đang bước ra khỏi thế giới ảo và được triển khai toàn diện trên các thiết bị đầu cuối như hệ thống tự lái, robot nhân hình và thiết bị công nghiệp thông minh, trang bị cho phần cứng vật lý đầy đủ các khả năng thông minh từ nhận thức, lập luận, lập kế hoạch cho đến hành động. Việc triển khai trên quy mô lớn trong lĩnh vực này sẽ thúc đẩy một làn sóng đầu tư cơ sở hạ tầng mới trị giá hàng nghìn tỷ USD.
Huang ví cơ sở hạ tầng AI với các dự án hạ tầng lớn trong lịch sử nhân loại như lưới điện và internet, đồng thời tin rằng đây sẽ là một đợt bùng nổ xây dựng kéo dài hàng thập kỷ. Ông nhấn mạnh rằng công nghệ của Nvidia sẽ không chỉ hỗ trợ các tác nhân số mà còn cung cấp hiệu năng tính toán cốt lõi cho AI vật lý, vốn được kỳ vọng sẽ trở thành động lực tăng trưởng lớn tiếp theo của công ty.
Trong bối cảnh cổ phiếu có hiệu suất kém hơn so với thị trường chung của Mỹ trong năm nay, ông Jensen Huang đã nỗ lực củng cố niềm tin của thị trường bằng cách nhấn mạnh quan điểm rằng siêu chu kỳ chi tiêu vốn cho AI vẫn đang ở giai đoạn đầu.
Ông tái khẳng định rằng hơn 50% dòng tiền tự do sẽ được hoàn trả cho các cổ đông và xác định một số chính sách hoàn trả vốn là cam kết dài hạn. Trong cuộc họp công bố kết quả kinh doanh gần đây nhất, Nvidia đã thông báo về chương trình mua lại cổ phiếu trị giá 80 tỷ USD đã được phê duyệt.
Nhìn về tương lai, ông Huang bày tỏ sự tự tin mạnh mẽ: "Cơ sở hạ tầng AI không còn mang tính thử nghiệm nữa; nó đã bước vào giai đoạn sản xuất." Ông dự báo rằng nhu cầu về năng lực tính toán trong kỷ nguyên của các tác nhân AI sẽ tăng trưởng theo cấp số nhân, và Nvidia, nhờ tận dụng các lợi thế công nghệ toàn diện và hào phòng thủ hệ sinh thái, sẽ tiếp tục dẫn đầu đợt kiến tạo cơ sở hạ tầng lớn nhất trong lịch sử nhân loại.