TradingKey - Trọng tâm của hạ tầng AI đang dịch chuyển, và việc điều phối giữa các lệnh gọi suy luận đã trở thành nút thắt cổ chai chính trong các hệ thống AI dạng tác nhân vốn kết nối các công cụ, API, bộ nhớ và nhiều tác nhân để hoàn thành các tác vụ đa bước trên CPU.
Hệ quả của điều này là Arm (ARM) sẽ báo cáo kết quả kinh doanh quý 4 năm tài chính 2026 vào ngày 6/5/2026. Các nhà đầu tư của Arm sẽ muốn thấy bằng chứng cho thấy nhu cầu đối với CPU cao hơn về mặt cấu trúc so với giai đoạn trước quý 4 năm tài chính 2026 và sẽ tiếp tục duy trì trong giai đoạn 2026–2028, đồng thời Arm có thể chuyển hóa chu kỳ này thành doanh thu, gia tăng thị phần và duy trì biên lợi nhuận của mình.
Trong giai đoạn bùng nổ của chatbot từ năm 2023–2025, phần lớn sức mạnh xử lý đến từ các GPU trong khi CPU đóng góp rất ít. AI tác nhân (Agentic AI) đang thay đổi cách thức phân bổ tải trọng này. Mặc dù GPU vẫn đảm nhiệm việc suy luận, nhưng phần lớn thời gian giữa các bước suy luận sẽ được dành cho việc điều phối ở phía CPU: gửi yêu cầu đến các công cụ, gọi API, cập nhật bộ nhớ, đồng bộ hóa luồng và phối hợp hoạt động của nhiều tác nhân. Quá trình điều phối này sẽ chiếm từ 50%–90% độ trễ đầu-cuối, nghĩa là nếu CPU không thể theo kịp, hiệu suất khai thác GPU sẽ bị giảm xuống. Do đó, tỷ lệ CPU so với GPU trên mỗi cụm AI sẽ tăng lên, cùng với đó là số lượng nhân CPU trên mỗi megawatt điện năng tiêu thụ, đồng nghĩa với việc các tủ rack CPU sẽ được bố trí nằm sát các tủ rack tăng tốc.
Các hệ thống đa tác nhân (MAS) được dự báo sẽ làm tăng thêm số lượng token do mỗi người dùng tạo ra khi các API và công cụ được gọi thông qua các chuỗi hoạt động phức tạp. Theo Arm, mức tăng này có thể cao gấp 15 lần số lượng token trên mỗi người dùng, vốn là chỉ báo cho thấy cường độ điều phối tăng cao và tiêu tốn nhiều chu kỳ CPU hơn. Các dấu hiệu về áp lực nhu cầu đã xuất hiện trong chuỗi cung ứng x86. Tính đến thời điểm hiện tại của năm 2026, giá CPU trung bình đã tăng từ 10% đến 15%, và nhiều thông tin trên báo chí đã đề cập đến thời gian chờ giao hàng kéo dài (ví dụ: Intel được báo cáo có lượng đơn hàng tồn đọng lên đến sáu tháng, và AMD mất từ tám đến mười tuần để giao hàng). Do đó, hiệu suất trên mỗi watt điện cũng như tính chất mô-đun và mật độ tính toán cao của Arm đã chuyển từ việc chỉ giới hạn trong thiết bị di động sang áp dụng cho cả những hạn chế mới tại các trung tâm dữ liệu AI.
Arm là kiến trúc đứng sau các CPU phổ biến nhất thế giới và đã xuất xưởng con số khổng lồ 350 tỷ chip thông qua các bên được cấp phép, chiếm lĩnh 99% thị trường CPU di động. Thành công này đến từ các thiết kế không đồng nhất với triết lý dựa trên RISC, giúp phân chia công việc giữa các nhân hiệu năng cao và các nhân hiệu quả nhằm giảm thiểu mức tiêu thụ điện năng trong khi vẫn duy trì thông lượng. Chiến lược tương tự hiện đã được triển khai cho trung tâm dữ liệu.
Các nhân Arm hiện đã hiện diện trong các CPU trung tâm dữ liệu đáng chú ý — từ các dòng (NVDA) Grace và Vera của Nvidia đến các CPU tùy chỉnh cho Amazon (AMZN), Alphabet (GOOGL) (GOOG), và Microsoft (MSFT). Alphabet đã khẳng định các CPU Axion của mình mang lại hiệu suất trên giá thành tốt hơn khoảng 65% và hiệu quả năng lượng cao hơn 60% khi so sánh với các chip x86 tương đương, và Cobalt 100 của Microsoft cùng Graviton4 của Amazon cũng cho thấy các lợi ích tương tự về hiệu quả và chi phí.
Với việc các cụm máy chủ AI đang chuyển dịch sang sử dụng nhiều CPU hơn, ưu thế về hiệu quả sẽ trở thành một ràng buộc thiết kế hàng đầu, thay vì chỉ là một yếu tố bổ trợ. Tại sự kiện “Arm Everywhere” mới nhất của Arm, CEO Rene Haas đã mô tả lộ trình từ 30 triệu nhân CPU trên mỗi gigawatt trong các trung tâm dữ liệu AI hiện nay lên tới 120 triệu nhân trên mỗi gigawatt để giảm bớt các điểm nghẽn về tác vụ đại lý — một sự gia tăng rõ rệt gấp bốn lần về mật độ nhân.
Cuộc cạnh tranh cũng đang thay đổi. Nvidia đang tiếp thị CPU Vera như những máy chủ điều phối GPU và nền tảng xử lý tác vụ đại lý độc lập. Tuy nhiên, Arm không còn chỉ đơn thuần là một bên cấp phép sở hữu trí tuệ trong cuộc đua này. Công ty đã ra mắt các hệ thống CPU quy mô tủ rack của riêng mình, về cơ bản là gia nhập phân khúc nền tảng CPU độc lập với các mẫu làm mát bằng không khí và chất lỏng. Điều này mở ra một kênh mua sắm mới cho các nhà cung cấp dịch vụ đám mây quy mô lớn để họ có thể độc lập điều chỉnh tỷ lệ giữa CPU và GPU, đồng thời giảm bớt sự phụ thuộc vào hệ sinh thái.
Đối với quý hiện tại và các quý dự báo, kết quả kinh doanh cần cung cấp các cột mốc cụ thể liên quan đến dòng chip AGI CPU do Arm tự thiết kế. Các tín hiệu củng cố kết luận này sẽ thông qua các chứng nhận hoặc cập nhật sản xuất với Meta trong vai trò khách hàng số 1, triển vọng giành thêm các hợp đồng từ những nhà cung cấp dịch vụ đám mây quy mô lớn (hyperscaler), và bất kỳ bình luận nào về lượng đơn đặt hàng liên quan đến các tủ rack làm mát bằng không khí và chất lỏng. Công ty đã đưa ra dự báo doanh thu khoảng 1 tỷ USD từ dòng chip AGI CPU cho giai đoạn năm tài chính 2027–2028 và các nhà đầu tư sẽ kỳ vọng vào những đợt triển khai thực tế thay vì chỉ dừng lại ở các hợp đồng mang tính dẫn dắt, đồng thời xem xét liệu chuỗi cung ứng đã sẵn sàng để mở rộng quy mô vào nửa cuối năm dương lịch 2026 hay chưa.
Việc cung cấp thêm thông tin chi tiết về tiến độ hoàn tất thiết kế (tape out) thế hệ thứ 2 và sự sẵn sàng của hệ sinh thái phần mềm cho các khối lượng công việc điều phối tác vụ của tác nhân AI nhằm hỗ trợ mục tiêu dài hạn 15 tỷ USD sẽ đóng vai trò rất quan trọng.
Các CPU dựa trên kiến trúc Arm hiện đang xuất hiện ngày càng nhiều bên cạnh các bộ tăng tốc AI tùy chỉnh từ các nhà cung cấp dịch vụ đám mây quy mô lớn (hyperscalers), v.v. Các nhà phân tích tin rằng các CPU được cấp phép bởi Arm sẽ chiếm từ đa số cho đến mức áp đảo 90% máy chủ ASIC AI tùy chỉnh vào năm 2029, trong đó nửa cuối năm 2026 sẽ là một điểm chuyển biến quan trọng.
Các cập nhật về tỷ lệ thiết kế dựa trên Armv9 và CSS trong những nền tảng tùy chỉnh này sẽ có ý nghĩa không chỉ đối với số lượng đơn vị mà còn đối với sự gia tăng tỷ lệ phí bản quyền. Vì CSS có thể nâng mức phí bản quyền thực tế lên gần 10% giá trị con chip, việc xác nhận thêm một vài hợp đồng ký kết CSS sẽ tạo ra tác động tích cực đến lợi nhuận lớn hơn nhiều so với mức tăng trưởng đơn thuần về sản lượng.
Hệ sinh thái Windows đang chuyển hướng sang các bộ vi xử lý dựa trên kiến trúc Arm, đây là một chủ đề mang tính cấu trúc tách biệt với mảng trung tâm dữ liệu. Các dòng máy tính AI (AI PC) vẫn đang được đẩy mạnh để đạt được thời lượng pin dài hơn, tăng cường hiệu suất NPU và cải thiện khả năng phối hợp giữa CPU, NPU và GPU – tất cả những yếu tố này đều rất phù hợp với triết lý thiết kế ưu tiên tính hiệu quả của Arm. Trong ngắn hạn, thách thức lớn nhất là Arm có thể giành thị phần nhanh chóng như thế nào từ các đối thủ sử dụng kiến trúc x86 truyền thống trong mảng PC mà không làm ảnh hưởng đến khả năng tương thích phần mềm hay hiệu suất đối với các tác vụ cũ. Các nhà đầu tư nên theo dõi những diễn biến về việc giành hợp đồng với các nhà sản xuất thiết bị gốc (OEM), mức độ sẵn sàng của Windows trên Arm, và liệu việc áp dụng Armv9 cùng sự hỗ trợ liên tục cho CSS có giúp tăng doanh thu bản quyền trên mỗi thiết bị nhằm giảm bớt tác động từ tính chu kỳ của thị trường điện thoại thông minh hay không.
Arm có cơ hội tăng trưởng lớn; tuy nhiên, công ty đang phải đối mặt với một cuộc chiến cam go trước sự cạnh tranh gay gắt. Nvidia đang thúc đẩy bộ vi xử lý Vera của mình vừa là CPU máy chủ vừa là một nền tảng điện toán độc lập. Ngoài ra, Arm cũng đang phải đối đầu với các hệ thống dựa trên x86 vốn đã có vị thế vững chắc trong một số thị trường doanh nghiệp và Điện toán Hiệu năng cao (HPC). Thêm vào đó, một số nhà cung cấp dịch vụ đám mây quy mô lớn (hyperscalers) đã tự phát triển các bộ vi xử lý dựa trên kiến trúc Arm của riêng họ; Amazon có Graviton, Alphabet có Axion và Microsoft có Cobalt. Sự thành công lớn của các thiết kế CPU nội bộ này giúp khẳng định mạnh mẽ giá trị của kiến trúc Arm, nhưng đồng thời cũng ảnh hưởng đến khả năng của Arm trong việc tận dụng sự gia tăng đáng kể trong việc áp dụng Arm (CSS) và tăng trưởng doanh số của các sản phẩm có giá trị cao. Ngoài ra, mặc dù môi trường x86 hiện tại có thể giúp giảm bớt các hạn chế về nguồn cung trong ngắn hạn, điều này cũng sẽ làm giảm mặt bằng giá thị trường chung cho các loại CPU. Cuối cùng, rủi ro lớn nhất đối với định giá của Arm là việc thực thi và các cơ hội thị trường được giả định trong định giá có thể bị trì hoãn do tiến độ phát triển AGI chậm, việc áp dụng Armv9 CSS diễn ra từ từ hoặc quá trình chuyển đổi của PC sang công nghệ mới bị chậm lại, điều này có khả năng tác động tiêu cực đến giá cổ phiếu của Arm do thiếu sự hỗ trợ của nhà đầu tư đối với hệ số định giá của công ty.