TradingKey - Google (GOOGL)Việc ra mắt TurboQuant, một công nghệ nén bộ nhớ AI mới, đã làm dấy lên những lo ngại trên thị trường về triển vọng nhu cầu lưu trữ. Chịu tác động từ tin tức này, lĩnh vực chip nhớ của Hoa Kỳ đã sụt giảm mạnh trong phiên giao dịch ngày thứ Tư, SanDisk (SNDK)có thời điểm giảm 6,5%, Micron Technology (MU)có thời điểm giảm hơn 5%, Western Digital (WDC)có thời điểm giảm hơn 6%, Seagate Technology (STX)giảm hơn 8%.

Trong thị trường do AI dẫn dắt suốt năm qua, lĩnh vực lưu trữ đã được hưởng lợi từ việc tăng giá HBM, DRAM và NAND, đẩy định giá lên mức tương đối cao; do đó, bất kỳ biến số nào có khả năng làm suy yếu tăng trưởng nhu cầu đều nhanh chóng được phản ánh vào giá.
Theo báo cáo, công nghệ này có thể giảm dung lượng bộ nhớ đệm của các mô hình ngôn ngữ lớn (LLM) ít nhất sáu lần mà không làm ảnh hưởng đến độ chính xác, đồng thời giúp tăng tốc độ lên tới tám lần, nhằm giải quyết các điểm nghẽn bộ nhớ trong suy luận AI và tìm kiếm vector.
Cốt lõi của TurboQuant nằm ở việc nén cực độ mức sử dụng bộ nhớ trong giai đoạn suy luận của các mô hình lớn. Mà không làm mất đi đáng kể độ chính xác của mô hình, nó có thể nén KV Cache xuống còn 3 bit, giúp tiết kiệm bộ nhớ khoảng sáu lần và cải thiện hiệu suất suy luận lên tới tám lần.
Về bản chất, bước đột phá này không làm giảm nhu cầu AI; thay vào đó, nó cải thiện đáng kể hiệu suất của đơn vị năng lực tính toán, cho phép cùng một nguồn lực phần cứng có thể xử lý nhiều tác vụ suy luận hơn.
Định giá thị trường cho thấy công nghệ này đang được diễn giải như một "tín hiệu tiêu cực cho ngành lưu trữ".
Tuy nhiên, dựa trên thông tin hiện tại, công nghệ này chủ yếu nhắm vào giai đoạn suy luận và không ảnh hưởng đến sự phụ thuộc cố định vào bộ nhớ băng thông cao ở phía huấn luyện, cũng như không thể thay thế vai trò trung tâm của các cụm máy tính quy mô lớn trong việc huấn luyện mô hình. Điều này ngụ ý rằng nền tảng cho nhu cầu hạ tầng AI vẫn vững chắc, ngay cả khi các phương thức sử dụng tài nguyên đang phát triển.
Nhìn xa hơn, việc tăng hiệu quả như vậy thực tế có thể dẫn đến "sự mở rộng nhu cầu". Khi chi phí suy luận giảm đáng kể và ngưỡng thương mại hóa cho các ứng dụng AI hạ xuống, sẽ có thêm nhiều doanh nghiệp và nhà phát triển có thể triển khai các dịch vụ mô hình lớn, dẫn đến tần suất sử dụng tăng lên. Trong quá trình này, tổng mức tiêu thụ năng lực tính toán không nhất thiết sẽ giảm đi; thay vào đó, nó có thể tăng lên do sự mở rộng của các kịch bản ứng dụng. Nói cách khác, việc cải thiện hiệu quả có thể kích thích tăng trưởng tổng nhu cầu trong những điều kiện nhất định.
Đợt điều chỉnh hiện tại của lĩnh vực lưu trữ có vẻ là một sự định giá lại các kỳ vọng trong môi trường định giá cao chứ không phải là sự suy yếu của các yếu tố cơ bản; về lâu dài, xu hướng lan tỏa nhu cầu AI vẫn không thay đổi và thậm chí có thể được củng cố hơn nữa nhờ chi phí giảm.
Tác động do TurboQuant của Google mang lại về bản chất không phải là "sự biến mất của nhu cầu", mà là "sự tái cấu trúc nhu cầu". Các nhà đầu tư cần tập trung vào việc những công ty lưu trữ nào có thể duy trì quyền năng định giá ban đầu trong cấu trúc ngành mới khi hiệu quả AI tiếp tục được cải thiện.