TradingKey - Đầu tuần này, Google (GOOG) (GOOGL) đã ra mắt thuật toán nén cực hạn mới mang tên TurboQuant. Thuật toán này được kỳ vọng sẽ giảm mức sử dụng bộ nhớ khoảng 6 lần và tăng tốc độ tính toán lên tới 8 lần trên cùng một cấu hình GPU, gây ra một đợt sụt giảm trên diện rộng trong lĩnh vực bán dẫn.
Trong phiên giao dịch hôm thứ Tư tại Mỹ, Micron (MU) , SanDisk (SNDK) , Western Digital (WDC) và Seagate Technology (STX) đều giảm điểm, với đà giảm kéo dài sang cả phiên tiền thị trường ngày thứ Năm.
Áp lực giảm điểm từ thị trường Mỹ cũng lan sang các cổ phiếu châu Á. Vào thứ Năm, Samsung Electronics đóng cửa giảm 4,71%, trong khi SK Hynix giảm 6,23%, kéo chỉ số tham chiếu KOSPI của Hàn Quốc giảm 3,22%. Cổ phiếu của cả hai công ty này đều đã ghi nhận chuỗi giảm điểm trong 4 phiên liên tiếp trong tuần này.
Thuật toán của Google tối ưu hóa các điểm nghẽn lưu trữ trong quá trình suy luận của các mô hình ngôn ngữ lớn (LLM), giúp giảm mức sử dụng bộ nhớ và tăng tốc độ tính toán mà không làm giảm độ chính xác. Tuy nhiên, liệu công nghệ này có thực sự gây xáo trộn nhu cầu bán dẫn? Tác động trong ngắn hạn sẽ lớn đến mức nào?
Tin tức về việc Google ra mắt thuật toán TurboQuant đã nhanh chóng thu hút sự chú ý của thị trường, và Cloudflare (NET), CEO Matthew Prince đã gọi đây là "khoảnh khắc DeepSeek" của Google, đại diện cho một bước đột phá lịch sử lớn về hiệu suất AI.
Phố Wall lưu ý rằng nếu được triển khai thành công, nhu cầu lưu trữ có thể giảm đáng kể, có khả năng làm suy yếu nhu cầu DRAM và NAND Flash vốn được thúc đẩy bởi sự bùng nổ AI trước đó. Trong tháng 1, Samsung Electronics đã tăng giá hợp đồng NAND flash thêm hơn 100%, sau khi giá DRAM tăng gần 70%, nhấn mạnh sự hưng phấn trên thị trường bán dẫn.
Bất chấp sự hạ nhiệt chung của lĩnh vực bán dẫn toàn cầu, Goldman Sachs (GS), chuyên gia công nghệ Peter Callahan tin rằng thị trường không rơi vào tình trạng hoảng loạn cực độ, mà các nhà đầu tư đang thực hiện một đợt kiểm chứng thực tế về đà tăng trưởng phi thường gần đây của các cổ phiếu lưu trữ.
Trên thực tế, thị trường đã có động thái trước khi "thiên nga đen" Google TurboQuant xuất hiện—gã khổng lồ bộ nhớ Micron, sau khi công bố kết quả kinh doanh khả quan, đã chứng kiến giá cổ phiếu tụt hậu so với Chỉ số Bán dẫn Philadelphia gần 20% trong vòng năm ngày, mức kém hiệu quả tương đối trong ngắn hạn lớn nhất kể từ năm 2011.
Mặc dù thuật toán TurboQuant về mặt lý thuyết có thể giảm nhu cầu bộ nhớ, công nghệ này vẫn đang trong giai đoạn nghiên cứu và chưa được xác thực về mặt thương mại.
Từ góc độ kỹ thuật, công nghệ này trên thực tế chỉ áp dụng cho mức tiêu thụ VRAM động trong quá trình suy luận (chủ yếu là KV Cache) và không liên quan đến bản thân các trọng số mô hình. Nói cách khác, đột phá lớn nhất của công nghệ này là cải thiện hiệu suất vận hành, nhưng bản thân không gian lưu trữ mà các mô hình lớn yêu cầu không thể giảm bớt.
Ngoài ra, xét đến việc số lượng tham số trong các mô hình AI cũng đang tăng trưởng theo cấp số nhân, thuật toán này hiện chỉ có thể tiết kiệm tối đa gấp 6 lần không gian lưu trữ thông qua việc nén, điều này có thể chỉ như muối bỏ bể.
Việc ra mắt công nghệ này rất có thể sẽ làm hạ nhiệt thị trường bán dẫn đang quá nóng hiện nay và làm tan vỡ bong bóng định giá của các cổ phiếu bộ nhớ, chứng minh rằng nhu cầu bộ nhớ có thể không hoàn toàn là vô hạn. Với việc triển khai các công nghệ tương tự và sự tiến bộ của thuật toán, đà tăng trưởng của nhu cầu lưu trữ có thể sẽ gặp phải một nút thắt cổ chai.
Đáng chú ý là so với các chip DRAM tiêu chuẩn, công nghệ này sẽ có ít tác động hơn đối với HBM (Bộ nhớ băng thông cao). TurboQuant chủ yếu được sử dụng để tối ưu hóa quá trình suy luận mô hình AI, một giai đoạn vốn dĩ hầu hết chỉ cần các chip DRAM thông thường. Tuy nhiên, HBM vẫn là một yếu tố bắt buộc trong giai đoạn đào tạo AI. Đối với ba gã khổng lồ HBM là Micron, Samsung Electronics và SK Hynix, thuật toán TurboQuant sẽ hầu như không có tác động đáng kể nào trong ngắn hạn.