Các tổ chức truyền thông hàng đầu ngày càng ký kết các thỏa thuận cấp phép với các công ty AI lớn. Đối với các tờ báo như The New York Times, thỏa thuận này bảo vệ tài sản trí tuệ của họ và cung cấp một nguồn thu nhập bổ sung.
Trong khi đó, các công ty như OpenAI và Amazon có thể huấn luyện mô hình của họ trên thông tin chính xác và tránh các vụ kiện về vi phạm bản quyền. Tuy nhiên, các chuyên gia từ IoTeX Network, O.XYZ và AR.IO đã nói với BeInCrypto rằng các giải pháp thay thế phi tập trung hiện có có thể đạt được kết quả tương tự một cách minh bạch và công bằng hơn cho những người sáng tạo nội dung.
Trong một động thái thu hút sự chú ý đáng kể, The New York Times đã ký một thỏa thuận với Amazon vào đầu tháng này, cho phép Amazon sử dụng nội dung biên tập của mình để huấn luyện các mô hình trí tuệ nhân tạo (AI) của công ty công nghệ này.
Thỏa thuận cấp phép giữa The New York Times và Amazon cho phép công ty công nghệ sử dụng các bài báo từ tờ báo và các ấn phẩm khác của nó. Tuy nhiên, thông báo công khai của tờ báo về thỏa thuận này không tiết lộ các điều khoản tài chính.
Quyết định này đánh dấu một sự thay đổi công khai trong chiến lược của The New York Times, trước đây đã phản đối các mô hình ngôn ngữ lớn (LLMs) sử dụng nội dung của mình mà không có sự cho phép.
Vào tháng 01/2024, tờ báo đã kiện OpenAI và Microsoft về vi phạm bản quyền. The New York Times tuyên bố rằng các công ty này đã sử dụng các bài báo có bản quyền để huấn luyện LLMs của họ mà không có sự cho phép hoặc bồi thường. Vụ kiện đó vẫn đang diễn ra và chưa có kết quả.
The New York Times không phải là tổ chức truyền thông đầu tiên kiện một công ty công nghệ về việc sử dụng không công bằng tài sản trí tuệ của mình.
“Trong những năm gần đây, nhiều dự án công nghệ lớn đã gặp phải nhiều thách thức pháp lý và tiền phạt. Ví dụ, Google đã phải đối mặt với hơn 8 tỷ EUR tiền phạt từ EU trong thập kỷ qua do các thực hành dữ liệu kém,” Ahmad Shadid, CEO của O.XYZ., nói với BeInCrypto.
Khi những người tạo ra các LLMs hàng đầu cần truy cập rộng rãi hơn vào thông tin chính xác, các thỏa thuận như vậy ngày càng trở nên phổ biến.
Các thỏa thuận cấp phép đang ngày càng phổ biến. Năm ngoái, OpenAI, do Sam Altman dẫn dắt, đã ký một thỏa thuận với công ty truyền thông đa quốc gia châu Âu Axel Springer SE. Thỏa thuận này tương tự với thỏa thuận gần đây giữa The New York Times và Amazon.
Thỏa thuận cho phép OpenAI sử dụng các bài báo từ các tổ chức truyền thông thuộc sở hữu của Axel Springer, bao gồm Politico, Business Insider và Morning Brew, cùng với các ấn phẩm quốc tế hàng đầu khác.
Altman sau đó đã ký các thỏa thuận tương tự với Financial Times, Vogue và các công ty mẹ của các tờ báo như The New Yorker, Cosmopolitan và Le Monde, để kể tên một vài. OpenAI đã đồng ý liên kết ngược tất cả thông tin liên quan đến các bài báo gốc như một phần của các thỏa thuận này.
Khi các công ty công nghệ lớn đối mặt với áp lực ngày càng tăng về vi phạm tài sản trí tuệ và vi phạm bản quyền, những tình huống này là một lợi ích cho tất cả các bên liên quan.
“Sau các vụ kiện như vụ The New York Times đã đệ trình, các công ty AI đang cẩn trọng hơn về những gì họ huấn luyện. Các thỏa thuận cấp phép mang lại sự yên tâm, và đối với các nhà xuất bản, đó là cơ hội để biến hàng thập kỷ nội dung lưu trữ thành nguồn thu nhập ổn định. Đồng thời, các công ty AI được hưởng lợi từ việc truy cập độc quyền vào các nguồn tin cậy, giúp cải thiện chất lượng của các mô hình của họ,” Aaron Basi, Trưởng phòng Sản phẩm tại IoTeX Network, giải thích.
Nhưng, liệu có cách nào tốt hơn để đạt được kết quả tương tự với sự minh bạch lớn hơn không?
Việc tìm kiếm một giải pháp mở rộng quyền truy cập vào thông tin đáng tin cậy khi tương tác với AI và bồi thường công bằng cho những người sáng tạo nội dung ngày càng trở nên cấp bách. Các thỏa thuận cấp phép cung cấp một con đường để đạt được mục tiêu này.
“Có giá trị chiến lược lớn. Các thỏa thuận này có thể bao gồm khả năng hiển thị tốt hơn, như được xuất hiện trong các câu trả lời hoặc tóm tắt do AI tạo ra. Cũng có quyền truy cập vào phân tích cho thấy cách nội dung đang được sử dụng hoặc tương tác,” Basi nói.
Nó cũng đi một chặng đường dài trong việc ngăn chặn thông tin sai lệch khi sử dụng LLMs.
“Huấn luyện AI mà không có dữ liệu được xác minh, minh bạch giống như bay mà không có định hướng. Nếu chúng ta không thể truy xuất những gì đã đưa vào, chúng ta không thể tin tưởng những gì sẽ ra. Đây là cách chúng ta kết thúc với những thất bại âm thầm được tạo ra bởi các mô hình AI dễ vỡ thiếu sự cân nhắc lâu dài,” Phil Mataras, người sáng lập AR.IO, nói với BeInCrypto.
Tuy nhiên, các thỏa thuận cấp phép này thường là riêng tư, khiến cho những người sáng tạo nội dung nhỏ khó có thể đạt được các thỏa thuận tương tự hoặc bảo vệ mình khỏi các trường hợp sử dụng không công bằng. Phi tập trung có tiềm năng cân bằng sân chơi ở đây.
“Các mô hình đóng thắng các cuộc đua ngắn hạn. Các mô hình phi tập trung thắng cuộc đua marathon. Niềm tin là tối thượng cùng với sự minh bạch và khả năng kiểm toán,” Mataras nói thêm.
Có một số công cụ khác nhau mà Web3 có thể cung cấp để đạt được điều này.
Công nghệ phi tập trung có thể tạo ra một hệ thống dân chủ và minh bạch hơn cho tất cả các nhà sáng tạo để cấp phép cho nội dung của họ. Điều này đặc biệt có lợi cho những người thường bị bỏ qua trong các thỏa thuận riêng tư truyền thống.
“Thay vì thực hiện các thỏa thuận cấp phép cá nhân sau cánh cửa đóng kín, các nhà sáng tạo có thể tải nội dung lên một mạng lưới phi tập trung. Smart contracts có thể thực thi các điều khoản và tự động xử lý thanh toán. Điều này giúp các nhà sáng tạo độc lập hoặc các tổ chức nhỏ hơn dễ dàng tham gia. Nó cũng tạo ra sự minh bạch hơn về việc ai đang sử dụng dữ liệu và như thế nào,” Basi giải thích.
Tokenization cũng cung cấp cho các nhà sáng tạo một phương pháp để theo dõi việc sử dụng nội dung của họ bởi các mô hình AI.
“Token hóa nội dung có thể giúp các nhà xuất bản kiểm soát và theo dõi tốt hơn. Ví dụ, họ có thể đặt ra các quy tắc về quyền truy cập hoặc sử dụng và được thanh toán tự động thông qua smart contracts. Dù vẫn còn sớm, nhưng đối với các công ty truyền thông kỹ thuật số, loại hình này có thể mang lại những cách mới để kiếm doanh thu mà không phải từ bỏ quyền kiểm soát,” Basi bổ sung.
Các giải pháp khác dựa trên blockchain có thể đảm bảo việc lưu trữ hồ sơ không thể phá vỡ để củng cố thêm các lựa chọn phi tập trung này.
Một khía cạnh quan trọng khác của hệ sinh thái kỹ thuật số công bằng thực sự là đảm bảo tính xác thực, theo dõi việc sử dụng và bảo vệ quyền sở hữu trí tuệ. Đây là nơi mà các hệ thống nguồn gốc dựa trên blockchain xuất hiện như những giải pháp mạnh mẽ.
Các hệ thống nguồn gốc dựa trên blockchain được thiết kế để ghi lại lịch sử và dòng dõi của nội dung kỹ thuật số một cách tỉ mỉ. Chúng tận dụng các tính năng cốt lõi của blockchain—khả năng truy xuất, tính minh bạch và không thể thay đổi—để tạo ra các hồ sơ đáng tin cậy và không thể giả mạo.
Mọi sự kiện quan trọng trong vòng đời của một nội dung, từ khi tạo ra đến bất kỳ thay đổi hoặc chuyển nhượng nào, đều có thể được ghi lại trên sổ cái phân tán, tạo ra một hồ sơ không thể phá vỡ về lịch sử của nó.
“Các hệ thống nguồn gốc đã rất hữu ích trong ngành công nghệ. Việc mô tả chính xác lịch sử của một tập dữ liệu được sử dụng hoặc chuyển nhượng. Nó giúp xác định chủ sở hữu ban đầu, ai đã mua, cách thức bán, khi nào, và người hiện tại đang giữ tập dữ liệu đó. Các hệ thống blockchain đã có cơ chế lưu trữ vĩnh viễn—chúng cung cấp sự cứng rắn khi nói đến quyền sở hữu dữ liệu,” Shadid nói với BeInCrypto.
Dựa trên nền tảng lịch sử có thể xác minh này, các công cụ watermarking bổ sung cho các hệ thống nguồn gốc bằng cách nhúng thông tin ẩn, có thể nhận dạng trực tiếp vào nội dung kỹ thuật số.
“Các công cụ watermarking đóng vai trò quan trọng trong việc ngăn chặn vi phạm bản quyền, trộm cắp dữ liệu và tuyên bố quyền sở hữu sai trái… Những kỹ thuật này mang lại một thách thức lớn hơn cho những kẻ trộm dữ liệu và hacker nhằm đảm bảo tính toàn vẹn, công bằng và đạo đức của dữ liệu,” Shadid bổ sung.
Nguyên tắc phi tập trung cũng có thể được mở rộng đến việc quản lý và điều hành tập thể nội dung.
Thay vì các nhà sáng tạo cá nhân hoặc lãnh đạo của các tổ chức truyền thông lớn tự quyết định về việc cấp phép nội dung, các tổ chức tự trị phi tập trung (DAOs) có thể trao quyền cho các tập thể nhà sáng tạo, như các nhà báo, để cùng nhau kiểm soát việc ra quyết định.
“Một nhóm các nhà sáng tạo có thể gộp công việc của họ lại và sử dụng DAO để quản lý việc cấp phép, thanh toán và quản trị. Cách tiếp cận này trao cho các tiếng nói độc lập một chỗ ngồi tại bàn khi đối phó với các công ty AI lớn. Nó cũng giúp dễ dàng đàm phán các điều khoản công bằng và đảm bảo rằng các quyết định được đưa ra tập thể. Nó giống như một công đoàn, nhưng được thiết kế cho thời đại kỹ thuật số,” Basi giải thích.
Mặc dù tập trung vào sự minh bạch, các thỏa thuận cấp phép giữa các mô hình AI và các nguồn thông tin vẫn đang ở giai đoạn đầu. Điều này đặt ra một câu hỏi quan trọng: Liệu các mô hình mã nguồn mở có bị tụt hậu khi các công ty AI đảm bảo các thỏa thuận dữ liệu độc quyền?
Việc sử dụng nội dung không được phép và không minh bạch của LLMs ban đầu đã gây ra sự bất mãn đáng kể trong số các nhà sáng tạo gốc. Các thỏa thuận cấp phép hiện đã cải thiện tình hình.
Tuy nhiên, sự minh bạch hoàn toàn vẫn chưa được thấy. Các thỏa thuận như thỏa thuận giữa The New York Times và Amazon sẽ không đủ cho những người muốn biết nguồn gốc dữ liệu của họ và cho các nhà sáng tạo muốn hiểu cách nội dung của họ đang được sử dụng.
“Các mô hình đóng thắng trong các cuộc đua ngắn hạn. Các mô hình phi tập trung thắng trong cuộc đua marathon. Niềm tin là tối thượng cùng với sự minh bạch và khả năng kiểm toán,” Mataras nói.
Basi đồng ý và bổ sung:
“Sự minh bạch là một lợi thế mạnh mẽ. Mọi người muốn hiểu rõ những gì tạo nên các công cụ họ sử dụng, đặc biệt trong các lĩnh vực nhạy cảm như y tế hoặc giáo dục. Các dự án mã nguồn mở có thể thích ứng nhanh chóng, nhận được sự hỗ trợ từ cộng đồng và xây dựng niềm tin thông qua sự cởi mở. Về lâu dài, niềm tin đó có thể quan trọng hơn việc tiếp cận một vài bộ dữ liệu độc quyền.”
Mặc dù các thỏa thuận cấp phép là một điểm khởi đầu tốt, nhưng sự chuyển đổi thực sự cho những người sáng tạo nội dung và tính minh bạch của AI có thể sẽ xuất phát từ các phương pháp tiếp cận phi tập trung và mã nguồn mở.