Tiết lộ: Các quan điểm và ý kiến ​​​​được trình bày ở đây chỉ thuộc về tác giả và không đại diện cho quan điểm và ý kiến ​​​​của bài xã luận của crypto.news.

Elon Musk đã kiện OpenAI vì bị cáo buộc chuyển hướng khỏi sứ mệnh phát triển AGI ‘vì lợi ích của nhân loại.’ Carlos E. Perez nghi ngờ vụ kiện có thể biến công ty dẫn đầu thị trường Generative AI hiện tại thành WeWork tiếp theo. 

Bạn cũng có thể thích: AI phi tập trung sẽ tạo ra làn sóng kỳ lân tiếp theo ở Thung lũng Silicon | Ý kiến

Sự chuyển đổi vì lợi nhuận của OpenAI là trọng tâm của cuộc chiến pháp lý này. Tuy nhiên, việc nhấn mạnh quá mức vào lợi nhuận sẽ phản bội lại lợi ích doanh nghiệp được đảm bảo. Nó cũng chuyển hướng sự chú ý khỏi những mối quan tâm quan trọng hơn đối với người dùng cuối, tức là đào tạo AI và quản lý dữ liệu có đạo đức. 

Grok, đứa con tinh thần của Elon và đối thủ cạnh tranh ChatGPT, có thể truy cập ‘thông tin thời gian thực’ từ các tweet. OpenAI dù sao cũng nổi tiếng với việc thu thập dữ liệu có bản quyền ở bên trái, bên phải và giữa. Giờ đây, Google đã đạt được thỏa thuận trị giá 60 triệu USD để truy cập dữ liệu của người dùng Reddit nhằm đào tạo Gemini và Cloud AI. 

Chỉ thúc đẩy nguồn mở không phục vụ được lợi ích của người dùng trong môi trường này. Họ cần những cách để đảm bảo sự đồng ý và đền bù có ý nghĩa để giúp đào tạo LLM. Ví dụ, các công cụ xây dựng nền tảng mới nổi để thu thập dữ liệu đào tạo AI từ cộng đồng là rất quan trọng trong vấn đề này. Thêm về điều đó sau. 

Nó chủ yếu là phi lợi nhuận cho người dùng

Hơn 5,3 tỷ người sử dụng Internet trên toàn cầu và khoảng 93% trong số họ sử dụng mạng xã hội tập trung. Do đó, có khả năng phần lớn trong số 147 tỷ terabyte dữ liệu được tạo ra trực tuyến vào năm 2023 đều do người dùng tạo. Khối lượng dự kiến ​​sẽ vượt 180 tỷ vào năm 2025. 

Mặc dù tập dữ liệu khổng lồ hoặc 'thông tin có sẵn công khai' này thúc đẩy quá trình đào tạo và phát triển của AI, nhưng hầu hết người dùng không thu được lợi ích gì. Họ không có quyền kiểm soát cũng như quyền sở hữu thực sự. Cách thể hiện sự đồng ý “Tôi đồng ý” cũng không có ý nghĩa gì - tốt nhất đó là một sự lừa dối và tệ nhất là sự ép buộc. 

Dữ liệu là loại dầu mới. Big Tech không quan tâm đến việc cung cấp cho người dùng cuối nhiều quyền kiểm soát hơn đối với dữ liệu của họ. Thứ nhất, việc trả tiền cho người dùng để lấy dữ liệu sẽ làm tăng đáng kể chi phí đào tạo LLM, dù sao cũng lên tới hơn 100 triệu USD. Tuy nhiên, như Chris Dixon lập luận trong “Đọc, viết, sở hữu”, năm công ty lớn đang kiểm soát và có khả năng 'hủy hoại mọi thứ' chính là con đường nhanh chóng dẫn đến viễn cảnh lạc hậu. 

Tuy nhiên, với sự phát triển của blockchain như lớp dữ liệu phân tán và nguồn gốc của sự thật, kỷ nguyên tốt nhất cho người dùng vừa mới bắt đầu. Quan trọng nhất, không giống như các tập đoàn lớn, các công ty AI thời đại mới nắm bắt những lựa chọn thay thế như vậy để có hiệu suất tốt hơn, tiết kiệm chi phí và cuối cùng là cải thiện nhân loại. 

Dữ liệu cung cấp từ cộng đồng để đào tạo AI có đạo đức

Mô hình đọc-ghi-tin cậy của Web2 dựa vào các thực thể và các bên liên quan không phải là kẻ ác. Nhưng lòng tham của con người là không có giới hạn - tất cả chúng ta đều là một nhóm 'những kẻ ích kỷ', theo nhà triết học thế kỷ 18 David Hume. 

Do đó, mô hình đọc-ghi riêng của Web3 sử dụng chuỗi khối, mật mã, v.v., để những người tham gia mạng phân tán không thể trở thành kẻ ác. Chris khám phá ý tưởng này một cách sâu rộng trong cuốn sách của mình.

Nhóm công nghệ web3 về cơ bản là hướng tới cộng đồng và do người dùng dẫn dắt. Việc cung cấp bộ công cụ để cho phép người dùng lấy lại quyền kiểm soát dữ liệu của họ—tài chính, xã hội, sáng tạo và các mặt khác—là tiền đề cốt lõi trong miền này. Ví dụ, chuỗi khối đóng vai trò là lớp dữ liệu phân tán, có thể xác minh để giải quyết các giao dịch và thiết lập nguồn gốc một cách bất biến. 

Hơn nữa, các cơ chế bảo mật và quyền riêng tư khả thi như bằng chứng không có kiến ​​thức (zkProofs) hoặc tính toán đa bên (MPC) đã phát triển trong vài năm qua. Họ mở ra những con đường mới trong việc xác thực, chia sẻ và quản lý dữ liệu bằng cách cho phép các đối tác thiết lập sự thật mà không tiết lộ nội dung. 

Những khả năng rộng rãi này rất phù hợp với PoV đào tạo AI. Giờ đây, bạn có thể lấy nguồn dữ liệu đáng tin cậy mà không cần dựa vào các nhà cung cấp hoặc trình xác nhận tập trung. Nhưng quan trọng nhất, tính chất phi tập trung, không qua trung gian của web3 giúp kết nối trực tiếp những người tạo ra dữ liệu—tức là người dùng—và các dự án cần dữ liệu đó để đào tạo các mô hình AI. 

Loại bỏ 'các bên trung gian đáng tin cậy' và người gác cổng giúp giảm đáng kể chi phí. Nó cũng điều chỉnh các biện pháp khuyến khích để các dự án có thể đền bù cho những nỗ lực và đóng góp của người dùng. Ví dụ: người dùng có thể kiếm tiền điện tử bằng cách hoàn thành các nhiệm vụ vi mô như ghi lại tập lệnh bằng phương ngữ bản địa của họ, nhận dạng và gắn nhãn đối tượng, sắp xếp và phân loại hình ảnh, cấu trúc dữ liệu phi cấu trúc, v.v. 

Mặt khác, các công ty có thể xây dựng các mô hình chính xác hơn bằng cách sử dụng dữ liệu chất lượng cao được con người trong vòng lặp xác thực và ở mức giá hợp lý. Đó là một kết quả đôi bên cùng có lợi và tốt cho tất cả. 

Những tiến bộ từ dưới lên, không chỉ đơn thuần là nguồn mở

Các khuôn khổ truyền thống quá ảnh hưởng đến các cá nhân và cộng đồng người dùng, nguồn mở đơn thuần không có ý nghĩa gì như vậy. Những thay đổi căn bản trong các mô hình kinh doanh và khung đào tạo hiện tại là cần thiết để đảm bảo việc đào tạo AI có đạo đức. 

Thay thế các hệ thống từ trên xuống bằng cách tiếp cận cơ sở, từ dưới lên là cách tốt nhất. Đó cũng là việc thiết lập một trật tự trọng dụng nhân tài coi trọng quyền sở hữu, quyền tự chủ và sự hợp tác. Trong thế giới này, phân phối công bằng là lợi nhuận cao nhất chứ không phải tối đa hóa. 

Điều thú vị là các hệ thống này sẽ mang lại lợi ích cho các tập đoàn lớn cũng như trao quyền cho các doanh nghiệp nhỏ hơn và người dùng cá nhân. Bởi vì xét cho cùng, dữ liệu chất lượng cao, giá cả hợp lý và mô hình AI chính xác là những thứ mọi người đều cần. 

Giờ đây, với các biện pháp khuyến khích phù hợp, lợi ích chung của ngành là đón nhận và áp dụng các mô hình thời đại mới. Giữ những lợi ích thu hẹp, thiển cận sẽ không giúp ích gì về lâu dài. Tương lai có những nhu cầu khác với quá khứ. 

Đọc thêm: Còn gì tuyệt vời hơn việc sở hữu tài sản của bạn? Sở hữu dữ liệu của bạn | Ý kiến

Tác giả: William Simonin

William Simonin là chủ tịch của Ta-da, một thị trường dữ liệu AI tận dụng blockchain để xác minh dữ liệu. Trước đây ông từng làm kỹ sư phần mềm và nhà nghiên cứu cho Bộ Quốc phòng Pháp trong khoảng sáu năm và làm việc cho Hiệp hội An ninh của Epitech Nancy, giữ chức Chủ tịch của họ và sau đó là Giáo sư về Lập trình Chức năng. Ông là một doanh nhân người Pháp và là người đồng sáng lập của nhiều công ty AI, công nghệ và tiền điện tử.