Chính sách bảo mật được cập nhật của Google cho biết họ có thể sử dụng dữ liệu công khai để đào tạo các mô hình AI của mình

Nó có thể sử dụng dữ liệu công khai để tạo ra các sản phẩm như khả năng của Bard và Cloud AI, Google cho biết.

Google đã cập nhật chính sách bảo mật của mình để tuyên bố rằng họ có thể sử dụng dữ liệu có sẵn công khai để giúp đào tạo các mô hình AI của mình. Gã khổng lồ công nghệ đã thay đổi từ ngữ trong chính sách của mình vào cuối tuần qua và chuyển “mô hình AI” thành “mô hình ngôn ngữ”. Nó cũng tuyên bố rằng nó có thể sử dụng thông tin có sẵn công khai để xây dựng không chỉ các tính năng mà còn các sản phẩm đầy đủ như “các khả năng của Google Dịch, Bard và Cloud AI”. Bằng cách cập nhật chính sách của mình, nó cho phép mọi người biết và làm rõ rằng bất kỳ thứ gì họ đăng công khai trực tuyến đều có thể được sử dụng để đào tạo Bard, các phiên bản tương lai của nó và bất kỳ sản phẩm AI tổng quát nào khác mà Google phát triển.

Gã khổng lồ công nghệ đã nhấn mạnh những thay đổi đối với chính sách quyền riêng tư trong kho lưu trữ của mình, nhưng đây là bản sao của phần thích hợp:

Các nhà phê bình đã nêu lên mối lo ngại về việc các công ty sử dụng thông tin được đăng trực tuyến để đào tạo các mô hình ngôn ngữ lớn của họ để sử dụng AI một cách tổng quát. Gần đây, một vụ kiện tập thể được đề xuất đã được đệ trình chống lại OpenAI, cáo buộc OpenAI đã thu thập “một lượng lớn dữ liệu cá nhân từ internet”, bao gồm cả “thông tin cá nhân bị đánh cắp” để đào tạo các mô hình GPT của mình mà không có sự đồng ý trước. Như Search Engine Journal lưu ý, chúng ta có thể sẽ thấy nhiều vụ kiện tương tự trong tương lai khi nhiều công ty phát triển các sản phẩm AI tổng quát của riêng họ.

Chủ sở hữu của các trang web có thể được coi là quảng cáo công cộng trong thời đại kỹ thuật số cũng đã thực hiện các bước để ngăn chặn hoặc thu lợi từ sự bùng nổ AI tổng quát. Reddit đã bắt đầu tính phí truy cập vào API của mình, khiến các ứng dụng khách bên thứ ba ngừng hoạt động vào cuối tuần. Trong khi đó, Twitter đưa ra hạn chế về số lượng tweet mà người dùng nhìn thấy mỗi ngày để “giải quyết mức độ cực đoan của việc thu thập dữ liệu [và] thao tác hệ thống.”

Related Posts

Leave a Comment Cancel Reply