您现在的位置是:NEWS > Kinh doanh
Chợ dữ liệu âm thầm mà nhộn nhịp trong thời AI bùng nổ
NEWS2025-03-08 13:23:07【Kinh doanh】9人已围观
简介Vào thời kỳ đỉnh cao đầu những năm 2000,ợdữliệuâmthầmmànhộnnhịptrongthờiAIbùngnổlê bống Photobucket lê bốnglê bống、、
Vào thời kỳ đỉnh cao đầu những năm 2000,ợdữliệuâmthầmmànhộnnhịptrongthờiAIbùngnổlê bống Photobucket là website lưu trữ hình ảnh hàng đầu thế giới, với hơn 70 triệu người dùng, chiếm gần một nửa thị trường ảnh trực tuyến ở Mỹ.
Ngày nay, theo Similarweb, Photobucket chỉ còn hai triệu người dùng thường xuyên. Song, cơn sốt AI tạo sinh đang mang lại cho công ty sức sống mới. CEO Ted Leonard cho biết đang đàm phán với nhiều công ty công nghệ để cấp phép cho 13 tỷ ảnh và video của Photobucket, phục vụ đào tạo mô hình ngôn ngữ lớn (LLM). Giá mỗi ảnh tùy thuộc bên mua và loại nội dung được tìm kiếm, dự kiến từ 0,05 đến 1 USD và từ 1 USD mỗi video.
“Họ thậm chí còn muốn mua hơn một tỷ video, nhiều hơn cả những gì chúng tôi có”, Leonard nói.
“Cơn sốt tìm vàng”
Các công ty vận hành LLM như OpenAI, Meta, Google, Microsoft ban đầu sử dụng nguồn dữ liệu khổng lồ, miễn phí và công khai được thu thập từ Internet. Tuy nhiên, khi đối mặt với hàng loạt vụ kiện bản quyền, cũng như việc dịch AI thu phí đã đi vào triển khai, họ cần một khối lượng dữ liệu bản quyền khổng lồ.

Đi kèm với đó là hoạt động giao dịch ngầm về mọi loại dữ liệu, từ nhật ký trò chuyện đến ảnh cá nhân bị “lãng quên” từ lâu trên các diễn đàn, mạng xã hội cổ xưa.
Luật sư Edward Klaris từ Klaris Law cho biết những gã khổng lồ công nghệ đang sốt sắng tìm kiếm những người nắm bản quyền dữ liệu của những “nội dung riêng tư mà không thể loại bỏ” trong quá trình thu thập dữ liệu và huấn luyện AI. Hãng luật này đang tư vấn cho một số khách hàng mua bản quyền nội dung và cấp phép lưu trữ ảnh, phim, sách phục vụ đào tạo AI với giá hàng chục triệu USD.
Business Research Insightsước tính giá trị thị trường mua bán dữ liệu cho AI hiện ở mức 2,5 tỷ USD và sẽ tăng lên 30 tỷ USD trong vòng một thập kỷ.
Meta, Google, Amazon và Apple đều có thoả thuận với nhà cung cấp hình ảnh Shutterstock. Nguồn tin của Reuterscho hay, giá trị các hợp đồng rơi vào khoảng từ 25 triệu USD đến 50 triệu USD. Những công ty AI nhỏ hơn cũng không đứng ngoài cuộc chơi khiến chợ dữ liệu càng thêm nhộn nhịp suốt hai tháng qua.
Freepik, đối thủ của Shutterstock, cũng cho biết họ có thoả thuận với hai công ty công nghệ lớn, cấp phép phần lớn kho lưu trữ 200 triệu hình ảnh với mức giá từ 0,02 USD đế 0,04 USD mỗi hình ảnh. CEO Joaquin Cuenca Abela tiết lộ còn có thêm 5 giao dịch tương tự nhưng từ chối tiết lộ danh tính bên mua.
OpenAI, một trong những khách hàng đầu tiên của Shutterstock, cũng đã ký thoả thuận cấp phép với ít nhất bốn tổ chức xuất bản tin tức bao gồm AP, Axel Springer và Thomson Reuters.
Ngành công nghiệp dữ liệu AI
Ngành công nghiệp dữ liệu AI chuyên dụng đang dần định hình. Defined.ai, trụ sở Seattle đang cấp phép dữ liệu cho một loạt công ty bao gồm Google, Meta, Apple, Amazon và Microsoft.
Giá cả khác nhau tùy theo người mua và loại nội dung, nhưng CEO Daniela Braga cho biết các công ty thường sẵn sàng trả từ 1 đến 2 USD cho mỗi hình ảnh, 2 đến 4 USD cho mỗi video dạng ngắn và 100 đến 300 USD mỗi giờ cho phim dài hơn. Trong khi đó, giá thị trường cho văn bản là 0,001 USD mỗi từ.
Defined.ai cho biết, các tập dữ liệu “có nguồn gốc hợp pháp” do có sự đồng ý từ những người chủ sở hữu và đã loại bỏ thông tin nhận dạng cá nhân. Công ty cũng chia sẻ khoản thu nhập với các nhà cung cấp nội dung. Sau đó, các nhà cung cấp nội dung trả chủ sở hữu bản quyền 20-30% tổng giá trị giao dịch.
Theo một nhà cung cấp dữ liệu trụ sở Brazil, những hình ảnh đắt giá nhất trong danh mục thường là hình ảnh đào tạo hệ thống AI chặn nội dung bạo lực. Do đó, công ty thu thập hình ảnh về hiện trường vụ án, bạo lực và các cuộc phẫu thuật chủ yếu từ cảnh sát, phóng viên ảnh tự do và sinh viên y khoa ở những khu vực như Nam Mỹ và châu Phi.
Rủi ro quyền riêng tư người dùng
Các chuyên gia nhận định, việc đưa những "tên tuổi Internet cũ" như Photobucket trở lại, sử dụng nội dung làm nhiên liệu cho đào tạo AI có thể gây ra một số rủi ro nghiêm trọng, đặc biệt về quyền riêng tư của người dùng.
"Có nghĩa là, những bức ảnh hoặc nội riêng tư của một người được đăng cách đây vài thập kỷ có thể xuất hiện trở lại trong kết quả đầu ra của AI mà không cần thông báo hoặc có sự đồng ý rõ ràng", một chuyên gia cho biết.
Braga của Defined.ai cho biết công ty tránh mua nội dung từ các đơn vị mang tính "nền tảng" như Photobucket. Thay vào đó, công ty lấy nguồn ảnh trên mạng xã hội do KOL tạo ra - những người có yêu cầu rõ ràng hơn về quyền cấp phép.
"Tôi thấy lấy nội dung từ nền tảng cũ rất rủi ro", Braga nói. "Nếu có AI nào đó tạo ra thứ gì đó giống với hình ảnh của một người chưa bao giờ đồng ý chia sẻ, đó là một vấn đề".
Photobucket không phải là nền tảng cũ duy nhất bán nội dung cho công ty AI. Automattic, công ty mẹ của Tumblr, tháng trước cũng cho biết đang chia sẻ nội dung với "công ty AI được chọn lọc". Trong tháng 2, Reddit cũng đạt được thỏa thuận với Google về việc huấn luyện AI.
Dù vậy vào tháng 3, Reddit nói quyết định cấp phép dữ liệu cho bên thứ ba đào tạo AI khiến công ty trở thành mục tiêu điều tra của Ủy ban Thương mại Liên bang Mỹ. Mạng xã hội thừa nhận rằng hành vi này có thể vi phạm các quy định về quyền riêng tư và sở hữu trí tuệ đang có

很赞哦!(4)
相关文章
- Soi kèo phạt góc Vissel Kobe vs Gwangju FC, 17h00 ngày 5/3
- Soi kèo chẵn/ lẻ Atlas vs Monterrey, 10h05 ngày 10/2
- Máy tính dự đoán bóng đá 28/5: Orlando vs Dallas
- Soi kèo, dự đoán Macao Racing Club vs Boca Juniors, 6h30 ngày 15/8
- Nhận định, soi kèo U19 Sporting Lisbon vs U19 Stuttgart, 20h00 ngày 5/3: Chủ nhà đáng tin
- Phân tích kèo hiệp 1 San Luis vs Club América, 10h05 ngày 15/2
- Nhận định, soi kèo Shonan Bellmare vs Avispa Fukuoka, 17h ngày 16/7
- Nhận định, soi kèo Khánh Hòa vs Hà Nội, 17h00 ngày 25/6
- Nhận định, soi kèo Riga FC vs Super Nova Riga, 23h00 ngày 6/3: Sớm bứt phá
- Nhận định, soi kèo Urawa Red Diamonds vs Consadole Sapporo, 13h00 ngày 15/4
热门文章
站长推荐
Nhận định, soi kèo KF Tirana vs KF Laci, 21h00 ngày 5/3: Chìm xuống đáy
Công Phượng tuyên bố đanh thép, đối thủ của TP.HCM 'run rẩy'
Nhận định, soi kèo Nashville vs Seattle Sounders, 7h37 ngày 14/7 - Giải Nhà nghề Mỹ, MLS 2022. Dự đoán, phân tích châu Âu, châu Á trận Nashville đối đầu với Seattle Sounders từ các chuyên gia hàng đầu.Nhận định, soi kèo Dallas vs New York City, 08h00 ngày 14/07">
Nhận định, soi kèo Nashville vs Seattle Sounders, 7h37 ngày 14/7
Link xem trực tiếp trận đấu Nagoya Grampus vs Júbilo Iwata hôm nay, 17h30 ngày 19/8. Xem video trực tiếp bóng đá Nagoya Grampus vs Júbilo Iwata hoàn toàn miễn phí.Nhận định, soi kèo Hà Tĩnh vs Nam Định, 18h ngày 19/8">
Link xem trực tiếp Nagoya Grampus vs Júbilo Iwata, 17h30 ngày 19/8
Nhận định, soi kèo U19 Hoffenheim vs U19 Man City, 20h00 ngày 5/3: Tin vào chủ nhà
Nhận định, soi kèo Suwon vs Gangwon, 17h ngày 16/7 - Giải VĐQG Hàn Quốc. Dự đoán, phân tích châu Âu, châu Á trận Suwon đối đầu với Gangwon từ các chuyên gia hàng đầu.Nhận định, soi kèo Đắk Lắk vs Bình Phước, 15h30 ngày 16/7">
Nhận định, soi kèo Suwon vs Gangwon, 17h ngày 16/7
Ở trận đấu này, ĐT Thái Lan chỉ mang sang Việt Nam 21 cầu thủ, bao gồm nhiều cầu thủ trẻ và tân binh do một số trụ cột thi đấu ở nước ngoài chưa thể hội quân. Dù vậy, đẳng cấp của "Bầy Voi chiến" là quá vượt trội và dễ dàng giành 3 điểm đầu tay.
Thái Lan khởi đầu AFF Cup 2024 với thắng lợi 10-0 trước Đông Timor Sau màn đọ sức Đông Timor, thầy trò HLV Masatada Ishii đã rời Việt Nam trở về nước để chuẩn bị cho trận tiếp theo. Giống như ĐT Việt Nam, ĐT Thái Lan được nghỉ ngơi ở lượt đấu thứ 2 và tiếp tục ra sân đối đầu Malaysia ngày 14/12 ở lượt 3.
Trước cuộc tiếp đón Malaysia, ĐT Thái Lan đã đón tin vui về mặt lực lượng. Theo đó, đội tuyển xứ chùa Vàng đón chào sự bổ sung của tiền vệ ngôi sao Supachok Sarachat từ CLB Consadole Sapporo ở giải VĐQG Nhật Bản J-League 1.
Sau khi hoàn thành nhiệm vụ ở CLB chủ quản, Supachok đã được "nhả" về ĐT Thái Lan tham dự AFF Cup 2024. Tiền vệ sinh năm 1998 sẽ nhanh chóng bước vào tập luyện cùng toàn đội vào tối ngày 11/12 và đủ điều kiện ra sân ở trận gặp Malaysia tới.
Supachok hội quân ĐT Thái Lan, sẵn sàng đấu Malaysia (Ảnh: FAT) Đây sẽ là sự tăng cường quan trọng của ĐT Thái Lan trong chiến dịch AFF Cup 2024. Được biết, Supachok là cầu thủ đắt nhất AFF Cup 2024 khi được chuyên trang chuyển nhượng Transfermarkt định giá tới 900.000 euro (hơn 24 tỷ đồng).
Supachok Sarachat khoác áo ĐT Thái Lan từ năm 2017, ra sân 36 lần và ghi được 9 bàn thắng. Ngôi sao thuộc biên chế Consadole Sapporo là cái tên giàu kinh nghiệm của ĐT Thái Lan, từng vô địch AFF Cup 2020 và là anh trai của tiền đạo Suphanat Mueanta.
Như vậy, Thái Lan gần như sở hữu toàn bộ lực lượng, chỉ còn thiếu vắng một vài cái tên, trong đó có Ekanit Panya của Urawa Red Diamonds. Trận đấu giữa Thái Lan vs Malaysia sẽ diễn ra vào 20h00 thứ Bảy 14/12 tới.
Bài liên quan">Rời Việt Nam, ĐT Thái Lan đón tin cực vui ở AFF Cup
Nhận định, soi kèo Dallas vs Minnesota, 6h07 ngày 23/5