Dans la course clandestine des Big Tech pour acheter des données de formation en IA

Anna Tong - Reuters - 05/04

À son apogée au début des années 2000, Photobucket était le premier site d'hébergement d'images au monde. Pilier médiatique de services autrefois populaires comme Myspace et Friendster, il comptait 70 millions d'utilisateurs et représentait près de la moitié du marché américain de la photo en ligne.

NEW YORK, 5 avril (Reuters) - À son apogée au début des années 2000, Photobucket était le premier site d'hébergement d'images au monde. Pilier médiatique de services autrefois populaires comme Myspace et Friendster, il comptait 70 millions d'utilisateurs et représentait près de la moitié du marché américain de la photo en ligne.

Aujourd'hui, seulement 2 millions de personnes utilisent encore Photobucket, selon le tracker d'analyse Similarweb. Mais la révolution de l’IA générative pourrait lui donner un nouveau souffle.

Le PDG Ted Leonard, qui dirige l'entreprise de 40 personnes à Edwards, dans le Colorado, a déclaré à Reuters qu'il était en pourparlers avec plusieurs sociétés technologiques pour obtenir une licence pour les 13 milliards de photos et de vidéos de Photobucket afin qu'elles soient utilisées pour former des modèles d'IA génératifs capables de produire de nouveaux contenus en réponse. aux invites textuelles.

Il a évoqué des tarifs compris entre 5 cents et 1 dollar par photo et plus de 1 dollar par vidéo, a-t-il déclaré, les prix variant considérablement selon l'acheteur et les types d'images recherchés.

"Nous avons parlé à des entreprises qui ont dit : 'nous avons besoin de bien plus'", a ajouté Leonard, un acheteur lui disant qu'il voulait plus d'un milliard de vidéos, soit plus que ce que sa plateforme possède.

"Vous vous grattez la tête et vous demandez, où trouvez-vous ça ?"

Photobucket a refusé d'identifier ses acheteurs potentiels, invoquant la confidentialité commerciale. Les négociations en cours, qui n'ont pas été signalées auparavant, suggèrent que l'entreprise pourrait s'asseoir sur des milliards de dollars de contenu et donner un aperçu d'un marché de données animé qui surgit dans la ruée vers la domination de la technologie de l'IA générative.

Des géants de la technologie comme Google (GOOGL.O), ouvre un nouvel onglet, Meta (META.O), ouvre un nouvel onglet et, soutenu par Microsoft (MSFT.O), ouvre un nouvel onglet. OpenAI utilisait initialement des tonnes de données récupérées gratuitement sur Internet pour former des modèles d'IA génératifs comme ChatGPT qui peuvent imiter la créativité humaine. Ils ont déclaré que cela était à la fois légal et éthique, bien qu'ils soient confrontés à des poursuites judiciaires de la part d'une série de détenteurs de droits d'auteur à propos de cette pratique.

Dans le même temps, ces entreprises technologiques paient également discrètement pour du contenu verrouillé derrière des paywalls et des écrans de connexion, donnant lieu à un commerce caché de tout, des journaux de discussion aux photos personnelles oubliées depuis longtemps provenant d'applications de médias sociaux décolorées.

"Il y a actuellement une ruée vers les détenteurs de droits d'auteur qui possèdent des collections privées de contenus qui ne peuvent pas être récupérés", a déclaré Edward Klaris du cabinet d'avocats Klaris Law, qui dit conseiller les propriétaires de contenu sur des transactions valant des dizaines de millions de dollars. chacun pour autoriser des archives de photos, de films et de livres pour la formation en IA.

Reuters s'est entretenu avec plus de 30 personnes connaissant les transactions liées aux données d'IA, y compris des dirigeants actuels et anciens des entreprises impliquées, des avocats et des consultants, pour fournir la première exploration approfondie de ce marché naissant - détaillant les types de contenu achetés, les prix. se matérialise, ainsi que des préoccupations émergentes concernant le risque que des données personnelles se retrouvent dans des modèles d'IA à l'insu des personnes ou sans leur co...
[Courte citation de 8% de l'article original]

Tags : RSBI : DATA-PRIVACY - INSGHT - EREP - ANLINS - ARTI - BACT - BIZ - CCOS - CIV - CMPELC - CMPNY - COMS - COMS08 - CPROD - CYCS - CYCS08 - DAT - DEPT - DLI - ENT - GEN - ITSE - ITSE08 - FRV - MAILOD - MDIA - MDIA08 - NETSV - NETSV1 - NEWS1 - PHNE - PHONES - POL - PUB - PUBL - RET - RETE - RGEN - SCI - SHOP - SHOPAL - SMED - SOCI - SOCMED - SOFW - SOFW1 - SPCRET - SRCHEN - SWIT - TECH - TECH08 - TEEQ - TEEQ08 - TMT - WWW - AMERS - US - NAMER - SUSTAINABLE-BUSINESS - EF:TECHNOLOGY-PERRUPTED - PACKAGE:US-TOP-NEWS -

Article automatiquement traduit - Source et Copyright images et textes : Anna Tong - Reuters
Lien vers la traduction, consulter la traduction de l'article sur Google Translate : https://translate.google.com/translate?hl=en&sl=auto&tl=fr&u=https://www.reuters.com/technology/inside-big-techs-underground-race-buy-ai-training-data-2024-04-05/
Lien original, consulter l'article dans son intégralité ici : https://www.reuters.com/technology/inside-big-techs-underground-race-buy-ai-training-data-2024-04-05/
Lien direct sur notre site : http://www.newsexplorer.fr/article/17458659/Dans-la-course-clandestine-des-Big-Tech-pour-acheter-des-donn%C3%A9es-de-formation-en-IA
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.