NEW YORK, 5 avril (Reuters) - À son apogée au début des années 2000, Photobucket était le premier site d'hébergement d'images au monde. Pilier médiatique de services autrefois populaires comme Myspace et Friendster, il comptait 70 millions d'utilisateurs et représentait près de la moitié du marché américain de la photo en ligne.
Aujourd'hui, seulement 2 millions de personnes utilisent encore Photobucket, selon le tracker d'analyse Similarweb. Mais la révolution de l’IA générative pourrait lui donner un nouveau souffle.
Le PDG Ted Leonard, qui dirige l'entreprise de 40 personnes à Edwards, dans le Colorado, a déclaré à Reuters qu'il était en pourparlers avec plusieurs sociétés technologiques pour obtenir une licence pour les 13 milliards de photos et de vidéos de Photobucket afin qu'elles soient utilisées pour former des modèles d'IA génératifs capables de produire de nouveaux contenus en réponse. aux invites textuelles.
Il a évoqué des tarifs compris entre 5 cents et 1 dollar par photo et plus de 1 dollar par vidéo, a-t-il déclaré, les prix variant considérablement selon l'acheteur et les types d'images recherchés.
"Nous avons parlé à des entreprises qui ont dit : 'nous avons besoin de bien plus'", a ajouté Leonard, un acheteur lui disant qu'il voulait plus d'un milliard de vidéos, soit plus que ce que sa plateforme possède.
"Vous vous grattez la tête et vous demandez, où trouvez-vous ça ?"
Photobucket a refusé d'identifier ses acheteurs potentiels, invoquant la confidentialité commerciale. Les négociations en cours, qui n'ont pas été signalées auparavant, suggèrent que l'entreprise pourrait s'asseoir sur des milliards de dollars de contenu et donner un aperçu d'un marché de données animé qui surgit dans la ruée vers la domination de la technologie de l'IA générative.
Des géants de la technologie comme Google (GOOGL.O), ouvre un nouvel onglet, Meta (META.O), ouvre un nouvel onglet et, soutenu par Microsoft (MSFT.O), ouvre un nouvel onglet. OpenAI utilisait initialement des tonnes de données récupérées gratuitement sur Internet pour former des modèles d'IA génératifs comme ChatGPT qui peuvent imiter la créativité humaine. Ils ont déclaré que cela était à la fois légal et éthique, bien qu'ils soient confrontés à des poursuites judiciaires de la part d'une série de détenteurs de droits d'auteur à propos de cette pratique.
Dans le même temps, ces entreprises technologiques paient également discrètement pour du contenu verrouillé derrière des paywalls et des écrans de connexion, donnant lieu à un commerce caché de tout, des journaux de discussion aux photos personnelles oubliées depuis longtemps provenant d'applications de médias sociaux décolorées.
"Il y a actuellement une ruée vers les détenteurs de droits d'auteur qui possèdent des collections privées de contenus qui ne peuvent pas être récupérés", a déclaré Edward Klaris du cabinet d'avocats Klaris Law, qui dit conseiller les propriétaires de contenu sur des transactions valant des dizaines de millions de dollars. chacun pour autoriser des archives de photos, de films et de livres pour la formation en IA.
Reuters s'est entretenu avec plus de 30 personnes connaissant les transactions liées aux données d'IA, y compris des dirigeants actuels et anciens des entreprises impliquées, des avocats et des consultants, pour fournir la première exploration approfondie de ce marché naissant - détaillant les types de contenu achetés, les prix. se matérialise, ainsi que des préoccupations émergentes concernant le risque que des données personnelles se retrouvent dans des modèles d'IA à l'insu des personnes ou sans leur co...
[Courte citation de 8% de l'article original]