Technologie

La plateforme de chatbot de Quora, Poe, permet aux utilisateurs de télécharger sur demande des articles payants.

Poe, une plateforme de chatbot AI appartenant au site de questions et réponses Quora et soutenue par un investissement de 75 millions de dollars d’Andreessen Horowitz, propose aux utilisateurs des fichiers HTML téléchargeables d’articles publiés par des médias payants.

En utilisant le bot Assistant du service avec l’URL de cet article de WIRED sur le service de recherche alimenté par l’IA, Perplexity, qui a plagiarisé l’un de nos articles, par exemple, on obtient un résumé détaillé de 235 mots et un fichier HTML de 1 Mo contenant la capture de l’article entier, que les utilisateurs peuvent télécharger directement depuis les serveurs de Poe via le chatbot.

WIRED a également pu récupérer des articles de sites payants comme le New York Times, Bloomberg Businessweek, The Atlantic, Forbes, Defector et 404 Media au format téléchargeable simplement en entrant des URL dans l’interface du bot Assistant. Cela semble être le dernier exemple de l’approche cavalière de l’industrie de l’IA concernant le droit de la propriété intellectuelle, ce qui compromet rapidement les modèles économiques existants dans des secteurs comme le journalisme et la musique.

« Il s’agit d’un problème de droit d’auteur significatif », a écrit James Grimmelmann, professeur de droit numérique et de l’information à l’Université Cornell, dans un e-mail. « Parce qu’ils ont fait une copie sur leur propre serveur, c’est a priori une infraction au droit d’auteur » (Quora conteste cela, en comparant Poe à un service de stockage cloud).

Lorsqu’on lui a demandé de résumer le contenu d’un site de test contrôlé par mon collègue Dhruv Mehrotra, le bot n’a pas retourné de résumé mais a renvoyé un fichier HTML. Selon les journaux serveur du site Web, immédiatement après que le bot Assistant a été invité à résumer le site, un serveur s’identifiant comme « Quora Bot » a visité le site. Il n’a pas tenté de visiter la page robots.txt du site, suggérant que Poe et Quora ignorent le Protocole d’exclusion des robots, une norme largement acceptée mais non juridiquement contraignante sur le web.

Un haut cadre des médias, à qui WIRED a accordé l’anonymat pour discuter franchement d’une question légalement sensible que son entreprise enquête activement, indique que sa publication a également observé des serveurs s’identifiant comme des bots Quora accédant à son site immédiatement après avoir donné des instructions au chatbot de Poe concernant des articles spécifiques ; ces instructions, dit-il, ont rapporté une grande partie ou la totalité du texte de ces articles.

« Poe est une plateforme qui permet aux utilisateurs de poser des questions et d’avoir des dialogues avec divers bots alimentés par l’IA fournis par des tiers », a écrit la porte-parole de Quora, Autumn Besselman, dans un e-mail. « Nous n’avons pas ou formons nos propres modèles d’IA. Poe a une fonctionnalité qui permet à un utilisateur de montrer le contenu d’une URL à un bot, mais le bot ne verra que le contenu que le domaine lui sert. Nous serions ravis de mettre votre équipe technique en relation pour les aider à s’assurer que votre contenu payant n’est pas servi aux personnes utilisant Poe ».

« Les pièces jointes de fichier sur Poe sont créées sur instruction des utilisateurs et fonctionnent de manière similaire aux services de stockage cloud, aux services de lecture ultérieure et aux produits de ‘web clipper’, que nous croyons tous être conformes au droit d’auteur », a répondu Besselman à un e-mail posant des questions de suivi. Andreessen Horowitz n’a pas répondu à une demande de commentaire.