Technologie

Un trouble neurologique a volé sa voix. Jennifer Wexton la récupère sur le sol de la Chambre.

Jennifer Wexton a retrouvé sa voix grâce à l’intelligence artificielle

Lorsque Jennifer Wexton s’est levée jeudi pour prendre la parole à la Chambre des représentants, quelque chose qu’elle a fait d’innombrables fois auparavant, la députée a utilisé une voix qu’elle pensait avoir perdue à jamais.

Après avoir été privée de sa capacité de s’exprimer clairement en raison d’un trouble neurologique rare, Wexton a retrouvé sa voix grâce à un puissant programme d’intelligence artificielle, lui permettant de créer un clone de sa voix à partir d’anciens enregistrements de discours et d’apparitions qu’elle avait fait en tant que membre du Congrès. Elle a utilisé ce programme pour prononcer ce qui est censé être le tout premier discours jamais donné à la Chambre des représentants avec une voix clonée par intelligence artificielle.

« C’était un moment spécial que je n’aurais jamais imaginé possible. J’ai pleuré de joie quand je l’ai entendu pour la première fois », a déclaré Wexton à l’Associated Press lors de la première interview à laquelle elle a participé depuis l’obtention de sa nouvelle voix.

Debout derrière un pupitre sur le sol de la Chambre, Wexton s’est levée pour commémorer le Mois de la fierté des personnes handicapées, un événement qui vise à célébrer la loi sur les Américains handicapés, la loi emblématique des années 1990 destinée à protéger les Américains handicapés. Mais son discours était aussi un symbole de sa force face à une maladie débilitante.

« J’étais l’une de ces personnes qui détestait le son de ma voix », a-t-elle déclaré depuis le sol. « Quand mes publicités passaient à la télévision, je me crispais et je changeais de chaîne. Mais vous ne savez vraiment pas ce que vous avez jusqu’à ce que vous le perdiez, car entendre la nouvelle IA de ma vieille voix pour la première fois a été de la musique pour mes oreilles. C’était la plus belle chose que j’aie jamais entendue. »

La voix de Wexton résonne désormais depuis son iPad, soutenu par un étui floral multicolore. Lors de l’interview à sa table à manger à Leesburg, en Virginie, la députée a tapé ses pensées, utilisé un stylet pour déplacer le texte, appuyé sur lecture, puis le programme d’IA a mis ce texte dans la voix de Wexton. C’est un processus long, donc l’AP a fourni à Wexton quelques questions avant l’interview pour donner à la députée le temps de taper ses réponses.

Wexton a reçu un diagnostic de paralysie supranucléaire progressive en 2023, un trouble neurologique agressif qui affecte de nombreux aspects de la vie, y compris la parole. Assise en face d’une crédence remplie de photos marquant les moments forts de sa vie personnelle – mariages, voyages en famille, ses enfants – la députée a qualifié le diagnostic de « cruel » pour quelqu’un dont « toute sa carrière professionnelle a été construite autour de l’utilisation de ma voix », du procureur de Virginie au sénateur d’État en passant par la membre du Congrès.

« Un politicien qui ne peut pas prendre la parole en public cessera bientôt d’être un politicien. Mais ce modèle vocal d’IA m’a donné une nouvelle occasion de faire entendre ma voix et rappelle aux auditeurs que je suis toujours moi », a déclaré Wexton à l’AP.

La députée, dont la victoire écrasante en 2018 a annoncé le succès que les démocrates auraient cette année-là, a initialement annoncé un diagnostic de la maladie de Parkinson en avril 2023, adoptant un ton optimiste en disant à ses partisans qu’ils étaient « invités à empathiser » avec elle, mais pas à « avoir pitié de moi ». Son ton en septembre 2023 était très différent : elle a décrit son diagnostic de PSP comme du « Parkinson sur stéroïdes » et a déclaré qu’elle ne briguerait pas de réélection en 2024.

« Ce nouveau diagnostic est difficile. Il n’y a pas de ‘guérison’ avec la PSP. Je continuerai les options de traitement pour gérer mes symptômes, mais ils ne fonctionnent pas aussi bien avec ma maladie qu’avec la maladie de Parkinson », a-t-elle déclaré à l’époque.

Le diagnostic a changé la vie personnelle et professionnelle de Wexton. La députée ne ressemble plus à ce qu’elle était autrefois. Sa posture est affaissée, ses mouvements moins précis, sa voix naturelle étouffée – tous des impacts de la maladie. Alors qu’il devenait de plus en plus difficile pour Wexton d’utiliser sa voix, elle s’est tournée vers une application traditionnelle de texte en parole que de nombreuses personnes atteintes de troubles de la parole utilisent souvent. La voix sonnait plus comme un robot que comme un être humain, mais Wexton l’a utilisée pour mener des entretiens et prononcer des discours.

« Ce n’est pas une situation dans laquelle j’aurais choisi de me retrouver », a-t-elle déclaré depuis le sol de la Chambre. « Je n’ai jamais pensé qu’à mon âge et malgré ma bonne santé générale, quelque chose comme la PSP pourrait, en l’espace d’un peu plus d’un an, me priver de ma capacité de parler, courir ou danser, et me forcer à arrêter de faire le travail que j’aime. »

ElevenLabs, une start-up avec l’un des modèles de clonage vocal alimentés par IA les plus utilisés, a vu Wexton parler en utilisant l’ancienne technologie. Ils ont contacté son bureau il y a plusieurs semaines et les assistants de Wexton ont fourni à l’entreprise plusieurs enregistrements, principalement des discours qu’elle avait prononcés en tant que membre du Congrès.

« Notre technologie donne aux personnes qui ont perdu leur voix la possibilité de parler comme elles le faisaient autrefois, avec l’émotion et la passion qu’elles ressentent, et nous espérions aider la députée à le faire », a déclaré Dustin Blank, responsable des partenariats au sein de l’entreprise.

Wexton a déclaré à l’AP qu’elle avait utilisé pour la première fois sa voix clonée pour parler au président Joe Biden dans le Bureau ovale plus tôt ce mois-ci, lorsqu’il a signé la loi sur le plan national de lutte contre la maladie de Parkinson, un projet de loi que Wexton a qualifié de « mesure la plus conséquente que nous ayons prise depuis des décennies pour lutter contre la maladie de Parkinson et les maladies connexes, comme ma PSP ». Quelques jours plus tard, Wexton a présenté publiquement sa voix clonée dans une vidéo, suscitant un élan de soutien et propulsant la députée au cœur d’un débat sur l’IA.

« Ce n’est pas la façon dont je pensais quitter le Congrès », a-t-elle déclaré. « Je n’anticipais pas d’être à l’avant-plan d’un débat sur l’avenir de l’IA. »

L’utilisation du clonage vocal alimenté par l’IA pour redonner sa voix à Wexton est l’une des applications positives de cette technologie. Cependant, le clonage vocal a également été utilisé de manière malveillante, comme pour tromper les gens et diffuser de fausses informations politiques. Le plus notable de ces cas a été lorsqu’une fausse campagne téléphonique générée par IA se faisant passer pour le président Joe Biden a exhorté les électeurs avant la primaire du New Hampshire de ne pas voter. L’appel a été rapidement signalé et a entraîné de graves conséquences pour ceux qui en étaient responsables, mais l’incident a soulevé de sérieuses questions sur l’avenir de cette technologie et des entreprises derrière elle.

Wexton, dont le district abrite de nombreux centres de données alimentant l’IA, se pose également ces questions. Après avoir dévoilé son clone vocal, Wexton a envoyé à quelques amis le même message de manière humoristique : « L’IA n’est pas entièrement maléfique, juste principalement. »

Hany Farid, un professeur et expert en informatique légale à l’Université de Californie, à Berkeley, a déclaré que l’exemple de Wexton est une exception aux nombreuses utilisations malveillantes de la technologie de clonage vocal.

« J’ai trouvé cela très émouvant… et je suis tout à fait favorable à cette application », a-t-il déclaré. « Mais je tiens à souligner que, même s’il y a de très belles histoires, cela ne signifie pas que nous devrions ignorer les aspects assez méchants de ces technologies. »

Un moyen d’assurer que la technologie est utilisée à bon escient, selon Farid, est de mettre en place de « meilleurs contrôles » pour garantir que « les gens n’utilisent pas des produits de manière malveillante ». Cela inclut des informations d’identification du contenu indiquant comment l’audio a été développé, le stockage de tout l’audio créé à l’aide de la technologie et des règles de « connaissance de la clientèle » qui exigent des entreprises de clonage vocal de savoir qui utilise leur technologie.

Wexton est d’accord pour dire que des garde-fous supplémentaires sont nécessaires. Son équipe de conseillers a pris des précautions pour s’assurer que son image est protégée, en limitant l’accès à la voix à seulement trois personnes et en renforçant la sécurité du programme.

« C’est humanisant et c’est valorisant. Cela peut aussi être dangereux », a-t-elle déclaré. « Je crois toujours que le potentiel dangereux de la technologie de l’IA doit être mieux compris et des mesures doivent être prises pour empêcher les abus de la technologie comme les deepfakes de se propager, et une partie de cette responsabilité incombe aux législateurs comme nous au Congrès », a-t-elle ajouté plus tard.

En 2019, Wexton a obtenu l’approbation bipartisane pour un amendement demandant à la National Science Foundation de mener des recherches sur la sensibilisation du public aux vidéos deepfake générées par IA.

Wexton a également déclaré que la technologie n’est pas parfaite. Comme l’audio utilisé provenait de discours et d’événements publics, il n’est pas très adapté à la conversation courante, rendant souvent tout plus prosaïque. Ses deux fils étudiants, a-t-elle dit, n’aiment pas cela pour cette raison et, a-t-elle plaisanté, elle ne l’utilise pas pour « demander à mon mari de me passer le ketchup », montrant ainsi un sens de l’humour pour lequel elle est connue sur la Colline du Capitole.

« En fin de compte, ce ne sera jamais moi. Mais c’est plus moi que je n’aurais jamais espéré pouvoir entendre à nouveau et pour cela, je suis tellement reconnaissante et excitée », a-t-elle déclaré. « J’ai l’intention d’en tirer le meilleur parti. »

Pour des médecins comme Jori Fleisher, directrice du Centre de soins Rush CurePSP, ce type de technologie pourrait être révolutionnaire pour ceux qui ont reçu un diagnostic de cette maladie neurologique rare.

Trop souvent, les patients atteints de la PSP perdent leur voix et doivent se fier à des programmes traditionnels de texte en parole pour communiquer, a déclaré Fleisher. Mais ces programmes utilisent des voix robotiques qui ne ressemblent souvent en rien aux patients. Fleisher fait remarquer que les personnes atteintes de « maladies neurologiques sont déjà stigmatisées », alors parler avec une voix qui ressemble à un ordinateur « perpétue la stigmatisation » et les amène souvent à se replier sur eux-mêmes et à « aggraver l’isolement social qui peut être une partie importante de ces conditions ».

« Savoir que je respecte déjà profondément la représentante Wexton et l’entendre ensuite parler si admirablement dans sa propre voix, en utilisant ses propres mots grâce à cette technologie, me donne des frissons », a-t-elle dit, devenant émotionnelle. « C’est si valorisant. »

Selon Fleisher, l’essentiel est de rendre cette technologie accessible à un plus grand nombre de personnes en encourageant les patients aux premiers stades de la PSP et d’autres troubles neurologiques à « enregistrer suffisamment de sons de leur propre voix pour pouvoir les utiliser plus tard » et à ce que les compagnies d’assurance couvrent ce type de traitement. Wexton a déclaré qu’elle avait essayé de le faire à la fin de l’année dernière grâce à un programme Apple, mais sa voix avait déjà été trop affectée par la maladie pour que leur IA puisse l’utiliser.

La nouvelle voix de Wexton est particulièrement utile dans les moments plus émotionnels où entendre le sentiment dans son discours est significativement plus puissant qu’un son plus robotique. Lorsqu’on lui a demandé comment Barbara Comstock, la représentante républicaine avec laquelle Wexton s’est rapprochée depuis qu’elle l’a battue en 2018, l’avait aidée depuis que Wexton avait révélé son diagnostic, la démocrate est devenue émotive et a déclaré : « Elle a été si gracieuse. »

« J’étais tellement contente pour elle », a déclaré Comstock, se rappelant quand elle a entendu pour la première fois la voix IA de Wexton. « C’était fantastique de savoir qu’elle récupérait sa voix littéralement pour que d’autres voient la puissance de la technologie. … Je suis émue d’y penser à nouveau. »

Après avoir battu Comstock en 2018, l’avenir de Wexton dans la politique en Virginie s’annonçait prometteur, de nombreux habitants de l’État spéculant qu’elle pourrait briguer un poste plus élevé. Son diagnostic a mis fin à ce futur – sa carrière politique prendra fin l’année prochaine – mais il a donné à Wexton une nouvelle détermination.

« Je veux être une voix, même une voix IA, pour les Américains confrontés à des défis d’accessibilité et d’autres handicaps, car trop souvent, les gens ne nous voient que pour ce handicap », a déclaré Wexton. « J’espère qu’en continuant à faire de mon mieux dans mon travail, que cela signifie utiliser un déambulateur ou un fauteuil roulant pour me rendre à la Chambre pour voter ou prononcer mes discours à travers une version reconstituée par IA de ma voix, cela montrera que je suis tout autant moi à l’intérieur que je l’ai toujours été. »