toute l'actu de la 3DS

Quand l’intelligence artificielle bouleverse le monde des livres audios

Quand l’intelligence artificielle bouleverse le monde des livres audios

26 Mai, 2023

L’intelligence artificielle est une technologie qui bouleverse de nombreux domaines professionnels. Celui des livres audios fait partie de ceux qui sont chamboulés, car cet outil peut désormais créer des enregistrements à la chaîne sans avoir à solliciter un narrateur humain à chaque fois.

Très investis dans l’intelligence artificielle, les géants technologiques sont impliqués dans l’économie bourgeonnante des livres audios générés par logiciel. Photography Sebastian Pandelache / Unsplash©

Le souci des professionnels des livres audios face à la narration synthétique

Le monde des livres audios subit déjà les transformations liées à l’apparition de l’intelligence artificielle. En effet, cette technologie a la possibilité de créer des enregistrements vocaux, et ce, sans avoir besoin d’utiliser la voix d’un narrateur professionnel. Résultat, cette activité en subit les conséquences. Une narratrice professionnelle appelée Tanya Eby a 20 ans d’expérience dans le métier et annonce recevoir moins de commandes ces 6 derniers mois. Elle précise que son carnet de commandes a été réduit de 50% et qu’il en est de même pour ses autres collègues. La narratrice pense alors que le plan d’avenir dans le milieu est de remplacer les employés par cette technologie, dans l’objectif de réduire les coûts.

De nombreuses œuvres créées à partir d’IA générative sur le marché

Bien qu’aucun label d’intelligence artificielle ne soit clairement identifié pour l’heure, des milliers d’œuvres conçues à partir de banque de données vocales circulent déjà sur le marché. L’une des plus connues est DeepZen, qui dispose d’une offre d’entrée qui permet de diviser jusqu’à 4 fois le coût de conception d’un audiolivre. Le directeur général de cette banque de données informe avoir signé un accord de licence avec toutes les voix exploitées par son entreprise. Ainsi, la structure paie l’enregistrement, puis verse des royalties pour chaque utilisation de voix dans le cadre un projet. Ce qui n’est pas toujours le cas des nouveaux venus qui ne rémunèrent pas les auteurs à chaque fois, souligne Tanya Eby.

Des plateformes profitent d’une zone grise pour l’exploitation des banques de données vocales

De nombreuses plateformes exploitent une zone grise dans le secteur, qui leur permet de prendre la voix de plusieurs narrateurs pour en créer une nouvelle et l’utiliser comme bon leur semble. Au final, elles ne paient pas pour ces voix, car elles considèrent que le produit final qu’elles ont créé n’appartient à personne. Pour autant, il existe encore des petites entreprises telles que Speechki, qui utilisent leurs propres enregistrements, mais qui se servent également de voix tirées de banques de données existantes. Pour cette seconde utilisation, elles doivent signer un contrat pour payer les droits d’utilisation.

Les avantages de l’intelligence artificielle pour créer des audiolivres

L’un des avantages les plus évidents de la narration générative d’IA réside dans sa capacité à automatiser la production de l’audiolivre. En utilisant des modèles d’apprentissage automatique sophistiqués et les banques de données vocales, les systèmes d’IA peuvent générer des enregistrements vocaux plus réalistes et plus naturels. Cela permet de produire des produits à une échelle beaucoup plus rapide et à moindre coût, ouvrant ainsi de nouvelles opportunités pour la publication de ce type de contenus. De plus, les voix générées peuvent être personnalisées en fonction des préférences des auditeurs, en termes de ton, de vitesse ou même d’accent.

Une technologie vocale qui a encore ses limites

Bien que la narration synthétique offre des avantages indéniables, il est essentiel de comprendre également les limites de cette nouvelle technologie. Tout d’abord, malgré les progrès réalisés, l’intelligence artificielle n’a pas encore atteint le niveau de finesse, d’expression et de compréhension émotionnelle d’un narrateur humain expérimenté. Les voix générées peuvent parfois manquer de chaleur, de nuance et de la capacité à interpréter le texte de manière subtile. Cette différence qualitative peut affecter l’expérience des auditeurs, qui peuvent préférer l’authenticité et la connexion émotionnelle qu’apporte un narrateur humain. Sans oublier que l’outil peut rencontrer des difficultés avec des textes complexes, techniques ou comportant des éléments culturels spécifiques.

Avec ETX/DailyUp