L’intelligence artificielle infiltre le monde de l’édition

Cette révolution technologique concerne déjà la traduction, s’immisce dans l’édition scientifique, juridique et les techniques de vente mais n’arrive encore qu’à titre expérimental dans la création littéraire. Article tiré du journal Le Monde.

Le début du premier roman écrit par une IA, « 1 the Road », publié en 2018 par Jean Boîte Editions. CHRISTIANA CARO

En quoi l’intelligence artificielle (IA) va-t-elle révolutionner le monde de l’édition ? Les algorithmes font déjà partie de ce secteur puisque Amazon, par exemple, y investit fortement depuis des années pour vendre des livres adaptés aux goûts supposés de ses clients. Mais d’importantes transformations, parfois radicales, se profilent ou s’imposent déjà dans toute la chaîne du livre : la fabrication, la traduction, les méthodes de vente, la constitution de métadonnées, et ne devraient arriver qu’à plus long terme dans la création littéraire.

Pour Virginie Clayssen, directrice du patrimoine et de la numérisation chez Editis et présidente de la commission numérique du Syndicat national de l’édition (SNE), « le premier bouleversement concernera la traduction des ouvrages ». Des progrès considérables ont été réalisés en trois ans grâce aux technologies d’« apprentissage profond » et permettront d’augmenter, à moindre coût, le nombre de versions linguistiques des livres. Ce qui va donc accroître le marché des cessions de droits pour les éditeurs. A contrario, l’usage plus répandu de ces traductions par IA risque de fragiliser le métier déjà précaire des traducteurs littéraires ou, en tout cas, forcera ces derniers à s’adapter à cette nouvelle donne.

Ces perspectives créent des micromarchés. Avec l’université de La Rochelle, Geo Comix a développé une aide à la traduction destinée à la bande dessinée. En quelques clics, les nouveaux textes peuvent être intégrés dans des bulles adaptées au format de chaque langue. Le groupe Média Participations (Le Lombard, Dupuis, Dargaud…) a déjà intégré cette innovation.

Fortes résistances

L’IA envahit chaque jour davantage de domaines dans l’édition. Bookalope propose par exemple des outils de conversion de manuscrits de livres ou de livres déjà édités en une multitude de formats (audio, numérique…). « Là où il fallait une semaine pour transformer un ouvrage en version numérique, l’automatisation du nettoyage des contenus permet de réaliser ce travail en une heure », assure le fondateur de cette start-up, Jens Tröger. Un progrès considérable, mais qui ne l’empêche pas de se heurter à des résistances fortes pour imposer sa technologie puisqu’elle menace directement des centaines d’emplois.

Expérimentée depuis 2015 par le pionnier ePagine, la recommandation personnalisée d’ouvrages permet d’augmenter significativement (+ 12 %), la proportion d’achats selon Stéphane Michalon, le directeur du développement de cette entreprise. L’application Gleeph vise, quant à elle, à recommander des lectures à des particuliers qui partagent les mêmes goûts et ont préalablement scanné leur bibliothèque. Avec un marketing très ciblé, « les lecteurs qui cliquent sur une recommandation Gleeph ont quatre fois plus de chances d’acheter », soutenait le cofondateur de Gleeph, Khalil Mouna, au cours des assises du livre numérique organisées par le SNE sur l’IA le 6 décembre 2021.

Parce qu’elle est assise sur des bases de données gigantesques, « l’édition professionnelle, juridique, médicale et scientifique est aux premières loges pour profiter dès à présent de l’intelligence artificielle », constate Virginie Clayssen. De fait, les start-ups tricolores se sont multipliées dans ces secteurs. Comme Juisci, qui cherche à rendre les revues et publications scientifiques plus accessibles, plus digestes et plus faciles à partager au sein de la communauté médicale. Sa plate-forme entraînée à l’IA extrait les dernières découvertes scientifiques publiées dans un océan de données pour les diffuser. Selon un principe similaire, ArcaScience vise les professionnels de l’industrie biopharmaceutique.

Evaluation du potentiel commercial

Dans l’édition juridique aussi, Lexbase propose, dans une base de 25 millions de documents juridiques, non seulement les jurisprudences existantes mais surtout des modèles d’actes destinés à des avocats ou encore des outils destinés à faciliter la prise de décision dans des contentieux.

Sans surprise, l’IA joue également un rôle primordial pour faciliter une navigation de plus en plus fine dans les bases de données des livres numérisés. La Bibliothèque nationale de France, par exemple, qui compte quelque 40 millions de documents, utilise désormais des outils de fouille de textes ou d’images pour explorer des corpus de presse ancienne ou des collections iconographiques. L’IA permet ainsi d’entamer des recherches sur des fonds jusqu’alors inexploités.

Pour l’édition grand public, les romans, la fiction, là encore les innovations technologiques commencent à voir le jour. QualiFiction et Booxby assistent les éditeurs dans l’évaluation des manuscrits. Le premier, avec son logiciel LiSA, analyse un texte selon une liste de critères précis comme le niveau de suspense et de réflexion de l’histoire, la complexité des phrases ou encore le niveau d’innovation par rapport au reste du catalogue de l’éditeur. En fonction de la dramaturgie du manuscrit, le logiciel évalue son potentiel commercial. Booxby analyse aussi les manuscrits, mais pour y déceler la meilleure stratégie marketing à adopter pour en faire la promotion auprès des lecteurs.

Pour faciliter les processus d’écriture, l’IA est utilisée par un nombre croissant de journaux ou d’agences de presse afin de créer des petits textes simples, comme des résumés succincts de compétitions sportives, de performances boursières ou de résultats d’élections. En littérature en revanche, le pas n’est pas franchi, si ce n’est de façon encore purement expérimentale. Aujourd’hui rares sont les ouvrages écrits par IA. La poétesse américaine Allison Parrish, dans son recueil Articulations (Counterpath, 2018, non traduit) cherche ainsi à inventer de nouvelles formes de langage, un peu à l’instar de Tristan Tzara en 1920. Travesty Generator (Noemi Press, 2019, non traduit), de Lillian-Yvonne Betram, également poétesse américaine férue de narration numérique, procède de la même intention.

« Tout est possible »

Le premier roman écrit par une IA, 1 the Road, a été publié, en septembre 2018 par Jean Boîte Editions. L’initiateur de ce projet, Ross Goodwin, spécialiste en entraînement de réseaux de neurones artificiels, avait équipé une splendide Cadillac d’une caméra de surveillance, d’un GPS, d’un microphone et d’une horloge connectés à une intelligence artificielle. S’inspirant de Jack Kerouac, Ross Goodwin et son acolyte Kenric Mc Dowell, qui dirige le programme Artists + Machine Intelligence chez Google Arts & Culture, avaient voyagé entre New York et La Nouvelle-Orléans. Au fil du voyage, un manuscrit était apparu, ligne par ligne sur des rouleaux de papiers qui remplissaient le siège arrière de la voiture, en décrivant le paysage, les villes, les personnages…

Pour Pascal Mougin, professeur de littérature et art contemporain à l’université Versailles-Saint-Quentin-en-Yvelines et à l’université Sorbonne nouvelle « cet ouvrage apporte un résultat délibérément pauvre, il s’agit davantage d’un dérèglement calculé des sens, comme d’une perception du monde sous hallucinogènes. La machine est utilisée pour une restitution aliénée du monde, à l’image de ce qui se passait du temps de la Beat Generation ».

Depuis 2015, il existe pourtant une IA capable d’écrire des livres. Le modèle GPT-3 cofondé en 2015 par la société californienne OpenAI du milliardaire Elon Musk qui, depuis, a accordé une licence exclusive à Microsoft, permet en théorie à un utilisateur de démarrer une phrase que la machine termine. Cet outil, qui signifie « Transformateur génératif pré-entraîné », a lu et intégré près de 175 milliards de paramètres, notamment de pages Web en tous genres, afin de générer des phrases naturelles et vraisemblables, en s’appropriant le style littéraire demandé. Il reste toutefois un handicap majeur : « Cette IA reproduit tous les biais sexistes, racistes et antisémites, puisqu’elle renvoie en miroir ce qu’elle a appris… », souligne Pascal Mougin.

Dans un programme de recherche rattaché à l’université Sorbonne nouvelle, Pascal Mougin va toutefois, avec son confrère Alexandre Gefen, solliciter ce programme GPT-3, là encore à titre d’expérimentation, pour produire des récits. « Dans un cursus exhaustif, explique-t-il, si l’objet d’étude concerne le roman sentimental au XIXe siècle, il faudrait lire des dizaines de milliers de livres et non pas la seule sélection des textes canoniques des grands auteurs indiscutables. Si la machine ingurgite tous ces milliers de textes, nous pourrons voir ce qu’elle génère. Même si c’est un roman moyen, qui peut décevoir. » Et d’ajouter, ravi : « Tout est possible : on pourra aussi demander une vraie fausse fable de La Fontaine, en incluant des paramètres aussi variés que le thème plutôt animalier ou la forme des octosyllabes ou des alexandrins », se réjouit déjà Pascal Mougin.

Pour romans Harlequin

Publié fin 2020, le Livre blanc sur l’intelligence artificielle et le monde du livre, cosigné par deux universitaires canadiens, prévoit que cette technologie pourrait rapidement servir à écrire les prochains romans Harlequin. Là où « la récurrence des modèles narratifs est de mise » dans un marché de masse, donc précisément les romans à l’eau de rose, assurent les auteurs Tom Lebrun, qui enseigne le droit et l’IA à l’université Laval (Québec) et à l’UQAM à Montréal et René Audet, professeur de littérature à l’université Laval.

A leurs yeux, l’IA pourra devenir à terme un indispensable assistant d’écriture. Quitte à l’utiliser pour donner une première version brute qui sera ensuite retravaillée. Ou encore pour se focaliser sur une partie du texte, à l’instar du romancier américain Robin Sloan, qui recourt à ces technologies pour générer les dialogues d’un personnage. Voire s’inspirer des dessins et des illustrations : le manga Paigon est déjà créé par IA en fonction « de la capture esthétique des travaux d’Osamu Tezuka, le père d’Astro Boy », décrit le livre blanc.

Dans ce cas qui, de l’écrivain, de l’illustrateur ou du logiciel, est considéré comme l’auteur et donc celui qui peut toucher des droits ? Tom Lebrun tranche : c’est celui qui a lancé l’opération sur la machine. En Grande-Bretagne, la législation, visionnaire, a déjà prévu ce cas de figure depuis 1993.

Nicole Vulser