Créer avec son double : retour sur la fabrication du clip « Les Vieux »

Un clip sur la peur de vieillir

Je viens de terminer ce clip musical « Les Vieux ».

C’est une œuvre autour de la vieillesse, mais aussi autour de la peur de vieillir. Le point de départ est une satire grotesque : un chanteur rétro, encore accroché à sa vitalité, se déchaîne contre les vieux, contre leur corps, leur odeur, leur lenteur, leur mentalité — du moins telle qu’il la fantasme.

Mais le clip est construit sur un retournement. Plus la chanson avance, plus le chanteur comprend que cette vieillesse qu’il caricature est déjà à l’œuvre dans son propre corps. La moquerie devient alors révolte contre soi-même, contre le temps, contre le statut profondément humiliant d’homme éphémère.

Le propos est donc satirique et ironique : celui qui rit des vieux finit par se voir lui-même au bord de ce qu’il redoute.

L’intelligence artificielle comme question de travail et de création

C’est aussi un travail sur l’intelligence artificielle.
Cette technologie que j’explore depuis 2015 évolue sans cesse. C’est un lieu commun que de le dire. Je l’ai utilisée professionnellement pendant dix ans. Je crains un peu son usage dans des buts de maximisation du profit des entreprises. Quiconque voit l’entreprise comme un centre de profit n’aura en effet bientôt, en tout cas dans le tertiaire, plus besoin d’une cohorte de collaborateurs. La multiplicité des petites tâches sera prise en charge par l’IA avec une efficacité déconcertante. Seuls à bord, les experts de chaque domaine, qui auront su développer une maîtrise de l’IA, seront alors bien seuls dans leur bureau… Pendant ce temps, que feront les autres ? Rien ? Profiter d’un revenu universel ou préparer une révolte ?

Du point de vue de la création artistique, il me semble que l’incursion de l’IA générative, et sans doute de futures technologies encore plus performantes, dont je ne connais même pas le nom, va remettre en cause les mécanismes de production industrielle de l’art du divertissement.
Tous les métiers paraissent concernés. La production d’images, de sons, de musiques, de voix, a déjà atteint un très bon niveau de reproduction du réel… et de l’iréel. De même que le passage de l’argentique au numérique a rétréci les équipes de production, l’intelligence artificielle générative laisse entre les mains d’une toute petite équipe, voire d’un seul individu, un pouvoir de création et de production artistique presque illimité. On va y revenir.

Composer avec Suno

Dans le clip « Les Vieux », j’ai voulu maximiser l’utilisation de l’IA générative. Elle a donc servi sur le plus de dimensions créatives et productives possibles. J’ai écrit seul les paroles. Au lieu d’utiliser un éditeur de texte, j’ai directement écrit dans Suno. C’est une IA qui permet de « composer » des musiques dans une infinités de genres. Ce qui est intéressant, c’est ici de pouvoir écrire une première version des paroles, définir un genre, puis tester si les paroles et leur rythmique fonctionnent par rapport au genre choisi. C’est un aller-retour assez motivant, qui m’a permis d’avoir à ma disposition un compositeur qui cherchait à mettre en musique ce que j’écrivais, et selon les propositions de l’IA, qui me permettait de corriger, reprendre, et affiner mon texte.

Une fois la structure textuelle trouvée, j’ai expérimenté beaucoup de versions musicales dans l’application. On n’y dispose pas tant d’un catalogue de genres que d’un orchestre infatigable capable d’explorer des genres aussi divers que le rock, la pop, le classique, l’opéra, la musique expérimentale, et surtout la fusion illimitée de tous ces genres. On peut même aller plus loin : on peut d’ores et déjà travailler uniquement sur une piste son, par exemple la batterie, ou la basse, pour peaufiner ce que l’on a en tête, enregistrer avec sa voix quelques mesures et obtenir une version ajustée à une trompette ou un choeur d’opéra.

J’ai cloné ma voix dans Suno : je lui ai montré comment je chantais en réalité, quelle était ma tessiture et mon timbre. En enregistrant plusieurs minutes de chant a cappella, l’application en a tiré un modèle. Ce qui est remarquable, c’est que ma façon de chanter influence désormais les propositions de l’IA : à même texte et même style, avec ou sans ma voix, je n’obtiens pas du tout le même résultat.

Produire des images et construire un double numérique

J’ai testé de nombreuses IA qui produisent de l’image et de la vidéo. Elles se valent toutes en réalité. Certaines prennent de l’avance technologique sur leurs concurrentes, mais pour pour peu de temps car la concurrence est rude.

J’ai travaillé avec le générateur d’image de chatGPT en version 5.5. C’est un long travail d’aller-retour entre l’IA et son utilisateur. On n’obtient pas tout de suite ce que l’on veut. Il faut beaucoup écrire, et décrire, pour obtenir un résultat satisfaisant.

J’ai cloné mon apparence physique. J’ai transmis à l’IA une dizaine d’images de moi, sous tous les angles, avec des expressions faciales. Le résultat est à la fois magique et malaisant. Magique, parce qu’on peut d’un seul coup se mettre en scène dans des situations banales ou extraordinaires. Malaisant, parce que les expressions et les postures que prend votre double numérique ne sont pas celles que vous avez en réalité. L’IA générative dispose de mon enveloppe charnelle, mais pas de mon esprit ni de mon caractère. Notamment, les expressions faciales, comme un simple sourire, mettent mal à l’aise. J’ai pu le tester directement avec des proches qui fixaient l’écran avec effarement et fascination. J’ai donc obtenu autant de clichés de ma personne qui correspondaient aux plans clés de mon clip musical.

L’IA comme équipe imaginaire

Cependant, j’avais aussi besoin d’un costumier, d’un maquilleur, d’un coiffeur, d’un accessoiriste : l’IA a rempli ces fonctions. J’ai essayé différents costumes, différents objets. Son entrepôt d’accessoires, de mobiliers, d’objets est infini… J’avais besoin d’acteurs et de figurants : l’IA a donc recruté ces personnes imaginaires, ces avatars. Certains ont été conçus selon mes désirs. D’autres recrutements ont été laissés sous l’autorité de l’IA. Je lui ai fait confiance, et au fur et à mesure de nos échanges, elle a de mieux en mieux compris où je voulais aller.

Tourner avec Kling, monter soi-même

Il a ensuite fallu tourner ces scènes. J’ai utilisé Kling, qui est une IA capable de générer des séquences animées. J’ai produit le clip en deux jours. La génération d’une séquence de dix secondes nécessite quatre minutes environ de calculs.

J’ai procédé au montage moi-même. Je sais qu’une IA aurait déjà pu le faire, mais elle serait sans doute partie dans des directions que je ne souhaitais pas. C’est sans doute une fonction d’auteur qui est difficile à abandonner à l’IA dans une démarche artistique.

Ce que cela change

Plusieurs conclusions s’imposent.

D’abord, je n’ose imaginer l’électricité et l’eau consommées pour produire tout cela… C’est un débat dans le débat… Les conséquences économiques et écologiques sont importantes, c’est une évidence. Mais cette question dépasse celle de la production artistique : tout usage de l’IA implique une consommation énergétique très importante. Mon espoir réside dans le fait que plus on l’utilise, plus des propriétaires de ces plateformes de production ont besoin d’accroître leur profit et donc de minimiser leur dépense énergétique. Est-ce une illusion ?

Ensuite, j’ai la certitude qu’on assiste à une remise en cause de la production de certains contenus de divertissement. Plus besoin d’équipes de tournage pour produire des clips courts : publicité, clip musical, vidéo de propagande, court-métrage pour produire en masse des contenus qui s’insèrent habituellement dans l’espace publicitaire des réseaux sociaux. Le changement est d’ailleurs déjà en marche.

En ce qui concerne la production plus artistique, je pense que cela ouvre une voie plus qu’elle ne porte atteinte à l’art cinématographique. L’intelligence artificielle générative ouvre la possibilité à des individus d’exprimer leurs émotions, leurs idées, leur art sans dépendre directement d’un collectif. On peut le regretter, mais regrette-t-on qu’un écrivain soit seul à sa table de travail ? Ce qu’il produit par des mots, c’est-à-dire des émotions, des histoires, des personnages, des décors, des reconstitutions historiques ou des utopies, l’écrivain pourra le faire aussi en exploitant l’art visuel et sonore, et pas seulement les mots. Encore que les mots soient à la source de toutes ces productions : les fameux prompts, ces instructions données à la machine, jouent un rôle crucial sur le résultat.

Plagiat, styles et héritages

Ai-je l’impression d’avoir plagié ou copié un artiste ? Sincèrement non. J’ai en effet exploité grâce à l’IA des styles, des genres, mais toute création artistique repose sur les précédentes. Tous les artistes ne créent pas des œuvres uniques et révolutionnaires. La grande majorité s’inscrivent dans des tendances, et peu innovent. Les plus créatifs passeront à la postérité, ce qui ne sera pas mon cas, d’accord.

Créer une œuvre multimédia comme on écrit un roman

Les productions collectives continueront d’exister. Le cinéma n’a pas remplacé les romans qui n’ont pas remplacé la poésie. En revanche, un nouveau mode d’expression artistique est en train de naître. Tous les outils sont presque prêts pour donner à un individu créatif des moyens importants pour raconter ses histoires, captiver ou divertir, faire réfléchir, interpeller, provoquer, créer un contenu qui sera ensuite reconnu par les spectateurs et par les pairs comme une œuvre d’art.

Il est enfin possible de produire une œuvre multimédia comme on écrit un roman.

Laisser un commentaire