L’intelligence Artificielle écrit, réalise et produit un court métrage toute seule pour la première fois

Après plusieurs mois d’échanges avec le GPT-3 de OpenAI et plus récemment avec une adaptation de leur CLIPS pour traduire du texte en image, je suis abasourdi par ce qu’une Intelligence Artificielle (IA) est capable de produire, toute seule.

Avant d’aller plus loin avec le résultat de cette expérience, il pourrait être dans l’intérêt du lecteur que je vous présente l’artiste et scientifique ALAgrApHY derrière cela et que je mette ses recherches et son intérêt sur la carte.

ALAgrApHY est un artiste (cinéaste, peintre, photographe, artiste numérique) et scientifique (docteur en systèmes complexes, data scientist, postdoc en extraction d’informations et NLP) cosmopolite basé à Paris et fasciné par l’interaction entre les arts et la science. Avant que l’Internet ne connaisse un buzz dans l’art générée par l’intelligence Artificielle, ALAgrApHY a exposé des mosaïques d’art générées par l’IA au Grand Palais et a remporté le prix d’art digital du Salon d’Automne qui a lancé les mouvements du cubisme et du fauvisme il y a un siècle . Il a donné quelques exposés dont je recommande ceux de TEDx qui résument parfaitement ce qu’il fait. Dans beaucoup de ses discours, il insiste à plusieurs reprises sur le fait que l’IA n’est un outil qui est loin d’être créatif de manière autonome. Cependant, ses résultats les plus récents ont dévoilé l’aube d’une IA créative mais à une condition que je vais aborder ci-dessous.

Je discute longuement de GPT-3 dans un autre article avec plusieurs exemples, mais pour l’instant, définissons-le comme un générateur de texte très avancé qui a été surnommé l’outil d’intelligence artificielle le plus puissant au monde par le magazine Entrepreneur. ALAgrApHY est l’un des testeurs de la version bêta rendue possible par OpenAI et par simplicité, nous ne passerons en revue qu’un des millions d’exemples possibles que ce puissant outil est capable de produire en utilisant uniquement une graine de texte (seed en anglais) qui est à compléter automatiquement par l’IA. L’exemple ci-dessous est basé sur la graine “Yeti Tardigrade”.

Génération de texte avec GPT-3

Remarquez comment le mot Yeti n’est plus mentionné dans le texte généré, cependant, les aspects du Yeti se reflètent dans la pilosité! La génération de texte pourrait être répétée à chaque fois, conduisant à un nouveau résultat. Ce que nous avons choisi ici est un résultat très simple qui, avec les mots-clés “Yeti Tardigrade” devrait être assez pour générer suffisamment de complexité visuelle comme je vais l’illustrer ci-dessous.

La partie visuelle est basée sur un outil d’abstraction de texte à image appelé CLIPS. L’une de ses applications est DALL-E qui peut saisir des concepts à partir de texte et les peindre en images. Une autre implémentation utilise Big Sleep Gan de Ryan Murdock pour faire de même. La vidéo basée sur le Tardigrade Yeti que vous êtes sur le point de voir utilise à la fois des codes open source et ajoute un réamorçage itératif qui sont tous paramétrables.

Court-métrage écrit et produit par l’IA

Ce qui me fascine dans cette vidéo, c’est la capacité d’abstraction de CLIPS qui est capable non seulement de dessiner des tardigrades à partir de zéro, mais d’ajouter des cheveux ou de la fourrure à leurs corps microscopiques et doux. Ce qui est également fascinant, c’est l’aspect de la neige qui vient de la puissance de tout cela. On a l’impression que ces tardigrades velus vivent au pôle nord.

Qu’est-ce qui peut être plus fascinant?

Quant à la créativité, cela apporte sûrement une énorme surprise à l’auteur ainsi qu’au spectateur en termes de conception comme d’exécution. Cependant, l’idée d’un YETI TARDIGRADE n’a pas été conçue par l’IA. De plus, le texte de GPT-3 n’était pas le premier généré. Quelques textes ont été commis jusqu’à ce que l’un d’eux vaille la peine d’être produit visuellement.
La vraie question concernant l’IA créative est: “Dans quelle mesure sommes-nous loin d’avoir une IA capable de générer des concepts sensible et de les rendre de manière à pouvoir nous toucher?”. Notez que je n’ai pas dit de concepts significatifs bien que “Yeti Tardigrades” puisse être sans doute significatif. Les grands artistes, poètes et écrivains ne sont pas nécessairement compris mais définitivement ressentis.

1000 singes tapant sur un clavier pendant 100 ans pourraient éventuellement taper l’une des pièces de Shakespear. Cela ne fait pas d’un singe un écrivain créatif bien que les singes aient une créativité exceptionnelle dans d’autres domaines. De même, on peut affirmer qu’une IA essayant de stimuler ses neurones par génération aléatoire n’est pas une mesure de la créativité, eh bien, jusqu’à ce que ce hasard disparaisse ou surpasse celui des essais et erreurs de l’homme avec de l’empathie et des taux d’apprentissage incroyablement rapides.

Dans les articles précédents, j’ai discuté des visages générés par l’IA, des chats générés par l’IA, des faux annonces Airbnb générées par l’IA et de presque tout ce que l’on peut ou ne peut pas imaginer, cependant, notre cas s’agit d’une IA encore plus générale de celle que nous avons rencontrée auparavant.

Merci de m’avoir lu.

Cet article a été écrit par ALAgrApHY dans son intégralité et non par un bot!
Si vous souhaitez soutenir ma recherche et développement il y a surement le moyen

Traditional, Digital & AI Artist, Data Scientist, Creative Coder, Filmmaker, Hyperpolyglot, Cosmopolitan. Formerly @snips @fortia_s @UPMC @CNRS @paris_sorbonne.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store