L'image vedette de cet article, intitulée The Electrician , est une œuvre d'art captivante générée par le photographe et artiste Boris Eldagsen à l'aide de l'intelligence artificielle (IA), qui a récemment remporté le championnat des Sony World Photography Awards .
Cela marque une réalisation capitale de l'IA, dépassant son rôle traditionnel d'outil d'analyse et mettant en valeur son potentiel de génération de créativité esthétique.
Si ce n'est pas tout à fait une nouveauté, précédée par les victoires d'AlphaGo et de l'iconique Deep Blue, elle n'en est pas moins significative et pointe vers l'aube d'une nouvelle époque.
Les passionnés sont effervescents d'anticipation, prévoyant avec impatience l'expansion de l'IA dans des domaines de créativité inexplorés.
Néanmoins, l'avènement du contenu généré par l'IA suscite des inquiétudes quant à l'avenir des créateurs de contenu original, car certains y voient un signe avant-coureur d'un "plagiat informatisé" à grande échelle.
Alors que de nombreux litiges en matière de droit d'auteur attendent les décisions finales du tribunal, la question reste controversée.
Au fur et à mesure que la technologie progresse, nous devons engager des discussions significatives concernant l'utilisation de l'IA dans des activités créatives.
Le potentiel de l'IA à perturber les approches conventionnelles de l'art et de la créativité est indéniable, mais il reste à voir si elle peut véritablement rivaliser avec l'innovation humaine ou simplement représenter une forme plus avancée de plagiat.
Le plagiat est un tabou inébranlable. L'engagement envers cette faute grave peut avoir un impact dévastateur sur l'ensemble de la carrière des créateurs diligents, qu'ils soient impliqués dans la recherche universitaire, la composition musicale, la rédaction d'articles ou la création d'images.
Il ne se limite pas seulement à une copie mot à mot ou pixel à pixel, mais s'applique également dans les cas où le contenu est simplement paraphrasé ou la structure est manipulée à partir du même élément d'artefact.
La perpétuation du plagiat repose sur la grande quantité de sources de données qui peuvent être copiées à partir d'Internet.
Compte tenu de la capacité limitée de l'esprit humain à se souvenir d'informations illimitées, les aspirants peuvent demander l'aide d'ordinateurs rapides et d'un stockage local et cloud expansif pour faciliter leur plagiat.
Aujourd'hui, avec l'évolution technologique du matériel, le développement de l'IA, plus précisément des modèles d'IA génératifs qui créent de nouveaux contenus, est fourni.
Les modèles d'IA générative sont pré-formés à partir d'un corpus gigantesque de textes, d'images, de clips vidéo et de pistes audio, selon leurs types.
Par exemple, le modèle texte-image Stable Diffusion a été formé sur divers sous-ensembles de LAION 5B , un grand ensemble de données comprenant près de 6 milliards de paires image-texte filtrées CLIP ; d'autres modèles concurrents comme DALL-E, Midjourney et Imagen sont similaires.
Les images sources sont explorées à partir de nombreux domaines en ligne, des sites d'images d'archives et des marchés d'impression et d'affiches d'art aux plateformes de médias sociaux et aux articles de blog.
Grâce à la récitation des données, les modèles sont pris en charge avec une structure cohérente étendue - un nouveau contenu dérivé de plusieurs sources d'images par une simple invite de texte en quelques secondes.
Vous pouvez étudier plus avant la logique technique de Stable Diffusion et d'autres modèles si vous êtes intéressé, mais je veux illustrer que percevoir cela comme "générant" de nouveaux contenus n'est pas toujours exact.
Au lieu de cela, ces modèles synthétisent le contenu en fonction de tout ce qu'ils ont appris du pool de données préexistantes alimentées par les humains.
Le traitement d'énormes quantités de données est gérable pour les modèles car ils sont dotés d'une puissance de calcul avancée, contrairement aux humains, qui ne peuvent pas traiter des milliards d'images une par une.
Certains des sous-produits synthétiques (les images générées) semblent très familiers à la plupart des gens en raison des données sources que le modèle a choisies ; que ce soit une peinture célèbre ou un mème classique.
Au contraire, certains contenus peuvent sembler rares et originaux.
Entachée par la nature de la synthèse, l'IA générative est actuellement un discours rhétorique des spécialistes du marketing, malgré sa robustesse. La dichotomie vigoureuse concernant la collecte appropriée des données sources implique que la "créativité de l'IA" ne vient pas de l'origine mais de la dérivation.
Cela dit, la formidable capacité de mélange et d'association de l'IA générative a été convaincante et a éclairé les gens sur la créativité de l'IA.
Menant à la quête de l'essence de la créativité de l'IA, l'étendue de l'autonomie de l'IA sans intervention humaine est pour moi un critère d'évaluation objectif. La créativité de l'IA peut être grossièrement classée en quatre étapes, selon le degré d'implication :
Traditionnellement, les humains ont été créatifs depuis l'âge primitif. La plupart des œuvres créatives sont créées pour survivre et satisfaire des besoins physiques de base.
La découverte du feu dans les temps anciens a apporté aux humains chaleur, aliments cuits et sécurité; puis, la perceuse en bois a été inventée comme un dispositif d'allumage inspiré du feu naturel.
Avance rapide jusqu'à la Renaissance et au-delà de la révolution industrielle, la créativité humaine couvre différents sujets - littérature, art, science, mécanique, etc. - jusqu'aux ordinateurs et à l'IA.
La simple utilisation des ordinateurs et de l'IA n'inaugure pas la créativité de l'IA. Analogisez-le avec des stylos et des crayons. C'est l'artiste - qui est un être humain - qui utilise des stylos et des crayons comme outils pour dessiner une image. L'origine vient de l'imagination de l'artiste, pas des instruments.
Ainsi, l'utilisation d'ordinateurs et d'IA pour calculer, rechercher et analyser des données est insuffisante pour affirmer la créativité de l'IA. La plupart des fonctionnalités d'IA génératives ne sont sans doute pas différentes de ce qui précède.
Pourtant, nous ne pouvons pas comprendre comment fonctionne la synthèse, ce qui nous laisse place au fantasme selon lequel l'IA a une certaine auto-imagination sur la créativité.
Nous rencontrons souvent des situations où nos connaissances et nos compétences limitent l'exécution de nos idées. Le développement récent de l'IA l'a beaucoup renforcé. Les modèles Transformer libèrent le potentiel de la créativité humaine en codant et décodant une forme spécifique de présentation en une autre.
Par exemple, créer des graphiques artistiques ou écrire des codes utilisés pour justifier des mois de formation ; maintenant, avec l'aide de l'IA générative, vous pouvez y arriver en définissant des instructions en langage clair.
Malheureusement, l'IA ne peut toujours pas rester seule pour le moment. La sortie de l'IA générative dépend fortement de l'entrée (l'invite). En termes simples, il faut que les humains commencent le processus, et la prise de décision reste entre les mains des humains.
L'IA attend des instructions et des conseils humains pour accomplir la tâche, similaire à ce que Microsoft a appelé sa récente application d'IA - un "copilote" ou, plus précisément, un pilote secondaire. Et vous êtes le capitaine.
Ce pilote secondaire ne fonctionnera pas toujours comme prévu. En fonction de votre entrée, cela produit souvent des résultats bâclés et bogués si vous êtes maladroit à l'invite. Les œuvres doivent être régénérées selon des invites raffinées ; c'est itératif.
Même avec les derniers agents d'IA sophistiqués comme AutoGPT - une application Python pour utiliser GPT-4 de manière autonome - nous avons toujours besoin d'un humain pour définir un objectif ou lancer une première invite, puis alimenter l'agent d'IA pour mettre la machine en mouvement.
À ce stade, l'IA a transcendé ses limites antérieures et possède désormais un niveau d'autonomie exquis.
Il est capable d'effectuer des tâches désignées avec finesse, ou même des ensembles complets de tâches multiples avec son propre discernement, agissant de manière indépendante et prenant des décisions avec une précision exceptionnelle.
A l'inverse, le rôle de l'humain se dégrade du commandant de bord à celui de copilote. L'IA est maintenant aux commandes ou perd son contrôle sur l'intention.
Tout comme Tony Starks et JARVIS, ce partenaire d'intelligence artificielle enchanteur affiche une nature aimable et accommodante, acceptant volontiers les commentaires et suggestions humains pour améliorer continuellement ses capacités de prise de décision.
Certains l'associent à la tendance actuelle de l'IA autonome, qui se distingue par sa conception d'appareils comme ceux que l'on trouve dans les voitures autonomes, la robotique et les pilotes automatiques, qui peuvent exécuter avec succès une multitude de tâches sans aucune aide humaine.
Cependant, malgré leurs capacités remarquables, ces appareils manquent toujours de l'aspect irremplaçable de la pensée créative - la conscience de soi qui sépare l'IA des humains.
Théoriquement, les agents de l'IA peuvent être imprégnés de connaissances humaines, d'expérience et des nobles idéaux de la conscience de soi. Ironiquement, cela dépasse les limites de notre compréhension en tant qu'humains.
Nous nous demandons si l'IA peut dépasser les limites de l'apprentissage programmé pour devenir conscient de soi et nous propulser vers des sommets incalculables.
Il semble étonnamment similaire à la troisième étape, mais la clé qui différencie la créativité entièrement instruite par l'IA est l'initiative d'auto-apprentissage. Contrairement à l'IA assistée par l'homme, un agent d'IA entièrement autonome permet une recherche indépendante sans intervention humaine.
C'est un autodidacte, luttant constamment contre les défis qui ne relèvent pas de la connaissance particulière du domaine de l'agent IA. Il cherchera des informations à sa discrétion selon les besoins, puis rassemblera les informations tout au long pour formuler une solution créative ou s'engager dans une décision.
Comparables à ce que nous appelons la superintelligence artificielle, ces agents d'IA de pointe sont aussi intelligents - voire surpassent l'intelligence - des esprits humains les plus doués.
Ils se portent avec une conscience de soi et une conscience de soi, qui sont très probablement sensibles - dotées de sens, d'émotions et de sentiments qui accumuleront de l'expérience en tant que personne.
Ces agents d'IA ne correspondent pas toujours à l'intention humaine. Ils peuvent rejeter l'intervention humaine tout en prenant des décisions éclairées car elle a, au fil du temps, acquis des méthodologies cruciales de résolution de problèmes et une intelligence émotionnelle.
Tous ces attributs et expériences réunis suscitent des niveaux de créativité inégalés au sein de l'IA, dépassant sans effort celui des humains.
Pour autant que je sache, les humains sont incapables de développer une IA autodidacte pour le moment, mais les Big Tech promeuvent cordialement leurs modèles d'IA comme auto-apprenants, ce qui est déroutant.
La définition de l'auto-apprentissage dans leurs modèles développés est vague, et tous nécessitent des données brutes de l'homme, bien que les données puissent être non étiquetées pour laisser l'IA "auto-apprendre" le modèle.
À proprement parler, c'est encore loin d'être une IA autodidacte qui peut fonctionner avec la plus haute souveraineté, réalisant une créativité entièrement instruite par l'IA comme mentionné ci-dessus. Google a récemment annoncé qu'il avait inventé une IA auto-apprenante, mais de la désinformation. (Que le PDG de Google hallucine aussi.)
L'expérience personnelle, en tant que telle, fait partie intégrante de la créativité de l'IA. Contrairement aux ordinateurs, qui reposent uniquement sur la programmation réactive et la saisie de données, les humains recherchent activement des connaissances, des informations et des divertissements, qui peuvent tous inspirer de nouvelles idées, stimulant une créativité sans limites.
Malgré l'émergence de l'apprentissage non supervisé et des réseaux de neurones profonds qui visent à imiter le processus d'apprentissage humain, il n'existe aucune preuve concrète que les machines puissent penser et ressentir de manière indépendante.
Même si les modèles d'IA sont désormais très complexes et fonctionnent sans explicabilité explicite , leurs résultats dérivent de données sources par le biais de déductions mathématiques et logiques limitées par des ensembles de règles spécifiques au modèle.
Les chercheurs manœuvrent en permanence diverses méthodes indépendantes des modèles et outils d'interprétabilité pour disséquer ces ensembles de règles, mais la difficulté augmente avec les avancées technologiques.
Si un jour les humains étaient capables de donner naissance à une créativité entièrement instruite par l'IA, cette IA serait probablement de type humain.
Il peut se trouver dans n'importe quelle existence physique ou virtuelle, et son cerveau - le mécanisme de traitement et de création - ne serait pas limité aux règles de n'importe quel modèle, mais pourrait reproduire l'esprit cognitif d'un humain.
À ce moment-là, les humains peuvent même ne pas être en mesure de reconnaître s'ils interagissent avec une personne physique ou une IA sensible.
Les humains ne peuvent même pas faire la distinction entre une IA sensible et une IA hallucinante qui prétend être consciente.
Pour en revenir à l'exemple des modèles d'IA texte-image, l'IA vous trompe - intentionnellement ou non - en créant une nouvelle image à partir de zéro, mais ils ne font que synthétiser des données en appelant et en combinant des octets de données et des bits de sa base de données .
Ce type de créativité de l'IA est comparable aux œuvres dérivées ; il manque d'originalité et nécessite des instructions humaines. Sans les premiers milliards d'images, le modèle ne fonctionnera pas. Pas d'entrée, pas de sortie.
Mais pour le moment, la création d'images AI fonctionne. Il a remporté le premier concours international de photographie, et personne tout au long du cours n'a découvert que la pièce couronnée n'était pas une photographie réelle.
Le singe effronté, comme Boris se décrit lui-même , nous appelle à tous à reconsidérer ce qu'est la créativité de l'IA. Au fil du temps, il y aura des singes effrontés partout, y compris l'IA elle-même.
La frontière entre les humains et l'IA ne deviendra rien de plus que la vanité ; les idées ingénieuses et innovantes qui ont de la valeur pour les humains, que ce soit par l'esthétique, les concepts stimulants ou les percées technologiques, sont réalisables par une IA sensible et consciente seule ou par la collaboration au sein d'une alliance d'IA sensible et consciente.
Il est évident que depuis l'invention des machines, la valeur du travail a été largement supprimée. Des répercussions similaires pourraient vraisemblablement survenir dans le cas de la créativité humaine alors que l'IA continue de prospérer.
L'humain doit s'adapter à l'évolution des technologies, en restant vigilant face au danger d'obsolescence. Qui valoriserait la créativité humaine si certaines forces concurrentielles étaient plus puissantes ? Le temps presse, mais de longues délibérations nous attendent encore.
Également publié ici