AI craint de faire des photos de chats adorables, il manque clairement tout l'intérêt d'Internet

Pin
Send
Share
Send

L'intelligence artificielle (IA) a récemment tenté de générer des photos de chats à partir de zéro, et les résultats ont été astronomiques.

Ce réseau neuronal particulier (un type d'IA modélisé d'après le fonctionnement du cerveau humain) peut produire des photos originales étonnamment réalistes de visages humains. En fait, les images de ces personnes maquillées étaient presque impossibles à distinguer des téléspectateurs humains des photos de vraies personnes, ont rapporté les programmeurs de l'IA dans une étude publiée en décembre 2018 dans le journal de préimpression arXiv.

Les félins, cependant, se sont révélés être une autre histoire. Le même algorithme qui a généré des visages humains sans défaut a créé des chats avec des têtes difformes; le mauvais nombre d'yeux et de jambes; et des corps trop longs, trop courts, inhabituellement ronds ou rectangulaires, et pliés à des angles particuliers.

Le moteur d'IA qui a produit les photos de chats effrayants est ce qu'on appelle "une architecture de générateur basée sur le style pour les réseaux contradictoires génératifs" ou StyleGAN. Des réseaux comme ceux-ci sont "contradictoires" car deux modèles fonctionnent simultanément: l'un génère des images et un autre évalue les résultats par rapport aux photos dans un ensemble de données de formation, afin que le réseau apprenne de ses erreurs et améliore ses performances, selon l'étude.

Pour que l'IA produise des images humaines réalistes, elle a d'abord dû «apprendre» à quoi ressemblaient les visages humains à partir des photos existantes. L'algorithme a divisé les visages en une liste de contrôle des caractéristiques de style, telles que la position de la tête; le genre; couleur de peau; texture et style des cheveux; et la forme des yeux, du nez et de la bouche, ont rapporté les chercheurs.

Une fois que StyleGAN a pu reconnaître tous ces éléments - sans supervision humaine - il a appris à les assembler indépendamment pour générer un tout nouveau visage humain photo-réaliste. Les chercheurs ont refusé une demande d'entrevue, mais ont expliqué leur processus dans une vidéo publiée sur Youtube le 12 décembre 2018.

Alors, pourquoi StyleGAN ne pouvait-il pas créer des photos de chats adorablement réalistes? L'algorithme faisait de son mieux avec ce avec quoi il devait travailler - et quand il s'agissait de chats, les milliers d'images de référence qu'il utilisait n'étaient pas idéales, a déclaré Janelle Shane, une chercheuse qui forme des réseaux de neurones mais n'était pas impliquée dans le étude, a déclaré Live Science.

Shane a écrit sur les chats bizarres le 7 février dans son blog AI Weirdness. Contrairement au jeu de données photo de visages humains de StyleGAN - dans lequel les corps et les arrière-plans ont été rognés et les positions de la tête étaient similaires - les images de chats dans le jeu de données variaient énormément. La collection comprend des gros plans et des plans larges de chats dans une gamme de paramètres et contre différents fonds. Certaines photos montraient un chat, certaines incluaient plusieurs chats et d'autres incluaient aussi des personnes.

"Il y a des chats à l'envers; il y a des chats recroquevillés en boule; leurs yeux sont ouverts; leurs yeux sont fermés. Vous pouvez certainement dire que leurs données d'entrée sont un peu bruyantes - et par bruyant, je veux dire qu'il y a des trucs dedans ce n'est pas seulement une photo d'un chat ", a déclaré Shane.

Alors, ne soyez pas trop dur avec StyleGan pour son horrible ménagerie de chats cauchemardesques.

"Il y a beaucoup plus à faire que l'algorithme doit apprendre", a ajouté Shane.

Alors que les humains photoréalistes de StyleGAN étaient impeccables, le réseau neuronal a eu du mal à assembler des félins. (Crédit d'image: Nvidia)

Des indices visuels contradictoires ont rendu difficile pour StyleGAN d'apprendre à quoi devait ressembler un vrai chat. Et les réseaux de neurones n'ont pas de contexte réel pour les informations qui leur sont fournies; tout ce qu'ils savent, c'est ce qu'il y a dans leurs ensembles de données. StyleGAN a suffisamment appris des photos de référence pour reproduire avec précision les détails et les textures à petite échelle, comme la fourrure d'un chat ou la forme d'une oreille féline. Mais le programme a clairement eu du mal à rassembler tout le chat, a déclaré Shane.

"Le réseau neuronal ne comprend pas comment fonctionnent les chats. Il ne comprend pas combien de pattes ils ont. On ne sait pas vraiment combien d'yeux ils ont ni où va toute leur anatomie", a-t-elle déclaré à Live Science.

Découvrez plus de photos inquiétantes de chats de StyleGAN, d'images humaines presque parfaites et d'autres fichiers de projet sur la plateforme de développement GitHub.

Pin
Send
Share
Send