MC Geek !

10 apps d'intelligence artificielle bluffantes pour convertir un texte en image

2023-03-20 2023-03-20

20.03.2023

2023-03-20 2023-03-20

Ajouter aux favoris

http://www.mediacongo.net/dpics/filesmanager/actualite/2023_actu1/03-mars/20-26/intelligence_artificielle_application_23.jpeg

Les text to image ou générateurs d’image par IA sont l’une des révolutions majeures de l’Intelligence artificielle. Souvent surprenantes par l’élégance des images, les possibilités d’édition mais aussi par la créativité offerte à tout un chacun, ces applications sont à même de vous ouvrir bien des horizons inespérés…

Les text to image ou applications à même de convertir un texte en une image, ont été l'une des révélations de l'année 2022. L’Intelligence artificielle, traditionnellement associée à des activités telles que la robotique, la vision par ordinateur, la reconnaissance du langage ou le comportement de personnages dans les jeux vidéo, s'est attaquée, cette fois, à l'art et à l'esthétique, des domaines dans lesquelles on n'aurait pas forcément imaginé qu'elle puisse s'immiscer. La surprise a été au rendez-vous.

Après avoir testé la plupart des applications disponibles à ce jour, nous avons retenu 10 des plus marquantes, que ce soit par la qualité des images, la créativité dont elles font preuve, leur originalité ou encore la facilité d'usage. Nous en avons aussi éliminé certaines pour des questions de prix initial - celles qui apparaissent ici peuvent toutes être essayées gratuitement, avec la possibilité d'obtenir un accès privilégié si l'on est prêt à débourser des sommes habituellement raisonnables.

Dall.e 2

DALL.E 2 EST OUVERT À DES PHRASES FORT SURRÉALISTES ET, COMME IL REPOSE SUR LE MOTEUR GPT, IL EST À MÊME DE COMPRENDRE LE FRANÇAIS. LES IMAGES QU’IL CRÉÉES SONT PARFOIS LOIN D’ÊTRE PARFAITES ET IL FAUT SOUVENT LUI DEMANDER PLUSIEURS FOIS DE PROPOSER DES VARIATIONS. © OPENAI

À tout seigneur, tout honneur, Dall.e a été la première application proposant de générer des images à partir d'une phrase, et ce, dès janvier 2021. Toutefois, cette première version s'apparentait à un prototype. Les images que l'on pouvait créer avaient un aspect « peu fini ».

Dès avril 2022, Dall.e 2 lui a succédé et cette fois, la qualité des images proposées a été convaincante. Les choix de couleurs, de décors, les ombres et lumières ont parfois été dignes d'œuvres artistiques.

Il se trouve que Dall.e 2 est une production de OpenAI, soit les créateurs de ChatGPT. Donc, Dall.e 2 s'appuie également sur le moteur GPT. Le point remarquable est que OpenAI dit être parvenu à coder dans son IA les caractéristiques qui font qu'une image nous semble agréable à regarder. Cette IA a ainsi été entraînée à comparer la qualité esthétique -- facteur de jugement humain par excellence -- de multitudes d'images. Un avantage de reposer sur GPT est que l'application comprend les requêtes tapées en français.

Ce qui a frappé les utilisateurs de Dall.e 2, c'est la possibilité d'imaginer des scènes totalement surréalistes et de voir l'application répondre à des demandes telles que : « Un kangourou avec des dreadlocks habillé style Louis XV qui serre à la main à un cosmonaute. Style de peinture à la Frida Kahlo ».

Dall.e 2 peut également prendre une photographie existante et remplacer ou compléter le décor. Par la force des choses, les résultats sont parfois inattendus et décevants, mais il suffit habituellement de relancer la génération d'images pour tôt ou tard parvenir à une création honorable.

Stable Diffusion

LA GALERIE LEXICA.ART AFFICHE QUELQUES RÉALISATIONS MAJEURES EFFECTUÉES À PARTIR DE STABLE DIFFUSION ET AMÈNE À RÉALISER À QUEL POINT CET OUTIL EST SOPHISTIQUÉ. © LEXICA.ART

Stable Diffusion a très vite marqué par sa capacité à générer des images plus sophistiquées que celles de Dall.e 2. La société créatrice de cet outil, Dreamstudio, dispose de serveurs puissants et donc, la génération d'images est plutôt rapide. Avant tout, Stable Diffusion est impressionnant au niveau de la richesse visuelle des images générées, avec une qualité digne de ce qu'aurait pu produire un graphiste, un dessinateur ou encore un photographe de haut niveau

Pour générer une image, il faut partir d'un prompt (description) qui doit être idéalement fort long. L'interface peut être intimidante au premier abord dès lors que l'on cherche à influencer les diverses options. Le plus simple est d'essayer divers paramètres et de constater ce qui en sort ou de s'inspirer de créations déjà effectuées en copiant leur prompt, ce qui est possible depuis des galeries telles que Lexica.art. Le résultat correspond rarement ce que l'on attendait au premier abord et donc on prend assez vite l'habitude de lui spécifier des « negatives prompts », en gros, de lui spécifier aussi ce que l'on ne veut pas voir apparaître dans l'image : pas de gratte-ciel, pas de couleur mauve, pas de personnage hors cadre...

Stable Diffusion peut aussi partir d'une image existante et en proposer des variations tout en offrant d'ajuster divers paramètres.

Plusieurs sites proposent de rendre l'usage à grand échelle de Stable Diffusion plus maniable, notamment dreamlike.art, invoke.ai, image.ai ou stability.ai. La plupart nécessitent assez vite d'acheter des crédits mais le tarif est fort raisonnable. Ainsi, depuis dreamlike.art, pour 15 dollars, on peut produire très rapidement des centaines d'images tout en indiquant le format de sortie souhaité. La facilité d'opération depuis un tel site est fort susceptible de vous séduire.

DES SITES TELS QUE DREAMLIKE.ART FACILITENT L’USAGE EN VOLUME DE STABLE DIFFUSION. POUR UN TARIF TRÈS MODÉRÉ, ILS OUVRENT LA VOIE À LA PRODUCTION DE CENTAINES D’IMAGES FORT SIMPLEMENT. © DREAMLIKE.ART

Mid journey

MIDJOURNEY EST EXCELLENT AU NIVEAU DE LA GÉNÉRATION DE VISUELS MAIS SON APPROCHE, TRÈS « GEEK », EST À MÊME DE REBUTER CERTAINS UTILISATEURS. © MIDJOURNEY

Mid Journey est une autre application qui produit des images d'une qualité indéniable à partir de phrases complexes. Le reproche que certains pourront lui faire est qu'il est nécessaire pour en faire usage de passer par le serveur Discord lié à cette application et d'intervenir dans l'un des forums dédiés aux « newbies ». À partir de là, on peut taper sa demande et il faut alors patienter tandis que l'on voit défiler la génération des images demandées par d'autres utilisateurs du même service. Il arrive donc que l'on ait du mal à retrouver ses petits. L'alternative consiste à choisir une version payante.

Pour chaque proposition, MidJourney propose 4 images que l'on voit se composer peu à peu à l'écran. On peut s'attarder sur l'une d'entre elles qui va servir de modèle à la génération de 4 nouvelles images. Une fois que l'on a repéré un visuel que l'on souhaite télécharger, il est alors possible de l'agrandir. Tout cela n'est pas forcément simple au premier abord et il peut être avisé de consulter un tutorial.

MidJourney a aussi la capacité de produire le design d'un site Web sur le thème qui lui est donné et ce service est d'une qualité souvent stupéfiante.

Si l'on fait abstraction de la nécessité d'utiliser cette interface pas toujours pratique au premier abord, il reste que MidJourney est bluffant au niveau des images qu'il peut produire, avec un parti pris esthétique très stylisé. Il n'est pas rare de voir cette application produire des visuels dignes d'un studio d'art, et ce, presque à tous les coups.

Leonardo

LEONARDO EST PROBABLEMENT L’APPLICATION LA PLUS ACCOMPLIE QUI EXISTE ACTUELLEMENT. TOUTEFOIS, SON USAGE NÉCESSITE DE PASSER PAR UNE LISTE D’ATTENTE PARTICULIÈREMENT LONGUE.

Si MidJourney a longtemps été considéré comme une sorte de Rolls des text-to-image, il semblerait que Leonardo soit en mesure de lui ravir cette place. Il est nécessaire, comme pour beaucoup d'applications, de s'inscrire et d'attendre une invitation de l'application. Ici, le temps d'attente habituel s'élève à plusieurs semaines ou mois, en raison du succès rencontré par Leonardo et nous avons dû fortement insister pour obtenir la nôtre plus vite que prévu, dans le cadre des présents tests.

S'il fallait décrire de façon simple ce qui fait la force de Leonardo, nous pourrions la résumer en une phrase : une qualité similaire voire supérieure à celle de Midjourney, depuis une interface extrêmement plus simple, et qui favorise une meilleure flexibilité. De fait, c'est depuis un simple site Web que l'on tape sa demande. Que dire ? Leonardo produit des visuels d'une qualité exceptionnelle avec une probabilité correcte d'obtenir un rendu correspondant bien à ce que l'on a demandé.

Incontestablement, lorsque l'on parcourt la galerie des images produites avec Leonardo, il y a de quoi être époustouflé. D'autant que l'application propose aussi des aides fort utiles pour le cas où vous manqueriez d'inspiration au niveau du style. D'ailleurs, Leonardo repose par ailleurs sur un modèle analogue à Stable Diffusion et donc, avec des prompts mais aussi des « negative prompts » pour spécifier ce que l'on ne veut pas.

Leonardo dispose aussi d'outils avancés, par exemple ne modifier qu'une partie d'une image avec énormément de flexibilité.

IL EST POSSIBLE DE PARTIR D’UNE IMAGE EXISTANTE ET DE LAISSER LEONARDO IMAGINER DES VISUELS À PARTIR DE CE MODÈLE. © LEONARDO

NightCafe

NIGHTCAFE FACILITE LA CRÉATION D'IMAGE EN GUIDANT L'UTILISATEUR PAS À PAS DANS LE PROCESSUS DE CRÉATION. © NIGHTCAFÉ

NightCafe propose une interface qui facilite la création d'images. Une fois le prompt défini, il nous faut en premier lieu sélectionner un algorithme prédéfini. NightCafe s'appuie sur divers moteurs, notamment Dall.e 2 ou Stable Diffusion, mais aussi d'autres outils moins connus comme Clip ou VQGAN qui autorisent des créations fort artistiques. Cet outil nous invite aussi à choisir parmi divers styles prédéfinis : artistique, animation numérique, manga... Il est possible au passage de mélanger plusieurs styles. Il suffit ainsi de se laisser guider et la création d'une image peut sembler assez longue. Certains des résultats que nous avons obtenus étaient plus qu'honorables et certains réellement beaux.

Parmi les points originaux de NightCafe se trouve le fait que l'application encourage la possibilité de créer des images en faisant intervenir des amis, ce qui est en mesure de « booster » la créativité.

Maze Guru

LE MODÈLE DISCO PREND DE LONGUES MINUTES POUR GÉNÉRER SES IMAGES. TOUTEFOIS, AU BOUT DU COMPTE, LES VISUELS SONT D'UNE CRÉATIVITÉ REMARQUABLE. © MAZE GURU

Les images issues de Maze Guru sont d'une qualité et d'une créativité appréciables. Une version simplifiée de ce outil est accessible depuis le site Web de Maze Guru. Toutefois, il semblerait qu'il faille d'abord s'inscrire sur le forum Discord de Maze Guru pour accéder à l'outil Web.

Il est possible avec Maze Guru de générer des visuels fantastiques fictifs, mais aussi une version de soi-même en cyborg, personnage de Pixar ou autre. Un grand nombre de modèles fort esthétiques sont disponibles et il suffit de cliquer sur des visuels pour les choisir un à un. Autant le savoir, si vous choisissez le modèle Disco, les images peuvent être fort longues à produire.

Si vous en avez le courage, vous pouvez opérer depuis le serveur Discord de Maze Guru qui fonctionne sur le même principe que MidJourney : génération de 4 images, variations sur l'une d'entre elles, agrandissement... Reconnaissons-le : tout cela n'est pas facile à prendre en main, même si, au bout de quelques minutes de pratique, vous devriez parvenir à maîtriser cette approche. Et d'ailleurs, on prend goût à voir les créations d'autres internautes être créées avant et après les siennes, car il en résulte une source d'inspiration régulière.

LE FORUM DISCORD DE MAZE GURU REPOSE SUR UNE APPROCHE À LA MIDJOURNEY ET N'EST DONC PAS FORCÉMENT FACILE À PRENDRE EN MAIN. MAIS LA QUALITÉ DES VISUELS COMPENSE CETTE DIFFICULTÉ DE PREMIÈRE APPROCHE. © MAZE GURU

Deep Dream Generator

DEEP DREAM FACILITE LA CRÉATION D'IMAGE EN NOUS GUIDANT DANS LE CHOIX DE STYLES. © DEEP DREAM

Deep Dream est un outil qui se veut simple : il repose donc sur une seule page dans laquelle sont définis les critères de l'image souhaitée -- celle-ci pouvant être intégrée à une photographie existante. Si l'on clique sur « Modifier », Deep Dream propose divers guides. Par exemple, des listes d'artistes (Picasso, Michel Ange...), des effets, de la lumière, le style photographique... Avantage : par défaut, cet outil crée des images en mode paysage et de belle définition.

DeepAI

DEEPAI PRODUIT DES VISUELS AYANT L'ASPECT DE PEINTURES ET CE, DE FAÇON TRÈS SIMPLE : POUR L'ESSENTIEL, VOUS TAPEZ UN TEXTE PUIS SÉLECTIONNEZ UN STYLE ARTISTIQUE PRÉDÉFINI. © DEEPAI

Si votre désir est avant tout de produire des images ayant l'aspect de peintures, alors DeepAI est à même de répondre à ce désir. Une fois le texte de son choix introduit, vous pouvez choisir un style pictural, et DeepAI génère un visuel adapté. Si le résultat ne vous convient pas, vous pouvez choisir un autre type de peinture. Les options sont limitées au choix de la forme de l'image (carré, rectangulaire...). Il reste que ce type d'outil est bien adapté à ceux qui ne désirent pas se perdre dans les détails techniques.

Artbreeder

UNE IMAGE TELLE QUE CELLE-CI A ÉTÉ OBTENUE FORT SIMPLEMENT AVEC ARTBREEDER. OUTRE LA GÉNÉRATION D'IMAGES À PARTIR DE PHRASES, CET OUTIL PERMET DE CRÉER DES PERSONNAGES FICTIFS À PARTIR DE « PARENTS ». © ARTBREEDER

Artbreeder est un autre outil qui met en avant sa facilité d'usage. Il se veut donc pratique avec une interface à base d'icônes et de modèles tels que portrait, couverture d'album, personnage de dessin animé avec des exemples dont on peut s'inspirer. Originalité : il est possible d'utiliser cet outil pour créer des images de personnages fictifs qui seront des composés de personnages « parents » ou encore des paysages. Artbreeder propose également la création d'images à partir de prompts.

Patterned

Vous cherchez un motif pour le logo de votre marque, pour votre site Web. Eh bien, c'est exactement ce que Patterned produit à partir du texte indiqué. Et les résultats sont généralement attrayants. Ils sont libres de droit et utilisables à volonté, et certains pourraient même juger opportun de les revendre. Seuls 10 motifs sont offerts gratuitement, et ce crédit est vite épuisé, après quoi, il faut débourser une somme modique (10 dollars pour 300 motifs par mois avec la possibilité d'annuler à tout moment). D'autres outils du même type existent et certains tels que Poly pourraient également répondre à vos besoins.

MediaCongo
Futura Sciences / MCP, via mediacongo.net

C’est vous qui le dites :

2224 suivent la conversation

Faites connaissance avec votre « Code MediaCongo »

Le code à 7 caractères (précédé de « @ ») à côté du Nom est le Code MediaCongo de l’utilisateur. Par exemple « Jeanne243 @AB25CDF ». Ce code est unique à chaque utilisateur. Il permet de différencier les utilisateurs.

Poster un commentaire, réagir ?

Les commentaires et réactions sont postés librement, tout en respectant les conditions d’utilisation de la plateforme mediacongo.net. Vous pouvez cliquer sur 2 émojis au maximum.

Merci et excellente expérience sur mediacongo.net, première plateforme congolaise

MediaCongo – Support Utilisateurs

Se connecter pour commenter