Pour une nouvelle dimension dans la génération IA d’images, cet écosystème accueille un nouvel outil, Whisk de Google Labs. Whisk crée des œuvres uniques en combinant des éléments visuels de trois images, contrairement aux outils traditionnels textuels. Cette approche intuitive et innovante ouvre de nouvelles possibilités pour l’expression créative et la conception.
De fait, pour générer des images uniques, Whisk de Google Labs utilise les modèles IA Imagen 3 et Gemini. Whisk de Google Labs analyse trois images représentant le sujet, la scène et le style téléchargés comme invites. Ensuite, il combine ces éléments pour créer une nouvelle œuvre visuelle unique, grâce à un processus innovant. Les résultats surprennent et offrent une exploration visuelle rapide et amusante, comme en témoignent ces clichés générés.
Whisk de Google Labs : quelques contraintes et limites
Déployé seulement aux États-Unis via le site Google Labs, Whisk est encore en phase expérimentale et présente donc certaines limites. Les images générées peuvent parfois différer des attentes des utilisateurs en raison de la nature subjective de la description visuelle. Par exemple, le sujet généré peut avoir une taille, un poids, une coiffure ou un teint de peau différents.
Cependant, les utilisateurs peuvent toujours modifier les prompts sous-jacents pour obtenir des résultats plus proches de leurs attentes. Google encourage d’ailleurs les utilisateurs à essayer l’outil et à fournir des retours afin d’aider à son développement futur.
Lors de nos premiers tests avec des artistes et des créatifs, les gens ont décrit Whisk comme un nouveau type d’outil créatif, et non comme un éditeur d’images traditionnel… Il s’agit d’explorer des idées de manière nouvelle et créative, ce qui vous permet de travailler sur des dizaines d’options et de télécharger celles que vous aimez… Notre objectif est d’obtenir des commentaires sur les nouveaux produits et fonctionnalités alors que nous travaillons ensemble à façonner la technologie. »
Ainsi, Whisk propose une approche innovante de la création visuelle, favorisant une exploration immédiate et ludique des idées. De plus, il s’appuie sur des technologies d’IA avancées pour enrichir et améliorer le processus créatif.