DALL-E

DALL-E
Description de l'image DALL-E 2 Signature.svg.
Description de cette image, également commentée ci-après
Image générée par DALL-E à partir de la consigne suivante « Ours polaire dans le désert » (donnée en anglais).
Informations
Créateur OpenAI
Développé par OpenAIVoir et modifier les données sur Wikidata
Fichier exécutable images générées à partir de commandes naturelles
Première version
Écrit en GPT-3[1]
Supporte les langages langage naturel
Langues AnglaisVoir et modifier les données sur Wikidata
Type Intelligence artificielle générative
Site web www.openai.com/blog/dall-e/

Chronologie des versions

DALL-E (ou DALL·E) est un programme d'intelligence artificielle générative, capable de créer des images à partir de descriptions textuelles. Son nom est un mot-valise évoquant à la fois le robot de Pixar WALL-E et le peintre Salvador Dalí[2],[3].

Microsoft a implémenté le modèle dans l'outil Image Creator de Bing et prévoit de l'implémenter dans son application Designer[4].

DALL-E utilise une version à 12 milliards de paramètres[3] du modèle de langage GPT-3[1] pour interpréter les entrées (commandes) en langage naturel (telles que par exemple : « un sac à main en cuir vert en forme de pentagone » ou « une vue isométrique d'un capybara triste »), et générer les images demandées[2]. Il peut créer des images d'objets réalistes (« un vitrail avec l'image d'une fraise bleue »), mais aussi des objets qui n'existent pas dans la réalité (ex. : « un cube avec la texture d'un porc-épic »)[5],[6],[7].

DALL-E a été cité comme le logiciel existant faisant le plus preuve de créativité[8].

  1. a et b (en) Tom B. Brown, Benjamin Mann, Nick Ryder et Melanie Subbiah, « Language Models are Few-Shot Learners », arXiv:2005.14165 [cs],‎ (lire en ligne, consulté le ).
  2. a et b (en) Devin Coldewey, « OpenAI’s DALL-E creates plausible images of literally anything you ask it to », sur TechCrunch, (consulté le ).
  3. a et b (en-US) « OpenAI debuts DALL-E for generating images from text », sur VentureBeat, (consulté le ).
  4. (en-US) Yusuf Mehdi, « Announcing Microsoft Copilot, your everyday AI companion », sur The Official Microsoft Blog, (consulté le ).
  5. (en-US) « OpenAI’s text-to-image engine, DALL-E, is a powerful visual idea generator », sur VentureBeat, (consulté le ).
  6. (en) Mihai Andrei, « This AI module can create stunning images out of any text input », sur zmescience.com, (consulté le ).
  7. (en) Bryan Walsh, « A new AI model draws images from text », Axios, (consulté le ).
  8. (en) Rob Toews, « AI And Creativity: Why OpenAI's Latest Model Matters » [archive du ], Forbes, (consulté le ).

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by razib.in