Créateur | OpenAI |
---|---|
Développé par | OpenAI |
Fichier exécutable | images générées à partir de commandes naturelles |
Première version | |
Écrit en | GPT-3[1] |
Supporte les langages | langage naturel |
Langues | Anglais |
Type | Intelligence artificielle générative |
Site web | www.openai.com/blog/dall-e/ |
Chronologie des versions
DALL-E (ou DALL·E) est un programme d'intelligence artificielle générative, capable de créer des images à partir de descriptions textuelles. Son nom est un mot-valise évoquant à la fois le robot de Pixar WALL-E et le peintre Salvador Dalí[2],[3].
Microsoft a implémenté le modèle dans l'outil Image Creator de Bing et prévoit de l'implémenter dans son application Designer[4].
DALL-E utilise une version à 12 milliards de paramètres[3] du modèle de langage GPT-3[1] pour interpréter les entrées (commandes) en langage naturel (telles que par exemple : « un sac à main en cuir vert en forme de pentagone » ou « une vue isométrique d'un capybara triste »), et générer les images demandées[2]. Il peut créer des images d'objets réalistes (« un vitrail avec l'image d'une fraise bleue »), mais aussi des objets qui n'existent pas dans la réalité (ex. : « un cube avec la texture d'un porc-épic »)[5],[6],[7].
DALL-E a été cité comme le logiciel existant faisant le plus preuve de créativité[8].