DALL-E

Informations
Créateur	OpenAI
Développé par	OpenAI
Fichier exécutable	images générées à partir de commandes naturelles
Première version	5 janvier 2021
Écrit en	GPT-3
Supporte les langages	langage naturel
Langues	Anglais
Type	Intelligence artificielle générative
Site web	www.openai.com/blog/dall-e/

DALL-E (ou DALL·E) est un programme d'intelligence artificielle générative, capable de créer des images à partir de descriptions textuelles. Son nom est un mot-valise évoquant à la fois le robot de Pixar WALL-E et le peintre Salvador Dalí^[2]^,^[3].

Microsoft a implémenté le modèle dans l'outil Image Creator de Bing et prévoit de l'implémenter dans son application Designer^[4].

DALL-E utilise une version à 12 milliards de paramètres^[3] du modèle de langage GPT-3^[1] pour interpréter les entrées (commandes) en langage naturel (telles que par exemple : « un sac à main en cuir vert en forme de pentagone » ou « une vue isométrique d'un capybara triste »), et générer les images demandées^[2]. Il peut créer des images d'objets réalistes (« un vitrail avec l'image d'une fraise bleue »), mais aussi des objets qui n'existent pas dans la réalité (ex. : « un cube avec la texture d'un porc-épic »)^[5]^,^[6]^,^[7].

DALL-E a été cité comme le logiciel existant faisant le plus preuve de créativité^[8].

↑ ^{a et b} (en) Tom B. Brown, Benjamin Mann, Nick Ryder et Melanie Subbiah, « Language Models are Few-Shot Learners », arXiv:2005.14165 [cs],‎ 22 juillet 2020 (lire en ligne, consulté le 21 avril 2022).
↑ ^{a et b} (en) Devin Coldewey, « OpenAI’s DALL-E creates plausible images of literally anything you ask it to », sur TechCrunch, 6 janvier 2021 (consulté le 20 avril 2022).
↑ ^{a et b} (en-US) « OpenAI debuts DALL-E for generating images from text », sur VentureBeat, 5 janvier 2021 (consulté le 20 avril 2022).
↑ (en-US) Yusuf Mehdi, « Announcing Microsoft Copilot, your everyday AI companion », sur The Official Microsoft Blog, 21 septembre 2023 (consulté le 18 décembre 2023).
↑ (en-US) « OpenAI’s text-to-image engine, DALL-E, is a powerful visual idea generator », sur VentureBeat, 16 janvier 2021 (consulté le 20 avril 2022).
↑ (en) Mihai Andrei, « This AI module can create stunning images out of any text input », sur zmescience.com, 8 janvier 2021 (consulté le 20 avril 2022).
↑ (en) Bryan Walsh, « A new AI model draws images from text », Axios, 5 janvier 2021 (consulté le 2 mars 2021).
↑ (en) Rob Toews, « AI And Creativity: Why OpenAI's Latest Model Matters » [archive du 12 février 2021], Forbes, 18 janvier 2021 (consulté le 2 mars 2021).

[GPT3-1] {a et b} (en) Tom B. Brown, Benjamin Mann, Nick Ryder et Melanie Subbiah, « Language Models are Few-Shot Learners », arXiv:2005.14165 [cs],‎ 22 juillet 2020 (lire en ligne, consulté le 21 avril 2022).

[tc-2] {a et b} (en) Devin Coldewey, « OpenAI’s DALL-E creates plausible images of literally anything you ask it to », sur TechCrunch, 6 janvier 2021 (consulté le 20 avril 2022).

[vb-3] {a et b} (en-US) « OpenAI debuts DALL-E for generating images from text », sur VentureBeat, 5 janvier 2021 (consulté le 20 avril 2022).

[4] (en-US) Yusuf Mehdi, « Announcing Microsoft Copilot, your everyday AI companion », sur The Official Microsoft Blog, 21 septembre 2023 (consulté le 18 décembre 2023).

[vb2oped-5] (en-US) « OpenAI’s text-to-image engine, DALL-E, is a powerful visual idea generator », sur VentureBeat, 16 janvier 2021 (consulté le 20 avril 2022).

[zme-6] (en) Mihai Andrei, « This AI module can create stunning images out of any text input », sur zmescience.com, 8 janvier 2021 (consulté le 20 avril 2022).

[axios-7] (en) Bryan Walsh, « A new AI model draws images from text », Axios, 5 janvier 2021 (consulté le 2 mars 2021).

[forbesoped-8] (en) Rob Toews, « AI And Creativity: Why OpenAI's Latest Model Matters » [archive du 12 février 2021], Forbes, 18 janvier 2021 (consulté le 2 mars 2021).

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

DALL-E

From Wikipedia, the free encyclopedia · View on Wikipedia