Tähän artikkeliin tai osioon ei ole merkitty lähteitä, joten tiedot kannattaa tarkistaa muista tietolähteistä. Voit auttaa Wikipediaa lisäämällä artikkeliin tarkistettavissa olevia lähteitä ja merkitsemällä ne ohjeen mukaan. Tarkennus: Käännetty artikkeli kaipaa lähteitä |
Dall-E | |
---|---|
![]() |
|
![]() Kuvankaappaus DALL-E 2-käyttöliittymästä |
|
Luoja | OpenAI |
Kehityshistoria | |
Ensijulkaisu | 5. tammikuuta 2021 |
Vakaa versio | 10. elokuuta 2023 |
Tiedot | |
Alusta | selain |
Aiheesta muualla | |
Verkkosivusto |
DALL-E (tyylitelty DALL·E) on OpenAI:n kehittämä tekoälypohjaisten kuvageneraattorimallien perhe, joka luo kuvia tekstimuotoisista kuvauksista.
DALL-E käyttää 12 miljardin parametrin versiota GPT-3 Transformer -mallista tulkitsemaan luonnollisen kielen syötteitä (kuten "viisikulmion muotoinen vihreä nahkakukkaro" tai "isometrinen näkymä surullisesta kapybarasta") ja tuottamaan niitä vastaavat kuvat. Se voi luoda kuvia realistisista esineistä ("lasimaalauksinen ikkuna, jossa on kuva sinisestä mansikasta") sekä esineistä, joita ei ole todellisuudessa olemassa ("kuutio, jossa on piikkisian tekstuuri"). Nimi on portmanteau sanoista WALL-E ja Salvador Dalí.
Monet neuroverkot ovat 2000-luvulta lähtien pystyneet tuottamaan melko realistisia kuvia. DALL-E pystyy kuitenkin tuottamaan niitä luonnollisista kielikehotuksista, joita se "ymmärtää [...] ja epäonnistuu harvoin vakavasti".
OpenAI ei ole julkaissut lähdekoodia kummallekaan mallille.
MIT Technology Review -lehden mukaan yksi OpenAI:n tavoitteista oli "antaa kielimalleille parempi käsitys jokapäiväisistä käsitteistä, joita ihmiset käyttävät asioiden ymmärtämiseen".