DALL-E

Dall-E
Kuvankaappaus DALL-E 2-käyttöliittymästä
Kuvankaappaus DALL-E 2-käyttöliittymästä
Luoja OpenAI
Kehityshistoria
Ensijulkaisu 5. tammikuuta 2021
Vakaa versio 10. elokuuta 2023
Tiedot
Alusta selain
Aiheesta muualla
Verkkosivusto

DALL-E (tyylitelty DALL·E) on OpenAI:n kehittämä tekoälypohjaisten kuvageneraattorimallien perhe, joka luo kuvia tekstimuotoisista kuvauksista.

DALL-E käyttää 12 miljardin parametrin versiota GPT-3 Transformer -mallista tulkitsemaan luonnollisen kielen syötteitä (kuten "viisikulmion muotoinen vihreä nahkakukkaro" tai "isometrinen näkymä surullisesta kapybarasta") ja tuottamaan niitä vastaavat kuvat. Se voi luoda kuvia realistisista esineistä ("lasimaalauksinen ikkuna, jossa on kuva sinisestä mansikasta") sekä esineistä, joita ei ole todellisuudessa olemassa ("kuutio, jossa on piikkisian tekstuuri"). Nimi on portmanteau sanoista WALL-E ja Salvador Dalí.

Monet neuroverkot ovat 2000-luvulta lähtien pystyneet tuottamaan melko realistisia kuvia. DALL-E pystyy kuitenkin tuottamaan niitä luonnollisista kielikehotuksista, joita se "ymmärtää [...] ja epäonnistuu harvoin vakavasti".

OpenAI ei ole julkaissut lähdekoodia kummallekaan mallille.

MIT Technology Review -lehden mukaan yksi OpenAI:n tavoitteista oli "antaa kielimalleille parempi käsitys jokapäiväisistä käsitteistä, joita ihmiset käyttävät asioiden ymmärtämiseen".


From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Tubidy