Dall-E2-Dall-E2官网:OpenAI文本生成图像模型-天马行空导航

Dall-E2，是OpenAI的文本生成图像模型，是一种可以根据文本描述创造高质量图像的AI模型，从而允许用户快速地进行艺术创作。描述可能非常复杂，包含动作、艺术风格和多个主题。

Dall-E2的简介

OpenAI公司，为致敬《WALL-E》以及超现实主义画派达利，推出了新型人工智能模型 DALL-E。

与WALL-E不同的是，这个人工智能不是用来清扫垃圾的，而是用来画画的。并且画风也不局限于达利画派的超现实主义。

这个模型用起来很简单，你只需要把你想要的图像用文字描述出来，输入到模型里，它就会根据你的描述，输出对应的图像。

DALL-E 推出一年之后，DALL-E 就升级到 DALL-E-2。

从此，开启了吊打人类平面设计师的旅程。

Dall-E2的挑战

安全性和可解释性

DALL-E 2的语言让我们大开眼界，来的研究出现了一些有趣的方向。研究者表示某些乱码也许是不同语言中正常单词的拼写错误，但尚未搜索到此类示例。许多prompt中词的来源仍然令人困惑，并且在该研究的初步实验中，其中一些词与其他词不一致。

稳健性和局限性

最重要的问题之一是所用方法的一致性。例如，该研究初步研究表明，像「Contarra ccetnxniams luryca tanniounons」这样的prompt 有时存在bug，多次实验生成的图像不一致；而「Apoploe vesrreaitais」这样的prompt则更加稳健。