Dall-E2,是OpenAI的文本生成图像模型,是一种可以根据文本描述创造高质量图像的AI模型,从而允许用户快速地进行艺术创作。描述可能非常复杂,包含动作、艺术风格和多个主题。
Dall-E2的简介
OpenAI公司,为致敬《WALL-E》以及超现实主义画派达利,推出了新型人工智能模型 DALL-E。
与WALL-E不同的是,这个人工智能不是用来清扫垃圾的,而是用来画画的。并且画风也不局限于达利画派的超现实主义。
这个模型用起来很简单,你只需要把你想要的图像用文字描述出来,输入到模型里,它就会根据你的描述,输出对应的图像。
DALL-E 推出一年之后,DALL-E 就升级到 DALL-E-2。
从此,开启了吊打人类平面设计师的旅程。
Dall-E2的挑战
安全性和可解释性
DALL-E 2的语言让我们大开眼界,来的研究出现了一些有趣的方向。研究者表示某些乱码也许是不同语言中正常单词的拼写错误,但尚未搜索到此类示例。许多prompt中词的来源仍然令人困惑,并且在该研究的初步实验中,其中一些词与其他词不一致。
稳健性和局限性
最重要的问题之一是所用方法的一致性。例如,该研究初步研究表明,像「Contarra ccetnxniams luryca tanniounons」这样的prompt 有时存在bug,多次实验生成的图像不一致;而「Apoploe vesrreaitais」这样的prompt则更加稳健。