Dall-E2

  • OpenAI文本生成图像模型
  • 所属分类:AI绘图
  • 官方网址:openai.com/product/dall-e-2
  • 更新日期:10-27

Dall-E2,是OpenAI的文本生成图像模型,是一种可以根据文本描述创造高质量图像的AI模型,从而允许用户快速地进行艺术创作。描述可能非常复杂,包含动作、艺术风格和多个主题。

Dall-E2

Dall-E2的简介

OpenAI公司,为致敬《WALL-E》以及超现实主义画派达利,推出了新型人工智能模型 DALL-E。

与WALL-E不同的是,这个人工智能不是用来清扫垃圾的,而是用来画画的。并且画风也不局限于达利画派的超现实主义。

这个模型用起来很简单,你只需要把你想要的图像用文字描述出来,输入到模型里,它就会根据你的描述,输出对应的图像。

DALL-E 推出一年之后,DALL-E 就升级到 DALL-E-2。

从此,开启了吊打人类平面设计师的旅程。

Dall-E2的挑战

安全性和可解释性

DALL-E 2的语言让我们大开眼界,来的研究出现了一些有趣的方向。研究者表示某些乱码也许是不同语言中正常单词的拼写错误,但尚未搜索到此类示例。许多prompt中词的来源仍然令人困惑,并且在该研究的初步实验中,其中一些词与其他词不一致。

稳健性和局限性

最重要的问题之一是所用方法的一致性。例如,该研究初步研究表明,像「Contarra ccetnxniams luryca tanniounons」这样的prompt 有时存在bug,多次实验生成的图像不一致;而「Apoploe vesrreaitais」这样的prompt则更加稳健。

相关推荐

返回顶部