Make A Scene,是Meta的一个AI图像生成器,旨在让人们更好地控制他们的AI图像。在AI的帮助下,Meta希望构建下一代创意AI工具,使许多人能够在2D、XR和元宇宙中创建富有表现力的信息。
Make A Scene的简介
Make-A-Scene 是Meta在7月14日宣布推出的一项新的AI技术,其最大特点是可以在用户创作的粗略草图的基础上,结合文本提示生成具体的图像,让生成图像的可控性更高。
Meta研究人员最近展示的多模态AI模型Make-A-Scene则通过草图加文本的输入赋予了用户更多的控制权,从而能生成更有针对性的图像。
Make-A-Scene可以捕捉预先设置的场景布局,使草图也成为输入内容的一部分,然后用户通过文本输入来对框架进行填充。该模型还可以通过输入文本来创建自己的布局,但这意味着用户放弃了部分控制权。
Make A Scene的优势
与Dall·E 2和Imagen这种仅凭提示文本生成图像的模型相比,Make-A-Scene创作出的图像有了更高的可控性。使用者可以通过草图控制最终图像的具体效果,包含元素数量、大小、形式、排列方式、构图、深度等各个方面。这项新技术使Make-A-Scene在与其他模型进行对比测试时,在图像与文本契合度方面的评价明显高于只根据文本生成的图像的模型。当然用户也可以选择不使用草图,直接通过文本生成所需的图像。
“为了充分实现人工智能促进创造性表达的目标,人们必须能够影响和控制这些智能模型产生的内容。用户应该能够以他们喜欢的任何方式来表达自己的想法,包括语音、文本、手势甚至是绘图,并且应该易于使用和直观。”这是Meta在Make-A-Scene的介绍文章提出的观点,也很好的表现了Make-A-Scene的意义所在。