Parti

  • Google文本图像AI模型
  • 所属分类:AI绘图
  • 官方网址:parti.research.google
  • 更新日期:10-27

Parti是Google推出的文本-图像生成AI模型,Parti是Imagen之后又出了一个更强,像素更高,细节更丰富的AI绘画工具,最多能支持扩展到200亿个参数。

Parti

Parti的简介

Parti是Google在推出Imagen不久后推出的另一款文本-图像生成模型。二者都是专注于通过文本生成逼真的图像,区别在于Imagen是扩散(CLIP)模型,而Parti是路径自回归文本-图像(Pathways Autoregressive Text-to-Image)生成模型,后者可实现高保真、极具真实感的图像生成。

据官网介绍,Parti通过研究一组图像来训练自身模型来生成另一组新的图像,可供研究的图像数量越多,生成的图像就越逼真。而Parti则在训练过程中,将参照图像数量由3.5亿个提升至200亿个,这也使得生成图像与文本的契合度达到75.9%。

而且Google发现,在图片参照数量达到200亿的情况下,Parti在生成有关抽象、世界通识知识、特定视角、书写和符号的图像时特别出色。

Parti的优势

Parti表明,与大型语言模型一样,图像AI通过更全面的训练和更多的参数获得了明显更好的结果。它还可以将长而复杂的文本输入准确地翻译成图像,这表明它可以更好地理解语言和主题之间的关系。

Parti生成的图像分辨率为256 x 256像素,然后可以放大到1024 x 1024像素。上图显示了四种经过不同级别训练的Parti模型在相同命令提示下生成图像的质量差异。具有200亿参数的最大模型生成了与长文本输入匹配的无错误图像。最大版本的Parti模型甚至可以拼写单词,而DALL-E 2只能生成图像。

另外,Parti还可以生成超越培训材料及其主题的出色的图像。研究人员认为,这意味着图像AI能够准确地再现世界知识,以精细的细节和交互组合产生许多主角和对象,并遵循特定的图像格式和风格。

Parti的特色

1、准确地反映世界知识;

2、有许多参与者和对象,有精细的细节和互动;

3、遵守特定的图像格式和风格。

相关推荐

返回顶部