作者 | 黄金琼
(相关资料图)
编辑 | 邓咏仪
北京时间7月27日,Stability AI宣布推出最新的图像生成模型Stable Diffusion XL 1.0,Stable Diffusion XL 1.0的开源版本,当前可在GitHub上进行访问。
Stable Diffusion已经是目前全球使用最广泛的开源文生图模型。本次推出的Stable Diffusion XL 1.0,其实只和上一个版本0.9的推出时间相差不久,新版本相当于是一个“旗舰版本”。
来源:Stability AI
Stability AI也称其是目前为止“最先进”的版本,事实也如此。Stable Diffusion XL 1.0在图片的色彩更鲜艳和准确,并且对比度、阴影以及光影效果方面更佳。
并且,Stability AI这次还发布了Stability 的 API 和消费者应用程序 ClipDrop 和 DreamStudio。其中发布的API包含了测试版的微调功能,允许用户使用最少5张图像来“专门”生成特定的人、产品等。
参数是模型的核心参数,在这一方面,Stable Diffusion XL 1.0有进一步的提升。据TechCrunch报道,Stability AI的应用机器学习负责人Joe Penna表示,Stable Diffusion XL 1.0包含35 亿个参数,能在“几秒钟内”生成多种长宽比的100 万像素分辨率的完整图像。
相对于此,上一代模型Stable Diffusion XL 0.9尽管能生成更高分辨率的图像,并且在修复、补全图像上能力更强,但同时要求更高的计算能力。
Stable Diffusion XL 1.0在操作上也更方便快捷,提供更具个性化的操作。Penna表示:“Stable Diffusion XL 1.0 是可定制的,可以根据概念和风格进行微调。它也更容易使用,可以通过基本的自然语言处理提示,来实现复杂的设计。”
目前,Stability AI已将稳定的Stable Diffusion XL 1.0部署亚马逊关于生成式AI模型的云平台项目(Amazon Bedrock)中,也宣布与AWS进行深度合作。
不过,Stability AI当前还是面临各类道德争议。比如在训练模型的数据来源方面,Stability AI采用了包括艺术家的作品等数据用于训练,这引发了艺术家本人的抗议。
尽管Stability AI认为,这符合美国的合理使用原则并坚持使用,但在艺术家们选择诉讼来警告这种行为后,Stability AI还是选择尊重艺术家们的要求——从数据集中删除作品。而后,Stability AI转而与新兴企业Spawning合作,以寻求训练数据。
并且,Stable Diffusion XL 1.0也和之前的版本尚未能避免被滥用的问题——不少人利用开源版本来进行换脸、生成有害的内容。
除此之外,Stability AI近期也深陷负面新闻漩涡,包括创始人Emad的造假传闻等等。而据TechCrunch,Stability AI由于在快速烧钱,在资金方面也颇有压力,正在大力拓展销售,并且寻找融资。