吃瓜归吃瓜,技术没有开玩笑
11月的最后一天,OpenAI的短篇“宫斗”剧终于落下帷幕,OpenAI 正式官宣Sam Altman回归,总结一下多方的长篇大论,看下OpenAI的人员变动:
OpenAI正式官宣Sam Altman回归;Mira Murati回归CTO职位;Greg Brockman重新担任总裁;OpenAl成立一个新的董事会,旧董事会中仅有一人留任;此次事件的主要发起者Ilya Sutskever不再是董事会成员,但似乎会继续在OpenAI工作;Sam Altman表示对Ilya没有恶意。
最后,作为OpenAI的主要投资者,也是此次事件从中斡旋的关键角色,OpenAI董事会决定将把微软纳入,作为无投票权的观察员角色。
不过让人没有想到的是,这边大剧刚谢幕,另一家同为AI明星的企业又“送瓜来吃”了。
融资不成就得卖身?有国外媒体援引知情人描述,开发出知名文生图大模型Stable Diffusion的公司Stability AI似乎正在考虑出售,CEO很可能也面临下台。
事情的起因是此前Stability AI的主要投资方之一Coatue Management担心其财务状况,呼吁让其CEO下台,并提供高管的薪酬明细。因为这一事件,导致Stability AI与其他一些主要投资者的关系也变得紧张起来,后续还有多位高管离职。
Stability AI成立于2019年,在去年10月拿到了1.01亿美元融资,领投者就包括了Coatue Management。今年早前刚刚收获了英特尔的新一轮5000万美元融资。
但以如今AI大模型的“烧钱”速度,这样的融资规模显然是不太够的。Stability AI仅早期的AI模型训练就投入了数百张英伟达A100,后续还在加码。此外,其一直在资助几个AI研究社区,今年3月时还收购了一家图片生成公司Init ML。
所以,不难理解Coatue Management方面对于资产的担忧。
据悉,近期已经有几家公司与Stability AI进行过沟通,包括另外几家AI独角兽企业,但官方的回应是并未试图出售,可能后续还会考虑进一步融资。
但即便内部出现动荡,Stable Diffusion的更新脚步似乎也没有停止。
实时文生图SDXL Turbo在上周,Stable Diffusion刚刚更新了Stable Video Diffusion视频模型。在近日,他们又带来了一项新的文生图模型更新:Stable Diffusion XL Turbo(下称SDXL Turbo)。
作为Stable Diffusion XL的升级,文生图模型本身并没有什么好说的。
根据官方的说明,SDXL Turbo采用了一项称为“对抗性扩散蒸馏”Adversarial Diffusion Distillation(ADD)的技术,ADD使用分数蒸馏(模型从现有图像合成模型中学习)和对抗性训练(增强模型区分真实图像和生成图像的能力,从而提高输出的真实感)。整体架构如下图:
看不懂也没关系,SDXL Turbo的特色其实就写在了名字里——Turbo(涡轮增压器,一般被用于形容高速度)。
有外媒在RTX 3060 GPU上部署SDXL Turbo,仅需要大约4秒就可以生成3步配置的1024×1024大小的图像,而拥有类似细节的图像在20步配置的SDXL上需要26.4秒。
Stability AI表示,在相对更为专业的NVIDIA A100 GPU上,该模型可以在207毫秒内生成512×512大小的图像,大概就像这样:
几乎实现了“实时的文生图”效果。
而且,SDXL Turbo不仅够快,质量上也有保证。此前的模型蒸馏大多只能保证一项优势,也就是在快速采样时会降低输出品质,追求画面细节又会延长速度,但是通过上面提到的“对抗性扩散蒸馏技术”,SDXL Turbo能够实现更高品质的输出。
Stability AI进行了两项实验,结果显示,SDXL Turbo只需要4步配置就可以超过普通版SDXL的50步配置了,不仅速度够快,画面质量还更好,与提示词的关联度也更高。
目前SDXL Turbo已经可以在 Stability AI的图像编辑平台Clipdrop上测试使用,相关代码公布在Hugging Face,可以用于非商业用途。
本文作者:Visssom,观点仅代表个人,文中图源:stability.ai