01
画风逐渐偏离正轨的AI扩图
自从chatGPT们以聊天伴侣融入人们生活开始,各式段子、翻车剧本就层出不穷,相对于中规中矩的交流,人们似乎更期待AI们“一本正经的胡说八道”。相比文字,图片的冲击力似乎更大,继文生图、图生图之后,打着“拯救相册废照”旗帜的AI扩图开始成为朋友圈新宠。
相关话题#用AI扩图拯救相册废照#、#让人意想不到的AI扩图#,登上抖音热榜前10,累计参与人数分别达16.08万和2.73万。
这些话题的火爆,得益于剪映新上线的“智能扩图”功能。有人表示:“受益了,直接拯救废片”。不过,也有网友反馈:“AI扩图,越扩越废”。
AI扩图原本是一种将一张照片按照等比例或者自由角度进行扩展延伸的技术,AI会根据图像内容,预测和补充扩展出来的部分。然而,AI扩图通常需要经历“图片分析-图像生成-二次构图-输出结果”等多个过程,其通过深度学习算法对原有图片进行分析和处理,实现对图片的大面积生成,而由于这种技术的不成熟以及AI视角的不同,往往会让用户可以看到原图画面经过扩展之后到底“藏”着什么惊喜或惊吓。
类似这种“美女与野兽”“人模狗样”的图片层出不穷,更有相互拥抱的半身照,在AI眼里直接变成了大人抱小孩;圆满的结婚照,扩出了第三个人……如此扩图大有偏离正轨的感觉,却也因AI视角的搞怪而在朋友圈创造出不少爆款。
02
两款低门槛AI扩图工具推荐
扩图本身可以看做是AI在图片领域的主流应用之一,因此不少主流的AI图片工具其实都搭载了该功能,不过要么是全英文操作门槛较高,要么“事故”频发后被隐藏或下线,笔者这里将分PC和手机两个平台给小伙伴们推荐两款易用性还不错的AI扩图工具。
在PC平台上,笔者非常推荐美图旗下的WHEE,该平台本身在人物图生图、文生图方面表现较好,AI扩图也成为其平台的主推功能之一。登录WHEE/AI扩图功能界面后,根据提示上传照片。
用户上传完图片之后,还可以给出“提示词”(不超过800字)以便AI能够更好地领悟用户想法,同时还可以对画面尺寸、生成张数等参数进行设定,不过需要注意的是每次生成需要消耗8枚美豆。
完成所有设定后点击“立即生成”即可,这里有些不好的是的WHEE没有显示扩图需要等待的时间,大概需要等待2分钟的样子,就可以看到扩图后的4张图片了。对于生成效果,笔者只能说“还好”。
没有出现夸张或者非主流的设计,四张图片更多是对顶部天花板或者左边环境进行扩充,并加入了一些相对合理的小元素作为装饰点缀。单看画面本身是没有违和感的,且让原本有些紧凑的构图界面变得宽松。
而在手机端,笔者则推荐“MewXAI”这款小程序,无需安装独立APP,仅通过微信即可使用。登录完成后MewXAI的AI扩图功能会首先要求用户按比例对图片进行裁剪,然后选择扩展比例。
这里注意不同的清晰度会耗费不同的虚拟点数,这也算是商业化的尝试。相对中规中矩的WHEE扩图,MewXAI的AI扩图功能就有翻车的嫌疑了。
画面环境扩充部分并不明显,但人物身体明显被改得有些走样,不仅出现了“大肚腩”,更让右手完全失真,少了点真实感,倒是多一些搞怪元素。
03
AI扩图原理分析
说到AI扩图这事,之前Midjourney、Photoshop、DALL-E 2、Stable Diffusion等都有推出类似功能,其背后原理也有些相似之处。像DALL-E、Stable Diffusion、Photoshop的Generative Fill等都用到了一种叫做Outpainting的技术。
Outpainting是一种图像处理技术,与Inpainting(图像内部填充)相反,可以根据现有图像的内容、风格和上下文,合成与原始图像相协调的新内容,从而扩展图像的视觉范围。
Outpainting通常依赖于深度学习模型,有基于内容扩散的、基于GAN的、基于语义理解的等。此外,AI扩图不仅是增加像素的数量,更重要的是增加图像分辨率的过程。
例如,CNN是AI扩图中常用的神经网络,通过学习大量的低分辨率和高分辨率图像对,来理解图像特征,学习如何从低分辨率重建高分辨率图像。超分辨率技术使得模型能够填补低分辨率图像中缺失的像素,从而生成更高分辨率的图像。
在扩图过程中为了保证图像细节还要注意细节增强、噪声抑制等。虽然目前AI扩图技术有了很大进展,但实时处理能力还有待提升,通常来说更高质量的图像扩展需要更多的计算时间。
现有的很多AI扩图工具生成速度已经有了不小的提高,不过成品的质量是否符合逻辑,这个概率还是比较随机的。
即便AI扩图有时给出的结果很离谱,但这种“抽象风”也给网友们带来了不少的乐子。
看到这儿,对于这两位AI灵魂画师的表现还满意吗?赶紧生成一张你的AI扩图作品,看看能否让手机相册里的图片大变样!