AI绘画目前已经不是什么新鲜事了,大家都已经知道输入关键词,就可以让AI生成你想要的图像。但是,你知道吗?市面上的AI绘画工具五花八门,它们各有各的特点和优劣,有些甚至可以创造出超乎想象的艺术作品。那么,究竟哪个AI绘画工具的效果最好呢?
写在开头:由于工作和爱好的关系,我算的上是一个AI绘画的爱好者,也通过AI绘画完成过一些工作任务。在AI绘画这个技术开始之初,我就非常的关注。最早一开始使用的是Midjiourney,后来也用过一段时间的Stable Diffustion(但由于技术门槛的问题,我放弃了),因为我不能把我不了解的内容,随便评说,所以这篇文章不会包含SD的内容。我也尝试过使用必应的图像创建器。过了没多久,荣幸的成为了国内的“文心一言”的首批邀请用户,最近又使用上了刚刚发布的阿里的“通义万相”。所以这四个AI绘图工具,我都使用过了,所以还是有一些和大家分享的使用的心得和体会的。
注意:这篇文章通过各个工具生成的图片做了横向对比,如果你只想看结果,可以直接滑到文章最下面。
本次进行AI文生图比较的四款工具:百度“文心一言”
阿里“通义万相”
必应(bing)图像创建器
Midjourney
既然是横向的测评,那为了确保测试尽可能的公平公正,我这里采用的方法是,尽可能的用一致的关键词,喂给这四个AI工具。分别看看他们出来的图片,会是一个什么样的结果。我将从功能、效果、速度和价格四个维度,对它们进行横向比较,让你一目了然。这样的测试才有参考意义。
Part 1 第一部分
测试开始:测试从百度的“文心一言”闹出过的笑话开始。
从2023年3月16日,百度CEO李彦宏宣布正式推出大语言“文心一言”开始,网上就流传着许多关于“文心一言”的画闹出过的笑话,比如“驴肉火烧”和“红烧狮子头”
图片来源于网络
图片来源于网络
如今已经接近4个月的时间过去了,百度的“文心一言”现在究竟有没有提升呢?
是的,真的很欣喜的看到我们国内第一个在AI绘画领域中吃螃蟹的“文心一言”真的有进步,我让“文心一言”画一幅【夫妻肺片】的结果,还是比较准确的。
7月16日,我让文心一言画的【夫妻肺片】
那作为刚刚入局的阿里“通义万相”,有了百度的“珠玉在前”,能否不要重蹈覆辙呢?
并没有,“通义万相”很显然避免了这个低级错误,在中文的语意理解上,从一开始就没有让网友有吐槽的机会。
我们再对比一下,据说是接入了Chat GPT-4的必应的表现会如何呢?
毫无悬念的必应翻车了!好家伙,直接给我整了几对男女,其中一对亚洲男女各自拿了一个X光片?上帝把智慧洒满人间,唯独给你撑了把伞是吧。糊弄谁呢?
7月16日,我让通义万相画的【夫妻肺片】
其实必应的翻车在情理之中,毕竟不是国内的语意理解,老外的词库里,让AI去理解【夫妻肺片】应该是一件比较困难的事情。所以这里必应需要扣-1分。
接着我又让这三款工具分别生成了【老婆饼】和【驴肉火烧】以下分别是出图的结果:
7月16日,我让3款AI文生图工具分别生成的【老婆饼】
7月16日,我让3款AI文生图工具分别生成的【老婆饼】
我们暂时先不去评价究竟哪个工具生成的图片质量好或者不好吧。至少国内的两款工具都给我们整出了“饼”,而不是给你画了个“老婆”出来。而必应在这方面就比较令人失望了,虽然老婆饼没有翻车,但是在驴肉火烧上,还是犯了同样的字面直出的问题。扣-1分。
必应的“驴肉火烧”
Part 2 第二部分
好了,一定有朋友说了, 你别尽拿十级中文去为难AI呀,那我们接着往下看。
前面都是让AI生成一些比较简单的内容,我们接下来,提高难度,加入号称AI绘画界老大哥的Midjourney进入测评组。我曾经在MJ中生成过不少的图片,比如下面这套“老了也要时尚”的组图,曾经获得过不少的关注,这次我们就拿它作为参照,进行一下对比。
1.Midjourney:AI生成亚洲时尚老年人
为了保证尽可能的公平,我用的关键词都是统一的,但由于Midjourney需要用英文作为关键词,其他三个用中文理解,所以关键词我都用了翻译软件进行了统一。(除了MJ特有的代表宽高比的ar 9:16之类的特殊指令)
2.百度“文心一言”:AI生成亚洲时尚老年人
7月16日,百度“文心一言”生成的时尚老年人
“文心一言”是唯一一个一次只出一张图的AI工具,可以看到,百度理解了时尚的老年人的这个概念,但是在人物形象,动作形态上实在差强人意。
3.阿里的“通义万相”:AI生成亚洲时尚老年人
7月16日,阿里“通义万相”生成的时尚老年人
个人感觉,“通义万相”在色彩的饱和度和人物的表情上都优于“文心一言”,当然这种色彩的饱和度是否真的讨喜,仁者见仁,智者见智吧。
4.必应图像创建器:AI生成亚洲时尚老年人
7月16日,必应图像创建器生成的时尚老年人
我不知道诸位看到这样的图片作何感想,反正我的感觉就是无语,无力吐槽,这是在丑化我们亚洲人吗?再次扣-1分。
Part 3 第三部分
人物对比好了,我们接下来试试看建筑吧。这套图是曾经用Midjourney生成的店面设计,也在之前发布的文章中出现过,感兴趣的朋友,可以去我的主页翻一下。
1.Midjourney:AI生成街道店面设计
2.百度“文心一言”:AI生成街道店面设计
这里百度给出的回复是“很抱歉,我没有构思好这幅作品,请您稍后再试。”可能由于是我直接用的Midjourney的生成词语,“文心一言”并不理解。所以这幅图,百度没有生成出来。抱歉扣-1分。
3.阿里的“通义万相”:AI生成街道店面设计
这里我要夸一下“通义万相”,我用了和“文心一言”同样的词语,在“文心一言”直接罢工的先例下,它还是很厉害的画出了我想要的画面。虽然结果并没有达到非常的理想。
4.必应图像创建器:AI生成街道店面设计
嗯,怎么评价呢,画风完全构成了另一个感觉,很难评价。只要是涉及到人物的脸部的,都惨不忍睹吧。
Part 4 总结
经过以上的测试,我相信,其实你内心对四款AI绘画工具,基本上已经有了自己的判断。
1.百度“文心一言”据说是基于全球最大跨模态生成模型,参数规模达到240亿,能够学习过程融入语言、视觉、跨模态等多源知识,生成图像语义一致性更高,但是在AI绘画功能上明显,还有很大的改进空间,虽然和刚刚入局时相比,已经有了很大的进步。同时百度作为国内具有创新意义和应用价值的技术,还需要不断完善和优化,以提高生成质量和用户体验。我给的打分是:
功能:★★★
图片质量:★★
生图速度:★★★★
价格:★★★★★(目前免费)
使用感受:只要你是注册用户,不限量生成。但是每次只能出一张图,而且如果页面停止指令15分钟,就会需要重新登录,释放给其他需要使用的朋友。但是出图的效果并不理想。
2.阿里“通义万相”据说是基于阿里研发的组合式生成模型Composer,其可通过对配色、布局、风格等图像设计元素进行拆解和组合,提供高度可控性和极大自由度的图像生成效果,仅需一个模型即可支持多类图像生成类任务能力,但是对一些复杂的文本或图片的处理不够理想。不过阿里还是非常谦虚的,它在官方的首页就标明:我是通义万相,一个不断进化的AI绘画创作模型。所以它的成长期待,目前于我来说,是最高的。
我的感受评分是:
功能:★★★
图片质量:★★★
生图速度:★★★★
价格:★★★★★(目前免费)
使用感受:比“文心一言”好,可以尝试使用,目前也是公测期间,每天可以有50个生成图片的额度,只要不是用来大量出图,还是够用,够体验的。
3.必应图像创建器据了解该功能是基于DALL·E模型,该模型是一个深度学习系统,能够根据文本描述生成各种图像。使用需要科学上网,但是整体的使用感受,非常的不佳,而且其对于人物脸部的处理非常的糟糕。所以我的感受评分是:
功能:★★
图片质量:★
生图速度:★★★
价格:★★★★★(目前免费)
使用感受:只要你是注册用户,不限量生成。但是出图的效果并不理想。如果你只是想体验一下,那没有问题。
4.MidjouneyMidjourney是一个类似于 DALL·E 的文本到图像的 AI,专长于“漂亮”图像。您可以通过在聊天应用程序 Discord 中向机器人发送消息来使用它——它不是 Web 应用程序,但也不需要任何编程。(附上一些Midjourney生成的图片)
功能:★★★
图片质量:★★★★
生图速度:★★
价格:★★
使用感受:门槛较高,需要英文输入关键词“咒语”,有一定的命令需要掌握和学习,同时需要科学上网,出图的速度相对较慢,价格较贵(下图是Midjourney的收费标准),虽然对于国内用户来说,缺点很多。但也是目前出图质量最好的,几乎没有之一。
Midjourney收费标准
通过这四款AI文生图的软件的对比,相信你一定也已经有了自己的答案。可以看到,国内的两款软件其实和国际顶流的AI生图技术还是有非常大的差距的。在这块上,我们不得不承认,我们还有很长的路需要追赶。
希望我以上对四款AI文生图软件的功能对比能给您的选择和使用有所帮助,您认为我的评分是否合理呢,或者您在使用过程中有什么想法,欢迎在评论区留下您的看法。