独家发布：横向测评对比四家AI绘图，你就知道究竟哪家强了

AI绘画目前已经不是什么新鲜事了，大家都已经知道输入关键词，就可以让AI生成你想要的图像。但是，你知道吗？市面上的AI绘画工具五花八门，它们各有各的特点和优劣，有些甚至可以创造出超乎想象的艺术作品。那么，究竟哪个AI绘画工具的效果最好呢？

写在开头：

由于工作和爱好的关系，我算的上是一个AI绘画的爱好者，也通过AI绘画完成过一些工作任务。在AI绘画这个技术开始之初，我就非常的关注。最早一开始使用的是Midjiourney，后来也用过一段时间的Stable Diffustion（但由于技术门槛的问题，我放弃了），因为我不能把我不了解的内容，随便评说，所以这篇文章不会包含SD的内容。我也尝试过使用必应的图像创建器。过了没多久，荣幸的成为了国内的“文心一言”的首批邀请用户，最近又使用上了刚刚发布的阿里的“通义万相”。所以这四个AI绘图工具，我都使用过了，所以还是有一些和大家分享的使用的心得和体会的。

注意：这篇文章通过各个工具生成的图片做了横向对比，如果你只想看结果，可以直接滑到文章最下面。

本次进行AI文生图比较的四款工具：

百度“文心一言”

阿里“通义万相”

必应（bing）图像创建器

Midjourney

既然是横向的测评，那为了确保测试尽可能的公平公正，我这里采用的方法是，尽可能的用一致的关键词，喂给这四个AI工具。分别看看他们出来的图片，会是一个什么样的结果。我将从功能、效果、速度和价格四个维度，对它们进行横向比较，让你一目了然。这样的测试才有参考意义。

Part 1 第一部分

测试开始：

测试从百度的“文心一言”闹出过的笑话开始。

从2023年3月16日，百度CEO李彦宏宣布正式推出大语言“文心一言”开始，网上就流传着许多关于“文心一言”的画闹出过的笑话，比如“驴肉火烧”和“红烧狮子头”

图片来源于网络

如今已经接近4个月的时间过去了，百度的“文心一言”现在究竟有没有提升呢？

是的，真的很欣喜的看到我们国内第一个在AI绘画领域中吃螃蟹的“文心一言”真的有进步，我让“文心一言”画一幅【夫妻肺片】的结果，还是比较准确的。

7月16日，我让文心一言画的【夫妻肺片】

那作为刚刚入局的阿里“通义万相”，有了百度的“珠玉在前”，能否不要重蹈覆辙呢？

并没有，“通义万相”很显然避免了这个低级错误，在中文的语意理解上，从一开始就没有让网友有吐槽的机会。

我们再对比一下，据说是接入了Chat GPT-4的必应的表现会如何呢？

毫无悬念的必应翻车了！好家伙，直接给我整了几对男女，其中一对亚洲男女各自拿了一个X光片？上帝把智慧洒满人间，唯独给你撑了把伞是吧。糊弄谁呢？

7月16日，我让通义万相画的【夫妻肺片】

其实必应的翻车在情理之中，毕竟不是国内的语意理解，老外的词库里，让AI去理解【夫妻肺片】应该是一件比较困难的事情。所以这里必应需要扣-1分。

接着我又让这三款工具分别生成了【老婆饼】和【驴肉火烧】以下分别是出图的结果：

7月16日，我让3款AI文生图工具分别生成的【老婆饼】

我们暂时先不去评价究竟哪个工具生成的图片质量好或者不好吧。至少国内的两款工具都给我们整出了“饼”，而不是给你画了个“老婆”出来。而必应在这方面就比较令人失望了，虽然老婆饼没有翻车，但是在驴肉火烧上，还是犯了同样的字面直出的问题。扣-1分。

必应的“驴肉火烧”

Part 2 第二部分

好了，一定有朋友说了，你别尽拿十级中文去为难AI呀，那我们接着往下看。

前面都是让AI生成一些比较简单的内容，我们接下来，提高难度，加入号称AI绘画界老大哥的Midjourney进入测评组。我曾经在MJ中生成过不少的图片，比如下面这套“老了也要时尚”的组图，曾经获得过不少的关注，这次我们就拿它作为参照，进行一下对比。

1.Midjourney：AI生成亚洲时尚老年人

为了保证尽可能的公平，我用的关键词都是统一的，但由于Midjourney需要用英文作为关键词，其他三个用中文理解，所以关键词我都用了翻译软件进行了统一。（除了MJ特有的代表宽高比的ar 9:16之类的特殊指令）

2.百度“文心一言”：AI生成亚洲时尚老年人

7月16日，百度“文心一言”生成的时尚老年人

“文心一言”是唯一一个一次只出一张图的AI工具，可以看到，百度理解了时尚的老年人的这个概念，但是在人物形象，动作形态上实在差强人意。

3.阿里的“通义万相”：AI生成亚洲时尚老年人

7月16日，阿里“通义万相”生成的时尚老年人

个人感觉，“通义万相”在色彩的饱和度和人物的表情上都优于“文心一言”，当然这种色彩的饱和度是否真的讨喜，仁者见仁，智者见智吧。

4.必应图像创建器：AI生成亚洲时尚老年人

7月16日，必应图像创建器生成的时尚老年人

我不知道诸位看到这样的图片作何感想，反正我的感觉就是无语，无力吐槽，这是在丑化我们亚洲人吗？再次扣-1分。

Part 3 第三部分

人物对比好了，我们接下来试试看建筑吧。这套图是曾经用Midjourney生成的店面设计，也在之前发布的文章中出现过，感兴趣的朋友，可以去我的主页翻一下。

1.Midjourney：AI生成街道店面设计

2.百度“文心一言”：AI生成街道店面设计

这里百度给出的回复是“很抱歉，我没有构思好这幅作品，请您稍后再试。”可能由于是我直接用的Midjourney的生成词语，“文心一言”并不理解。所以这幅图，百度没有生成出来。抱歉扣-1分。

3.阿里的“通义万相”：AI生成街道店面设计

这里我要夸一下“通义万相”，我用了和“文心一言”同样的词语，在“文心一言”直接罢工的先例下，它还是很厉害的画出了我想要的画面。虽然结果并没有达到非常的理想。

4.必应图像创建器：AI生成街道店面设计

嗯，怎么评价呢，画风完全构成了另一个感觉，很难评价。只要是涉及到人物的脸部的，都惨不忍睹吧。

Part 4 总结

经过以上的测试，我相信，其实你内心对四款AI绘画工具，基本上已经有了自己的判断。

1.百度“文心一言”

据说是基于全球最大跨模态生成模型，参数规模达到240亿，能够学习过程融入语言、视觉、跨模态等多源知识，生成图像语义一致性更高，但是在AI绘画功能上明显，还有很大的改进空间，虽然和刚刚入局时相比，已经有了很大的进步。同时百度作为国内具有创新意义和应用价值的技术，还需要不断完善和优化，以提高生成质量和用户体验。我给的打分是：

功能：★★★

图片质量：★★

生图速度：★★★★

价格：★★★★★（目前免费）

使用感受：只要你是注册用户，不限量生成。但是每次只能出一张图，而且如果页面停止指令15分钟，就会需要重新登录，释放给其他需要使用的朋友。但是出图的效果并不理想。

2.阿里“通义万相”

据说是基于阿里研发的组合式生成模型Composer，其可通过对配色、布局、风格等图像设计元素进行拆解和组合，提供高度可控性和极大自由度的图像生成效果，仅需一个模型即可支持多类图像生成类任务能力，但是对一些复杂的文本或图片的处理不够理想。不过阿里还是非常谦虚的，它在官方的首页就标明：我是通义万相，一个不断进化的AI绘画创作模型。所以它的成长期待，目前于我来说，是最高的。

我的感受评分是：

功能：★★★

图片质量：★★★

生图速度：★★★★

价格：★★★★★（目前免费）

使用感受：比“文心一言”好，可以尝试使用，目前也是公测期间，每天可以有50个生成图片的额度，只要不是用来大量出图，还是够用，够体验的。

3.必应图像创建器

据了解该功能是基于DALL·E模型，该模型是一个深度学习系统，能够根据文本描述生成各种图像。使用需要科学上网，但是整体的使用感受，非常的不佳，而且其对于人物脸部的处理非常的糟糕。所以我的感受评分是：

功能：★★

图片质量：★

生图速度：★★★

价格：★★★★★（目前免费）

使用感受：只要你是注册用户，不限量生成。但是出图的效果并不理想。如果你只是想体验一下，那没有问题。

4.Midjouney

Midjourney是一个类似于 DALL·E 的文本到图像的 AI，专长于“漂亮”图像。您可以通过在聊天应用程序 Discord 中向机器人发送消息来使用它——它不是 Web 应用程序，但也不需要任何编程。（附上一些Midjourney生成的图片）

功能：★★★

图片质量：★★★★

生图速度：★★

价格：★★

使用感受：门槛较高，需要英文输入关键词“咒语”，有一定的命令需要掌握和学习，同时需要科学上网，出图的速度相对较慢，价格较贵（下图是Midjourney的收费标准），虽然对于国内用户来说，缺点很多。但也是目前出图质量最好的，几乎没有之一。

Midjourney收费标准

通过这四款AI文生图的软件的对比，相信你一定也已经有了自己的答案。可以看到，国内的两款软件其实和国际顶流的AI生图技术还是有非常大的差距的。在这块上，我们不得不承认，我们还有很长的路需要追赶。

希望我以上对四款AI文生图软件的功能对比能给您的选择和使用有所帮助，您认为我的评分是否合理呢，或者您在使用过程中有什么想法，欢迎在评论区留下您的看法。

玩酷网

独家发布：横向测评对比四家AI绘图，你就知道究竟哪家强了

九月初玖娱乐说事