【AI实测】六大AI文生图工具SD3、DALLE3、Ideogram、即梦、混元-DiT、通义万相究竟谁的效果更好,实测见真章。

跟锅头一起学AI 2024-06-13 22:50:07
▌锅头导读

6月12日,号称最强文生图开源模型的SD3正式宣布开源,网上各大媒体宣传开源打败闭源,SD3又要吊打各大文生图平台的消息满天飞。

不过,听了太多网络传说和官宣世界领先或第一,锅头已经不太相信网传效果和跑分效果。

具体效果如何,用实测结果说话。

锅头挑选了6个自己方便访问的AI工具进行测试。

本次参与测试文生图AI模型如下:

SD3

DALLE3

Ideogram

即梦

混元-DiT

通义万相

提示词使用的是SD3官网示例图片(见下图)的英文提示词:a round anime owl with 'AI' stitched in a cuddly, plush style on its forehead, soft icon design.中文翻译:一只圆形的动漫猫头鹰,额头上缝有可爱的毛绒风格“AI”,柔和的图标设计。

▌生成效果对比

下面是SD3、DALLE3、Ideogram、即梦、混元-DiT、通义万相基于提示词“a round anime owl with 'AI' stitched in a cuddly, plush style on its forehead, soft icon design.”生成的效果图,你觉得哪个效果最好?欢迎留言反馈。

▌实测过程

锅头先进入Stability AI官网,选择了一张个人认为不错的图片,这里选择了红框中的照片,把提示词复制出来。

官网大图效果如下:

提示词为:a round anime owl with 'AI' stitched in a cuddly, plush style on its forehead, soft icon design.中文翻译:一只圆形的动漫猫头鹰,额头上缝有可爱的毛绒风格“AI”,柔和的图标设计。

保持与Stability AI官网一致的英文提示词,分别看看SD3、DALLE 3、Ideogram、即梦、混元文生图、通义万相的实测效果。SD3下图锅头在huggingface上运行demo SD3的实测效果。

优点:动漫猫头鹰正确显示。

不足:额头上的“AI”文字内容并没有正确显示,图片质量也没有官网那么好,而且没看出“AI”文字是毛绒风格的。

DALLE3

下图是锅头基于coze海外版+GPT4+DALLE3搭建的一个AI Bot,调用DALLE 3文生图模型生成的效果。

优点:动漫猫头鹰正确显示,“AI”文字正确显示。

不足:“AI”文字不是毛绒风格的。

Ideogram

下面是Ideogram的生成过程截图和效果图。

优点:动漫猫头鹰正确显示,“AI”文字正确显示,而且“AI”文字是毛绒风格的。

不足:“AI”文字旁边多了个“!”,不过其他图片并没有感叹号。所以可能并不算问题。

即梦

下面即梦的生成过程截图和效果图。

优点:动漫猫头鹰正确显示。

不足:额头上的“AI”文字内容并没有显示。

混元-DiT

腾讯元宝的文生图用的是混元-DiT的腾讯混元生图模型,下面混元-DiT的生成过程截图和效果图。

优点:动漫猫头鹰正确显示。

不足:额头上的“AI”文字内容并没有显示。

通义万相

下面通义万相的生成过程截图和效果图。

优点:动漫猫头鹰正确显示。

不足:额头上的“AI”文字内容并没有显示。

▌实测总结

经过一轮文生图实测,锅头有以下发现:

测试模型中,Ideogram是最符合提示词生图效果要求的。SD3开源版本和官网示例图片效果差距比较大,也可能是锅头操作方式或参数设置不对导致(欢迎能生成官网图片效果的大佬指点反馈)。国内文生图对于在图片上写字,例如“AI”,目前基本不识别或无法正确显示文字。AI模型和工具是否合适使用,要自己实测过才知道。(尽量不要人云亦云)
0 阅读:1

跟锅头一起学AI

简介:持续学习AI知识和使用技巧,思考如何用AI高效学习办公