大模型价格战凶猛。
5月22日,腾讯云全面下调大模型价格,混云-lite宣布免费。
随着成本快速下降,大模型全面普及的拐点已经到来。不过,大模型价格战面向的是B端开发者的,对大多数C端用户来说,大模型依然在“只听其声不见其面”阶段,ChatGPT这一AIGC应用鼻祖成了“玩具”,Sora这样的明星产品无法体验。市场急缺人人能用的大模型应用。
在消费级市场,也有在潜心做大模型产品的玩家,其中来自中国的昆仑万维——天工AI就蹚出了一条自己的路。5月27日,昆仑万维宣布,天工AI APP日活用户(DAU)已超100万,成为极少数进入“DAU百万俱乐部”的消费级AIGC应用,QuestMobile数据则显示,其月活量已逼近千万。作为大模型C端应用的全能型选手,天工AI体验到底如何?
初体验:AI超级应用,真全能“孤品”去年8月天工AI发布了中国第一款AI搜索产品,引发四面八方的AI产品扎堆搜索领域。随着谷歌发布Genimi demo,可能就连昆仑万维都没想到AI搜索会成为全球AI大战的“炸子鸡”应用。
自天工第一款AI搜索产品上线已过去10个月,现如今的天工AI俨然已升级为AI搜索为主的多模态全能AI孤品。
大多数AIGC应用目前还只通过PC WEB页提供服务,天工AI则支持PC、App、小程序等多渠道,让用户在不同场景可随时随地免费试用:
PC端:www.tiangong.cn;
APP:在应用商店搜索App“天工”,支持手机号码一键登录使用;
小程序:在微信等平台,【天工AI智能助手】小程序使用也十分简单方便。
从网站、App主界面来看,天工AI平台集成了AI搜索、AI文档分析、AI画画、做PPT、音乐生成、视频转绘、AI写作、AI语音对话等主流AIGC应用,本质就是一个AI应用的超级平台。
天工AI支持文字、图片、声音、视频、文档处理等,是第一个真正意义上的多模态AIGC产品。可能很多用户对多模态是什么不大了解,其实多模态就是更自然更好用的人机交互,因为人可以任意多种形式(文字、图片、声音、视频)与机器交互,就像跟人和人交互一样自然。
那么,天工AI能力到底如何?作为一家新媒体机构的创始人,我每天的工作都有大量场景需要使用AIGC,我发现常见的AI需求在平台都有对应的服务可以满足,而且完全免费。
刚好我最近接到了一个体验2024年新款iPad Pro的任务,这个任务串联了天工AI的不少核心功能,给大家分享下我的实操案例。
首先,我试着让天工AI给我一些小红书的文案建议:
答案让人惊喜,天工AI不只是准确地把握了iPad Pro的特性,而且可结合小红书笔记文风加入表情,且每一个表情都不是随意添加的。在文末,天工AI还加入了对小红书推荐效果影响很大话题标签,这份文案给人感觉很“走心”,90%可用。
不过,相较于纯文字而言,小红书用户习惯看图文结合的内容,于是我试着让天工AI给我生成一张iPad Pro的画报用于笔记。
结果也不错,画面简洁大方,颜色明亮鲜艳,还真有一点我要求的“金属质感”。
刚好雷科技今天的推文是关于微软AI PC的,于是我试着让天工AI帮忙制作一张封面图:
这个图剪裁一下就可以用了——美中不足的是logo成了苹果的,但瑕不掩瑜。
如果想要风格不一样的动漫图呢?我试着让天工AI智能体下面的二次元漫画给我制图,主题是乔布斯与iPhone同步出现,结果也同样能直接用。
前些年我们新媒体从业者最担心被图片版权机构敲诈勒索,现在有了天工AI,微信推文的封面图可以自己做了,感觉每年都可以省下一大笔钱了。
除了前面的图片生成功能,天工AI最近还上新了一个宝藏功能【AI视频转绘】,只需上传或者拍摄一段小视频,天工AI就能生成很多不同风格的视频,比如动漫、迪士尼等二次元风格,这个功能可太适合内容创作者了。
在白云机场,我拍摄了一则机场忙碌景象的小视频,想用来制作旅行Vlog。将视频上传到天工AI后,我只需指定“日漫”风格,它就能生成一则格调别致的小视频,还挺带感的:
天工AI让人惊喜的功能,不只是图片生成和AI视频转绘,它的AI音乐生成功能同样堪称惊艳。
让每个人都能创作歌曲的Suno一度很火,但Suno AI已开始收费,天工AI则支持免费创建音乐,且体验更接地气,支持选择不同曲风与情绪,一次可生成三个版本,均可免费下载。
我只花了几分钟时间就创作了两首歌曲,大家可以试听:
《明月几时有(电音版)》:
《互联网大佬凡尔赛之歌》:
特别值得一提的是,天工AI音乐不只是创作工作,也是AI音乐分享与发现社区,AI创建的歌曲可一键投稿到平台,参与相应的激励活动,说不定哪天你也可以作为AI kol在天工上变现了。
据了解,天工AI音乐生成大模型是完全自研的,当前AIGC音乐在国内外都没有公开可用的开源模型,suno也没公开任何技术架构。天工AI音乐生成在4月17日上线时,就对外公开了技术架构。
「天工SkyMusic」自研AI音乐大模型技术架构
「天工SkyMusic」是中国首个音乐SOTA模型,在人声&BGM音质、人声自然度、发音可懂度以及综合评分上超过AIGC音乐鼻祖Suno V3,这是中国自研大模型技术第一次在AIGC领域领跑全球。
在写作时,我经常需要阅读一些专业报告并快速提炼出信息,这是让人十分头疼的活儿,因为阅读一份报告需要很长时间,甚至比写稿本身的时间更多。使用天工AI的文档解析功能,我可以快速得到文档梗概重点,且可以生成脑图,这比传统目录更一目了然。
更强大的地方是,天工AI还能精准回答“手机相关内容在报告哪一页”这样的内容,我写稿要用到对应内容直接到对应页码精读即可,当然如果你不想自己精读,天工AI也支持一健AI速读。有一说一,天工AI的文档解析确实可以大幅节省编辑、记者、公关、研究员、分析师等人群的时间。
除了可以解析PDF等文档外,天工AI生成PPT的能力也不俗,比如我最近准备在公司内部展开一个新媒体内容风控的培训,它直接给我生成了一个框架,我还可以选择不同模版一健生成PPT,整个过程不到两分钟,基本覆盖我要培训的维度,我根据个人经验补充对应内容即可。
体验后我觉得天工AI算得上是真正意义上的全能AI助理。在搜索、写作、对话、文档分析、画画、音乐生成等基础能力外,它通过智能体整合AI PPT、翻译、百科、口语陪练、旅行规划、内容推荐、编程助理、AI识图、漫画、数据分析等应用,实实在在地帮用户解决工作、生活与学习中的诸多问题。
在全球范围内,AIGC产品百花齐放,ChatGPT、Midjourney、suno、Copilot、kimi、文心一言……有的擅长对话聊天,有的深耕办公场景,有的专注长文本。但对用户来说,不同类型的AIGC产品分散各处,需重复注册与付费,要解决一个问题则需在不同应用间切换,要用好AIGC往往需要系统的学习培训,这在无形中影响了大模型应用的普及。
天工AI让AIGC产品碎片化的问题迎刃而解。集成如此多AI功能、支持多模态的消费级AIGC平台,也只有天工AI一家,说其是“大模型孤品”不夸张。
天工AI让我想到了一个概念:“AI时代的微信”。
微信在移动时代扮演着“超级App”的角色,它像一个超级容器,基于小程序等应用形态,让用户可在平台内通信、社交、阅读、开会,还能玩游戏、支付理财、订机票、点外卖、购物。同样,天工AI也是一个真正的多模态AIGC应用平台,在这里用户可一站式获取所有主流AIGC服务,无需在不同App间跳转就能解决生活与工作中的诸多问题。
而且跟微信一样,天工AI将AIGC的使用做到了前所未有的简单:我体验的所有功能都是免费的,没有使用次数等额度限制,而且连注册登录都不需要。
移动互联网的普及微信功不可没,天工AI在AIGC走向亿万用户中也将发挥一样的作用,其将极大地降低AIGC应用的使用门槛,也将有望成为通用型AI时代的超级应用,成为“AI时代的微信”。
AI搜索鼻祖,如何重新定义搜索引擎?搜索引擎建立在数据、知识与算法基础之上,与AI有着密切的关系,在深度学习阶段,谷歌、百度等搜索巨头就曾是主力玩家。
大模型给搜索带来的变革更加彻底,AI搜索也成了谷歌、百度等巨头的关注点,而在巨头外,还有AI搜索鼻祖【天工AI】这种基于自研大模型和自研搜索引擎的实力派产品。
2023年8月,天工推出中国第一款AI搜索产品——天工AI搜索,如今AI搜索依然是天工AI的核心功能。天工AI的搜索界面,跟百度、谷歌等传统搜索引擎截然不同。作为AI搜索引擎,其支持简洁、增强和研究等不同搜索模式。“搜索框”变大了不少,这是因为用户使用天工AI不再需要学习Query等搜索技巧,可直接用自然语言输入任何需求。
传统搜索引擎要求用户只能输入数十个字,天工AI支持长文本输入,且可以给出更加清晰的答案,比如我让天工AI与百度分别做一个数学题,天工AI不只是得到了正确答案,还给出了解题思路和延展问题建议:
百度最多只支持38个汉字,且只给出了数学题答案:
我的工作需要关注所有科技行业的发布会日程,团队小伙伴每个月也会手工制作科技行业活动日历,我试着让天工AI帮我做这件事情,Bingo!它给出的答案竟然全部正确,信息整理能力完全不输实习编辑,且还贴心地给出了“参考链接”让用户二次确认。
我是重庆人,喜欢吃面食,我让天工AI帮我对比一下重庆小面与兰州拉面,它直接提炼出了对比表格,图文并茂,结果超预期。我特意去看了参考链接里面的内容,都没有对比表格,可见这表格是天工AI自行提炼的结果。
ChatGPT、文心一言等大模型助理也可以回答以上问题,天工AI还有什么看家本领呢?
第一个让我种草的是“更强的时效性”。
此前ChatGPT等大模型应用因结果过时被诟病——很多大模型预训练数据是一年前半年前的,因此输出的结果无法与时俱进,不可用。天工AI则是国内唯一能够支持实时天气、股市、星座运势等信息查询的AI产品,能够同时生成特定卡片和对应文本分析,满足用户的高频需求。
比如我最近在关注贵州茅台,天工AI可给我最新的股价数据,且通过卡片展示K线图:
第二个超出我预期的是搜索增强。
在启动天工AI的“增强模式”后,我体验到了一种前所未有的“增强搜索”:它可以对我的复杂需求进行拆分再推理,通过引导提问摸清楚我的需求,再整合全网海量内容给出我最需要的结果。
比如我在计划去越南旅行时,在天工AI输入“越南旅游”这样的模糊需求时,它会推理我可能的需求,问我是想了解签证还是航班抑或是酒店?(图左)。当我明确要查询越南签证办理方式时,它给出了准确的总结(图右)。
更超出我预期的是,天工AI的增强搜索还支持“追问”,当我再问“哪一种签证更快,适合紧急出行”时,它同样给出了准确的答案,堪比专业导游:
在前几天的Google I/O上,谷歌展示了Gemini可以给用户规划旅行计划、给出健康食谱,这被一些媒体报道成是很“炸裂”的成果,其实天工AI早都实现了,且做得更好,比如针对我的越南旅行,天工AI除了可以回答签证等专业问题外,也能给出具体的行程规划,图文并茂,路线科学,基本可直接用:
很遗憾,国内科技(自)媒体对硅谷公司的科技成果习惯“炸裂式”报道,对国内科技公司的成果却往往视而不见,这种“偏见”真得改改了。
其实ChatGPT最初最被外界看好的也是“下一代搜索”,不过它想做全能AI助理,看上去什么都可以做,但却没有针对搜索、问答、文档解析、漫画、音乐等等场景进行优化。结果就是,在搜索上,ChatGPT存在训练数据与结果过时的问题,搜索结果存在较大不确定性,体验很不完整。反倒是天工AI,针对AI搜索进行针对性的设计优化,推出搜索增强模式,提高结果时效性,支持多模态交互,免费零门槛使用,快速构建了先发优势,在巨头入局AI搜索时构建起“人无我有、人有我强”的优势。
天工AI搜索让我体验了全新的搜索模式,也看到了搜索引擎的全新可能。
搜索的核心价值是加速信息的流通,精准地匹配人与信息/知识/服务。
传统搜索引擎基于PageRank算法对海量内容进行匹配再排序,核心比拼的是“排序”能力。
AI大模型本质是真实世界模拟器,其具备极强的认知能力,可更准确地理解用户需求、更自然地与用户交互、更好地理解内容,进而可对搜索结果进行整理、组合、过滤、筛选、排序乃至再创作等“增强”,基于此,用户不再需要在大量搜索结果中再筛选比对,而是可一步到位得到所求。AI搜索引擎比拼的将不再是“排序”,而是“需求理解、内容认知与结果生成”的综合较量。
假以时日,AI搜索将取代传统搜索引擎,成为人们获取信息与服务的新入口。
天工会成为AI搜索时代的谷歌吗?当古老的搜索引擎市场爆发AI战事时,下一个谷歌正呼之欲出。
取代QQ的不是飞信而是微信,颠覆淘宝的不是京东而是拼多多。虽然ChatGPT曾被视作将颠覆谷歌,但从产品形态与市场反馈来看,针对搜索进行特定设计与优化的AI全能助理,将更有希望赢得下一轮搜索大战。
当前市面上出现了不少AI搜索引擎,但要么是自研大模型+套壳搜索引擎——其中大多是微软Bing接口,随时可能被掐断,要么是套壳大模型+自研搜索引擎,甚至还有大模型与搜索引擎都是“套壳”的,只有百度、字节和昆仑万维的天工AI走的是大模型与搜索引擎“双自研”路线。
AI搜索比拼的是大模型的真实世界认知能力与搜索的产品化能力,赢得AI搜索大战的一定是“双自研”的玩家。而在屈指可数的“双自研”玩家中,天工AI已构建独特的优势:
首先,搜索基础好。天工AI出自昆仑万维,依托Opera等业务有着多年的内容与搜索服务沉淀;
其次,AI基础技术强。2023年4月,天工skywork首款国内自研大模型上线,与文心一言、通义千问、讯飞星火并列前四,是国内第一批双千亿级大模型;2023年9月,昆仑万维推出多模态大模型Skywork-MM,在多模态大语言模型测评MME中综合得分排名第一;AI产品化早。早在2019年昆仑万维就已在全球布局AIGC,在海外有多款成熟AI产品;
最后,布局AI搜索最早。2023年天工AI推出AI搜索,率先构建多模态的搜索能力并延展成全能AI助手,在产品完整度、体验与技术上均已形成先发优势。谷歌在I/O大会上展示的“炸裂级”AI搜索能力均是吃天工AI的“剩饭”,多模态搜索、图文并貌的结果以及搜索增强理念,天工AI早已具备,且还拥有结果实时性、中文理解能力等差异化优化。可以说,天工AI搜索已具备世界级竞争力,其将有望在新一轮的搜索大战中脱颖而出,换道超车。
从AI全能助理角度看,天工AI是AIGC时代的消费级超级应用平台,堪称AI时代的微信;从AI搜索的维度看,天工AI则有望成为AI时代的谷歌。不容回避的是,天工AI依然面临一些挑战:
第一是商业模式。当前天工AI可免费无限次使用,AI搜索结果纯净无广告,暂未商业化。此前Google母公司Alphabet董事长John Hennessy曾表示,基于大型语言模型的搜索的成本可能是标准关键词搜索的10倍,如今大模型成本指数级下滑,但AI搜索商业化仍是行业待解难题,其结果高度精准,很难再像传统搜索一样在结果中插入广告。
第二是内容生态。算法与内容是搜索的基础。PC时代,基于入口地位与“爬虫”协议,搜索引擎不缺内容;移动时代,腾讯、字节通过超级App聚拢海量优质呢日,百度一度因内容匮乏“无源可搜”,因而不得不战略布局百家号、并投资知乎、快手等平台来充实内容生态;AIGC时代,内容(包括人工创作内容与AIGC内容)同样是互联网的基石,天工AI基于Opera等业务有一定的内容生态积累,但当前结果也依赖对全网内容的聚集,其需要对内容生态进行前瞻布局。
第三是竞争激烈。虽然天工AI已占据AI搜索的先发优势,但AI搜索以及AI助理已被行业看好,微软、谷歌、Meta以及国内的百度、字节等巨头均押下重注。天工AI被市场验证的一些产品形态,也正在被巨头们跟进。因此,天工AI要持续保持先发优势绝非易事。
在天工AI推出后,其母公司昆仑万维股价一骑绝尘,一度进入市值百亿美元俱乐部,由此可见,投资者对天工AI的前景还是很乐观的,一方面是看好其有望赢得新一轮AI搜索大战;另一方面则是期待其可在AI大模型时代成为AIGC版的超级应用平台。不论是AI搜索的谷歌还是AIGC应用的微信,无不都是十分性感的故事,天工AI正在用不断迭代的技术与产品证明自己。
(注:本文封面图由天工AI智能生成)