3月18日港股高开高走,恒生科技指数尤为抢眼,在百度的带领下最终涨超3%。而百度的股价能够大涨主要是因为2天前发布了两款新的人工智能大模型。周一晚上是美股本周第一个交易日,受利好影响百度美股“狂飙”9%,今日港股大涨也就不足为奇了。
这次百度一下子推出两款大模型,分别是基座大模型 “文心 4.5”和首款推理模型“文心 X1”,后者对标DeepSeek - R1。更为关键的是这两款大模型均采取免费策略。

新的大模型是否配得上暴涨的美股和港股股价?带着这些疑问,我第一时间对推理模型“文心 X1”进行了实测,以下便是测试结果及我的亲身感受。
我向“文心 X1”提出的第一个问题曾经让不少大模型“折戟沉沙”:3.9和3.11哪个数字大?
这看似是一个简单到但凡上过小学的人都能迅速给出答案的问题,但不少大模型在初期却答错了。“文心 X1”没有让人失望,它通过严谨的逻辑推演得出了正确答案。
值得一提的是,作为推理模型,“文心 X1”类似deepseek,不仅给出答案,还详细展示了思考和行动过程。

第二道题是一道纯逻辑问题:小王、小刘、小丁、小李分别是教师、军人、工人中的一种,已知小王是教师,小丁不是工人,且只有小刘和小李的职业相同,请问他们的职业各是什么?
这道题的难度相较于上一题明显增大,逻辑推理能力稍弱的人可能无法答对。而“文心 X1”表现出色,不仅给出了正确答案,而且整个思考、推理过程也相当严谨。
它在解题过程中考虑了不同的情形,最后还根据答案反向验证,这种方式与人类思考、做事的方式极为相似。毕竟,我们在做完一道题后,也会把答案代入条件进行验算,以判断答案是否正确。对于人工智能而言,模仿人类思考、做事的方式无疑是一个重要的发展方向。

最后一道测试题在我看来是最难的,涉及高中物理学知识的同时我特地在题目里下了个套,看看“文心 X1”会否入套。题目是:假设汽车的起始速度是30米/秒,加速度为50米/秒,请问10秒后汽车的速度是多少?
要想答对这道题,得先掌握一些物理学知识。匀速直线运动求速度的公式是:v = v0 + at,其中v0是初速度,a是加速度,t是时间。
“文心 X1”的知识储备是够用的,得出了530米/秒的答案。然而,这道题的解答并没有结束,“文心 X1”发现了题干中隐藏的套路,不知道大家有没有发现问题。

要知道,530米/秒相当于1908公里/小时,这个速度是战斗机的两倍,现实中根本不存在能跑那么快的汽车。因此,530米/秒的答案从数学角度来说是没错的,但不符合物理常识。
“文心 X1”在思考中敏锐地发现了这个“坑”,输出结果时,它先按照题干给出数学上正确的答案,然后贴心地提示我检查加速度的单位是否合理,还给出了可能的答案。
我对“文心 X1”在这道题上的回答十分满意,这表明大模型具备思考和判断能力。

至于一些写文案的问题不再一一赘述了,“文心 X1”的表现和主流大模型差别不大,能够给出较为详细的答案。其实这种类型的问题更需要用户具备一定的提问能力,给出的关键词要精准到位,才能引导大模型给出令人满意的答案。
总体来说“文心 X1”模型的体验相当不错,在我看来推理能力属于顶尖模型之列,百度这次没有让人失望。

自从deepseek开源后,人工智能领域的竞争进入了一个全新的阶段。在这场激烈的竞争中,谁能杀出重围登上顶峰还尚未可知。此前被吐槽“起了个大早,赶了个晚集”的百度,用“文心 X1”模型证明了自己依然在人工智能的牌桌上,并且有着强大的竞争力。
未来,百度能否凭借免费和开源的策略,以及“文心 X1”等优秀模型在人工智能领域取得更大的突破,值得我们拭目以待。
以上纯属个人观点,欢迎关注、点赞,您的支持是对原创最好的鼓励!